Корреляционная связь
В математическом анализе рассматривался случай, когда каждому значению одной переменной ставится в соответствие одно определенное значение другой переменной (y=f(x)). Такую зависимость одной величины от другой называют функциональной.
Подобные однозначные связи между переменными встречаются весьма редко. Например, если взять несколько людей одного роста, то они будут иметь различный вес. То есть одному значению одной переменной соответствует несколько значений другой переменной, которые можно представить в виде ряда распределения:
yi | y1 | y2 | … | yn |
ni | n1 | n2 | … | nn |
Такая зависимость называется статистической (аналог в теории вероятностей – условные законы распределения).
Если каждому значению ставится в соответствие условная средняя, вычисленная при X=xi , то есть x->Yxi , то такая зависимость называется корреляционной (или корреляцией). Термин «корреляция» был введен в науку в 1886 году английским ученым Френсисом Гальтоном.
Виды корреляционной связи могут быть различны: корреляционная связь может быть линейной и нелинейной, положительной и отрицательной. Примеры графиков приведены на рисунках. По оси абсцисс отложены значения величины , а по оси ординат – значения величины Y.
Корреляционная связь будет:
- линейной, если экспериментальные точки располагаются вдоль некоторой прямой;
- нелинейной, если экспериментальные точки располагаются вдоль какой-либо кривой, например, вдоль параболы;
- положительной, если с увеличением переменной переменная в среднем имеет тенденцию к увеличению;
- отрицательной, если с увеличением переменной переменная в среднем имеет тенденцию к уменьшению.
Не следует путать понятия «корреляционная связь» и «корреляционная зависимость». Зависимость – это изменение одной величины под действием другой, а корреляционная связь означает любые согласованные изменения двух величин (при этом они вполне могут не зависеть друг от друга, а зависеть от какой-то третьей величины).
Задача корреляционного анализа: установить направление корреляционной связи (положительное, отрицательное) и форму связи (линейная, нелинейная) между варьирующими признаками, измерить тесноту этой связи и проверить уровень значимости полученных коэффициентов корреляции.
Для оценки корреляционной зависимости могут использоваться различные коэффициенты: коэффициент линейной корреляции Пирсона (используется, если обе изучаемые величины распределены нормально), коэффициент ранговой корреляции Спирмена, коэффициент ранговой корреляции Кендала и другие.