Вычисление коэффициента корреляции при альтернативной изменчивости


Цель. Знакомство с методами вычисления коэффициента корреляции при альтернативной изменчивости.

Рассмотренные выше способы вычисления коэффициента корреляции употребляются в отношении признаков, сильно варьирующих и состояние которых можно измерить, взвесить и выразить в определенных цифровых показателях. Однако бывают случаи, касающиеся качественных признаков, когда требуется лишь констатировать наличие или отсутствие данного признака, или когда признак может проявиться лишь в двух состояниях. Такое положение называется альтернативным (двояко возможным), а признаки – альтернативными. Примером альтернативных признаков может служить наличие или отсутствие рогов у животных, той или иной окраски и т.д.

Корреляция между такими альтернативными признаками определяется степенью сочетаемости каждого из двух вариантов признака у двух взаимосвязанных групп особей.

Пример. Требуется установить связь между мастью матерей и мастью их потомства. Допустим от 300 красных матерей родилось 260 потомков красных и 40 палевых, а от 200 палевых матерей – 50 красных и 150 палевых. Эти данные можно разместить в простой корреляционной решетке (таблица 4.3.1).

Таблица 4.3.1 Распределение коров-матерей и их потомков в зависимости от масти

Масть потомков

Масть матерей

Итого

красная

палевая

Красная

260

50

310

Палевая

40

150

190

Итого

300

200

500

Обозначим четыре частоты, оказавшиеся в клетках нашей корреляционной решетки, через р1, р2, р3, р4 (таблица 4.3.2).

Таблица 4.3.2 Вычисление коэффициента корреляции между альтернативными признаками

Масть потомков

Масть матерей

Итого

1

2

(1)

Р1

Р2

1+ Р2)

(2)

Р3

Р4

3+ Р4)

Итого

1+ Р3)

2+ Р4)

N

Коэффициент корреляции (r) вычисляется по формуле:

            (43)

В нашем примере коэффициент корреляции между мастью матерей и мастью потомков равняется +0,62.

Это указывает, что большинство потомков имеет ту же масть, что и их матери.

Бисериальный коэффициент корреляции (rbs) применяется при измерении тесноты связи между качественными признаками, группируемыми в альтернативные группы (+ и -), и непрерывно варьирующими количественными признаками. Он вычисляется по формуле:

        (44)

где  и  - средние арифметические альтернативных групп, n1 и n2 – объемы этих групп;  N=(n1+n2) – общее число наблюдений, или объем выборки; σх – среднее квадратическое отклонение для всех выборки.

Пример. Выяснилась значимость между полом подростков 16-17-летнего возраста и их тактильной чувствительностью. Единицей измерения признака служило расстояние между ножками эстезиометра (мм), при котором ощущение двух прикосновений к концу среднего пальца левой руки воспринималось как одно прикосновение, т.е. сливалось. Результаты опыта и их обработка приведены в таблице 4.3.3.

Сначала определяем средние арифметические групп: мм, мм. Затем находим величину среднего квадратического отклонения  Подставляем найденные значения в формулу:

Значимость выборочного rbs оценивается с помощью t-критерия Стьюдента. С вероятностью Р>0,95 можно заключить, что тактильная чувствительность конца среднего пальца левой руки у девушек выше, чем у юношей того же возраста.

Таблица 4.3.3

Показания эстезиометра, мм (х)

Пол подростков (у)

Рi

Pxi

Px2i

мужской

женский

1.5

1.6

1.7

1.8

1.9

2.0

2.1

2.2

2.3

2.4

2.5

1

-

-

1

1

2

-

1

2

3

2

5

2

2

1

1

2

1

-

-

-

1

6

2

2

2

2

4

1

1

2

3

3

9.0

3.2

3.4

3.6

3.8

8.0

2.1

2.2

4.6

7.2

7.5

 

13.50

5.12

5.78

6.48

7.22

16.00

4.41

4.84

10.58

17.28

18.75

n1=13

N2=15

N=28

54.6

109.96