Множественная корреляция


Цель. Знакомство с методами вычисления коэффициента множественной корреляции

Наряду с димерным анализом в биологических исследованиях применяется и многомерный анализ корреляционных связей, когда корреляция измеряется одновременно между несколькими варьирующими признаками. Простейшим случаем множественной корреляционной зависимости является корреляция трех признаков: Y, Х и Z. Теснота связи между ними измеряется с помощью коэффициента множественной корреляции, который рассчитывается по следующей формуле:

,        (45)

где rxy, rxz и ryz – парные коэффициенты корреляции между признаками  X и Y,  X и Z, Y и Z.

Теснота связи между признаками Х и Y (при постоянстве z) определяется частным коэффициентом корреляции:

         (46)

Соответственно частный коэффициент корреляции между признаками Х и Z при исключении влияния на эту связь признака Y равен

       (47)

Частный коэффициент корреляции между Y и Z при исключении влияния на эту связь признака Х равен

             (48)

Частные коэффициенты корреляции имеют тот же смысл и обладают теми же свойствами, что и обыкновенный парный коэффициент корреляции.

t-критерий для проверки гипотезы о независимом варьировании двух признаков при исключении влияния третьего признака выражается в виде следующего отношения:

где n – объем выборки,  m – число зависимых признаков, для которых вычисляется частный коэффициент корреляции.

Пример. Из снопа озимой ржи случайным способом было отобрано 10 колосьев. Затем измерялась длина (мм) каждого колоса (Х), подсчитывалось число колосков (Y) и количество зерен (Z) в каждом колосе. Собранные данные и их предварительная обработка приведены в таблице 4.4.1

Таблица 4.4.1

Х

Y

Z

Х2

Y2

Z2

Х Y

YZ

ХZ

70

60

70

46

58

69

32

62

46

62

18

17

22

10

16

18

9

18

15

22

36

29

40

12

31

32

13

35

30

36

4900

3600

4900

2116

3364

4761

1024

3844

2116

3844

324

289

484

100

256

324

81

324

225

484

1296

841

1600

144

961

1024

169

1225

900

1296

1260

1020

1540

460

928

1242

288

1116

690

1364

648

493

880

120

496

576

117

630

450

792

2520

1740

2800

552

1798

2208

416

2170

1380

2232

575

165

294

34469

2891

9456

9908

5202

17816

Для определения коэффициента множественной корреляции между этими признаками нужно сначала рассчитать парные коэффициенты корреляции. Пользуясь итогами таблицы 4.4.1, находим суммы квадратов отклонений вариант от их средних арифметических:

∑(xi-)2=∑x2i-(∑xi)2/n=34469-5752/10=34469-33062.5=1406.5; ∑(уi-)2=∑у2i-(∑уi)2/n=2891-1652/10=2891-2722.5=168.5;

∑(zi-)2=∑z2i-(∑zi)2/n=9456-2942/10=9456-8643.6=812.4; σy= σx=

Далее рассчитываем величины сопряженной величины:

∑(уi-)(xi-)=∑ух-∑у/n=9908-575·165/10=420,5;

∑(уi-)(zi-)=∑уz--∑z/n=5202-165·294/10=351,0;

∑( xi-)(zi-)=∑xz--∑x/n=17816-575·294/10=911,0.

Определим парные коэффициенты корреляции:

; 

Рассчитываем частные коэффициенты корреляции:

rxy(z)=0.239;  rуz(х)=0.900;  rxz(у)=0.090 .

Определим общий коэффициент множественной корреляции для всех трех признаков:

R2=0.531;  R=0.729.