Критерий X2 («хи-квадрат») К.Пирсона


Цель. Освоение метода Х2, использование его при решении задач

Как бы точно ни вычислялись теоретические частоты, они, как правило, не совпадают с эмпирическими частотами ряда. Отсюда возникает необходимость сопоставления эмпирических частот с вычисленными, или ожидаемыми, частотами, с тем, чтобы установить достоверность или случайность наблюдаемого между ними расхождения.

Для сопоставления эмпирических и теоретических частот количественных и качественных признаков К.Пирсон (1900) предложил использовать критерий «хи-квадрат» (Х2), или критерий соответствия. Формула критерия «хи-квадрат» включает сумму дробей, полученную от деления квадрата разности между эмпирическими (Рэмп) и теоретическими частотами (Ртеор) на частоты теоретические (Ртеор):

Х2=.               (35)

Символ Х2 – не квадрат какого-то числа, он выражает лишь исходную величину, определяемую данной формулой. Так как отклонения эмпирических частот возводятся в квадрат, величина критерия Х2 всегда положительная.

При полном совпадении эмпирических частот с частотами вычисленными или ожидаемыми Σ(Рэмп-Ртеор)=0 и критерий Х2 тоже будет равен нулю. Если же Σ(Рэмп-Ртеор)≠0, это укажет на несоответствие вычисленных частот эмпирическим частотам ряда. В таких случаях необходимо оценить значимость критерия Х2, который теоретически может изменяться от 0 до ∞. Это производится путем сравнения фактически полученной величины Х2ф с его критическим значением (Х2st). Нулевая гипотеза, т.е. предположение, что расхождение между эмпирическими и теоретическими или ожидаемыми частотами носит случайный характер, опровергается, если  Х2ф Х2st для принятого уровня значимости и числа степеней свободы. Критические значения Х2 для разных уровней значимости и чисел степеней свободы содержатся в таблице 2 приложений.

Распределение вероятных значений случайной величины Х2 непрерывно и асимметрично. Оно зависит от числа степеней свободы и приближается к нормальному распределению по мере увеличения числа наблюдений. Поэтому применение критерия Х2 к оценке дискретных распределений сопряжено с некоторыми погрешностями, которые сказываются на его величине, особенно на малочисленных выборках. Для получения более точных оценок выборка, распределяемая в вариационный ряд, должна иметь не менее 50 вариант. Правильное применение критерия хи-квадрат требует также, чтобы частоты вариант в крайних классах не были бы меньше 5; если их меньше 5, то они объединяются с частотами соседних классов, чтобы в сумме составляли величину, большую или равную 5. Соответственно объединению частот уменьшается и число классов. Число степеней свободы устанавливается по вторичному числу классов с учетом числа ограничений свободы вариации.

Пример. Требуется оценить результат испытания нового препарата для предупреждения инфекционного заболевания кроликов. Из 50 кроликов 20 получали профилактический препарат (опытная группа), а 30 – не получали (контроль). В опытной группе заболело 7 особей.

Доказывают ли результаты опыта профилактическое действие препарата или случайность причин?

Чтобы сделать определенное заключение, следует все данные опыта внести в таблицу и провести соответствующую их обработку.

Таблица 3.4.1 Расчет критерия соответствия при определении достоверности различий между кроликами двух групп

Группа животных

Число заболевших животных

Число здоровых животных

Всего животных в группе

Наблюдаемые (Ф)

Теоретически ожидаемые (Т)

Наблюдаемые (Ф)

Теоретически ожидаемые (Т)

Опытная

7

8,4 (Т1)

13

11,6 (Т2)

20

Контрольная

14

12,6 (Т3)

16

17,4 (Т4)

30

Итого

21

21

29

29

50

Следует подсчитать теоретически ожидаемые частоты – Т для заболевших и здоровых животных в опытной и контрольной группах; Т1=; Т2 можно найти вычитанием из числа животных в опытной группе ожидаемой величины – Т1, т.е. Т2=20-8,4=11,6; Т3=; Т4=30-12,6=17,4.

Подставив все величины в формулу (35) получим:

Для того, чтобы провести сравнение вычисленного значения хи-квадрат с табличным, необходимо знать число степеней свободы, которое на единицу меньше числа классов. При расчетах по четырехпольным таблицам число степеней свободы равно единице. Сравнивая полученное в нашем примере значение хи-квадрат со стандартным, находим, что вычисленная нами величина (0,26) меньше всех стандартных ее значений в строке таблицы, соответствующей одной степени свободы. Следовательно, профилактическое действие препарата не может считаться доказанным.