Критерий согласия Пирсона χ2 (Хи-квадрат)
До конца XIX века нормальное распределение считалась всеобщим законом вариации данных. Однако К. Пирсон заметил, что эмпирические частоты могут сильно отличаться от нормального распределения. Встал вопрос, как это доказать. Требовалось не только графическое сопоставление, которое имеет субъективный характер, но и строгое количественное обоснование.
Так был изобретен критерий χ2 (хи квадрат), который проверяет значимость расхождения эмпирических (наблюдаемых) и теоретических (ожидаемых) частот. Это произошло в далеком 1900 году, однако критерий и сегодня на ходу. Более того, его приспособили для решения широкого круга задач. Прежде всего, это анализ категориальных данных, т.е. таких, которые выражаются не количеством, а принадлежностью к какой-то категории. Например, класс автомобиля, пол участника эксперимента, вид растения и т.д. К таким данным нельзя применять математические операции вроде сложения и умножения, для них можно только подсчитать частоты.
Наблюдаемые частоты обозначим О (Observed), ожидаемые – E (Expected). В качестве примера возьмем результат 60-кратного бросания игральной кости. Если она симметрична и однородна, вероятность выпадения любой стороны равна 1/6 и, следовательно, ожидаемое количество выпадения каждой из сторон равна 10 (1/6∙60). Наблюдаемые и ожидаемые частоты запишем в таблицу и нарисуем гистограмму.
Нулевая гипотеза заключается в том, что частоты согласованы, то есть фактические данные не противоречат ожидаемым. Альтернативная гипотеза – отклонения в частотах выходят за рамки случайных колебаний, расхождения статистически значимы. Чтобы сделать строгий вывод, нам потребуется.
- Обобщающая мера расхождения между наблюдаемыми и ожидаемыми частотами.
- Распределение этой меры при справедливости гипотезы о том, что различий нет.
Начнем с расстояния между частотами. Если взять просто разницу О — E, то такая мера будет зависеть от масштаба данных (частот). Например, 20 — 5 =15 и 1020 – 1005 = 15. В обоих случаях разница составляет 15. Но в первом случае ожидаемые частоты в 3 раза меньше наблюдаемых, а во втором случае – лишь на 1,5%. Нужна относительная мера, не зависящая от масштаба.
Обратим внимание на следующие факты. В общем случае количество категорий, по которым измеряются частоты, может быть гораздо больше, поэтому вероятность того, что отдельно взятое наблюдение попадет в ту или иную категорию, довольно мала. Раз так, то, распределение такой случайной величины будет подчинятся закону редких событий, известному под названием закон Пуассона. В законе Пуассона, как известно, значение математического ожидания и дисперсии совпадают (параметр λ). Значит, ожидаемая частота для некоторой категории номинальной переменной Ei будет являться одновременное и ее дисперсией. Далее, закон Пуассона при большом количестве наблюдений стремится к нормальному. Соединяя эти два факта, получаем, что, если гипотеза о согласии наблюдаемых и ожидаемых частот верна, то, при большом количестве наблюдений, выражение
имеет стандартное нормальное распределение.
Важно помнить, что нормальность будет проявляться только при достаточно больших частотах. В статистике принято считать, что общее количество наблюдений (сумма частот) должна быть не менее 50 и ожидаемая частота в каждой группе должна быть не менее 5. Только в этом случае величина, показанная выше, имеет стандартное нормальное распределение. Предположим, что это условие выполнено.
У стандартного нормального распределения почти все значение находятся в пределах ±3 (правило трех сигм). Таким образом, мы получили относительную разность в частотах для одной группы. Нам нужна обобщающая мера. Просто сложить все отклонения нельзя – получим 0 (догадайтесь почему). Пирсон предложил сложить квадраты этих отклонений.
Это и есть статистика для критерия Хи-квадрат Пирсона. Если частоты действительно соответствуют ожидаемым, то значение статистики Хи-квадрат будет относительно не большим (отклонения находятся близко к нулю). Большое значение статистики свидетельствует в пользу существенных различий между частотами.
«Большой» статистика Хи-квадрат становится тогда, когда появление наблюдаемого или еще большего значения становится маловероятным. И чтобы рассчитать такую вероятность, необходимо знать распределение статистики Хи-квадрат при многократном повторении эксперимента, когда гипотеза о согласии частот верна.
Как нетрудно заметить, величина хи-квадрат также зависит от количества слагаемых. Чем больше слагаемых, тем больше ожидается значение статистики, ведь каждое слагаемое вносит свой вклад в общую сумму. Следовательно, для каждого количества независимых слагаемых, будет собственное распределение. Получается, что χ2 – это целое семейство распределений.
И здесь мы подошли к одному щекотливому моменту. Что такое число независимых слагаемых? Вроде как любое слагаемое (т.е. отклонение) независимо. К. Пирсон тоже так думал, но оказался неправ. На самом деле число независимых слагаемых будет на один меньше, чем количество групп номинальной переменной n. Почему? Потому что, если мы имеем выборку, по которой уже посчитана сумма частот, то одну из частот всегда можно определить, как разность общего количества и суммой всех остальных. Отсюда и вариация будет несколько меньше. Данный факт Рональд Фишер заметил лет через 20 после разработки Пирсоном своего критерия. Даже таблицы пришлось переделывать.
По этому поводу Фишер ввел в статистику новое понятие – степень свободы (degrees of freedom), которое и представляет собой количество независимых слагаемых в сумме. Понятие степеней свободы имеет математическое объяснение и проявляется только в распределениях, связанных с нормальным (Стьюдента, Фишера-Снедекора и сам Хи-квадрат).
Чтобы лучше уловить смысл степеней свободы, обратимся к физическому аналогу. Представим точку, свободно движущуюся в пространстве. Она имеет 3 степени свободы, т.к. может перемещаться в любом направлении трехмерного пространства. Если точка движется по какой-либо поверхности, то у нее уже две степени свободы (вперед-назад, вправо-влево), хотя и продолжает находиться в трехмерном пространстве. Точка, перемещающаяся по пружине, снова находится в трехмерном пространстве, но имеет лишь одну степень свободы, т.к. может двигаться либо вперед, либо назад. Как видно, пространство, где находится объект, не всегда соответствует реальной свободе перемещения.
Примерно также распределение статистики может зависеть от меньшего количества элементов, чем нужно слагаемых для его расчета. В общем случае количество степеней свободы меньше наблюдений на число имеющихся зависимостей.
Таким образом, распределение хи квадрат (χ2) – это семейство распределений, каждое из которых зависит от параметра степеней свободы. Формальное определение следующее. Распределение χ2 (хи-квадрат) с k степенями свободы — это распределение суммы квадратов k независимых стандартных нормальных случайных величин.
Далее можно было бы перейти к самой формуле, по которой вычисляется функция распределения хи-квадрат, но, к счастью, все давно подсчитано за нас. Чтобы получить интересующую вероятность, можно воспользоваться либо соответствующей статистической таблицей, либо готовой функцией в Excel.
Интересно посмотреть, как меняется форма распределения хи-квадрат в зависимости от количества степеней свободы.
С увеличением степеней свободы распределение хи-квадрат стремится к нормальному. Это объясняется действием центральной предельной теоремы, согласно которой сумма большого количества независимых случайных величин имеет нормальное распределение. Про квадраты там ничего не сказано )).
Вот мы и подошли к проверке гипотез по методу хи-квадрат. В целом техника остается прежней. Выдвигается нулевая гипотеза о том, что наблюдаемые частоты соответствуют ожидаемым (т.е. между ними нет разницы, т.к. они взяты из той же генеральной совокупности). Если этот так, то разброс будет относительно небольшим, в пределах случайных колебаний. Меру разброса определяют по статистике Хи-квадрат. Далее либо полученную статистику сравнивают с критическим значением (для соответствующего уровня значимости и степеней свободы), либо, что более правильно, рассчитывают наблюдаемый p-value, т. е. вероятность получить такое или еще больше значение статистики при справедливости нулевой гипотезы.
Т.к. нас интересует согласие частот, то отклонение гипотезы произойдет, когда статистика окажется больше критического уровня. Т.е. критерий является односторонним. Однако иногда (иногда) требуется проверить левостороннюю гипотезу. Например, когда эмпирические данные уж оооочень сильно похожи на теоретические. Тогда критерий может попасть в маловероятную область, но уже слева. Дело в том, что в естественных условиях, маловероятно получить частоты, практически совпадающие с теоретическими. Всегда есть некоторая случайность, которая дает погрешность. А вот если такой погрешности нет, то, возможно, данные были сфальсифицированы. Но все же обычно проверяют правостороннюю гипотезу.
Вернемся к задаче с игральной костью. Рассчитаем по имеющимся данным значение статистики критерия хи-квадрат.
Теперь найдем критическое значение при 5-ти степенях свободы (k) и уровне значимости 0,05 (α) по таблице критических значений распределения хи квадрат.
То есть квантиль 0,05 хи квадрат распределения (правый хвост) с 5-ю степенями свободы χ20,05; 5 = 11,1.
Сравним фактическое и табличное значение. 3,4 (χ2) < 11,1 (χ20,05; 5). Расчетный значение оказалось меньшим, значит гипотеза о равенстве (согласии) частот не отклоняется. На рисунке ситуация выглядит вот так.
Если бы расчетное значение попало в критическую область, то нулевая гипотеза была бы отклонена.
Более правильным будет рассчитать еще и p-value. Для этого нужно в таблице найти ближайшее значение для заданного количества степеней свободы и посмотреть соответствующий ему уровень значимости. Но это прошлый век. Воспользуемся ЭВМ, в частности MS Excel. В эксель есть несколько функций, связанных с хи-квадрат.
Ниже их краткое описание.
ХИ2.ОБР – критическое значение Хи-квадрат при заданной вероятности слева (как в статистических таблицах)
ХИ2. ОБР.ПХ – критическое значение при заданной вероятности справа. Функция по сути дублирует предыдущую. Но здесь можно сразу указывать уровень α, а не вычитать его из 1. Это более удобно, т.к. в большинстве случаев нужен именно правый хвост распределения.
ХИ2.РАСП – p-value слева (можно рассчитать плотность).
ХИ2.РАСП.ПХ – p-value справа.
ХИ2.ТЕСТ – по двум диапазонам частот сразу проводит тест хи-квадрат. Количество степеней свободы берется на одну меньше, чем количество частот в столбце (так и должно быть), возвращая значение p-value.
Давайте пока рассчитаем для нашего эксперимента критическое (табличное) значение для 5-ти степеней свободы и альфа 0,05. Формула Excel будет выглядеть так:
=ХИ2.ОБР(0,95;5)
Или так
=ХИ2.ОБР.ПХ(0,05;5)
Результат будет одинаковым – 11,0705. Именно это значение мы видим в таблице (округленное до 1 знака после запятой).
Рассчитаем, наконец, p-value для 5-ти степеней свободы критерия χ2 = 3,4. Нужна вероятность справа, поэтому берем функцию с добавкой ПХ (правый хвост)
=ХИ2.РАСП.ПХ(3,4;5) = 0,63857
Значит, при 5-ти степенях свободы вероятность получить значение критерия χ2 = 3,4 и больше равна почти 64%. Естественно, гипотеза не отклоняется (p-value больше 5%), частоты очень хорошо согласуются.
А теперь проверим гипотезу о согласии частот с помощью теста хи квадрат и функции Excel ХИ2.ТЕСТ.
Никаких таблиц, никаких громоздких расчетов. Указав в качестве аргументов функции столбцы с наблюдаемыми и ожидаемыми частотами, сразу получаем p-value. Красота.
Представим теперь, что вы играете в кости с подозрительным типом. Распределение очков от 1 до 5 остается прежним, но он выкидывает 26 шестерок (количество всех бросков становится 78).
p-value в этом случае оказывается 0,003, что гораздо меньше чем, 0,05. Есть серьезные основания сомневаться в правильности игральной кости. Вот, как выглядит эта вероятность на диаграмме распределения хи-квадрат.
Статистика критерия хи-квадрат здесь получается 17,8, что, естественно, больше табличного (11,1).
Надеюсь, мне удалось объяснить, что такое критерий согласия χ2 (хи-квадрат) Пирсона и как с его помощью проверяются статистические гипотезы.
Напоследок еще раз о важном условии! Критерий хи-квадрат исправно работает только в случае, когда количество всех частот превышает 50, а минимальное ожидаемое значение для каждой группы не меньше 5. Если в какой-либо категории ожидаемая частота менее 5, но при этом сумма всех частот превышает 50, то такую категорию объединяют с ближайшей, чтобы их общая частота превысила 5. Если это сделать невозможно, или сумма частот меньше 50, то следует использовать более точные методы проверки гипотез. О них поговорим в другой раз.
Ниже находится видео ролик о том, как в Excel проверить гипотезу с помощью критерия хи-квадрат.
youtube.com/embed/oS-0XA6AfhE?feature=oembed» frameborder=»0″ allow=»accelerometer; autoplay; encrypted-media; gyroscope; picture-in-picture» allowfullscreen=»»>Скачать файл с примером.
Поделиться в социальных сетях:
Таблица критерия Пирсона χ2 (хи-квадрат) онлайн. Теория вероятностей и математическая статистика
Ниже представлена таблица значений критических точек распределения χ2 (хи-квадрат) критерия Пирсона, широко используемые в задачах математической статистики, таких как построение доверительных интервалов, проверка статистических гипотез и непараметрическое оценивание.
Число степеней свободы k | Уровень значимости α | |||||
0,01 | 0,025 | 0,05 | 0,95 | 0,975 | 0,99 | |
1 | 6,6 | 5 | 3,8 | 0,0039 | 0,00098 | 0,00016 |
2 | 9,2 | 7,4 | 6 | 0,103 | 0,051 | 0,02 |
3 | 11,3 | 9,4 | 7,8 | 0,352 | 0,216 | 0,115 |
4 | 13,3 | 11,1 | 9,5 | 0,711 | 0,484 | 0,297 |
5 | 15,1 | 12,8 | 11,1 | 1,15 | 0,831 | 0,554 |
6 | 16,8 | 14,4 | 12,6 | 1,64 | 1,24 | 0,872 |
7 | 18,5 | 16 | 14,1 | 2,17 | 1,69 | 1,24 |
8 | 20,1 | 17,5 | 15,5 | 2,73 | 2,18 | 1,65 |
9 | 21,7 | 19 | 16,9 | 3,33 | 2,7 | 2,09 |
10 | 23,2 | 20,5 | 18,3 | 3,94 | 3,25 | 2,56 |
11 | 24,7 | 21,9 | 19,7 | 4,57 | 3,82 | 3,05 |
12 | 26,2 | 23,3 | 21 ,0 | 5,23 | 4,4 | 3,57 |
13 | 27,7 | 24,7 | 22,4 | 5,89 | 5,01 | 4,11 |
14 | 29,1 | 26,1 | 23,7 | 6,57 | 5,63 | 4,66 |
15 | 30,6 | 27,5 | 25 | 7,26 | 6,26 | 5,23 |
16 | 32 | 28,8 | 26,3 | 7,96 | 6,91 | 5,81 |
17 | 33,4 | 30,2 | 27,6 | 8,67 | 7,56 | 6,41 |
18 | 34,8 | 28,9 | 9,39 | 8,23 | 7,01 | |
19 | 36,2 | 32,9 | 30,1 | 10,1 | 8,91 | 7,63 |
20 | 37,6 | 34,2 | 31,4 | 10,9 | 9,59 | 8,26 |
21 | 38,9 | 35,5 | 32,7 | 11,6 | 10,3 | 8,9 |
22 | 40,3 | 36,8 | 33,9 | 12,3 | 11 | 9,54 |
23 | 41,6 | 38,1 | 35,2 | 13,1 | 11,7 | |
24 | 43 | 39,4 | 36,4 | 13,8 | 12,4 | 10,9 |
25 | 44,3 | 40,6 | 37,7 | 14,6 | 13,1 | 11,5 |
26 | 45,6 | 41,9 | 38,9 | 15,4 | 13,8 | 12,2 |
27 | 47 | 43,2 | 40,1 | 16,2 | 14,6 | 12,9 |
28 | 48,3 | 44,5 | 41,3 | 16,9 | 15,3 | 13,6 |
29 | 49,6 | 45,7 | 42,6 | 17,7 | 16 | 14,3 |
30 | 50,9 | 47 | 43,8 | 18,5 | 16,8 | 15 |
ГОСТы, СНиПы Карта сайта TehTab.ru Поиск по сайту TehTab.ru | Навигация по справочнику TehTab.ru: главная страница / / Техническая информация/ / Математический справочник/ / Теория вероятностей и статистика / / Хи квадрат-распределение. Распределение Пирсона. Квантили хи-квадрат распределения
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Нашли ошибку? Есть дополнения? Напишите нам об этом, указав ссылку на страницу. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
TehTab.ru Реклама, сотрудничество: [email protected] | Обращаем ваше внимание на то, что данный интернет-сайт носит исключительно информационный характер. Информация, представленная на сайте, не является официальной и предоставлена только в целях ознакомления. Все риски за использование информаци с сайта посетители берут на себя. Проект TehTab.ru является некоммерческим, не поддерживается никакими политическими партиями и иностранными организациями. |
: Вероятности хи-квадрата Таблица
: Вероятности хи-квадратаОбласти, указанные вверху, — это области справа от критического значения. Чтобы найти область слева, вычтите его из единицы, а затем посмотрите вверх (т. е. 0,05 слева равно 0,95 справа). справа)
дф | 0,995 | 0,99 | 0,975 | 0,95 | 0,90 | 0,10 | 0,05 | 0,025 | 0,01 | 0,005 |
---|---|---|---|---|---|---|---|---|---|---|
1 | — | — | 0,001 | 0,004 | 0,016 | 2,706 | 3,841 | 5.024 | 6,635 | 7,879 |
2 | 0,010 | 0,020 | 0,051 | 0,103 | 0,211 | 4,605 | 5,991 | 7,378 | 9.210 | 10,597 |
3 | 0,072 | 0,115 | 0,216 | 0,352 | 0,584 | 6.251 | 7,815 | 9,348 | 11.345 | 12.838 |
4 | 0,207 | 0,297 | 0,484 | 0,711 | 1,064 | 7,779 | 9,488 | 11. 143 | 13.277 | 14.860 |
5 | 0,412 | 0,554 | 0,831 | 1,145 | 1,610 | 9.236 | 11.070 | 12.833 | 15.086 | 16.750 |
6 | 0,676 | 0,872 | 1,237 | 1,635 | 2,204 | 10,645 | 12.592 | 14.449 | 16.812 | 18.548 |
7 | 0,989 | 1,239 | 1,690 | 2,167 | 2,833 | 12.017 | 14.067 | 16.013 | 18.475 | 20,278 |
8 | 1,344 | 1,646 | 2,180 | 2,733 | 3,490 | 13.362 | 15.507 | 17.535 | 20.090 | 21.955 |
9 | 1,735 | 2,088 | 2.700 | 3,325 | 4,168 | 14. 684 | 16.919 | 19.023 | 21.666 | 23.589 |
10 | 2,156 | 2,558 | 3,247 | 3,940 | 4,865 | 15,987 | 18.307 | 20.483 | 23.209 | 25.188 |
11 | 2,603 | 3,053 | 3,816 | 4,575 | 5,578 | 17.275 | 19.675 | 21.920 | 24.725 | 26.757 |
12 | 3,074 | 3,571 | 4.404 | 5,226 | 6.304 | 18.549 | 21.026 | 23.337 | 26.217 | 28.300 |
13 | 3,565 | 4.107 | 5.009 | 5,892 | 7.042 | 19.812 | 22.362 | 24.736 | 27.688 | 29.819 |
14 | 4.075 | 4,660 | 5,629 | 6,571 | 7,790 | 21. 064 | 23.685 | 26.119 | 29.141 | 31.319 |
15 | 4.601 | 5.229 | 6,262 | 7,261 | 8,547 | 22.307 | 24,996 | 27.488 | 30,578 | 32.801 |
16 | 5.142 | 5,812 | 6.908 | 7,962 | 9.312 | 23.542 | 26.296 | 28.845 | 32.000 | 34,267 |
17 | 5,697 | 6.408 | 7,564 | 8,672 | 10.085 | 24.769 | 27.587 | 30.191 | 33.409 | 35,718 |
18 | 6,265 | 7.015 | 8.231 | 9.390 | 10,865 | 25,989 | 28.869 | 31,526 | 34.805 | 37,156 |
19 | 6,844 | 7,633 | 8. 907 | 10.117 | 11.651 | 27.204 | 30.144 | 32.852 | 36.191 | 38,582 |
20 | 7,434 | 8.260 | 9,591 | 10.851 | 12.443 | 28.412 | 31.410 | 34.170 | 37,566 | 39,997 |
21 | 8.034 | 8.897 | 10.283 | 11.591 | 13.240 | 29.615 | 32.671 | 35.479 | 38,932 | 41.401 |
22 | 8,643 | 9,542 | 10,982 | 12.338 | 14.041 | 30.813 | 33,924 | 36.781 | 40.289 | 42.796 |
23 | 9.260 | 10,196 | 11.689 | 13.091 | 14.848 | 32.007 | 35,172 | 38.076 | 41,638 | 44.181 |
24 | 9,886 | 10. 856 | 12.401 | 13.848 | 15.659 | 33.196 | 36.415 | 39,364 | 42,980 | 45,559 |
25 | 10,520 | 11.524 | 13.120 | 14.611 | 16.473 | 34.382 | 37,652 | 40.646 | 44.314 | 46,928 |
26 | 11.160 | 12.198 | 13.844 | 15.379 | 17.292 | 35,563 | 38.885 | 41,923 | 45.642 | 48.290 |
27 | 11.808 | 12.879 | 14.573 | 16.151 | 18.114 | 36.741 | 40.113 | 43,195 | 46,963 | 49,645 |
28 | 12.461 | 13,565 | 15.308 | 16,928 | 18,939 | 37.916 | 41.337 | 44.461 | 48.278 | 50,993 |
29 | 13. 121 | 14.256 | 16.047 | 17.708 | 19.768 | 39.087 | 42,557 | 45.722 | 49,588 | 52,336 |
30 | 13.787 | 14,953 | 16.791 | 18.493 | 20.599 | 40.256 | 43.773 | 46,979 | 50.892 | 53,672 |
40 | 20.707 | 22.164 | 24.433 | 26.509 | 29.051 | 51.805 | 55,758 | 59.342 | 63,691 | 66,766 |
50 | 27,991 | 29.707 | 32.357 | 34.764 | 37.689 | 63,167 | 67,505 | 71.420 | 76,154 | 79.490 |
60 | 35,534 | 37.485 | 40.482 | 43,188 | 46.459 | 74,397 | 79.082 | 83,298 | 88. 379 | 91,952 |
70 | 43,275 | 45.442 | 48.758 | 51,739 | 55,329 | 85,527 | 90.531 | 95.023 | 100.425 | 104.215 |
80 | 51.172 | 53,540 | 57,153 | 60.391 | 64,278 | 96,578 | 101.879 | 106.629 | 112.329 | 116.321 |
90 | 59,196 | 61,754 | 65,647 | 69,126 | 73.291 | 107,565 | 113,145 | 118,136 | 124,116 | 128,299 |
100 | 67,328 | 70.065 | 74.222 | 77,929 | 82,358 | 118.498 | 124,342 | 129,561 | 135.807 | 140,169 |
Содержание
1.3.6.7.4. Критические значения распределения хи-квадрат
1. 3.6.7.4. Критические значения хи-квадрата Распределение 1.
Исследовательский анализ данных 1.3. Методы ЭДА 1.3.6. Распределения вероятностей 1.3.6.7. Таблицы распределения вероятностей
| |||
Как использовать эту таблицу | Эта таблица содержит критические значения
распределение хи-квадрат. Из-за
отсутствие симметрии распределения хи-квадрат, отдельные таблицы
предусмотрены верхний и нижний хвосты распределения. Тестовая статистика с ν степенями свободы вычисляется из данные. Для односторонних тестов с верхним хвостом статистика теста сравнивается с значение из таблицы верхних критических значений. Для двустороннего тесты, статистика теста сравнивается со значениями из таблицы для критические значения верхнего хвоста и таблица критических значений нижнего хвоста ценности. Уровень значимости α показан на графике ниже показано распределение хи-квадрат с 3 степенями свободы для двусторонний тест на уровне значимости α = 0,05. Если тест статистика больше, чем критическое значение верхнего хвоста или меньше, чем критическое значение нижнего хвоста, мы отвергаем нулевую гипотезу. Специфический инструкции приведены ниже. Учитывая указанное значение α :
|
Верхние критические значения распределения хи-квадрат с ν степенями свободы Вероятность меньше критического значения ν 0,90 0,95 0,975 0,99 0,999 Критические значения нижнего хвоста распределения хи-квадрат с ν степень свободы Вероятность меньше критического значения ν 0,10 0,05 0,025 0,01 0,001 |
Хи-квадрат (Χ²) Таблица | Примеры и загружаемая таблица
Опубликован в 31 мая 2022 г. по Шон Терни. Отредактировано 9 июля 2022 г.
Таблица распределения хи-квадрата (Χ 2 ) представляет собой справочную таблицу, в которой перечислены критические значения хи-квадрата . Критическое значение хи-квадрат представляет собой порог статистической значимости для определенных проверок гипотез и определяет доверительные интервалы для определенных параметров.
Критические значения хи-квадрата рассчитываются из распределений хи-квадрат. Их трудно рассчитать вручную, поэтому большинство людей вместо этого используют справочную таблицу или статистическое программное обеспечение.
Скачать таблицу хи-квадрат (PDF)
Содержание
- Когда использовать таблицу распределения хи-квадрат
- Таблица распределения хи-квадрат (правосторонние вероятности)
- Как пользоваться таблицей
- Левосторонние и двусторонние вероятности
- Практические вопросы
- Часто задаваемые вопросы о таблицах хи-квадрат
Когда использовать таблицу распределения хи-квадрат
Вам понадобится критическое значение хи-квадрат, если вы хотите:
- Расчет доверительного интервала для дисперсии генеральной совокупности или стандартного отклонения
- Проверить, равна ли дисперсия или стандартное отклонение совокупности определенному значению (проверка одной дисперсии)
- Проверить, отличается ли частотное распределение категориальной переменной от ваших ожиданий (критерий согласия хи-квадрат)
- Проверить, связаны ли две категориальные переменные друг с другом (критерий независимости хи-квадрат)
- Проверка равенства пропорций двух тесно связанных переменных (критерий Макнемара)
Таблица распределения хи-квадрат (правосторонние вероятности)
Используйте приведенную ниже таблицу, чтобы найти критическое значение хи-квадрат для теста хи-квадрат или доверительного интервала, или загрузите таблицу распределения хи-квадрат (PDF).
В таблице представлены вероятности правого хвоста. Если вам нужны вероятности левого хвоста, вам нужно будет сделать небольшой дополнительный расчет.
Как пользоваться столом
Чтобы найти критическое значение хи-квадрат для проверки гипотезы или доверительного интервала, выполните следующие три шага.
Пример: исследование хи-квадрата. Представьте, что служба безопасности большого офисного здания устанавливает камеры видеонаблюдения на четырех входах в здание. Чтобы помочь им решить, где установить камеры, они хотят знать, как часто используется каждый вход. Они случайным образом выбирают 500 человек внутри здания и спрашивают их, через какой вход они вошли в здание.Команда хочет использовать критерий согласия хи-квадрат для проверки нулевой гипотезы ( H 0 ) о том, что четыре входа одинаково часто используются населением.
Чтобы узнать, следует ли отклонить нулевую гипотезу, им необходимо сравнить хи-квадрат Пирсона выборки с соответствующим критическим значением хи-квадрат.
Шаг 1. Расчет степеней свободы
Существует не одно распределение хи-квадрат — их много, и их формы различаются в зависимости от параметра, называемого «степенями свободы» (также называемого 9).1077 df или к ). Каждая строка таблицы распределения хи-квадрат представляет собой распределение хи-квадрат с различными df.
Вам необходимо использовать распределение с правильным df для вашего теста или доверительного интервала. В таблице ниже приведены уравнения для расчета df для нескольких распространенных процедур:
Тест или процедура | Степени свободы ( df ) уравнение |
---|---|
Проверка одной дисперсии Доверительный интервал для дисперсии или стандартного отклонения | df = объем выборки − 1 |
Хи-квадрат критерия согласия | df = количество групп − 1 |
Критерий независимости хи-квадрат | df = (количество групп переменных 1 — 1) * (количество групп переменных 2 — 1) |
Тест Макнемара | дф = 1 |
df = количество групп − 1
df = 4 − 1
df = 3
Шаг 2: Выберите уровень значимости
В столбцах таблицы распределения хи-квадрат указан уровень значимости критического значения. По соглашению уровень значимости (α) почти всегда равен 0,05, поэтому столбец для 0,05 выделен в таблице.
В редких случаях вы можете увеличить α, чтобы уменьшить частоту ошибок типа II, или уменьшить α, чтобы уменьшить частоту ошибок типа I.
Чтобы рассчитать доверительный интервал, выберите уровень значимости на основе желаемого уровня достоверности:
α = 1 − уровень достоверности
Наиболее распространенный доверительный уровень составляет 95% (0,95), что соответствует α = 0,05.
Пример: выбор уровня значимости Группа безопасности следует соглашению, выбирая уровень значимости 0,05.Шаг 3: Найдите критическое значение в таблице
Теперь у вас есть два числа, необходимые для нахождения критического значения в таблице распределения хи-квадрат:
- Степени свободы ( df ) перечислены в левой части таблицы. Найдите строку таблицы, соответствующую вычисленным вами степеням свободы.
- Уровни значимости (α) перечислены вверху таблицы. Найдите столбец, соответствующий выбранному вами уровню значимости.
- Ячейка таблицы, где встречаются строка и столбец, является вашим критическим значением.
Команда безопасности теперь может сравнить это критическое значение хи-квадрата с хи-квадратом Пирсона, рассчитанным для их выборки. Если критическое значение больше, чем хи-квадрат выборки, они могут отклонить нулевую гипотезу.
Левосторонние и двусторонние вероятности
В приведенной здесь таблице указаны вероятности правого хвоста. Вы должны использовать эту таблицу для большинства тестов хи-квадрат, включая критерий согласия хи-квадрат соответствия и критерий независимости хи-квадрат, а также критерий Макнемара.
Если вы хотите выполнить двусторонний или левосторонний тест, вам нужно будет сделать небольшой дополнительный расчет.
Левосторонние тесты
Наиболее распространенный левосторонний тест — это тест одной дисперсии при определении того, равна ли дисперсия совокупности или стандартное отклонение меньше, чем определенное значение.
Чтобы найти критическое значение левосторонней вероятности в приведенной выше таблице, просто используйте столбец таблицы для 1 − α.
Пример: левосторонний тестПредставьте, что вы подрабатываете печеньем в пекарне. Владелец пекарни говорит вам, что их печенье обычно различается по размеру со стандартным отклонением всего в 0,2 дюйма в диаметре.Вы гордитесь тем, что делаете все файлы cookie одинакового размера, поэтому решаете случайным образом отобрать 25 файлов cookie, чтобы проверить, не превышает ли их стандартное отклонение 0,2 дюйма.
Это левосторонний тест, потому что вы хотите знать, меньше ли стандартное отклонение определенного значения. Вы ищете левостороннюю вероятность в правосторонней таблице, вычитая единицу из вашего уровня значимости: 1 — α = 1 — 0,05 = 0,95.
Критическое значение для df = 25 − 1 = 24 и α = 0,95 равно 13,848.
Если хи-квадрат вашей выборки больше этого критического значения, вы можете отклонить нулевую гипотезу о том, что ваши файлы cookie имеют стандартное отклонение в 0,2 дюйма в диаметре.
Двусторонние тесты
Наиболее распространенный левосторонний тест — это тест одной дисперсии при определении того, равна ли дисперсия или стандартное отклонение генеральной совокупности определенному значению.
Двусторонний тест имеет два критических значения. Чтобы найти критические значения, используйте столбцы таблицы для
и . Пример: двусторонний тест. Производитель детской одежды хочет спроектировать свои детские шапочки таким образом, чтобы они подходили любому шестимесячному ребенку с точностью до двух стандартных отклонений от среднего диаметра головы.Они находят в медицинском учебнике, что стандартное отклонение диаметра головы шестимесячных младенцев составляет 1 дюйм, но хотят сами подтвердить это число. Они случайным образом выбирают 20 шестимесячных младенцев и измеряют их головы.
Это двусторонний тест, потому что они хотят знать, равно ли стандартное отклонение определенному значению. Они должны искать два критических значения в столбцах для:
- и
Критическое значение для df = 20 — 1 = 19 и α = 0,025 равно 32,852. Критическое значение для df = 19 и α = 0,975 равно 8,907.
Если хи-квадрат их выборки не находится между этими двумя критическими значениями, компания по производству одежды может отвергнуть нулевую гипотезу о том, что стандартное отклонение диаметра головы составляет 1 дюйм.
Практические вопросы
на базе Typeform
Часто задаваемые вопросы о таблицах хи-квадрат
Вы можете использовать функцию qchisq() , чтобы найти критическое значение хи-квадрат в R.
Например, чтобы вычислить критическое значение хи-квадрат для теста с df = 22 и α = 0,05:
qchisq(p = 0,05, df = 22, нижний.хвост = ЛОЖЬ)
Вы можете использовать функцию CHISQ.INV.RT() , чтобы найти критическое значение хи-квадрат в Excel.
Например, чтобы вычислить критическое значение хи-квадрат для теста с df = 22 и α = 0,05, щелкните любую пустую ячейку и введите:
Источники в этой статье
Мы настоятельно рекомендуем учащимся использовать источники в своей работе.