U критерий Манна-Уитни
Критерий Манна-Уитни представляет непараметрическую альтернативу t-критерия для независимых выборок. Преимущество его состоит в том, что мы отказываемся от предположения нормальности распределения и одинаковых дисперсий. Необходимо, чтобы данные были измерены как минимум в порядковой шкале.
STATISTICA предполагает, что данные расположены тем же образом, что в и t-критерии для независимых выборок. Файл должен содержать кодовую (независимую) переменную, имеющую, по крайней мере, два разных кода для однозначной идентификации принадлежности каждого наблюдения к определенной группе.
Предположения и интерпретация. Критерий Манна-Уитни предполагает, что рассматриваемые переменные измерены, по крайней мере, в порядковой шкале (ранжированы). Интерпретация теста по существу похожа на интерпретацию результатов t-критерия для независимых выборок, за исключением того, что U критерий вычисляется, как сумма индикаторов попарного сравнения элементов первой выборки с элементами второй выборки. U критерий — наиболее мощная (чувствительная) непараметрическая альтернатива t-критерия для независимых выборок; фактически, в некоторых случаях он имеет даже большую мощность, чем t-критерий.
Если объем выборки больше 20, то распределение выборки для U статистики быстро сходится к нормальному распределению (см. Siegel, 1956). Поэтому вместе с U статистикой будут показаны z значение (для нормального распределения и соответствующее p-значение.
Точные вероятности для малых выборок. Для выборок малого объема STATISTICA вычислит точную вероятность, связанную с соответствующей U статистикой. Эта вероятность основана на подсчете всех возможных значений U при заданном количестве наблюдений в двух выборках (см. Dinneen & Blakesley, 1973). Программа сообщит (в последнем столбце таблицы результатов) значение 2 * p, где p равно 1 минус кумулятивная (односторонняя) вероятность соответствующей U статистики. Заметим, что это обычно не приводит к большой недооценке статистической значимости соответствующих эффектов (см. Siegel, 1956).
Статистика критерия выглядит следующим образом.
где W — статистика Вилкоксона, предназначенная для проверки этой же гипотезы
если
в противном случае
Таким образом, статистика U считает общее число тех случаев, в которых элементы второй выборки превосходят элементы первой выборки. Если гипотеза верна, то
Критерий Манна-Уитни предполагает, что рассматриваемые переменные измерены, по крайней мере, в порядковой шкале (ранжированы). Интерпретация теста по существу похожа на интерпретацию результатов t-критерия для независимых выборок, за исключением того, что U критерий вычисляется, как сумма индикаторов попарного сравнения элементов первой выборки с элементами второй выборки. U критерий — наиболее мощная (чувствительная) непараметрическая альтернатива t-критерия для независимых выборок; фактически, в некоторых случаях он имеет даже большую мощность, чем t-критерий.
Если объем выборки больше 20, то распределение выборки для U статистики быстро сходится к нормальному распределению. Поэтому, вместе с U статистикой, будут показано z значение (для нормального распределения) и соответствующее p-значение.
Подробные инструкции по поводу того, как использовать критерий, вы можете найти дальше в части, касающейся примера применения.
Пример
Проверим гипотезу о принадлежности сравниваемых независимых выборок к одной и той же генеральной совокупности с помощью непараметрического U-критерия Манна-Уитни. Сравним результаты, полученные в примере Основные статистики и t-критерий Стьюдента для 2-го и 3-го столбцов таблицы по критерию Стьюдента, с результатами непараметрического сравнения.
Для расчета U-критерия Уилкоксона расположим варианты сравниваемых выборок в порядке возрастания в один обобщенный ряд и присвоим вариантам обобщенного ряда ранги от 1 до n1 + n2. Первая строка представляет собой варианты первой выборки, вторая — второй выборки, третья — соответствующие ранги в обобщенном ряду:
6 |
7 |
7 |
8 |
8 |
|
9 |
9 |
9 |
|
|
10 |
11 |
|
|
|
|
|
|
|
|
|
|
|
|
8 |
|
|
|
9 |
9 |
|
|
11 |
11 |
12 |
12 |
12 |
13 |
13 |
1 |
2,5 |
2,5 |
5 |
5 |
5 |
9 |
9 |
9 |
9 |
9 |
12 |
14 |
14 |
14 |
17 |
17 |
17 |
19,5 |
19,5 |
Надо обратить внимание, что если имеются одинаковые варианты, им присваивается средний ранг, однако значение последнего ранга должно быть равно n1 + n2 (в нашем случае 20).
Это правило используют для проверки правильности ранжирования.Отдельно для каждой выборки рассчитываем суммы рангов их вариант R1 и R2. В нашем случае:
R1 = 1 + 2,5 + 2,5 + 5 + 5 + 9 + 9 + 9 + 12 + 14 = 69
R2 = 5 + 9 + 9 + 14 + 14 + 17 + 17 +17 + 19,5 + 19,5 = 141
Для проверки правильности вычислений можно воспользоваться другим правилом: R1 + R2 = 0,5 * (n1 + n2) * (n1 + n2 + 1). В нашем случае R1 + R2 = 210.
Статистика U1 = 69 — 10*11/2 = 14; U2 = 141 — 10*11/2 = 86.
Для проверки одностороннего критерия выбираем минимальную статистику U1 = 14 и сравниваем ее с критическим значением для n1 = n2 = 10 и уровня значимости 1%, равным 19.
Так как вычисленное значение критерия меньше табличного, нулевая гипотеза отвергается на выбранном уровне значимости, и различия между выборками признаются статистически значимыми. Таким образом, вывод о существовании различий, сделанный с помощью параметрического критерия Cтьюдента, подтверждается с помощью данного непараметрического метода.
Связанные определения:
Непараметрические статистические методы
Свободный от распределения критерий
В начало
Содержание портала
Пример расчета критерия U Манна-Уитни
Допустим мы хотим сравнить уровень интеллекта детей в 7 «а» и 7 «б» классе средней общеобразовательной школы. Для сравнения двух выборок между собой воспользуемся критерием U Манна-Уитни.
Шаг 1. Занесем значения в таблицу.
7 «а» | 7 «б» | ||
ФИО Испытуемого | Баллы IQ | ФИО Испытуемого | Баллы IQ |
КТИ | 112 | БРИ | 121 |
ВСИ | 105 | ДРО | 120 |
МНИ | 109 | РНА | 134 |
АНМ | 90 | ВРА | 119 |
УРА | 130 | ГРА | 115 |
ВФЫ | 117 | ДЖА | 106 |
РКИ | 117 | ВЦК | 107 |
ТРИ | 125 | ЮЕР | 101 |
ТРК | 134 | ЖЕН | 97 |
ТНК | 109 | КОР | 117 |
Шаг 2. Расположим все значения в один ряд (2.1) и проранжируем их (2.2).
ФИО Испытуемого | Баллы IQ (2.1) | Ранг (2.2) |
РНА | 134 | (1+2)/2=1,5 |
ТРК | ||
УРА | 130 | 3 |
ТРИ | 125 | 4 |
БРИ | 121 | 5 |
ДРО | 120 | 6 |
ВРА | 119 | 7 |
ВФЫ | 117 | (8+9+10)/3=9 |
РКИ | ||
КОР | ||
ГРА | 115 | 11 |
КТИ | 112 | 12 |
ТНК | 109 | (13+14)/2=13,5 |
МНИ | ||
ВЦК | 107 | 15 |
ДЖА | 106 | 16 |
ВСИ | 105 | 17 |
ЮЕР | 101 | 18 |
ЖЕН | 97 | 19 |
АНМ | 90 | 20 |
Шаг 3.
Ранги 7 «а» = 1,5+3+4+9+9+12+13,5+13,5+17+20 = 102,5
Ранги 7 «б» = 1,5+5+6+7+9+11+15+16+18+19 = 107,5
Шаг 4. определить какая из ранговых сумм бОльшая.
Ранг 7 «а»< Ранг 7 «б» => ранговая сумма 7″б» больше
Шаг 5. Определить эмпирические значения критерия U Манна-Уитни по формуле:
,где — количество испытуемых в 1 группе; — количество испытуемых во 2 группе; — большая из двух ранговых сумм; — количество испытуемых в группе с бОльшей ранговой суммой.
Шаг 6. По таблице определить критические значения критерия U Манна-Уитни.
Шаг 7. Сравнить критические значения с эмпирическими.
23<47,5 <
Шаг 8. Сделать выводы.
Расчет критерия U-Манна-Уитни | |
Расчет критерия U-Манна-Уитни в SPSS | Пример расчета критерия U-Манна-Уитни в SPSS |
Расчет критерия U-Манна-Уитни в Excell | Пример расчета критерия U-Манна-Уитни в Excell |
Непараметрический критерий U-Манна-Уитни |
U-тест Манна-Уитни: определение, как выполнять в SPSS
Определения статистики >
Содержание:
- Что такое тест Манна-Уитни?
- Нулевая гипотеза
- Прямой метод
- Предположения
- Как запустить тест Манна-Уитни в SPSS (видео)
U-критерий Манна-Уитни является непараметрическим эквивалентом двухвыборочного t-критерия. В то время как t-критерий делает предположение о распределении населения (т. е. что выборка получена из t-распределенного населения), U-критерий Манна-Уитни не делает такого предположения.
Тест сравнивает две совокупности. Нулевая гипотеза для теста состоит в том, что вероятность составляет 50 % того, что случайно выбранный член первой популяции превзойдет член второй популяции.
Другой вариант нулевой гипотезы состоит в том, что две выборки взяты из одной и той же совокупности (т. е. обе имеют одинаковую медиану).
Результатом выполнения U-теста Манна-Уитни является U-статистика. Для небольших выборок используйте прямой метод (см. ниже), чтобы найти статистику U; Для больших выборок необходима формула. Или вы можете использовать такие технологии, как SPSS, для запуска теста.
Любая из этих двух формул подходит для U-теста Манна-Уитни. R — сумма рангов в выборке, а n — количество элементов в выборке.
Этот метод ограничен только количеством вычислений, которые вы хотите выполнить. Чем больше выборка, тем сложнее математика:
- Назовите выборку с меньшими рангами «выборкой 1», а выборку с большими рангами «выборкой 2». Выбор выборки с меньшими рангами в качестве «выборки 1» не является обязательным, но это упрощает вычисления.
- Возьмите первое наблюдение в выборке 1. Подсчитайте, сколько наблюдений в выборке 2 меньше его. Если наблюдения равны, считайте это за половину. Например, если у вас есть десять меньше и два равных: 10 + 2 (1/2) = 11,
- Повторите шаг 2 для всех наблюдений в образце 1.
- Сложите все свои итоги из шагов 2 и 3. Это статистика U.
- Зависимая переменная должна измеряться в порядковой или непрерывной шкале.
- Независимая переменная должна быть двумя независимыми категориальными группами.
- Наблюдения должны быть независимыми. Другими словами, не должно быть никаких отношений между двумя группами или внутри каждой группы.
- Наблюдения не распределены нормально. Однако они должны иметь одинаковую форму (т. е. оба имеют форму колокола и скошены влево).
Посмотрите видео с инструкциями:
Как запустить U-тест Манна-Уитни в SPSS
Посмотрите это видео на YouTube.
Видео не видно? Кликните сюда.
УКАЗЫВАЙТЕ ЭТО КАК:
Стефани Глен . U-тест Манна-Уитни: определение, как работать в SPSS https://www.statisticshowto.com/mann-whitney-u-test/
————————————————— ————————-
Нужна помощь с домашним заданием или контрольным вопросом? С Chegg Study вы можете получить пошаговые ответы на ваши вопросы от эксперта в данной области. Ваши первые 30 минут с репетитором Chegg бесплатны!
Комментарии? Нужно опубликовать исправление? Пожалуйста, Свяжитесь с нами .
U-критерий Манна-Уитни: предположения и пример
Что такое U-критерий Манна-Уитни?U-критерий Манна-Уитни, также известный как критерий суммы рангов Уилкоксона, представляет собой непараметрический статистический критерий, используемый для сравнения двух выборок или групп.
U-критерий Манна-Уитни оценивает вероятность того, что две выбранные группы будут происходить из одной и той же совокупности, и по существу задает вопросы; имеют ли эти две популяции одинаковую форму в отношении их данных? Другими словами, нам нужны доказательства того, взяты ли группы из совокупностей с разными уровнями интересующей нас переменной. Отсюда следует, что гипотезы U-критерия Манна-Уитни таковы:
- Нулевая гипотеза (H0) состоит в том, что две совокупности равны.
- Альтернативная гипотеза (h2) заключается в том, что две совокупности не равны.
Некоторые исследователи интерпретируют это как сравнение медианы между двумя популяциями (напротив, параметрические тесты сравнивают средние между двумя независимыми группами). В определенных ситуациях, когда данные имеют одинаковую форму (см. предположения), это справедливо, но следует отметить, что медианы фактически не участвуют в расчете статистики U-критерия Манна-Уитни. Две группы могут иметь одинаковую медиану и значительно различаться по U-критерию Манна-Уитни.
Когда использовать U-критерий Манна-УитниНепараметрические тесты (иногда называемые «тестами без распределения») используются, когда вы предполагаете, что данные в интересующей вас совокупности не имеют нормального распределения. Вы можете рассматривать U-критерий Манна-Уитни как аналог непарного t-критерия Стьюдента, который вы использовали бы, предполагая, что ваши две совокупности нормально распределены, как определено их средними значениями и стандартным отклонением (параметрами распределений).
Рис. 1. Нормальное и асимметричное распределение
U-критерий Манна-Уитни — это распространенный статистический тест, который используется во многих областях, включая экономику, биологические науки и эпидемиологию. Это особенно полезно, когда вы оцениваете разницу между двумя независимыми группами с небольшим количеством людей в каждой группе (обычно менее 30), которые обычно не распределены и где данные непрерывны. Если вы заинтересованы в сравнении более чем двух групп с искаженными данными, следует использовать однофакторный дисперсионный анализ Краскела-Уоллиса (ANOVA).
Предположения U-критерия Манна-Уитни
Некоторые ключевые допущения для U-критерия Манна-Уитни подробно описаны ниже: – например, возраст, вес, рост или частота сердечных сокращений). Это связано с тем, что тест основан на ранжировании наблюдений в каждой группе.
Рассмотрим рандомизированное контролируемое исследование по оценке нового антиретровирусного препарата для лечения ВИЧ. В пилотном испытании участников случайным образом распределяли либо в группы, получавшие лечение, либо в группы, не получавшие лечения (N = 14). Мы хотим оценить вирусную нагрузку (количество вируса на миллилитр крови) в группах, получавших лечение, по сравнению с группами, не получавшими лечения. На практике U-критерий Манна-Уитни можно легко и быстро рассчитать с помощью статистического программного обеспечения, такого как SPSS или Stata, но шаги изложены ниже.
The data are shown below:
Treated | 540 | 670 | 1000 | 960 | 1200 | 4650 | 4200 |
Untreated | 5000 | 4200 | 1300 | 900 | 7400 | 4500 | 7500 |
Эти данные искажены при размере выборки, равном n=7 в каждой группе лечения. Прежде чем рассчитать тест, мы выбираем уровень значимости (обычно α=0,05). Первым шагом является присвоение рангов значениям из полной выборки (обе группы лечения объединены вместе) в порядке от наименьшего к наибольшему. Затем мы можем сгенерировать тестовую статистику на основе рангов.
В приведенной ниже таблице показаны значения вирусной нагрузки в группах, получавших и не получавших лечения, в порядке от наименьшего к наибольшему, а также суммарные ранги каждой группы:
Вирусная нагрузка (леченные) | Вирусная нагрузка (нелеченные) | Rank (Treated) | Rank (Untreated) |
540 | | 1 | |
670 | | 2 | |
| 900 | | 3 |
960 | | 4 | |
1000 | | 5 | |
1200 | | 6 | |
| 1300 | | 7 |
4200 | | 8 | |
| 4500 | | 9 |
4650 | | 10 | |
| 5000 | | 11 |
| 6100 | | 12 |
| 7400 | | 13 |
| 7500 | | 14 |
| | R 1 =36 | R 2 =69 |
After summing the рангов для каждой группы, статистика критерия U Манна-Уитни выбирается как наименьшее из двух следующих вычисленных значений U: ), где n1 и n2 — количество участников, а R1 и R2 — суммы рангов в группах леченных и нелеченных соответственно. В этом примере U1=41 и U2=8. Поэтому мы выбираем U=8 в качестве тестовой статистики.
Нормальная аппроксимация
Существуют ситуации, когда размер выборки может быть слишком большим для использования справочной таблицы для расчета точного распределения вероятностей — в этом случае вместо этого мы можем использовать Нормальную аппроксимацию. Поскольку U находится путем сложения независимых, одинаково распределенных случайных выборок, центральная предельная теорема применяется, когда выборка большая (обычно> 20 в каждой группе). Стандартное отклонение суммы рангов можно использовать для создания z-статистики и значения значимости, сгенерированного таким образом. Если нулевая гипотеза верна, распределение U приближается к нормальному распределению.
Затем мы определяем «критическое значение» U, с которым можно сравнить нашу расчетную тестовую статистику, что мы можем сделать, используя справочную таблицу критических значений и используя наши размеры выборки (n = 7 в обеих группах) и двусторонний анализ.