Разное

Манна уитни метод: U критерий Манна-Уитни

U критерий Манна-Уитни

Критерий Манна-Уитни представляет непараметрическую альтернативу t-критерия для независимых выборок. Преимущество его состоит в том, что мы отказываемся от предположения нормальности распределения и одинаковых дисперсий. Необходимо, чтобы данные были измерены как минимум в порядковой шкале.

STATISTICA предполагает, что данные расположены тем же образом, что в и t-критерии для независимых выборок. Файл должен содержать кодовую (независимую) переменную, имеющую, по крайней мере, два разных кода для однозначной идентификации принадлежности каждого наблюдения к определенной группе.

Предположения и интерпретация. Критерий Манна-Уитни предполагает, что рассматриваемые переменные измерены, по крайней мере, в порядковой шкале (ранжированы). Интерпретация теста по существу похожа на интерпретацию результатов t-критерия для независимых выборок, за исключением того, что U критерий вычисляется, как сумма индикаторов попарного сравнения элементов первой выборки с элементами второй выборки. U критерий — наиболее мощная (чувствительная) непараметрическая альтернатива t-критерия для независимых выборок; фактически, в некоторых случаях он имеет даже большую мощность, чем t-критерий.

Если объем выборки больше 20, то распределение выборки для U статистики быстро сходится к нормальному распределению (см. Siegel, 1956). Поэтому вместе с U статистикой будут показаны z значение (для нормального распределения и соответствующее p-значение.

Точные вероятности для малых выборок. Для выборок малого объема STATISTICA вычислит точную вероятность, связанную с соответствующей U статистикой. Эта вероятность основана на подсчете всех возможных значений U при заданном количестве наблюдений в двух выборках (см. Dinneen & Blakesley, 1973). Программа сообщит (в последнем столбце таблицы результатов) значение 2 * p, где p равно 1 минус кумулятивная (односторонняя) вероятность соответствующей U статистики. Заметим, что это обычно не приводит к большой недооценке статистической значимости соответствующих эффектов (см. Siegel, 1956).

Статистика критерия выглядит следующим образом.

где W — статистика Вилкоксона, предназначенная для проверки этой же гипотезы 

 если 

в противном случае

Таким образом, статистика U считает общее число тех случаев, в которых элементы второй выборки превосходят элементы первой выборки. Если гипотеза  верна, то

Критерий Манна-Уитни предполагает, что рассматриваемые переменные измерены, по крайней мере, в порядковой шкале (ранжированы). Интерпретация теста по существу похожа на интерпретацию результатов t-критерия для независимых выборок, за исключением того, что U критерий вычисляется, как сумма индикаторов попарного сравнения элементов первой выборки с элементами второй выборки. U критерий — наиболее мощная (чувствительная) непараметрическая альтернатива t-критерия для независимых выборок; фактически, в некоторых случаях он имеет даже большую мощность, чем t-критерий.

Если объем выборки больше 20, то распределение выборки для U статистики быстро сходится к нормальному распределению. Поэтому, вместе с U статистикой, будут показано z значение (для нормального распределения) и соответствующее p-значение.

Подробные инструкции по поводу того, как использовать критерий, вы можете найти дальше в части, касающейся примера применения. 

Пример

Проверим гипотезу о принадлежности сравниваемых независимых выборок к одной и той же генеральной совокупности с помощью непараметрического U-критерия Манна-Уитни. Сравним результаты, полученные в примере Основные статистики и t-критерий Стьюдента для 2-го и 3-го столбцов таблицы по критерию Стьюдента, с результатами непараметрического сравнения.

Для расчета U-критерия Уилкоксона расположим варианты сравниваемых выборок в порядке возрастания в один обобщенный ряд и присвоим вариантам обобщенного ряда ранги от 1 до n1 + n2. Первая строка представляет собой варианты первой выборки, вторая — второй выборки, третья — соответствующие ранги в обобщенном ряду:

6

7

7

8

8

 


9

9

9

 


 


10

11

 


 


 


 


 


 


 


 


 


 


 


 


8

 


 


 


9

9

 


 


11

11

12

12

12

13

13

1

2,5

2,5

5

5

5

9

9

9

9

9

12

14

14

14

17

17

17

19,5

19,5

Надо обратить внимание, что если имеются одинаковые варианты, им присваивается средний ранг, однако значение последнего ранга должно быть равно n1 + n2 (в нашем случае 20).

Это правило используют для проверки правильности ранжирования.

Отдельно для каждой выборки рассчитываем суммы рангов их вариант R1 и R2. В нашем случае:

R1 = 1 + 2,5 + 2,5 + 5 + 5 + 9 + 9 + 9 + 12 + 14 = 69

R2 = 5 + 9 + 9 + 14 + 14 + 17 + 17 +17 + 19,5 + 19,5 = 141

Для проверки правильности вычислений можно воспользоваться другим правилом: R1 + R2 = 0,5 * (n1 + n2) * (n1 + n2 + 1). В нашем случае R1 + R2 = 210.

Статистика U1 = 69 — 10*11/2 = 14; U2 = 141 — 10*11/2 = 86.

Для проверки одностороннего критерия выбираем минимальную статистику U1 = 14 и сравниваем ее с критическим значением для n1 = n2 = 10 и уровня значимости 1%, равным 19.

Так как вычисленное значение критерия меньше табличного, нулевая гипотеза отвергается на выбранном уровне значимости, и различия между выборками признаются статистически значимыми. Таким образом, вывод о существовании различий, сделанный с помощью параметрического критерия Cтьюдента, подтверждается с помощью данного непараметрического метода.

Связанные определения:
Непараметрические статистические методы
Свободный от распределения критерий

В начало

Содержание портала

Пример расчета критерия U Манна-Уитни

Допустим мы хотим сравнить уровень интеллекта детей в 7 «а» и 7 «б» классе средней общеобразовательной школы. Для сравнения двух выборок между собой воспользуемся критерием U Манна-Уитни.

Шаг 1. Занесем значения в таблицу.

7 «а»7 «б»
ФИО ИспытуемогоБаллы IQФИО Испытуемого Баллы IQ
КТИ112БРИ121
ВСИ105ДРО120
МНИ109РНА134
АНМ90ВРА119
УРА130ГРА115
ВФЫ117ДЖА106
РКИ117ВЦК107
ТРИ125ЮЕР101
ТРК134ЖЕН97
ТНК109КОР117

Шаг 2. Расположим все значения в один ряд (2.1) и проранжируем их (2.2).

ФИО ИспытуемогоБаллы IQ (2.1)Ранг (2.2)
РНА134(1+2)/2=1,5
ТРК
УРА1303
ТРИ1254
БРИ1215
ДРО1206
ВРА1197
ВФЫ117(8+9+10)/3=9
РКИ
КОР
ГРА11511
КТИ 11212
ТНК109(13+14)/2=13,5
МНИ
ВЦК10715
ДЖА10616
ВСИ10517
ЮЕР10118
ЖЕН9719
АНМ9020

Шаг 3.

Суммировать ранги значений в группе 7 «а» и в группе 7 «б»

Ранги 7 «а» = 1,5+3+4+9+9+12+13,5+13,5+17+20 = 102,5

Ранги 7 «б» = 1,5+5+6+7+9+11+15+16+18+19 = 107,5

Шаг 4. определить какая из ранговых сумм бОльшая.

Ранг 7 «а»< Ранг 7 «б» => ранговая сумма 7″б» больше

Шаг 5. Определить эмпирические значения критерия U Манна-Уитни по формуле:

,где  — количество испытуемых в 1 группе;  — количество испытуемых во 2 группе; — большая из двух ранговых сумм; — количество испытуемых в группе с бОльшей ранговой суммой.

Шаг 6. По таблице определить критические значения критерия U Манна-Уитни.

Шаг 7. Сравнить критические значения с эмпирическими.

23<47,5  < 

Шаг 8. Сделать выводы.

Расчет критерия U-Манна-Уитни
Расчет критерия U-Манна-Уитни в SPSSПример расчета критерия U-Манна-Уитни в SPSS
Расчет критерия U-Манна-Уитни в ExcellПример расчета критерия U-Манна-Уитни в Excell
Непараметрический критерий U-Манна-Уитни

U-тест Манна-Уитни: определение, как выполнять в SPSS


Определения статистики >


Содержание:

  1. Что такое тест Манна-Уитни?
  2. Нулевая гипотеза
  3. Прямой метод
  4. Предположения
  5. Как запустить тест Манна-Уитни в SPSS (видео)

U-критерий Манна-Уитни является непараметрическим эквивалентом двухвыборочного t-критерия. В то время как t-критерий делает предположение о распределении населения (т. е. что выборка получена из t-распределенного населения), U-критерий Манна-Уитни не делает такого предположения.

Тест сравнивает две совокупности. Нулевая гипотеза для теста состоит в том, что вероятность составляет 50 % того, что случайно выбранный член первой популяции превзойдет член второй популяции.

Другой вариант нулевой гипотезы состоит в том, что две выборки взяты из одной и той же совокупности (т. е. обе имеют одинаковую медиану).

Результатом выполнения U-теста Манна-Уитни является U-статистика. Для небольших выборок используйте прямой метод (см. ниже), чтобы найти статистику U; Для больших выборок необходима формула. Или вы можете использовать такие технологии, как SPSS, для запуска теста.
Любая из этих двух формул подходит для U-теста Манна-Уитни. R — сумма рангов в выборке, а n — количество элементов в выборке.

Этот метод ограничен только количеством вычислений, которые вы хотите выполнить. Чем больше выборка, тем сложнее математика:

  1. Назовите выборку с меньшими рангами «выборкой 1», а выборку с большими рангами «выборкой 2». Выбор выборки с меньшими рангами в качестве «выборки 1» не является обязательным, но это упрощает вычисления.
  2. Возьмите первое наблюдение в выборке 1. Подсчитайте, сколько наблюдений в выборке 2 меньше его. Если наблюдения равны, считайте это за половину. Например, если у вас есть десять меньше и два равных: 10 + 2 (1/2) = 11,
  3. Повторите шаг 2 для всех наблюдений в образце 1.
  4. Сложите все свои итоги из шагов 2 и 3. Это статистика U.
  • Зависимая переменная должна измеряться в порядковой или непрерывной шкале.
  • Независимая переменная должна быть двумя независимыми категориальными группами.
  • Наблюдения должны быть независимыми. Другими словами, не должно быть никаких отношений между двумя группами или внутри каждой группы.
  • Наблюдения не распределены нормально. Однако они должны иметь одинаковую форму (т. е. оба имеют форму колокола и скошены влево).

Посмотрите видео с инструкциями:

Как запустить U-тест Манна-Уитни в SPSS

Посмотрите это видео на YouTube.

Видео не видно? Кликните сюда.

УКАЗЫВАЙТЕ ЭТО КАК:
Стефани Глен . U-тест Манна-Уитни: определение, как работать в SPSS https://www.statisticshowto.com/mann-whitney-u-test/

————————————————— ————————-

Нужна помощь с домашним заданием или контрольным вопросом? С Chegg Study вы можете получить пошаговые ответы на ваши вопросы от эксперта в данной области. Ваши первые 30 минут с репетитором Chegg бесплатны!

Комментарии? Нужно опубликовать исправление? Пожалуйста, Свяжитесь с нами .


U-критерий Манна-Уитни: предположения и пример

Что такое U-критерий Манна-Уитни?

U-критерий Манна-Уитни, также известный как критерий суммы рангов Уилкоксона, представляет собой непараметрический статистический критерий, используемый для сравнения двух выборок или групп.

U-критерий Манна-Уитни оценивает вероятность того, что две выбранные группы будут происходить из одной и той же совокупности, и по существу задает вопросы; имеют ли эти две популяции одинаковую форму в отношении их данных? Другими словами, нам нужны доказательства того, взяты ли группы из совокупностей с разными уровнями интересующей нас переменной. Отсюда следует, что гипотезы U-критерия Манна-Уитни таковы:

  • Нулевая гипотеза (H0) состоит в том, что две совокупности равны.
  • Альтернативная гипотеза (h2) заключается в том, что две совокупности не равны.

Некоторые исследователи интерпретируют это как сравнение медианы между двумя популяциями (напротив, параметрические тесты сравнивают средние между двумя независимыми группами). В определенных ситуациях, когда данные имеют одинаковую форму (см. предположения), это справедливо, но следует отметить, что медианы фактически не участвуют в расчете статистики U-критерия Манна-Уитни. Две группы могут иметь одинаковую медиану и значительно различаться по U-критерию Манна-Уитни.

Когда использовать U-критерий Манна-Уитни

Непараметрические тесты (иногда называемые «тестами без распределения») используются, когда вы предполагаете, что данные в интересующей вас совокупности не имеют нормального распределения. Вы можете рассматривать U-критерий Манна-Уитни как аналог непарного t-критерия Стьюдента, который вы использовали бы, предполагая, что ваши две совокупности нормально распределены, как определено их средними значениями и стандартным отклонением (параметрами распределений).

Рис. 1. Нормальное и асимметричное распределение

  

U-критерий Манна-Уитни — это распространенный статистический тест, который используется во многих областях, включая экономику, биологические науки и эпидемиологию. Это особенно полезно, когда вы оцениваете разницу между двумя независимыми группами с небольшим количеством людей в каждой группе (обычно менее 30), которые обычно не распределены и где данные непрерывны. Если вы заинтересованы в сравнении более чем двух групп с искаженными данными, следует использовать однофакторный дисперсионный анализ Краскела-Уоллиса (ANOVA).

Предположения U-критерия Манна-Уитни

Некоторые ключевые допущения для U-критерия Манна-Уитни подробно описаны ниже: – например, возраст, вес, рост или частота сердечных сокращений). Это связано с тем, что тест основан на ранжировании наблюдений в каждой группе.

  • Предполагается, что данные имеют ненормальное или асимметричное распределение. Если ваши данные распределены нормально, вместо этого для сравнения двух групп следует использовать непарный t-критерий Стьюдента.
  • Хотя данные в обеих группах не считаются нормальными, предполагается, что данные похожи по форме в двух группах.
  • Данные должны быть двумя случайно выбранными независимыми выборками, что означает, что группы не имеют отношения друг к другу. Если выборки парные (например, два измерения одной и той же группы участников), то вместо этого следует использовать t-критерий парных выборок.
  • Достаточный размер выборки необходим для достоверности теста, обычно более 5 наблюдений в каждой группе.
  • Пример U-теста Манна-Уитни

    Рассмотрим рандомизированное контролируемое исследование по оценке нового антиретровирусного препарата для лечения ВИЧ. В пилотном испытании участников случайным образом распределяли либо в группы, получавшие лечение, либо в группы, не получавшие лечения (N = 14). Мы хотим оценить вирусную нагрузку (количество вируса на миллилитр крови) в группах, получавших лечение, по сравнению с группами, не получавшими лечения. На практике U-критерий Манна-Уитни можно легко и быстро рассчитать с помощью статистического программного обеспечения, такого как SPSS или Stata, но шаги изложены ниже.

    The data are shown below:

    Treated 540 670 1000 960 1200 4650   4200
    Untreated 5000 4200 1300 900 7400 4500 7500

      

    Эти данные искажены при размере выборки, равном n=7 в каждой группе лечения. Прежде чем рассчитать тест, мы выбираем уровень значимости (обычно α=0,05). Первым шагом является присвоение рангов значениям из полной выборки (обе группы лечения объединены вместе) в порядке от наименьшего к наибольшему. Затем мы можем сгенерировать тестовую статистику на основе рангов.

    В приведенной ниже таблице показаны значения вирусной нагрузки в группах, получавших и не получавших лечения, в порядке от наименьшего к наибольшему, а также суммарные ранги каждой группы:

    Вирусная нагрузка (леченные)
    Вирусная нагрузка (нелеченные)
    Rank (Treated) Rank (Untreated)
    540
    1
    670
    2

    900
    3
    960
    4
    1000
    5
    1200
    6

    1300
    7
    4200
    8

    4500

    9

    4650
    10

    5000
    11

    6100
    12

    7400
    13

    7500
    14


    R 1 =36
    R 2 =69

    After summing the рангов для каждой группы, статистика критерия U Манна-Уитни выбирается как наименьшее из двух следующих вычисленных значений U: ), где n1 и n2 — количество участников, а R1 и R2 — суммы рангов в группах леченных и нелеченных соответственно. В этом примере U1=41 и U2=8. Поэтому мы выбираем U=8 в качестве тестовой статистики.

    Нормальная аппроксимация

    Существуют ситуации, когда размер выборки может быть слишком большим для использования справочной таблицы для расчета точного распределения вероятностей — в этом случае вместо этого мы можем использовать Нормальную аппроксимацию. Поскольку U находится путем сложения независимых, одинаково распределенных случайных выборок, центральная предельная теорема применяется, когда выборка большая (обычно> 20 в каждой группе). Стандартное отклонение суммы рангов можно использовать для создания z-статистики и значения значимости, сгенерированного таким образом. Если нулевая гипотеза верна, распределение U приближается к нормальному распределению.

    Затем мы определяем «критическое значение» U, с которым можно сравнить нашу расчетную тестовую статистику, что мы можем сделать, используя справочную таблицу критических значений и используя наши размеры выборки (n = 7 в обеих группах) и двусторонний анализ.

    Добавить комментарий

    Ваш адрес email не будет опубликован. Обязательные поля помечены *