Как проверить мультиколлинеарность в SPSS
Редакция Кодкампа
читать 2 мин
Мультиколлинеарность в регрессионном анализе возникает, когда две или более переменных-предикторов сильно коррелируют друг с другом, так что они не предоставляют уникальную или независимую информацию в регрессионной модели. Если степень корреляции между переменными достаточно высока, это может вызвать проблемы при подгонке и интерпретации регрессионной модели.
Одним из способов обнаружения мультиколлинеарности является использование показателя, известного как коэффициент инфляции дисперсии (VIF) , который измеряет корреляцию и силу корреляции между переменными-предикторами в регрессионной модели.
В этом руководстве объясняется, как использовать VIF для обнаружения мультиколлинеарности в регрессионном анализе в SPSS.
Предположим, у нас есть следующий набор данных, который показывает экзаменационные баллы 10 студентов, а также количество часов, которые они потратили на учебу, количество сданных подготовительных экзаменов и их текущую оценку по курсу:
Мы хотели бы выполнить линейную регрессию, используя score в качестве переменной ответа и hours , prep_exams и current_grade в качестве переменных-предикторов, но мы хотим убедиться, что три переменные-предикторы не сильно коррелированы.
Чтобы определить, является ли мультиколлинеарность проблемой, мы можем получить значения VIF для каждой из переменных-предикторов.
Для этого щелкните вкладку « Анализ », затем « Регрессия », затем « Линейный »:
В появившемся новом окне перетащите оценку в поле с надписью Зависимые и перетащите три предиктора в поле с надписью Независимые(ые). Затем нажмите « Статистика » и убедитесь, что рядом с «Диагностика коллинеарности » установлен флажок. Затем нажмите «Продолжить».Затем нажмите ОК .
После того, как вы нажмете OK , отобразится следующая таблица, в которой показано значение VIF для каждой переменной-предиктора:
Значения VIF для каждой из переменных-предикторов следующие:
- часов: 1.169
- prep_exams: 1.403
- текущий_класс: 1.522
Значение VIF начинается с 1 и не имеет верхнего предела. Общее эмпирическое правило для интерпретации VIF выглядит следующим образом:
- Значение 1 указывает на отсутствие корреляции между данной переменной-предиктором и любыми другими переменными-предикторами в модели.
- Значение от 1 до 5 указывает на умеренную корреляцию между данной переменной-предиктором и другими переменными-предикторами в модели, но часто она недостаточно серьезная, чтобы требовать внимания.
- Значение больше 5 указывает на потенциально сильную корреляцию между данной переменной-предиктором и другими переменными-предикторами в модели. В этом случае оценки коэффициентов и p-значения в выходных данных регрессии, вероятно, ненадежны.
Мы видим, что ни одно из значений VIF для переменных-предикторов в этом примере не превышает 5, что указывает на то, что мультиколлинеарность не будет проблемой в регрессионной модели.
IBM SPSS Statistics. Уровень 1. Статистические методы анализа данных
Центр компьютерного обучения «Специалист» при МГТУ им. Н.Э. Баумана
- базовый курс
- Moscow Business School
- Стоимость:
- 173 400 р.
скидки
- Длительность:
- 16 ак. ч
- Московский международный колледж цифровых технологий «Академия TOP», г. Новомосковск
- Стоимость:
- 59 800 р.
- Длительность:
- 3 года
- Московский международный колледж цифровых технологий «Академия TOP», г. Чита
- Стоимость:
- 330 960 р.
- Длительность:
- 3 года
- Cleverics
- Стоимость:
- 33 575 р.
- Длительность:
- 3 дня
- Cleverics
- Стоимость:
- 33 575 р.
- Длительность:
- 3 дня
- Учебный центр CompTek
- Стоимость:
- 138 000 р.
- Длительность:
- 2 дня
- Cleverics
- Стоимость:
- 33 575 р.
- Длительность:
- 4 дня
- Cleverics
- Стоимость:
- 48 875 р.
- Длительность:
- 3 дня
- Учебный центр CompTek
- Стоимость:
- 138 000 р.
- Длительность:
- 2 дня
- Учебный центр CompTek
- Стоимость:
- 207 000 р.
- Длительность:
- 3 дня
- Центр компьютерного обучения «Специалист» при МГТУ им. Н.Э. Баумана
- Стоимость:
- 19 490 р.
- Длительность:
- 12 дней
- Центр компьютерного обучения «Специалист» при МГТУ им. Н.Э. Баумана
- Стоимость:
- 50 990 р.
- Длительность:
- 29 дней
- Центр компьютерного обучения «Специалист» при МГТУ им. Н.Э. Баумана
- Стоимость:
- 43 490 р.
- Длительность:
- 15 дней
- Центр компьютерного обучения «Специалист» при МГТУ им. Н.Э. Баумана
- Стоимость:
- 27 490 р.
- Длительность:
- 3 дня
- Центр компьютерного обучения «Специалист» при МГТУ им. Н.Э. Баумана
- Стоимость:
- 40 990 р.
- Длительность:
- 3 дня
- Центр компьютерного обучения «Специалист» при МГТУ им. Н.Э. Баумана
- Стоимость:
- 46 990 р.
- Длительность:
- 12 дней
- Центр компьютерного обучения «Специалист» при МГТУ им. Н.Э. Баумана
- Стоимость:
- 27 490 р.
- Длительность:
- 3 дня
- Центр компьютерного обучения «Специалист» при МГТУ им. Н.Э. Баумана
- Стоимость:
- 21 490 р.
- Длительность:
- 2 дня
- Центр компьютерного обучения «Специалист» при МГТУ им. Н.Э. Баумана
- Стоимость:
- 16 490 р.
- Длительность:
- 2 дня
- Центр компьютерного обучения «Специалист» при МГТУ им. Н.Э. Баумана
- Стоимость:
- 20 490 р.
- Длительность:
- 8 дней
Cпецпроекты
Колледж экономических международных связей
Для выпускников 9 и 11 классов.
Высшее образование онлайн
Федеральный проект дистанционного образования.
Я б в нефтяники пошел!
Пройди тест, узнай свою будущую профессию и как её получить.
Технологии будущего
Вдохновитесь идеей стать крутым инженером, чтобы изменить мир
Студенческие проекты
Студенты МосПолитеха рассказывают о своих изобретениях
Химия и биотехнологии в РТУ МИРЭА
120 лет опыта подготовки
Международный колледж искусств и коммуникаций
МКИК — современный колледж
Английский язык
Совместно с экспертами Wall Street English мы решили рассказать об английском языке так, чтобы его захотелось выучить.
15 правил безопасного поведения в интернете
Простые, но важные правила безопасного поведения в Сети.
Олимпиады для школьников
Перечень, календарь, уровни, льготы.
Первый экономический
Рассказываем о том, чем живёт и как устроен РЭУ имени Г.В. Плеханова.
Билет в Голландию
Участвуй в конкурсе и выиграй поездку в Голландию на обучение в одной из летних школ Университета Радбауд.
Цифровые герои
Они создают интернет-сервисы, социальные сети, игры и приложения, которыми ежедневно пользуются миллионы людей во всём мире.
Работа будущего
Как новые технологии, научные открытия и инновации изменят ландшафт на рынке труда в ближайшие 20-30 лет
Профессии мечты
Совместно с центром онлайн-обучения Фоксфорд мы решили узнать у школьников, кем они мечтают стать и куда планируют поступать.
Экономическое образование
О том, что собой представляет современная экономика, и какие карьерные перспективы открываются перед будущими экономистами.
Гуманитарная сфера
Разговариваем с экспертами о важности гуманитарного образования и областях его применения на практике.
Молодые инженеры
Инженерные специальности становятся всё более востребованными и перспективными.
Табель о рангах
Что такое гражданская служба, кто такие госслужащие и какое образование является хорошим стартом для будущих чиновников.
Карьера в нефтехимии
Нефтехимия — это инновации, реальное производство продукции, которая есть в каждом доме.
SPSS — Загрузить
Обзор Softonic
Кэти Баггс Обновлено 4 месяца назад
SPSS — это пробная версия, которую можно использовать для записи и последующего анализа данных . Хотя первоначальными разработчиками статистического инструмента являются SPSS Inc., IBM приобрела программное обеспечение, которое теперь называется IBM SPSS Statistics . Программное обеспечение SPSS обладает широкими возможностями настройки, позволяющими вводить именно те данные, которые вам нужны, такие как переменные и числа.
SPSS имеет пользовательский интерфейс, похожий на Microsoft Excel, поскольку пользовательский интерфейс настроен как электронная таблица . MatLab, Minitab, Power Bi, Stata, MySQL и Tableau являются альтернативами SPSS для управления данными. Все программы подходят для профессионального использования .
Что означает SPSS?
В то время как буквы в SPSS раньше обозначали Статистический пакет для социальных наук , теперь это название является просто аббревиатурой. Первоначально SPSS был создан для исследователей в области социальных наук, таких как социология, психология и дополнительные услуги.
SPSS расширен до разнообразие областей , вышедших за рамки социальных наук, особенно после приобретения IBM. Хотя фактическое название теперь IBM SPSS Statistics, функции программного обеспечения практически не изменились.
SPSS бесплатен?
Хотя SPSS не является бесплатным для использования, перед покупкой SPSS предлагает бесплатную пробную версию . Пакет SPSS доступен для операционных систем Apple Mac и Microsoft Windows PC. Пробная версия дает вам доступ ко всему набору функций в течение 30 дней . Вам нужно будет войти в программное обеспечение SPSS со своим IBMid.
SPSS имеет одноразовый пакет и планы подписки , помимо бесплатной пробной версии. Также доступна академическая версия для студентов и преподавателей. Диспетчер данных поддерживает нескольких языков таких как китайский, английский, французский, немецкий, итальянский, корейский, испанский и т. д.
Что лучше SPSS или Excel?
SPSS — популярная статистическая программа из-за ее управление данными возможности и удобный интерфейс . Пользовательский интерфейс хвалят и критикуют за его простоту. Хотя пользовательский интерфейс похож на Excel, пользовательский интерфейс отличается.
Для чего используется IBM SPSS Statistics?
SPSS используется для анализа данных исследователями во множестве областей. Вы выполняете прогнозную аналитику для прогнозирования будущих результатов и настраиваете свой пользовательский интерфейс таким образом, чтобы он поддерживал ваши исследования. Поскольку интерфейс можно настроить, вы можете легко собирать и анализировать данные.
SPSS позволяет вам сохранять и совместно использовать файлы данных в виде отчетов в различных форматах файлов. Существует два основных режима, между которыми вы можете переключаться: « Data View » (режим по умолчанию) и « Variable View ». вернуться назад и вперед и т. д.
Что такое SPSS?
Представление данных показывает числа вдоль вертикальной оси, которые представляют случаи, участников и субъектов. Переменные на горизонтальной стороне позволяют вводить измерения и переменные, которые вы используете во время учебы. Клетки между числовые и переменные оси остаются пустыми, пока вы не заполните недостающие значения. SPSS автоматически устанавливает свойства и имена переменных каждого столбца после ввода значений.
Желтое всплывающее окно появляется при наведении указателя мыши на ячейки переменных, чтобы сообщить свойства , такие как имя, тип и измерение. Представление переменных позволяет изменять имена и свойства переменных в анализе данных. Это дает вам переменные по вертикальной оси и свойства по горизонтальной.
Свойства : имя, тип, ширина, десятичные знаки, метка, значения, отсутствие, столбцы, выравнивание, мера и роль. Хотя имя ваших переменных должно начинаться с буквы, а использовать символы подчеркивания вместо пробелов, свойство label позволяет вам использовать пробелы для более подробного описания ваших переменных. Вы можете нажать на ячейку в категории «Тип», чтобы настроить тип переменной.
Хотя для типа по умолчанию установлено числовое значение, список альтернативных типов данных будет отображаться как запятая, точка, дата, доллар и т. д. Другим важным свойством является раздел измерения, который позволяет определить масштаб измерения , например Scale, Ordinal и Nominal. Система измерения шкалы в SPSS охватывает меры интервала и отношения, которые можно найти в стандартных шкалах измерения.
Свойство ширины предназначено для определения ширины строковой переменной, а десятичная секция определяет количество десятичных пробелов . Сегмент столбцов позволяет настроить размер столбцов, в которых будут отображаться ваши данные. Пользовательский интерфейс позволяет перетаскивать разделы, чтобы сделать столбцы более широкими или узкими.
Сложно ли освоить SPSS?
Оба представления настроены как электронные таблицы, чтобы вы могли легко анализировать данные обзора . Пользователи считают, что простой интерфейс упрощает использование SPSS. Представление данных и представление переменных автоматически синхронизируются вместе при внесении изменений на любой из вкладок. Таким образом, корректировки, которые вы делаете в электронной таблице представления данных, будут отображаться на листе представления переменных.
Учитывая, что SPSS обладает широкими возможностями настройки , вы можете создать пользовательских таблиц по своему вкусу. Ярлыки делают SPSS простым в использовании как для новичков, так и для экспертов . SPSS позволяет выполнять моделирование структурными уравнениями и использовать синтаксис SPSS для кодирования , если вам нужен расширенный пользовательский интерфейс.
Отраслевой стандарт статистического анализа
SPSS — это программное обеспечение для управления данными, которое используется как в академических, так и в профессиональных сферах. Представление данных — это окно, которое позволяет вам введите ваши значения данных , в то время как Variable View — это лист, который позволяет вам определить свойства вашей переменной . SPSS позволяет персонализировать и без того простой пользовательский интерфейс с помощью переменных меток и типов свойств.
Что нового?
В то время как исходная программа SPSS была выпущена в 1968 году, IBM взяла на себя управление в 2009 году. Программное обеспечение регулярно получает обновлений , чтобы оставаться в курсе новых требований и улучшений.
ПРОФИ
- Бесплатная пробная версия
- Легко в использовании
- Чистый пользовательский интерфейс
- Высоко настраиваемый
- Академический и профессиональный
Cons
- Иногда считаются слишком простыми.
ДОМ Содержание Редактор данных Окно Синтаксис редактор Окно Карл Ли
Феликс Фамой
О насРедактор диаграмм Окно Выход Окно Обзор анализа данных Манипуляции Данные Анализ данных Проекты и наборы данных Интегрировать R в СПСС Ниже приведены проект и наборы данных, использованные в этом интерактивном учебном семинаре по SPSS.
Щелкните ссылку Описание данных, чтобы просмотреть описание набора данных, и Ссылка для скачивания данныхПроекты и Данные Описание Загрузка данных Данные пассажиров авиакомпании Авиакомпания Passengers.sav Данные о телесном жире BodyFat.sav || BodyFat.dat || BodyFat.txt Данные о раке Рак.sav || Рак.xls Данные автомобилей Тачки. sav Данные о заболевании Болезнь.sav || Болезнь.dat || Болезнь.txt Данные о ткани для окрашивания Ткань для окрашивания.sav Данные обследования Exam.sav Данные ткани Ткань.sav Данные пищевой компании Продовольственная компания.sav Бензин Данные Бензин. sav Данные кредита Кредит.sav Данные о раке легких Рак легких.sav || Рак легких.xls Данные оценки по математике Математика Оценка.dav || Математическая оценка.xls Новые данные о лекарствах Новый Drug.sav || Новый препарат.xls Данные об апельсиновом соке Апельсин сок. dav Данные по пластмассам Пластмассы.sav || Пластмассы.xls Данные об опухоли крыс Крыса Tumor.sav Данные диаметра кольца Диаметр кольца.sav Данные о диаметре кольца (случай как подгруппа) Диаметр кольца (подгруппа).sav Данные супермаркета Super Market.