Итак, вы начали свое путешествие в области аналитики данных и статистического анализа и застряли на тесте хи-квадрат, разберитесь с тестом хи-квадрат с помощью примера.
Согласно статье в Википедии:
критерий хи-квадрат (также критерий хи-квадрат или критерий χ2) – это тест статистической гипотезы, используемый при анализе таблицы непредвиденных обстоятельств при больших размерах выборки. Проще говоря, этот тест в основном используется для проверки того, являются ли две категориальные переменные (два измерения таблицы непредвиденных обстоятельств) независимыми и влияют на статистику теста (значения в таблице). .
Чтобы понять тест хи-квадрат, вы должны знать о проверке гипотез, вы можете прочитать мою статью Здесь.
- Тест хи-квадрат утверждает пропорции населения.
- Тест хи-квадрат — это непараметрический тест, который выполняется на категориальных данных.
- Тест хи-квадрат оценивает, насколько близко наблюдаемое распределение соответствует ожидаемому распределению.
- Тест хи-квадрат используется для оценки того, является ли случайная величина независимой или нет.
- Тест хи-квадрат лучше всего подходит для бинарных целей, то есть да/нет, 1/0, правда/ложь.
Давайте разберемся с хи-квадратом с помощью вопроса:
Вопрос:
Директор школы хотел бы знать, в какие дни недели учащиеся чаще всего отсутствуют. Директор ожидает, что учащиеся будут отсутствовать в равной степени в течение 5-дневной учебной недели. Директор выбирает случайную выборку из 100 учителей, спрашивая их, в какой день недели у них было наибольшее количество пропусков занятий. Наблюдаемые результаты показаны в таблице ниже. Основываясь на этих результатах, определите, происходят ли дни с наибольшим количеством отсутствий с одинаковой частотой (используйте уровень значимости 5%).
Нулевая гипотеза (Ho): равная частота
Альтернативная гипотеза (H1): неравная частота
теперь узнаем степени свободы
DF = N-1
Здесь N - это нет. категорий в нашем наборе данных.
DF = 5–1 = 4
так что теперь мы узнаем наше критическое значение, используя таблицу распределения хи-квадрат, которая выглядит примерно так:
Получаем критическое значение = 9,41.
Теперь мы будем использовать формулу хи-квадрат, чтобы узнать значение хи-квадрат, которое мы будем сравнивать с критическим значением.
Здесь O — наблюдаемое значение, а E — ожидаемое значение.
поэтому, решая это, мы получаем 6,3.
Поскольку значение хи-квадрат меньше критического значения (6,3‹9,41), будет принята нулевая гипотеза (Но), что распределение имеет равную частоту.
Я надеюсь, что эта статья сделала тест Хи-квадрат простым для понимания, если у вас есть какие-либо предложения, дайте мне знать в поле для комментариев 💬, а также, пожалуйста, хлопните в ладоши 👏 и поделитесь этой статьей со своими друзьями и приятелями по учебе 🫂.
Контакты: https://atharv4git.github.io/webpage/