Итак, вы начали свое путешествие в области аналитики данных и статистического анализа и застряли на тесте хи-квадрат, разберитесь с тестом хи-квадрат с помощью примера.

Согласно статье в Википедии:

критерий хи-квадрат (также критерий хи-квадрат или критерий χ2) – это тест статистической гипотезы, используемый при анализе таблицы непредвиденных обстоятельств при больших размерах выборки. Проще говоря, этот тест в основном используется для проверки того, являются ли две категориальные переменные (два измерения таблицы непредвиденных обстоятельств) независимыми и влияют на статистику теста (значения в таблице). .

Чтобы понять тест хи-квадрат, вы должны знать о проверке гипотез, вы можете прочитать мою статью Здесь.

  • Тест хи-квадрат утверждает пропорции населения.
  • Тест хи-квадрат — это непараметрический тест, который выполняется на категориальных данных.
  • Тест хи-квадрат оценивает, насколько близко наблюдаемое распределение соответствует ожидаемому распределению.
  • Тест хи-квадрат используется для оценки того, является ли случайная величина независимой или нет.
  • Тест хи-квадрат лучше всего подходит для бинарных целей, то есть да/нет, 1/0, правда/ложь.

Давайте разберемся с хи-квадратом с помощью вопроса:

Вопрос:

Директор школы хотел бы знать, в какие дни недели учащиеся чаще всего отсутствуют. Директор ожидает, что учащиеся будут отсутствовать в равной степени в течение 5-дневной учебной недели. Директор выбирает случайную выборку из 100 учителей, спрашивая их, в какой день недели у них было наибольшее количество пропусков занятий. Наблюдаемые результаты показаны в таблице ниже. Основываясь на этих результатах, определите, происходят ли дни с наибольшим количеством отсутствий с одинаковой частотой (используйте уровень значимости 5%).

Нулевая гипотеза (Ho): равная частота

Альтернативная гипотеза (H1): неравная частота

теперь узнаем степени свободы

DF = N-1

Здесь N - это нет. категорий в нашем наборе данных.

DF = 5–1 = 4

так что теперь мы узнаем наше критическое значение, используя таблицу распределения хи-квадрат, которая выглядит примерно так:

Получаем критическое значение = 9,41.

Теперь мы будем использовать формулу хи-квадрат, чтобы узнать значение хи-квадрат, которое мы будем сравнивать с критическим значением.

Здесь O — наблюдаемое значение, а E — ожидаемое значение.

поэтому, решая это, мы получаем 6,3.

Поскольку значение хи-квадрат меньше критического значения (6,3‹9,41), будет принята нулевая гипотеза (Но), что распределение имеет равную частоту.

Я надеюсь, что эта статья сделала тест Хи-квадрат простым для понимания, если у вас есть какие-либо предложения, дайте мне знать в поле для комментариев 💬, а также, пожалуйста, хлопните в ладоши 👏 и поделитесь этой статьей со своими друзьями и приятелями по учебе 🫂.

Контакты: https://atharv4git.github.io/webpage/