Понимание дисперсии и z-показателя имеет решающее значение для лучшего понимания ваших данных. Действительно ли это так пугающе, как кажется?

Дисперсия и стандартное отклонение, безусловно, являются наиболее важными темами в статистике, поскольку на них основано множество передовых статистических концепций. Итак, давайте раскрывать их по одному. И получить четкое представление о Z-показателях.

Прежде чем погрузиться,

Параметр — Параметр — это измеримая характеристика населения, обозначаемая греческой буквой.

например - Например, среднее значение населения обозначается μ.

Статистика — измеримая характеристика выборки, обозначаемая английским алфавитом.

например - Например, выборочное среднее обозначается x̄.

Дисперсия

Это мера изменчивости в группе чисел. Это означает, что он говорит нам, насколько далеко точки данных разбросаны от среднего значения.

Давайте разберемся с этим на примере -

Предположим, у нас есть результаты тестов двух групп студентов:

Группа 1: 48, 48, 48, 48, 48

Группа 2: 50, 47, 52, 46, 45

Среднее значение каждой группы = 48

Обе группы разные, несмотря на то, что у них одинаковое среднее значение по группе.

Как мы фиксируем разницу?

Вот тут-то и проявляется дисперсия.

Расчет дисперсии

  • Один из способов - вычесть среднее значение из каждой оценки
  • Результат каждого вычитания называется отклонением
  • Тогда мы могли бы усреднять отклонения
  • Чем выше среднее значение, тем выше изменчивость, и наоборот.

Но есть одна проблема с этим методом

Мы видим, что минус вызывает проблемы, поэтому мы возводим каждое отклонение в квадрат, а затем берем среднее значение.

Дисперсия для этого набора данных составляет 6,8.

Чем выше дисперсия, тем больше изменчивость.

Обратите внимание на английскую букву «s», указывающую на то, что это статистика, и на греческую букву «σ», указывающую на то, что это параметр.

Некоторые важные термины -

  • Левая часть уравнения представляет собой среднее значение суммы квадратов отклонений и, короче говоря, называется средним квадратом.
  • Числитель справа — это сумма квадратов отклонений или сумма квадратов.
  • Знаменатель справа называется степенями свободы.

Среднеквадратичное отклонение

Единица дисперсии преобразуется в квадрат единицы исходного набора данных. Чтобы избавиться от этой проблемы, мы возьмем квадратный корень из дисперсии, и результатом будет стандартное отклонение.

  • Дисперсия населения = σ² Стандартное отклонение населения = σ
  • Выборочная дисперсия = s² Стандартное отклонение выборки = s

Теперь давайте посмотрим, как поместить данные в контекст

Z — Оценка

Мы хотим измерить отклонение точек данных от среднего значения, используя стандартное отклонение в качестве единицы измерения.

Для этого нам нужно присвоить z-оценку каждой точке данных. Для этого -

  • Вычислить среднее значение данных
  • Рассчитать стандартное отклонение
  • Вычтите среднее значение из точки данных (X)
  • Разделите результат на стандартное отклонение

Что означают Z-показатели?

Он сообщает расстояние соответствующей точки данных от среднего значения с точки зрения стандартных отклонений.

Это помогает помещать данные в контекст.

Например, ученик А набрал 66 баллов, а Б — 67. Оба они учатся в разных школах. Школа А имеет среднее значение 60,35 и стандартное отклонение 7,00, а школа Б имеет среднее значение 68 и стандартное отклонение 8,00. Мы хотим понять, кто на самом деле забил больше.

Для -

Z-оценка или стандартная оценка = (66–60,35)/7,00 = 0,807.

Для Б -

Z-оценка или стандартная оценка = (67–68)/8,00 = -0,125

«А» набрал выше среднего в своем классе, а «В» набрал ниже среднего в своем классе. Таким образом, контекст становится очень важным при анализе данных, и Z-оценка помогает нам в этом.