Понимание дисперсии и z-показателя имеет решающее значение для лучшего понимания ваших данных. Действительно ли это так пугающе, как кажется?
Дисперсия и стандартное отклонение, безусловно, являются наиболее важными темами в статистике, поскольку на них основано множество передовых статистических концепций. Итак, давайте раскрывать их по одному. И получить четкое представление о Z-показателях.
Прежде чем погрузиться,
Параметр — Параметр — это измеримая характеристика населения, обозначаемая греческой буквой.
например - Например, среднее значение населения обозначается μ.
Статистика — измеримая характеристика выборки, обозначаемая английским алфавитом.
например - Например, выборочное среднее обозначается x̄.
Дисперсия
Это мера изменчивости в группе чисел. Это означает, что он говорит нам, насколько далеко точки данных разбросаны от среднего значения.
Давайте разберемся с этим на примере -
Предположим, у нас есть результаты тестов двух групп студентов:
Группа 1: 48, 48, 48, 48, 48
Группа 2: 50, 47, 52, 46, 45
Среднее значение каждой группы = 48
Обе группы разные, несмотря на то, что у них одинаковое среднее значение по группе.
Как мы фиксируем разницу?
Вот тут-то и проявляется дисперсия.
Расчет дисперсии
- Один из способов - вычесть среднее значение из каждой оценки
- Результат каждого вычитания называется отклонением
- Тогда мы могли бы усреднять отклонения
- Чем выше среднее значение, тем выше изменчивость, и наоборот.
Но есть одна проблема с этим методом
Мы видим, что минус вызывает проблемы, поэтому мы возводим каждое отклонение в квадрат, а затем берем среднее значение.
Дисперсия для этого набора данных составляет 6,8.
Чем выше дисперсия, тем больше изменчивость.
Обратите внимание на английскую букву «s», указывающую на то, что это статистика, и на греческую букву «σ», указывающую на то, что это параметр.
Некоторые важные термины -
- Левая часть уравнения представляет собой среднее значение суммы квадратов отклонений и, короче говоря, называется средним квадратом.
- Числитель справа — это сумма квадратов отклонений или сумма квадратов.
- Знаменатель справа называется степенями свободы.
Среднеквадратичное отклонение
Единица дисперсии преобразуется в квадрат единицы исходного набора данных. Чтобы избавиться от этой проблемы, мы возьмем квадратный корень из дисперсии, и результатом будет стандартное отклонение.
- Дисперсия населения = σ² Стандартное отклонение населения = σ
- Выборочная дисперсия = s² Стандартное отклонение выборки = s
Теперь давайте посмотрим, как поместить данные в контекст
Z — Оценка
Мы хотим измерить отклонение точек данных от среднего значения, используя стандартное отклонение в качестве единицы измерения.
Для этого нам нужно присвоить z-оценку каждой точке данных. Для этого -
- Вычислить среднее значение данных
- Рассчитать стандартное отклонение
- Вычтите среднее значение из точки данных (X)
- Разделите результат на стандартное отклонение
Что означают Z-показатели?
Он сообщает расстояние соответствующей точки данных от среднего значения с точки зрения стандартных отклонений.
Это помогает помещать данные в контекст.
Например, ученик А набрал 66 баллов, а Б — 67. Оба они учатся в разных школах. Школа А имеет среднее значение 60,35 и стандартное отклонение 7,00, а школа Б имеет среднее значение 68 и стандартное отклонение 8,00. Мы хотим понять, кто на самом деле забил больше.
Для -
Z-оценка или стандартная оценка = (66–60,35)/7,00 = 0,807.
Для Б -
Z-оценка или стандартная оценка = (67–68)/8,00 = -0,125
«А» набрал выше среднего в своем классе, а «В» набрал ниже среднего в своем классе. Таким образом, контекст становится очень важным при анализе данных, и Z-оценка помогает нам в этом.