Описательная статистика помогает вам понять данные, но прежде чем мы поймем, что такое данные, мы должны знать различные типы данных в описательном статистическом анализе. Приведенный ниже экран поможет вам получить общее представление об этом.

Набор данных — это группа информации, которая связана друг с другом. Набор данных может быть качественным или количественным. Набор качественных данных состоит из слов, которые можно наблюдать, а не измерять. Набор количественных данных состоит из чисел, которые можно измерить напрямую. Месяцы в году будут примером качественных данных, а вес людей будет примером количественных данных.

Теперь давайте предположим, что вы идете в KFC, чтобы съесть гамбургеры вместе со своими друзьями, вы разместили заказ на прилавке с купонами, и после получения от прилавка с едой все едят то, что вы заказали от их имени. Если кто-то спрашивал о вкусе у других, то оценки по вкусу будут варьироваться от одного к другому, а если спросить, сколько бургеров мы заказали, то все придут к определенному счету, и он будет одинаковым для всех. Здесь оценки вкуса представляют собой категориальные данные, а количество бургеров — числовые данные.

Типы категориальных данных:

  1. Номинальные данные.Если между категориями нет естественного порядка, данные относятся к номинальному типу.
    Пример: цвет глаз, пол (мужской и женский), группа крови, политическая партия и почтовый индекс, тип жилья (дом, квартира, трейлер, другое), религиозные предпочтения (индуисты, буддисты, мусульмане, еврей, христианин, другой) и т. д.
  2. Порядковые данные.Если существует естественный порядок между категориями, данные имеют порядковый тип. Но здесь разница между значениями по порядку не имеет значения.
    Пример: оценки за экзамены, социально-экономический статус (бедный, средний класс, богатый), уровень образования (детский сад, начальное, среднее, высшее среднее, выпускной), рейтинг удовлетворенности (крайне не нравится, не нравится, нейтрально, нравится, очень нравится), Время суток (рассвет, утро, полдень, день, вечер, ночь), Уровень согласия (да, возможно, нет), Шкала Лайкерта (полностью не согласен, не согласен, нейтрально, согласен, полностью согласен) , и т.д.

Типы числовых данных:

  1. Дискретные данные. Данные называются дискретными, если измерения представляют собой целые числа. Он представляет счет или элемент, который можно посчитать.
    Пример: количество человек в семье, количество детей в классе, количество игроков в крикет в команде, количество стран мира, играющих в крикет.
    Дискретные данные — это особый вид данные, потому что каждое значение отдельно и отличается. С любыми данными, если мы можем ответить на следующие вопросы, они дискретны.
    1. Можно ли их посчитать?
    2. Можно ли разделить их на все более и более мелкие части?
  2. Непрерывные данные. Данные называются непрерывными, если измерения могут принимать любое значение, обычно в пределах некоторого диапазона. Это шкала измерения, которая может состоять из чисел, отличных от целых чисел, таких как десятичные дроби и дроби.
    Пример: рост, вес, длина, температура
    Непрерывные данные обычно требуют инструмента, такого как линейка, измерительная лента, весы или термометр, для получения значений в непрерывном наборе данных.

Шкалы измерения:

Данные можно классифицировать по одной из четырех шкал: номинальная, порядковая, интервальная или относительная. Каждый уровень измерения имеет некоторые важные свойства, которые полезно знать.

  1. Номинальный масштаб:номинальный тип данных, определенный выше, может быть помещен в эту категорию. Они не имеют числового значения, поэтому их нельзя ни сложить, ни вычесть, ни разделить, ни умножить. У них тоже нет порядка; если кажется, что они имеют порядок, то у вас, вероятно, вместо этого есть порядковые переменные.
  2. Порядковая шкала.Определенный выше порядковый тип данных может быть помещен в эту категорию. Порядковая шкала содержит вещи, которые вы можете расположить по порядку. Например, от самого горячего к самому холодному, от легкого к самому тяжелому, от самого богатого к самому бедному. Итак, если вы можете ранжировать данные по 1-му, 2-му, 3-му месту (и так далее), то у вас есть данные в порядковой шкале.
  3. Шкала интервалов.Шкала интервалов состоит из упорядоченных чисел со значащими делениями. Температура находится на интервальной шкале: разница в 10 градусов между 90 и 100 означает то же самое, что и 10 градусов между 150 и 160. Сравните это с олимпийским бегом (который является порядковым), где разница во времени между победителем и бегуном может быть 0,01 секунды и между предпоследней и последней 0,5 секунды. Если у вас есть значимые деления, у вас есть что-то на шкале интервалов.
  4. Шкала отношений.Шкала отношений обладает всеми свойствами шкалы интервалов с одним существенным отличием: ноль имеет смысл. Когда шкала равна 0,0, тогда такой шкалы нет. Например, высота, равная нулю, имеет смысл (это означает, что вы не существуете). Температура в Кельвинах (0,0 К), 0,0 Кельвина действительно означает «отсутствие тепла». Сравните это с нулевой температурой, которая, пока существует, ничего особенного не значит (хотя, надо признать, по шкале Цельсия это точка замерзания воды).

Примечание. При работе с переменными отношения, но не с переменными интервала, отношение двух измерений имеет смысловую интерпретацию. Например, поскольку вес зависит от отношения, вес в 4 грамма в два раза тяжелее веса в 2 грамма. Тем не менее, температура 10 градусов по Цельсию не должна считаться такой же высокой, как 5 градусов по Цельсию. В этом случае возникнет конфликт, потому что 10 градусов Цельсия — это 50 градусов по Фаренгейту, а 5 градусов по Цельсию — это 41 градус по Фаренгейту. Cleary 50 градусов не в два раза больше, чем 41 градус.