Основная тенденция в статистике:

  1. Среднее значение. Среднее – это сумма всех наблюдений, разделенная на количество наблюдений. давайте возьмем пример предмета и его оценок из 100 (80,75,85,70,78) это 5 предметных оценок, которые мы хотим рассчитать Среднее (среднее), поэтому первый шаг - это сложение всех оценок, что составляет 388, а затем разделить это по общему количеству баллов, которое равно 5, теперь мы получаем наше среднее (среднее) 77,6, и это среднее (среднее) всегда обозначается как x̄ ( x - bar ).x̄ = X1+X2+X3+…..+Xn / n, и при рассмотрении среднего значения населения оно будет обозначаться μ.
  2. Мода. Мода — это не что иное, как значение, которое чаще всего встречается в наборе данных. Наблюдение с самой высокой частотой называется режимом этих данных. Например. предположим, что у нас есть такие данные, как (12,23,45,12,67,45,3,4,12,2), из которых эти 12 встречаются чаще всего, поэтому мы можем сказать, что Mode = 12 для этих данных. Большинство Очащеданных вводились. Примечание. Данные могут не иметь режима, иметь 1 режим или более 1 режима. В зависимости от количества режимов, которые имеют данные, их можно назвать одномодальными (1 режим), бимодальными (2 режима), трехмодальными (3 режима) или мультимодальными (n режимов).
  3. Медиана. Среднее значение наблюдения, полученное после упорядочивания данных в порядке возрастания (Примечание. Вы также можете упорядочить данные в порядке убывания), называется медианой данных. Например, рассмотрим данные: (2,1,5,4,3). Расположим эти данные в порядке возрастания: 1, 2, 3, 4, 5. Всего 5 наблюдений. Таким образом, медиана = среднее значение, т. е. 3. Для нечетных чисел: Медиана = (n + 1)/2-е наблюдение, а для четных чисел: Медиана = [(n/2)-е наблюдение + ((n/2) + 1)-е наблюдение. обс.]/2

Что такое дисперсия. Термин дисперсия относится к статистическому измерению разброса между числами в наборе данных. В частности, дисперсия измеряет, насколько далеко каждое число в наборе от среднего и, следовательно, от любого другого числа в наборе. Дисперсия часто изображается этим символом: σ2 (сигма-квадрат). Существует небольшая разница между формулой генеральной совокупности и выборочной дисперсии:

Стандартное отклонение. Стандартное отклонение — это не что иное, как корень отклонения. Стандартное отклонение — это мера того, насколько разбросаны числа. Его символ σ (сигма). От среднего, насколько далеко распределены другие элементы, независимо от того, отличается ли оно от 1 стандартного отклонения вправо, влево, 2 или так далее.

При использовании стандартного отклонения помните о следующих свойствах:

  • Стандартное отклонение чувствительно к экстремальным значениям. Одно очень экстремальное значение может увеличить стандартное отклонение и исказить дисперсию.
  • Для двух наборов данных с одинаковым средним значением большее стандартное отклонение — это тот, в котором данные более разбросаны от центра.
  • Стандартное отклонение равно 0, если все значения равны (поскольку в этом случае все значения равны среднему значению).

Распределение Гаусса/Нормальное распределение. Когда случайная величина подчиняется распределению Гаусса, она образует кривую нормального распределения. На этой колоколообразной кривой мы видим, что наше среднее значение находится в центре, а все стандартные отклонения слева и справа от среднего значения.

Используя эмпирическую формулу, мы просто указываем, сколько элементов встречается в этой конкретной области. На приведенной выше диаграмме зеленый цвет имеет 68,2% элементов, и это 1 стандартное отклонение от среднего, а вероятность (среднее стандартное отклонение ≤ n ≤ среднее + стандартное отклонение) будет приблизительно 68,2%, где n — моя случайная величина. Общее количество элементов из этого n, присутствующих между первым стандартным отклонением слева и справа, составляет около 68,2%, и так далее, мы вычисляем следующие стандартные отклонения.

Формула для распределения Гаусса: (Среднее (μ) , Стандартное отклонение (σ))

Стандартное нормальное распределение.Стандартное нормальное распределение, также называемое z-распределением, представляет собой особое нормальное распределение, где среднее значение равно 0, а стандартное отклонение равно 1.

Используя эту формулу, мы можем рассчитать Z-показатель. Затем мы используем стандартный скаляр для масштабирования данных.

Журнал нормального распределения. Когда мое n, являющееся случайной величиной, принадлежит логарифмическому нормальному распределению, если log(n) нормально распределен с некоторым значением среднего и стандартного отклонения.

Разница между нормальной и логарифмической нормой заключается в том, что эта кривая расширена вправо, поэтому она не похожа на кривую нормального распределения. Давайте возьмем пример дохода людей, увидев эту диаграмму, мы можем сказать, что средний доход будет от 1 по оси x до 0,4 по оси y, и все миллиардеры будут находиться в диапазоне от 2 до 3 по оси x, потому что миллиардеры очень меньше сопоставляются со всеми народами, поэтому он сформировался кривая с наклоном вправо.

Функция плотности вероятности (PDF): также называется плотностью непрерывной случайной величины. В PDF результатом всегда является непрерывное значение. Возьмем пример цены акций, которая имеет непрерывные значения.

Функция массы вероятности (PMF):Функция массы вероятности играет очень важную роль в распределении Бернулли. Функция массы вероятности — это функция, которая дает вероятность того, что дискретная случайная величина точно равна некоторому значению. Поэтому ее также называют функцией дискретной плотности.

Распределение Бернулли:этодискретное распределение вероятностей случайной величины, которая принимает значение 1 с вероятностью p и значение 0 с вероятностью q=1-p. Менее формально его можно рассматривать как модель набора возможных результатов любого отдельного эксперимента, который задает вопрос «да-нет». Возьмем пример подбрасывания монеты, который даст {H, T}, представляя H с 1 и T с 0, и наоборот, поэтому наше p будет вероятностью H или T. В частности, у нечестных монет p не равно 1/2 .