Основная тенденция в статистике:
- Среднее значение. Среднее – это сумма всех наблюдений, разделенная на количество наблюдений. давайте возьмем пример предмета и его оценок из 100 (80,75,85,70,78) это 5 предметных оценок, которые мы хотим рассчитать Среднее (среднее), поэтому первый шаг - это сложение всех оценок, что составляет 388, а затем разделить это по общему количеству баллов, которое равно 5, теперь мы получаем наше среднее (среднее) 77,6, и это среднее (среднее) всегда обозначается как x̄ ( x - bar ).x̄ = X1+X2+X3+…..+Xn / n, и при рассмотрении среднего значения населения оно будет обозначаться μ.
- Мода. Мода — это не что иное, как значение, которое чаще всего встречается в наборе данных. Наблюдение с самой высокой частотой называется режимом этих данных. Например. предположим, что у нас есть такие данные, как (12,23,45,12,67,45,3,4,12,2), из которых эти 12 встречаются чаще всего, поэтому мы можем сказать, что Mode = 12 для этих данных. Большинство Очащеданных вводились. Примечание. Данные могут не иметь режима, иметь 1 режим или более 1 режима. В зависимости от количества режимов, которые имеют данные, их можно назвать одномодальными (1 режим), бимодальными (2 режима), трехмодальными (3 режима) или мультимодальными (n режимов).
- Медиана. Среднее значение наблюдения, полученное после упорядочивания данных в порядке возрастания (Примечание. Вы также можете упорядочить данные в порядке убывания), называется медианой данных. Например, рассмотрим данные: (2,1,5,4,3). Расположим эти данные в порядке возрастания: 1, 2, 3, 4, 5. Всего 5 наблюдений. Таким образом, медиана = среднее значение, т. е. 3. Для нечетных чисел: Медиана = (n + 1)/2-е наблюдение, а для четных чисел: Медиана = [(n/2)-е наблюдение + ((n/2) + 1)-е наблюдение. обс.]/2
Что такое дисперсия. Термин дисперсия относится к статистическому измерению разброса между числами в наборе данных. В частности, дисперсия измеряет, насколько далеко каждое число в наборе от среднего и, следовательно, от любого другого числа в наборе. Дисперсия часто изображается этим символом: σ2 (сигма-квадрат). Существует небольшая разница между формулой генеральной совокупности и выборочной дисперсии:
Стандартное отклонение. Стандартное отклонение — это не что иное, как корень отклонения. Стандартное отклонение — это мера того, насколько разбросаны числа. Его символ σ (сигма). От среднего, насколько далеко распределены другие элементы, независимо от того, отличается ли оно от 1 стандартного отклонения вправо, влево, 2 или так далее.
При использовании стандартного отклонения помните о следующих свойствах:
- Стандартное отклонение чувствительно к экстремальным значениям. Одно очень экстремальное значение может увеличить стандартное отклонение и исказить дисперсию.
- Для двух наборов данных с одинаковым средним значением большее стандартное отклонение — это тот, в котором данные более разбросаны от центра.
- Стандартное отклонение равно 0, если все значения равны (поскольку в этом случае все значения равны среднему значению).
Распределение Гаусса/Нормальное распределение. Когда случайная величина подчиняется распределению Гаусса, она образует кривую нормального распределения. На этой колоколообразной кривой мы видим, что наше среднее значение находится в центре, а все стандартные отклонения слева и справа от среднего значения.
Используя эмпирическую формулу, мы просто указываем, сколько элементов встречается в этой конкретной области. На приведенной выше диаграмме зеленый цвет имеет 68,2% элементов, и это 1 стандартное отклонение от среднего, а вероятность (среднее стандартное отклонение ≤ n ≤ среднее + стандартное отклонение) будет приблизительно 68,2%, где n — моя случайная величина. Общее количество элементов из этого n, присутствующих между первым стандартным отклонением слева и справа, составляет около 68,2%, и так далее, мы вычисляем следующие стандартные отклонения.
Формула для распределения Гаусса: (Среднее (μ) , Стандартное отклонение (σ))
Стандартное нормальное распределение.Стандартное нормальное распределение, также называемое z-распределением, представляет собой особое нормальное распределение, где среднее значение равно 0, а стандартное отклонение равно 1.
Используя эту формулу, мы можем рассчитать Z-показатель. Затем мы используем стандартный скаляр для масштабирования данных.
Журнал нормального распределения. Когда мое n, являющееся случайной величиной, принадлежит логарифмическому нормальному распределению, если log(n) нормально распределен с некоторым значением среднего и стандартного отклонения.
Разница между нормальной и логарифмической нормой заключается в том, что эта кривая расширена вправо, поэтому она не похожа на кривую нормального распределения. Давайте возьмем пример дохода людей, увидев эту диаграмму, мы можем сказать, что средний доход будет от 1 по оси x до 0,4 по оси y, и все миллиардеры будут находиться в диапазоне от 2 до 3 по оси x, потому что миллиардеры очень меньше сопоставляются со всеми народами, поэтому он сформировался кривая с наклоном вправо.
Функция плотности вероятности (PDF): также называется плотностью непрерывной случайной величины. В PDF результатом всегда является непрерывное значение. Возьмем пример цены акций, которая имеет непрерывные значения.
Функция массы вероятности (PMF):Функция массы вероятности играет очень важную роль в распределении Бернулли. Функция массы вероятности — это функция, которая дает вероятность того, что дискретная случайная величина точно равна некоторому значению. Поэтому ее также называют функцией дискретной плотности.
Распределение Бернулли:этодискретное распределение вероятностей случайной величины, которая принимает значение 1 с вероятностью p и значение 0 с вероятностью q=1-p. Менее формально его можно рассматривать как модель набора возможных результатов любого отдельного эксперимента, который задает вопрос «да-нет». Возьмем пример подбрасывания монеты, который даст {H, T}, представляя H с 1 и T с 0, и наоборот, поэтому наше p будет вероятностью H или T. В частности, у нечестных монет p не равно 1/2 .