Публикации по теме 'statistics'
Концепции статистики в науке о данных
Почему статистика
Статистика представляет информацию в простой форме.
Дает вам представление о данных, над которыми вы работаете.
В этом блоге мы будем работать с набором данных, чтобы понять несколько концепций статистики.
Набор данных представляет собой список полов, роста и веса.
Импортируйте необходимые библиотеки
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
Прочитайте данные и получите первые строки DataFrame
data =..
Тест хи-квадрат для начинающих
Итак, вы начали свое путешествие в области аналитики данных и статистического анализа и застряли на тесте хи-квадрат, разберитесь с тестом хи-квадрат с помощью примера.
Согласно статье в Википедии:
критерий хи-квадрат (также критерий хи-квадрат или критерий χ2 ) – это тест статистической гипотезы , используемый при анализе таблицы непредвиденных обстоятельств при больших размерах выборки. Проще говоря, этот тест в основном используется для проверки того, являются ли две..
Демистификация оценки максимального правдоподобия
Многие вводные материалы, учебные программы или курсы по машинному обучению, в которых есть математическая строгость, содержат основополагающие концепции вероятности и статистики. Понимание этих понятий может сбить с толку новичков в этой области, даже имеющих образование в области математики. Это потому, что область машинного обучения потребует своего взгляда на эти концепции для своих строительных блоков и практического использования.
Одной из основополагающих идей для..
Как прогнозировать с SARIMA
Глубокое погружение в модель SARIMA и ее приложения
Фон
В одном из моих предыдущих постов мы рассмотрели, пожалуй, самую известную модель sk-прогнозирования, авторегрессионную интегрированную скользящую среднюю , более известную как ARIMA . Однако одним из недостатков этой модели является то, что в ней не учитывается какая-либо сезонность . Здесь на помощь приходит модель Сезонная авторегрессионная интегрированная скользящая средняя или SARIMA . В этом посте мы..
За алгоритмом O_Sieve
O_Sieve – это алгоритм обнаружения выбросов, использующий трехмерную проекцию точек данных. Он вычисляет расстояния точек данных от центральной точки в трехмерном пространстве на основе квадратов значений целевого столбца. Затем алгоритм определяет верхний и нижний пороговые значения расстояния, используя подход, основанный на медиане. Точки данных, выходящие за пределы этих пороговых значений, считаются выбросами.
Математика
Предположение: возведение в квадрат меньших чисел..
Визуализировать анализ главных компонентов
В следующей статье я собираюсь использовать очень базовую терминологию и определения для описания анализа главных компонентов. Я всего лишь пытаюсь дать четкую визуализацию того, что на самом деле PCA делает с данными. Я не буду углубляться в математику и другие теоретические вещи. Существуют различные другие источники для изучения математики, лежащие в основе PCA. Также поделюсь полезной ссылкой в конце статьи. Итак, не теряя времени, перейдем к нашей сегодняшней теме.
Анализ..
Оценка максимального правдоподобия на основе демонстрации с нуля, визуализации и базовой математики
Роль оценки в машинном обучении и статистике
Алгоритмы машинного обучения, особенно контролируемого типа, часто влекут за собой форму подбора кривой или аппроксимации функции, где цель состоит в том, чтобы найти наилучшую функцию, которая фиксирует базовый шаблон или взаимосвязь в данном наборе данных. Мера «наилучшей» функции часто определяется процессом, называемым оценкой, когда мы количественно оцениваем, насколько хорошо функция соответствует данным, оптимизируя параметры..
Новые материалы
Как проанализировать работу вашего классификатора?
Не всегда просто знать, какие показатели использовать
С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..
Работа с цепями Маркова, часть 4 (Машинное обучение)
Нелинейные цепи Маркова с агрегатором и их приложения (arXiv)
Автор : Бар Лайт
Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..
Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]
Как вы сегодня, ребята?
В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..
Использование машинного обучения и Python для классификации 1000 сезонов новичков MLB Hitter
Чему может научиться машина, глядя на сезоны новичков 1000 игроков MLB? Это то, что исследует это приложение.
В этом процессе мы будем использовать неконтролируемое обучение, чтобы..
Учебные заметки: создание моего первого пакета Node.js
Это мои обучающие заметки, когда я научился создавать свой самый первый пакет Node.js, распространяемый через npm.
Оглавление
Глоссарий
I. Новый пакет
1.1 советы по инициализации..
Забудьте о Matplotlib: улучшите визуализацию данных с помощью умопомрачительных функций Seaborn!
Примечание. Эта запись в блоге предполагает базовое знакомство с Python и концепциями анализа данных.
Привет, энтузиасты данных! Добро пожаловать в мой блог, где я расскажу о невероятных..
ИИ в аэрокосмической отрасли
Каждый полет – это шаг вперед к великой мечте. Чтобы это происходило в их собственном темпе, необходима команда астронавтов для погони за космосом и команда технического обслуживания..