Публикации по теме 'statistics'
Что такое P-значение?
Серия специализаций John Hopkins DS
Что такое P-значение?
Введение в тестирование p-значения и значимости, p-hacking, а также примеры p-значений в R
Full series
Part 1 - What is Data Science, Big data and the Data Science process
Part 2 - The origin of R, why use R, R vs Python and resources to learn
Part 3 - Version Control, Git & GitHub and best practices for sharing code.
Part 4 - The 6 types of data analysis
Part 5 - The ability to design experiments to..
Раскрытие возможностей унифицированной многообразной аппроксимации и проекции для уменьшения размерности
Равномерное многомерное приближение и проецирование (UMAP) — это мощный метод машинного обучения, который позволяет сводить многомерные данные в низкоразмерное пространство, сохраняя при этом топологическую структуру данных. Это достигается за счет использования нечеткой топологической структуры, которая позволяет идентифицировать лежащее в основе многообразие данных и спроецировать это многообразие на пространство меньшей размерности.
Одним из ключевых преимуществ UMAP является его..
Выведенный статистика
Прежде чем перейти к главному, сначала я попытаюсь найти значение слова «Infer» — это значит делать какие-то выводы из доказательств. Итак, мы получаем что-то вроде «предсказания». Давайте посмотрим, каково правильное определение этого.
Логическая статистика - это еще одна отрасль статистики, которая опирается на теорию вероятностей и распределение, в частности, для прогнозирования стоимости населения на основе выборочных данных. конечно визуализация поможет нам.
Логическая..
Работа с выбросами с использованием трех надежных моделей линейной регрессии
Работа с выбросами с использованием трех надежных моделей линейной регрессии
С практическим примером использования алгоритмов регрессии Huber, RANSAC и Theil-Sen
Линейная регрессия — одна из самых простых моделей машинного обучения. Часто это отправная точка не только для изучения науки о данных, но и для создания быстрых и простых минимально жизнеспособных продуктов (MVP), которые затем служат эталоном для более сложных алгоритмов. Как правило, линейная регрессия соответствует..
Допущения линейной регрессии
Линейная регрессия используется, когда набор данных имеет линейную корреляцию. Перед построением модели линейной регрессии предположения должны быть проверены . Если предположения нарушаются, необходимо использовать разные методики.
Простая линейная регрессия имеет одну независимую переменную (предиктор) и зависимую переменную (ответ), а множественная линейная регрессия имеет более одного предиктора для прогнозирования ответа.
Уравнение простой линейной регрессии..
Некоррелированность и независимость
Разница между анализом основных компонентов и анализом независимых компонентов
Многим людям трудно отличить анализ основных компонентов (PCA) от анализа независимых компонентов (ICA). PCA — это алгоритм машинного обучения, который может преобразовывать набор данных за счет максимизации некоррелированности. Напротив, ICA преобразует данные, используя максимизацию независимости. В этой статье я попытаюсь объяснить разницу между некоррелированностью и независимостью.
Некоррелированность..
Настройка XGBoost: распространенные ошибки гиперпараметров и как их избежать
Настройка гиперпараметров XGBoost имеет решающее значение для достижения оптимальной производительности. Гиперпараметры — это параметры, которые задаются до начала процесса обучения и не изучаются во время обучения. Эти параметры включают в себя такие вещи, как скорость обучения, количество деревьев и глубину дерева. Неправильная установка этих гиперпараметров может привести к неоптимальной производительности, такой как переоснащение или недообучение. Поэтому важно уделить время..
Новые материалы
Как проанализировать работу вашего классификатора?
Не всегда просто знать, какие показатели использовать
С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..
Работа с цепями Маркова, часть 4 (Машинное обучение)
Нелинейные цепи Маркова с агрегатором и их приложения (arXiv)
Автор : Бар Лайт
Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..
Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]
Как вы сегодня, ребята?
В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..
Использование машинного обучения и Python для классификации 1000 сезонов новичков MLB Hitter
Чему может научиться машина, глядя на сезоны новичков 1000 игроков MLB? Это то, что исследует это приложение.
В этом процессе мы будем использовать неконтролируемое обучение, чтобы..
Учебные заметки: создание моего первого пакета Node.js
Это мои обучающие заметки, когда я научился создавать свой самый первый пакет Node.js, распространяемый через npm.
Оглавление
Глоссарий
I. Новый пакет
1.1 советы по инициализации..
Забудьте о Matplotlib: улучшите визуализацию данных с помощью умопомрачительных функций Seaborn!
Примечание. Эта запись в блоге предполагает базовое знакомство с Python и концепциями анализа данных.
Привет, энтузиасты данных! Добро пожаловать в мой блог, где я расскажу о невероятных..
ИИ в аэрокосмической отрасли
Каждый полет – это шаг вперед к великой мечте. Чтобы это происходило в их собственном темпе, необходима команда астронавтов для погони за космосом и команда технического обслуживания..