Публикации по теме 'dimensionality-reduction'
5 основных алгоритмов машинного обучения для бизнес-приложений
Компании, от гигантов рынка, таких как Amazon и Netflix, до небольшого розничного магазина где-то в центре Огайо, стремятся расти и повышать свою эффективность. Одним из способов достижения этого является включение ИИ и машинного обучения в операционную деятельность. Но из-за разнообразия ML сложно выбрать правильный метод и четко понимать, какую пользу он может принести. Итак, в этой статье мы рассмотрим основные алгоритмы машинного обучения, объясним их бизнес-применение и выделим..
Снижение размерности с помощью анализа главных компонентов
Больше не всегда лучше. Данные с высокой размерностью могут быстро стать непригодными из-за ограничений ресурсов и того, для чего вы планируете их использовать. Данные со 150 столбцами не дадут вам многого, если у вас нет вычислительного пространства для их анализа или если вы даже не знаете, что ищете. В качестве средства правовой защиты мы используем метод, называемый уменьшение размерности , чтобы уменьшить наши данные до размера, которым можно управлять и который будет содержать..
Визуализация t-SNE с помощью Yellowbrick — быстрый и простой метод
В моей предыдущей статье я обсуждал, как можно использовать t-SNE для визуализации многомерных данных в низкоразмерном пространстве.
t-SNE — это метод нелинейного уменьшения размерности, который можно использовать для визуализации…
Прогнозы засухи в США с использованием метеорологических данных
Прогнозирование — это больше, чем коммерческое требование. На корпоративном уровне это хлеб с маслом, благодаря которому руководство выживает и строит долгосрочные планы. Правительства принимают решения на национальном уровне, и очень важно учитывать каждый сценарий. Он может влиять на экономический прогресс страны. Каждый выбор, сделанный лидерами, учитывает тот или иной тип данных прогнозирования. Это помогает руководителям принимать более взвешенные решения. В ближайшие кварталы у..
t-SNE — техника визуализации данных
t-SNE или t распределенное встраивание стохастических соседей — это прежде всего метод визуализации данных, родственный анализу основных компонентов (по крайней мере, его применение). Причина, по которой я использовал PCA в качестве примера, заключается в том, что их часто сравнивают и спорят о том, какая из них лучше. В то время как PCA, безусловно, находит свое применение в разработке признаков и определении важных признаков, с точки зрения визуализации данных более высокого измерения в..
Обзор основных принципов анализа главных компонентов (PCA)
Введение
Анализ основных компонентов (PCA) — это широко используемый статистический метод в машинном обучении и статистике, целью которого является уменьшение размерности многомерных наборов данных. Это мощный инструмент для анализа и визуализации данных, поскольку он помогает выявлять закономерности и взаимосвязи в данных. Цель PCA состоит в том, чтобы уменьшить количество признаков в наборе данных, сохраняя при этом как можно больше информации, находя новый набор некоррелированных..
Методы выбора функций на основе обертки
Существует множество способов выбора функций из набора предикторов для повышения производительности моделей машинного обучения. Среди этих методов распространена практика использования другой модели машинного обучения в качестве оболочки, обученной на наборе комбинаций предикторов, чтобы определить, какой набор предикторов лучше всего работает в данной модели.
В этой статье мы рассмотрим некоторые популярные алгоритмы машинного обучения, такие как рекурсивное устранение признаков (RFE),..
Новые материалы
Объяснение документов 02: BERT
BERT представил двухступенчатую структуру обучения: предварительное обучение и тонкая настройка.
Во время предварительного обучения модель обучается на неразмеченных данных с помощью..
Как проанализировать работу вашего классификатора?
Не всегда просто знать, какие показатели использовать
С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..
Работа с цепями Маркова, часть 4 (Машинное обучение)
Нелинейные цепи Маркова с агрегатором и их приложения (arXiv)
Автор : Бар Лайт
Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..
Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]
Как вы сегодня, ребята?
В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..
Использование машинного обучения и Python для классификации 1000 сезонов новичков MLB Hitter
Чему может научиться машина, глядя на сезоны новичков 1000 игроков MLB? Это то, что исследует это приложение.
В этом процессе мы будем использовать неконтролируемое обучение, чтобы..
Учебные заметки: создание моего первого пакета Node.js
Это мои обучающие заметки, когда я научился создавать свой самый первый пакет Node.js, распространяемый через npm.
Оглавление
Глоссарий
I. Новый пакет
1.1 советы по инициализации..
Забудьте о Matplotlib: улучшите визуализацию данных с помощью умопомрачительных функций Seaborn!
Примечание. Эта запись в блоге предполагает базовое знакомство с Python и концепциями анализа данных.
Привет, энтузиасты данных! Добро пожаловать в мой блог, где я расскажу о невероятных..