Публикации по теме 'random-forest'
Выживание на «Титанике»: использование машинного обучения для анализа катастроф
Согласно учебнику Kaggle
О стихийном бедствии:
Титаник был британским пассажирским лайнером, который затонул во время своего первого рейса из Саутгемптона, Англия, в Нью-Йорк 15 апреля 1912 года. Корабль столкнулся с айсбергом в северной части Атлантического океана и затонул, в результате чего погибло более 1500 человек. Несмотря на то, что корабль был оснащен многочисленными средствами безопасности, он не смог предотвратить катастрофу. Гибель «Титаника» оказала глубокое влияние на..
Преимущества и недостатки случайного леса: всесторонний взгляд на машинное обучение…
Random Forest — это популярный алгоритм машинного обучения, который используется как для задач классификации, так и для задач регрессии. Он известен своей способностью обрабатывать большие объемы данных и высокой точностью. В этой статье мы рассмотрим основы алгоритма Random Forest, принципы его работы, а также некоторые из его основных преимуществ и недостатков.
Что такое случайный лес?
Случайный лес — это метод ансамблевого обучения, который объединяет прогнозы нескольких деревьев..
Случайное моделирование леса для прогнозирования почасового спроса на велосипеды в районе Ттарынджи в Сеуле, Южный…
Задача регрессии обучения с учителем.
Фон
Растущее повсеместное распространение информационных технологий за последние два десятилетия привело к массовому расцвету так называемой экономики совместного использования, создав возможности для большого количества людей коллективно использовать физические объекты или услуги, которые ранее были доступны только в форме частной собственности. Мы видели, как появилось несколько компаний, которые воспользовались этим изменчивым ландшафтом,..
Алгоритм случайного леса
Случайный лес — это популярный метод «обучения по ансамблю» (объединяет несколько небольших моделей посредством голосования/усреднения для получения прогноза) для задач классификации и регрессии.
Он работает путем построения большого количества деревьев решений во время обучения и вывода класса с большинством голосов среди деревьев решений (классификация) или среднего прогноза (регрессия) отдельных деревьев.
Деревья решений построены таким образом, что каждое дерево немного отличается..
Метод случайного леса в оригинальной идее.
Что такое случайный лес?
Метод ансамбля
Основной алгоритм
Предварительные требования:
Метод начальной загрузки Древо решений
Процесс
Шаг 1: Создайте «самозагрузочный» набор данных
Что такое «самозагружаемый» набор данных? → использовать реляционную ссылку
Шаг 2: Создайте дерево решений, используя набор данных с бустингом на шаге 1, но используйте только случайное подмножество переменных на каждом шаге.
Например, мы узнаем, что Good Blood Circle является..
Бэгинг и бустинг
Нежное введение в бэггинг, бустинг и несколько общих учеников ансамбля
Что я буду освещать?
Я попытаюсь охватить концепции голосования, бэггинга, бустинга и, возможно, концептуально объяснить несколько алгоритмов ансамбля. Я считаю, что есть много ресурсов, которые уже показывают вам, как создавать эти вещи с помощью Sklearn или других библиотек, но концепция, лежащая в их основе, гораздо интереснее. Просто прочтите книгу, и держу пари, вы еще больше оцените идею, лежащую в..
Начало работы с предсказанием молекулярных свойств с помощью машинного обучения
В этом посте я собираюсь показать, как приступить к разработке моделей машинного обучения для предсказания молекулярных свойств. Это должен быть очень минимальный пример. Мы рассмотрим другие методы улучшения этой модели в следующих постах. Мы собираемся предсказать липофильность малых молекул. Набор данных можно скачать с сайта MoleculeNet .
Прогнозирование липофильности — это регрессионная задача, и мы собираемся использовать алгоритм Random Forest, реализованный в пакете..
Новые материалы
Как проанализировать работу вашего классификатора?
Не всегда просто знать, какие показатели использовать
С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..
Работа с цепями Маркова, часть 4 (Машинное обучение)
Нелинейные цепи Маркова с агрегатором и их приложения (arXiv)
Автор : Бар Лайт
Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..
Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]
Как вы сегодня, ребята?
В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..
Использование машинного обучения и Python для классификации 1000 сезонов новичков MLB Hitter
Чему может научиться машина, глядя на сезоны новичков 1000 игроков MLB? Это то, что исследует это приложение.
В этом процессе мы будем использовать неконтролируемое обучение, чтобы..
Учебные заметки: создание моего первого пакета Node.js
Это мои обучающие заметки, когда я научился создавать свой самый первый пакет Node.js, распространяемый через npm.
Оглавление
Глоссарий
I. Новый пакет
1.1 советы по инициализации..
Забудьте о Matplotlib: улучшите визуализацию данных с помощью умопомрачительных функций Seaborn!
Примечание. Эта запись в блоге предполагает базовое знакомство с Python и концепциями анализа данных.
Привет, энтузиасты данных! Добро пожаловать в мой блог, где я расскажу о невероятных..
ИИ в аэрокосмической отрасли
Каждый полет – это шаг вперед к великой мечте. Чтобы это происходило в их собственном темпе, необходима команда астронавтов для погони за космосом и команда технического обслуживания..