Что такое случайный лес?
Метод ансамбля
Основной алгоритм
Предварительные требования:
- Метод начальной загрузки
- Древо решений
Процесс
Шаг 1: Создайте «самозагрузочный» набор данных
Что такое «самозагружаемый» набор данных? → использовать реляционную ссылку
Шаг 2: Создайте дерево решений, используя набор данных с бустингом на шаге 1, но используйте только случайное подмножество переменных на каждом шаге.
Например, мы узнаем, что Good Blood Circle является корневым узлом. Эта функция выделена серым цветом, чтобы сосредоточиться на остальных переменных.
Продолжайте с ним, чтобы закончить дерево.
Таким образом, у нас есть дерево решений с загруженным набором данных.
Повторяя этот процесс, мы получаем много деревьев решений. Слово «лес» в этом методе является представлением в этой ситуации.
Теперь мы создаем «таблицу» для агрегирования результатов для каждого случая. Это будет использоваться для прогнозирования метки для этого случая.
Ускорение данных плюс использование агрегата для принятия решения называется «бэггингом».
Примечание:
Random Forest — это ансамблевый алгоритм, а не бинарное дерево решений.
Ссылка
Спасибо за чтение! Я продолжу открывать Random Forest в ближайшем будущем.