Поскольку R — один из самых популярных языков для машинного обучения, существует множество пакетов, которые могут ускорить ваши проекты по науке о данных. Такие ресурсы, как ggplot, dplyr и data.table, уже очень популярны для любой работы со статистикой, но вот несколько отличных пакетов для машинного обучения, которые можно держать в заднем кармане.

млр3

mlr3 — это пакет, ориентированный на большие наборы данных и масштабируемые решения. Он фокусируется на основных вычислительных операциях и обеспечивает основу для дополнительных пакетов.

вставка

Caret (также известная как обучение классификации и регрессии) имеет множество функций для обучения, построения графиков и анализа алгоритмов классификации и регрессии.

XGboost

XGBoost — Extreme Gradient Boosting — это масштабируемая модель, которая развертывает деревья решений с градиентным усилением. Используя модели классификации и регрессии, XGBoost является ведущим пакетом для моделирования классификации в R.

e1071

e1071 — это пакет, содержащий функции для анализа скрытых классов, кластеризации, машин опорных векторов и многих других моделей.

случайный лес

randomForest легко и эффективно развертывает модели деревьев решений.