Поскольку R — один из самых популярных языков для машинного обучения, существует множество пакетов, которые могут ускорить ваши проекты по науке о данных. Такие ресурсы, как ggplot, dplyr и data.table, уже очень популярны для любой работы со статистикой, но вот несколько отличных пакетов для машинного обучения, которые можно держать в заднем кармане.
млр3
mlr3 — это пакет, ориентированный на большие наборы данных и масштабируемые решения. Он фокусируется на основных вычислительных операциях и обеспечивает основу для дополнительных пакетов.
вставка
Caret (также известная как обучение классификации и регрессии) имеет множество функций для обучения, построения графиков и анализа алгоритмов классификации и регрессии.
XGboost
XGBoost — Extreme Gradient Boosting — это масштабируемая модель, которая развертывает деревья решений с градиентным усилением. Используя модели классификации и регрессии, XGBoost является ведущим пакетом для моделирования классификации в R.
e1071
e1071 — это пакет, содержащий функции для анализа скрытых классов, кластеризации, машин опорных векторов и многих других моделей.
случайный лес
randomForest легко и эффективно развертывает модели деревьев решений.