Публикации по теме 'feature-engineering'
Создание ИИ Модели — это упражнение в понимании вашего бизнеса
Знание того, как создавать соответствующие обучающие наборы данных, требует от вас действительного понимания того, что имеет значение.
В последние несколько лет создание новой прогностической модели стало чрезвычайно простым. Существует множество инструментов, которые позволяют легко взять набор данных и создать обученную модель. Обучение А.И. это легкая часть (давайте пока проигнорируем генеративный ИИ).
Обычно говорят, что наиболее трудоемкой частью работы специалиста по данным..
Сравнение производительности двух регрессионных моделей с использованием разных показателей оценки.
Модель A имеет RMSE, равный 10, а модель B — MAE, равную 8. Какую модель вы бы выбрали как более эффективную и почему? Есть ли какие-либо ограничения в выборе показателя?
Итак, моему другу задали этот вопрос в интервью. Давайте углубимся в этот вопрос, чтобы ответить на него.
И RMSE (среднеквадратическая ошибка), и MAE (средняя абсолютная ошибка) являются популярными показателями для оценки эффективности регрессионных моделей, но они подчеркивают разные аспекты точности..
Примеры проектирования функций: группирование категориальных функций
Как использовать NumPy или Pandas для быстрой сортировки категориальных функций
Работа с категориальными данными в целях машинного обучения (ML) иногда может создавать сложные проблемы. В конечном итоге эти функции должны быть каким-то образом численно закодированы, чтобы алгоритм машинного обучения мог действительно работать с ними.
Вы также захотите рассмотреть дополнительные методы подготовки категориальных функций к моделированию. Например, производительность вашей модели может быть..
Важность функций в деревьях решений
Полная реализация Python и объяснение вычислений, лежащих в основе измерения важности функций в алгоритмах машинного обучения на основе дерева.
Цель этой статьи — познакомить читателя с тем, как рассчитывается важность признаков в деревьях решений. Лично я не нашел подробного объяснения этой концепции, и поэтому родилась эта статья.
Весь код, использованный в этой статье, находится в открытом доступе, и его можно найти через:
https://github.com/Eligijus112/градиентное повышение..
Как создать модель прогнозирования оттока
Примечание. португальская версия этой статьи доступна по адресу « Como criar um modelo para predição de churn »
Потеря клиентов - это плохо, и если вы можете предсказать, когда клиент перестанет пользоваться услугой, у вас будет возможность принимать решения, чтобы удержать клиента. Наша цель в этой статье - создать и сравнить модели машинного обучения для прогнозирования оттока.
Данные - самая важная вещь в модели машинного обучения. Хорошая модель не может творить чудо с..
Возможности Art of Engineering для сильной модели машинного обучения
Самый важный процесс для любой проблемы науки о данных, который вам следует изучить.
Что вы узнаете?
Развивайте навыки критического мышления, необходимые для проектирования функций Разработка функций для алгоритма борьбы с отмыванием денег
Вступление
Разработка функций? [1]
Функция - это числовое представление необработанных данных. В структурированных данных это независимые переменные, от которых зависит одна из переменных. Функции, которые уже присутствуют в наборе..
Разработка функций для конкурса Kaggle
0. Введение
Согласно Википедии:
Инженерия признаков – это процесс использования знаний предметной области о данных для создания признаков, обеспечивающих работу алгоритмов машинного обучения. Разработка признаков имеет фундаментальное значение для применения машинного обучения и является сложной и дорогостоящей задачей.
Разработка функций — важный шаг для большинства соревнований Kaggle. В этой статье будут обсуждаться часто используемые методы проектирования признаков для четырех..
Новые материалы
Объяснение документов 02: BERT
BERT представил двухступенчатую структуру обучения: предварительное обучение и тонкая настройка.
Во время предварительного обучения модель обучается на неразмеченных данных с помощью..
Как проанализировать работу вашего классификатора?
Не всегда просто знать, какие показатели использовать
С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..
Работа с цепями Маркова, часть 4 (Машинное обучение)
Нелинейные цепи Маркова с агрегатором и их приложения (arXiv)
Автор : Бар Лайт
Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..
Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]
Как вы сегодня, ребята?
В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..
Использование машинного обучения и Python для классификации 1000 сезонов новичков MLB Hitter
Чему может научиться машина, глядя на сезоны новичков 1000 игроков MLB? Это то, что исследует это приложение.
В этом процессе мы будем использовать неконтролируемое обучение, чтобы..
Учебные заметки: создание моего первого пакета Node.js
Это мои обучающие заметки, когда я научился создавать свой самый первый пакет Node.js, распространяемый через npm.
Оглавление
Глоссарий
I. Новый пакет
1.1 советы по инициализации..
Забудьте о Matplotlib: улучшите визуализацию данных с помощью умопомрачительных функций Seaborn!
Примечание. Эта запись в блоге предполагает базовое знакомство с Python и концепциями анализа данных.
Привет, энтузиасты данных! Добро пожаловать в мой блог, где я расскажу о невероятных..