WedX - журнал о программировании и компьютерных науках

Публикации по теме 'feature-engineering'


Создание ИИ Модели — это упражнение в понимании вашего бизнеса
Знание того, как создавать соответствующие обучающие наборы данных, требует от вас действительного понимания того, что имеет значение. В последние несколько лет создание новой прогностической модели стало чрезвычайно простым. Существует множество инструментов, которые позволяют легко взять набор данных и создать обученную модель. Обучение А.И. это легкая часть (давайте пока проигнорируем генеративный ИИ). Обычно говорят, что наиболее трудоемкой частью работы специалиста по данным..

Сравнение производительности двух регрессионных моделей с использованием разных показателей оценки.
Модель A имеет RMSE, равный 10, а модель B — MAE, равную 8. Какую модель вы бы выбрали как более эффективную и почему? Есть ли какие-либо ограничения в выборе показателя? Итак, моему другу задали этот вопрос в интервью. Давайте углубимся в этот вопрос, чтобы ответить на него. И RMSE (среднеквадратическая ошибка), и MAE (средняя абсолютная ошибка) являются популярными показателями для оценки эффективности регрессионных моделей, но они подчеркивают разные аспекты точности..

Примеры проектирования функций: группирование категориальных функций
Как использовать NumPy или Pandas для быстрой сортировки категориальных функций Работа с категориальными данными в целях машинного обучения (ML) иногда может создавать сложные проблемы. В конечном итоге эти функции должны быть каким-то образом численно закодированы, чтобы алгоритм машинного обучения мог действительно работать с ними. Вы также захотите рассмотреть дополнительные методы подготовки категориальных функций к моделированию. Например, производительность вашей модели может быть..

Важность функций в деревьях решений
Полная реализация Python и объяснение вычислений, лежащих в основе измерения важности функций в алгоритмах машинного обучения на основе дерева. Цель этой статьи — познакомить читателя с тем, как рассчитывается важность признаков в деревьях решений. Лично я не нашел подробного объяснения этой концепции, и поэтому родилась эта статья. Весь код, использованный в этой статье, находится в открытом доступе, и его можно найти через: https://github.com/Eligijus112/градиентное повышение..

Как создать модель прогнозирования оттока
Примечание. португальская версия этой статьи доступна по адресу « Como criar um modelo para predição de churn » Потеря клиентов - это плохо, и если вы можете предсказать, когда клиент перестанет пользоваться услугой, у вас будет возможность принимать решения, чтобы удержать клиента. Наша цель в этой статье - создать и сравнить модели машинного обучения для прогнозирования оттока. Данные - самая важная вещь в модели машинного обучения. Хорошая модель не может творить чудо с..

Возможности Art of Engineering для сильной модели машинного обучения
Самый важный процесс для любой проблемы науки о данных, который вам следует изучить. Что вы узнаете? Развивайте навыки критического мышления, необходимые для проектирования функций Разработка функций для алгоритма борьбы с отмыванием денег Вступление Разработка функций? [1] Функция - это числовое представление необработанных данных. В структурированных данных это независимые переменные, от которых зависит одна из переменных. Функции, которые уже присутствуют в наборе..

Разработка функций для конкурса Kaggle
0. Введение Согласно Википедии: Инженерия признаков – это процесс использования знаний предметной области о данных для создания признаков, обеспечивающих работу алгоритмов машинного обучения. Разработка признаков имеет фундаментальное значение для применения машинного обучения и является сложной и дорогостоящей задачей. Разработка функций — важный шаг для большинства соревнований Kaggle. В этой статье будут обсуждаться часто используемые методы проектирования признаков для четырех..

Новые материалы

Объяснение документов 02: BERT
BERT представил двухступенчатую структуру обучения: предварительное обучение и тонкая настройка. Во время предварительного обучения модель обучается на неразмеченных данных с помощью..

Как проанализировать работу вашего классификатора?
Не всегда просто знать, какие показатели использовать С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..

Работа с цепями Маркова, часть 4 (Машинное обучение)
Нелинейные цепи Маркова с агрегатором и их приложения (arXiv) Автор : Бар Лайт Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..

Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]
Как вы сегодня, ребята? В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..

Использование машинного обучения и Python для классификации 1000 сезонов новичков MLB Hitter
Чему может научиться машина, глядя на сезоны новичков 1000 игроков MLB? Это то, что исследует это приложение. В этом процессе мы будем использовать неконтролируемое обучение, чтобы..

Учебные заметки: создание моего первого пакета Node.js
Это мои обучающие заметки, когда я научился создавать свой самый первый пакет Node.js, распространяемый через npm. Оглавление Глоссарий I. Новый пакет 1.1 советы по инициализации..

Забудьте о Matplotlib: улучшите визуализацию данных с помощью умопомрачительных функций Seaborn!
Примечание. Эта запись в блоге предполагает базовое знакомство с Python и концепциями анализа данных. Привет, энтузиасты данных! Добро пожаловать в мой блог, где я расскажу о невероятных..


Для любых предложений по сайту: [email protected]