Публикации по теме 'feature-engineering'
Как извлечь встраивания нейронной сети
МАШИННОЕ ОБУЧЕНИЕ
Как извлечь встраивания нейронной сети
Повышение точности прогнозирования с помощью встраивания нейронных сетей
Введение
В нашем предыдущем блоге по разработке функций мы рассмотрели способы ручной разработки функций . В этом блоге мы рассмотрим автоматическую разработку функций, выполняемую нейронными сетями, и то, как извлекать эти вложения и использовать их вместе с функциями, созданными вручную. Обратите внимание, что мы использовали платформу TensorFlow..
Тема: 7 Обработка смешанных переменных даты и времени
Что такое смешанные переменные в данных?
Смешанные переменные в данных относятся к наличию переменных разных типов в одном наборе данных. В контексте машинного обучения смешанные переменные могут означать наличие как числовых, так и категориальных переменных, а также наличие как непрерывных, так и дискретных переменных.
Например, набор данных может содержать как числовые переменные, такие как доход и возраст, так и категориальные переменные, такие как пол и род занятий. Этот тип..
D для данных. F для преобразования Фурье. S для сигнала.
Часть-3
В продолжение нашего обсуждения удаления шума с помощью преобразования Фурье в Части-2 попробуем понять, всегда ли можно отфильтровать шум и получить чистый сигнал.
Амплитудный спектр, на который мы смотрели,
Проблема с этим спектром в том, что две частоты со значениями 25 и 75 полностью исчезают за шумом. Теперь в таких случаях мы, возможно, не сможем полностью отфильтровать шум, но, безусловно, уменьшим его, выбрав правильный порог для обнуления частот, отражающих шум...
Почему стандартные методы импутации отмывания денег недостаточно хороши
Работа с отсутствующими данными требует знаний в области бизнеса и дополнительной работы.
На большинстве курсов по науке о данных студентов учат легко находить недостающие данные с помощью методов статистического вменения. Их учат заполнять пропущенные значения средним значением или модой столбца.
По мере того, как студенты становятся практиками, они могут начать использовать более продвинутые методы, в которых они используют статистические методы для вывода наиболее вероятного значения..
Лучший способ обработки пропущенных значений в вашем наборе данных: использование KNN Imputer
Содержание:
∘ Многомерный вменитель: ∘ Здесь вам придется работать в два этапа. ∘ Реализация:
Многомерный импортер:
Многомерный вменитель — это статистический инструмент, используемый для заполнения пропущенных значений в наборе данных путем рассмотрения связей между несколькими переменными. Вместо того, чтобы просто самостоятельно угадывать пропущенные значения, он учитывает связи между различными точками данных, чтобы сделать более точные замены. Это помогает..
Покупка футбольной команды: подход машинного обучения
Подход, который лучше, чем случайное угадывание или выбор игроков из 18000 профессиональных игроков.
По мере того, как мы продвигаемся в мир, где спорт стал жизненно важной частью нашей жизни, он также стал горячим рынком для инвесторов, чтобы получить большую прибыль, взаимодействовать с аудиторией и сделать свое присутствие ощутимым. Кроме того, мы видим, что наблюдался всплеск спортивной аудитории, что привело к увеличению количества турниров, и получение на них прибыли стало..
Разработка функций
Разработка признаков — неотъемлемая часть построения и реализации моделей машинного обучения. В этой статье мы узнаем о контексте разработки функций в рабочем процессе машинного обучения. Кроме того, вы получите краткий обзор многих инструментов обработки данных, используемых в разработке функций, и того, как они помогают специалистам по данным в диагностике моделей.
Введение
Давайте теперь поговорим о «топливе» разработки признаков, которым являются «функции». Функция — это..
Новые материалы
Объяснение документов 02: BERT
BERT представил двухступенчатую структуру обучения: предварительное обучение и тонкая настройка.
Во время предварительного обучения модель обучается на неразмеченных данных с помощью..
Как проанализировать работу вашего классификатора?
Не всегда просто знать, какие показатели использовать
С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..
Работа с цепями Маркова, часть 4 (Машинное обучение)
Нелинейные цепи Маркова с агрегатором и их приложения (arXiv)
Автор : Бар Лайт
Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..
Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]
Как вы сегодня, ребята?
В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..
Использование машинного обучения и Python для классификации 1000 сезонов новичков MLB Hitter
Чему может научиться машина, глядя на сезоны новичков 1000 игроков MLB? Это то, что исследует это приложение.
В этом процессе мы будем использовать неконтролируемое обучение, чтобы..
Учебные заметки: создание моего первого пакета Node.js
Это мои обучающие заметки, когда я научился создавать свой самый первый пакет Node.js, распространяемый через npm.
Оглавление
Глоссарий
I. Новый пакет
1.1 советы по инициализации..
Забудьте о Matplotlib: улучшите визуализацию данных с помощью умопомрачительных функций Seaborn!
Примечание. Эта запись в блоге предполагает базовое знакомство с Python и концепциями анализа данных.
Привет, энтузиасты данных! Добро пожаловать в мой блог, где я расскажу о невероятных..