Публикации по теме 'data-science'
Предвзятость, дисперсия и их компромисс.
Введение:
Понятия предвзятости и дисперсии применимы к методам обучения с учителем. Они используются, чтобы помочь нам решить, какую модель выбрать для решения проблемы.
Что такое предвзятость?
Смещение — это термин, который обычно ассоциируется с обучающими данными. Он демонстрирует, насколько хорошо ваша модель уловила закономерности в обучающих данных. Модель с высокой степенью достоверности означает, что модель уловила большинство закономерностей в данных и наоборот.
Существует..
Помимо машинного зрения: как ИИ может создавать реалистичные изображения?
Центр науки о данных профессор Кайл Кранмер рассказывает о GAN и VAE
В настоящее время существует два основных подхода к созданию изображений с использованием искусственного интеллекта: генеративные состязательные сети (GAN) и вариационное автокодирование (VAE).
GAN противопоставляет две нейронные сети друг другу, чтобы улучшить качество их создания фотореалистичных изображений. В GAN есть генератор, который производит поддельные изображения, и дискриминатор, который отличает..
Как выбрать K для K-средних
Простое объяснение и реализация метода локтя
Есть несколько способов выбрать K для K-средних. В этой статье метод локтя объясняется и реализуется очень простым способом .
Объяснение
Ниже наши данные. Легко видеть, что количество кластеров должно быть равно 4.
Мы попытаемся получить K = 4, наблюдая различные значения K.
Визуальное объяснение
На изображении ниже синие точки принадлежат нашему набору данных, а красные точки — это центры кластеров.
Как видите, от каждого..
Лучшие библиотеки MLOps Python, которые вы должны знать в 2022 году
Введение
Операции машинного обучения называются MLOps. Цель MLOps — упростить запуск моделей машинного обучения в производство, управление ими и их мониторинг. Специалисты по данным, инженеры по машинному обучению и инженеры DevOps часто работают вместе в MLOps, что является совместной ролью. Машинное обучение и DevOps, две разные области программного обеспечения…
Прикладной анализ временных рядов велосипедных аварий в Мадриде
Вы будете в безопасности на велосипеде домой
Недавно я наткнулся на набор данных, содержащий зарегистрированные несчастные случаи с участием велосипедистов, и мне, как специалисту по данным, который любит время от времени кататься по моему городу, это показалось хорошей возможностью поразвлечься с этими данными.
Чтобы быть более точным, данные формируют временной ряд за период с 2010 по 2018 год, когда несчастные случаи регистрируются полицией в хронологическом порядке, и открыто..
Матрица путаницы
1 января 2022 г.
Матрица путаницы
Это метрика оценки классификации.
Матрица путаницы — это то место, где мы измеряем эффективность нашей модели. Лучше эффективность, лучше производительность, и это именно то, что мы хотим. И именно здесь в центре внимания оказывается матрица путаницы. Матрица путаницы — это показатель эффективности классификации машинного обучения.
Как следует из названия, это на самом деле немного сбивает с толку в первый раз, когда я учился, я имею в виду,..
Сортировка данных как стирка: волшебство кластеризации в персонализации клиентского опыта
TL;DR: краткое введение в захватывающий мир кластеризации, где сортировка данных становится такой же простой, но важной, как сортировка белья, что позволяет персонализировать взаимодействие с клиентами в различных секторах. Этот пост посвящен бизнес-пониманию и вариантам использования, а технические подробности будут рассмотрены в следующих постах!
Кластеризация, метод, используемый в науке о данных и машинном обучении, похож на сортировку белья для группировки похожих предметов...
Новые материалы
Я хотел выучить язык программирования MVC4, но не мог выучить его раньше, потому что это выглядит сложно…
Просто начните и учитесь самостоятельно
Я хотел выучить язык программирования MVC4, но не мог выучить его раньше, потому что он кажется мне сложным, и я бросил его. Это в основном инструмент..
Лицензии с открытым исходным кодом: руководство для разработчиков и создателей
В динамичном мире разработки программного обеспечения открытый исходный код стал мощной парадигмой, способствующей сотрудничеству, инновациям и прогрессу, движимому сообществом. В основе..
Объяснение документов 02: BERT
BERT представил двухступенчатую структуру обучения: предварительное обучение и тонкая настройка.
Во время предварительного обучения модель обучается на неразмеченных данных с помощью..
Как проанализировать работу вашего классификатора?
Не всегда просто знать, какие показатели использовать
С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..
Работа с цепями Маркова, часть 4 (Машинное обучение)
Нелинейные цепи Маркова с агрегатором и их приложения (arXiv)
Автор : Бар Лайт
Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..
Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]
Как вы сегодня, ребята?
В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..
Использование машинного обучения и Python для классификации 1000 сезонов новичков MLB Hitter
Чему может научиться машина, глядя на сезоны новичков 1000 игроков MLB? Это то, что исследует это приложение.
В этом процессе мы будем использовать неконтролируемое обучение, чтобы..