Публикации по теме 'data-science'
Последние обновления StyleGAN часть 1 (машинное обучение)
ChildGAN: крупномасштабные синтетические данные о лицах детей с использованием доменной адаптации в StyleGAN (arXiv)
Автор: Мухаммад Али Фарук , Ван Яо , Габриэль Косташ , Питер Коркоран .
Аннотация: В этой исследовательской работе мы предложили новый ChildGAN, пару сетей GAN для создания синтетических данных о лицах мальчиков и девочек, полученных из StyleGAN2. ChildGAN построен путем плавного переноса домена с использованием трансферного обучения. Он предоставляет..
10 примеров построения графиков распределения с Python Seaborn
Графики распределения имеют решающее значение для EDA
Первым шагом любого информационного продукта должно быть понимание необработанных данных. Для успешных и эффективных продуктов этот этап занимает значительную часть всего рабочего процесса.
Есть несколько методов, используемых для понимания и изучения данных. Один из них - создание визуализаций данных. Они помогают нам исследовать и объяснять данные.
Создавая подходящие и хорошо продуманные визуализации, мы можем обнаружить..
Что такое бэктестинг в машинном обучении?
Бэктестинг в машинном обучении — это метод, используемый для оценки производительности и эффективности модели машинного обучения с использованием исторических данных. Он включает тестирование модели на прошлых данных, чтобы смоделировать, как она работала бы, если бы она использовалась для прогнозов в течение этого периода. Основная цель ретроспективного тестирования — оценить способность модели обобщать и делать точные прогнозы на невидимых данных.
Вот как работает бэктестинг в..
Финансирование стартапа — Значения SHAP для этапа, лет, инвестора и т. д.
Значения SHAP этапа, лет, инвестора и т. д.
В этой статье я использую общедоступный набор данных, который содержит информацию о 2900 записях данных о финансировании индийских стартапов с 2018 по 2021 год, собранных с веб-сайта startuptalky.com . Набор данных публично доступен на Kaggle . Полную информацию об анализе можно найти в этой общедоступной записной книжке Kaggle .
Шаг 1 — предварительная обработка данных
Здесь предварительная обработка данных состоит из следующих..
Как работают модели, основанные на энергии, часть 4 (машинное обучение)
Универсальные энергетические модели для физики высоких энергий (arXiv)
Автор: Таоли Ченг , Аарон Курвиль .
Аннотация: Энергетические модели имеют естественное преимущество гибкости в виде функции энергии. В последнее время модели на основе энергии достигли больших успехов в моделировании многомерных данных в компьютерном зрении и обработке естественного языка. В соответствии с этими признаками прогресса мы строим универсальную энергетическую модель для событий в физике высоких..
10 практик, которые я оставил позади, чтобы овладеть искусством науки о данных
Привет, коллеги-энтузиасты данных! Меня зовут Гейб А., и сегодня я хочу познакомить вас с моей карьерой в области науки о данных, подчеркнув десять практик, от которых я отказался на пути к тому, чтобы стать экспертом по Python и визуализации данных, которым я являюсь сегодня. За последнее десятилетие мне посчастливилось глубоко погрузиться в мир данных, и я рад поделиться с вами уроками, которые я извлек.
1. Ручной ввод данных
В первые дни своего пути в области науки о данных я..
От беспорядка к великолепию: руководство по предварительной обработке данных для машинного обучения в Python
Данные — это жизненная сила алгоритмов машинного обучения, но реальные данные часто беспорядочны и требуют тщательной подготовки, прежде чем их можно будет использовать в моделях. Предварительная обработка данных — важнейший первый шаг, который очищает, преобразовывает и подготавливает необработанные данные для задач машинного обучения. В этом подробном руководстве мы рассмотрим основные этапы предварительной обработки данных с использованием библиотек Python, таких как Pandas, NumPy и..
Новые материалы
Как создать диаграмму градиентной кисти с помощью D3.js
Резюме:
Из этого туториала Вы узнаете, как добавить градиентную кисть к диаграмме с областями в D3.js. Мы добавим градиент к значениям SVG и применим градиент в качестве заливки к диаграмме с..
Я хотел выучить язык программирования MVC4, но не мог выучить его раньше, потому что это выглядит сложно…
Просто начните и учитесь самостоятельно
Я хотел выучить язык программирования MVC4, но не мог выучить его раньше, потому что он кажется мне сложным, и я бросил его. Это в основном инструмент..
Лицензии с открытым исходным кодом: руководство для разработчиков и создателей
В динамичном мире разработки программного обеспечения открытый исходный код стал мощной парадигмой, способствующей сотрудничеству, инновациям и прогрессу, движимому сообществом. В основе..
Объяснение документов 02: BERT
BERT представил двухступенчатую структуру обучения: предварительное обучение и тонкая настройка.
Во время предварительного обучения модель обучается на неразмеченных данных с помощью..
Как проанализировать работу вашего классификатора?
Не всегда просто знать, какие показатели использовать
С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..
Работа с цепями Маркова, часть 4 (Машинное обучение)
Нелинейные цепи Маркова с агрегатором и их приложения (arXiv)
Автор : Бар Лайт
Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..
Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]
Как вы сегодня, ребята?
В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..