Публикации по теме 'data-science'
Различные места для получения наборов данных для машинного обучения (часть 5: наборы данных Seaborn)
на Python доктора Элвина Анга
https://www.alvinang.sg/s/Various_Places_to_Get_Datasets_for_Machine_Learning_by_Dr_Alvin_Ang.ipynb
https://rdrr.io/cran/reshape2/man/tips.htmlhttps://rdrr.io/cran/reshape2/man/tips.html
О докторе Элвине Анге
Доктор Элвин Анг получил степень доктора философии, магистра и бакалавра в NTU, Сингапур. Ранее он был главным консультантом (наука о данных), а также доцентом. Он также был адъюнкт-лектором SUSS в течение 8 лет. Его..
Все, что вам нужно знать о публикации программного обеспечения на Bioconda
Публикация пакетов Python, связанных с биоинформатикой, на Bioconda
Были ли у вас проблемы с установкой пакетов и запуском огромного количества команд для установки зависимостей? Если вам повезет (в большинстве случаев вам не повезет), вы в конечном итоге установите пакет без каких-либо проблем с зависимостями или конфликтов версий. Работая в междисциплинарных науках, я понял, как сложно заставить эти инструменты работать, если вы не знаете, что на самом деле происходит с точки зрения..
Демистификация инженерии данных
Демистификация инженерии данных
Инжиниринг данных — очень востребованная и прибыльная профессия в технологической отрасли. Однако роль дата-инженера часто может быть окутана тайной. В этом блоге мы раскроем суть инженерии данных, исследуя роли и обязанности инженера данных, типичный жизненный цикл проекта по разработке данных и различия между инженерией данных и другими ролями, связанными с данными. Кроме того, мы углубимся в реальные примеры и достижения, чтобы пролить свет на..
2020 год сломал наши модели машинного обучения
Мнение
2020 год сломал наши модели машинного обучения
Выявить проблемы и внести изменения в 2021 году
Несомненно, в 2020 году поведение потребителей резко изменилось. Нам будет сложно найти модель, которая предсказывала бы глобальную потребность в лицевых масках N95 и других СИЗ. Необходимо будет полностью переработать и переобучить модели поставок СИЗ. Как поживают ваши модели? Как и многие практикующие специалисты по прикладной науке о данных, вы можете обнаружить, что..
От нуля до героя панд: полное руководство по пандам для науки о данных
Если вы хотите изучить анализ данных с помощью Python, вы, вероятно, слышали о Pandas. Pandas — мощная и популярная библиотека, предоставляющая простые в использовании структуры данных и инструменты анализа данных для Python. В этой статье мы проведем вас с нуля до героя Pandas, охватив все основы Pandas для науки о данных.
Начало работы с пандами
Прежде чем мы погрузимся в Pandas, нам нужно убедиться, что он у нас установлен. Самый простой способ сделать это — использовать pip,..
НЛП-день 4: нормализация словарного запаса может быть плохой идеей
#30DaysOfNLP
НЛП-день 4: нормализация словарного запаса может быть плохой идеей
Что такое сворачивание регистра, стемминг и лемматизация?
Вчера мы улучшили наш словарный запас, улучшив наш токенизатор.
Мы извлекли более значимые токены, учитывая знаки препинания, сокращения и даже небрежную лексику.
Введение в оркестрацию данных
Согласно отчету Gartner, более 87% организаций не способны использовать данные для бизнес-аналитики и анализа данных. Одной из причин этого может быть невозможность извлечь правильные данные из хранилищ данных. Поскольку эти хранилища представляют собой таблицы данных и ограничивают перенос данных в другие местоположения, миграция данных становится действительно сложной задачей.
Кроме того, организациям приходится обрабатывать гораздо больше операций, им не хватает управления данными...
Новые материалы
Как создать диаграмму градиентной кисти с помощью D3.js
Резюме:
Из этого туториала Вы узнаете, как добавить градиентную кисть к диаграмме с областями в D3.js. Мы добавим градиент к значениям SVG и применим градиент в качестве заливки к диаграмме с..
Я хотел выучить язык программирования MVC4, но не мог выучить его раньше, потому что это выглядит сложно…
Просто начните и учитесь самостоятельно
Я хотел выучить язык программирования MVC4, но не мог выучить его раньше, потому что он кажется мне сложным, и я бросил его. Это в основном инструмент..
Лицензии с открытым исходным кодом: руководство для разработчиков и создателей
В динамичном мире разработки программного обеспечения открытый исходный код стал мощной парадигмой, способствующей сотрудничеству, инновациям и прогрессу, движимому сообществом. В основе..
Объяснение документов 02: BERT
BERT представил двухступенчатую структуру обучения: предварительное обучение и тонкая настройка.
Во время предварительного обучения модель обучается на неразмеченных данных с помощью..
Как проанализировать работу вашего классификатора?
Не всегда просто знать, какие показатели использовать
С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..
Работа с цепями Маркова, часть 4 (Машинное обучение)
Нелинейные цепи Маркова с агрегатором и их приложения (arXiv)
Автор : Бар Лайт
Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..
Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]
Как вы сегодня, ребята?
В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..