Публикации по теме 'data-science'
Важность очистки данных для получения лучшего анализа в науке о данных
Насколько важна очистка данных для лучшей аналитики данных
В науке о данных на результаты анализа большое влияние будет оказывать качество используемых данных. качество данных означает наличие данных в соответствии с функцией, которая будет использоваться в анализе. Проще говоря, хорошие данные дадут хороший анализ, и наоборот.
Сам этап очистки данных является важным процессом в процессе анализа машинного обучения перед началом применения модели. В этом обсуждении будет рассмотрен..
Системы рекомендаций в Trunk Club: обзор (часть 1)
Аншул Агарвал
В этом посте, состоящем из двух частей, описывается, как различные виды систем рекомендаций на основе машинного обучения, разработанные командой Data Science в Trunk Club, улучшают персонализацию для клиентов, а также повышают ценность для бизнеса. В части 1 мы описываем типичный путь клиента с Trunk Club и его взаимодействие с рекомендательными системами на этом пути. Во Части 2 мы немного углубимся в технические детали алгоритмов, которые управляют этими системами...
В этот вторник: погрузитесь в методы глубокого обучения с Гарреттом Хоффманом из StockTwits
Данные управляют всем в StockTwits. Данные определяют множество аспектов повседневной работы с StockTwits - от агрегирования настроений пользователей по каждой акции или ценной бумаге до поиска лучшего контента для нашего сообщества.
Никто в StockTwits не разбирается в данных лучше, чем Гаррет Хоффман . В качестве директора по науке о данных Гарретт собирает, создает и формирует данные с бесчисленных конечных точек для создания видимых и невидимых систем на платформе StockTwits. Бывают..
Этика искусственного интеллекта: вызовы и возможности
Искусственный интеллект (ИИ) — это быстро развивающаяся область, которая меняет практически все аспекты нашей жизни. С ростом использования ИИ возникает растущая необходимость учитывать этические последствия такой технологии. В этой статье мы рассмотрим проблемы и возможности, связанные с этикой ИИ.
Проблема предвзятости в ИИ:
Одной из самых серьезных проблем в этике ИИ является проблема предвзятости. Алгоритмы ИИ беспристрастны настолько, насколько объективны данные, на которых..
Отбор проб из резервуара: простой алгоритм случайного отбора проб
Во многих приложениях нам может потребоваться случайная выборка подмножества данных из большего набора данных. Один из подходов к решению этой проблемы называется отбором проб из резервуара, который представляет собой простой, но мощный алгоритм случайного отбора проб. В этом посте мы рассмотрим, как работает алгоритм отбора проб пласта, его приложения и как его реализовать на Python.
Что такое отбор проб из резервуара?
Отбор проб резервуара — это метод, используемый для случайного..
От бизнес-потребностей к задачам анализа данных
Что следует учитывать при решении бизнес-задач с помощью науки о данных
Что, если я попрошу вас подумать о работе в области науки о данных? Скорее всего, вам в голову придут образы блокнотов, графиков данных, алгоритмов и программных фрагментов. Когда мы говорим о такого рода работе, мы очень часто сосредотачиваемся на инструментах и методах, полезных для конкретных задач, начиная от таких вещей, как классификация или НЛП, через новые классные библиотеки Python и некоторые..
Расширенное управление базами данных: краткий обзор
Эффективно разработанная система управления базами данных имеет важное значение для предприятия, стремящегося максимизировать влияние своих аналитических инициатив и развиваться, чтобы использовать эффективные данные и инструменты на базе искусственного интеллекта. Но, как мы видели, этапы подготовки данных конвейера данных могут быть чрезвычайно трудоемкими для специалистов по данным и связанных с ними специалистов и могут вызвать проблемы с эффективностью. Расширенная аналитика..
Новые материалы
Как создать диаграмму градиентной кисти с помощью D3.js
Резюме:
Из этого туториала Вы узнаете, как добавить градиентную кисть к диаграмме с областями в D3.js. Мы добавим градиент к значениям SVG и применим градиент в качестве заливки к диаграмме с..
Я хотел выучить язык программирования MVC4, но не мог выучить его раньше, потому что это выглядит сложно…
Просто начните и учитесь самостоятельно
Я хотел выучить язык программирования MVC4, но не мог выучить его раньше, потому что он кажется мне сложным, и я бросил его. Это в основном инструмент..
Лицензии с открытым исходным кодом: руководство для разработчиков и создателей
В динамичном мире разработки программного обеспечения открытый исходный код стал мощной парадигмой, способствующей сотрудничеству, инновациям и прогрессу, движимому сообществом. В основе..
Объяснение документов 02: BERT
BERT представил двухступенчатую структуру обучения: предварительное обучение и тонкая настройка.
Во время предварительного обучения модель обучается на неразмеченных данных с помощью..
Как проанализировать работу вашего классификатора?
Не всегда просто знать, какие показатели использовать
С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..
Работа с цепями Маркова, часть 4 (Машинное обучение)
Нелинейные цепи Маркова с агрегатором и их приложения (arXiv)
Автор : Бар Лайт
Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..
Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]
Как вы сегодня, ребята?
В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..