WedX - журнал о программировании и компьютерных науках

Публикации по теме 'data-science'


#SuperNaive: кластеризация K-медоидов
реализация грубой силы ВВЕДЕНИЕ Кластеризация является одной из основных проблем в науке о данных и других областях AI/ML. Было изобретено множество алгоритмов кластеризации с разными подходами и целями. На мой взгляд, кластеризация на основе центроидов проще всего понять новичкам в науке о данных . K-means — самый популярный из них. Поиск в Google термина дает вам более 1 миллиарда результатов менее чем за секунду. Однако K-medoids , напоминающий K-means , не..

Как собрать набор данных для глубокого обучения
Поиск и загрузка изображений вручную занимает много времени просто из-за объема работы человека. Так что же мы, программирующие компьютеры, делаем, когда задача требует большого количества ручной работы? … Программируем, конечно! Пишем код для автоматизации задачи! Мы будем использовать пример сбора некоторых данных для задачи компьютерного зрения, такой как обнаружение объектов или, возможно, сегментация. Что ж, в нашей задаче, вероятно, есть какие-то общие объекты, которые мы хотели..

15 вопросов по инженерии данных (ETL, DATA, на основе сценариев) — часть I
Посмотрим, сможешь ли ты на них ответить Вопросы по ETL Можете ли вы объяснить процесс ETL и его значение в инженерии данных? Приведите пример реального сценария, в котором ETL имеет решающее значение для успешной миграции данных. Каковы различия между пакетной обработкой и потоковой обработкой в ​​ETL? Приведите пример варианта использования каждого подхода. Как бы вы спроектировали конвейер ETL для перемещения данных из PubSub в Google BigQuery? Как бы вы справились с..

Анализ настроений успеха фильма от Pathsetter.io
Обзор На прошлой неделе вышло два больших фильма, которые очень ждали за последний год — Varisu и Thunivu. Мы пытаемся измерить успех фильмов, но это не ежу понятно — оба фильма собрали 150 Cr + в течение недели. Вокруг фильмов так много шумихи, но есть ли показатель качества фильмов. ? Мы здесь, чтобы узнать. В этом проекте мы пытаемся сравнить отношение рецензентов к этим фильмам. Для выполнения этой задачи мы будем использовать методы обработки естественного языка и модели..

5 небольших проектов Python для начинающих
Добро пожаловать! Python — потрясающий язык программирования с массой возможностей. Если вы новичок в Python, перейдите по ссылке ниже, чтобы узнать о нем больше:

Как сделать науку о данных правильным способом для бизнес-действий
Как сделать науку о данных правильным способом для бизнес-действий Почему мы никогда не должны использовать прогнозные данные в качестве причинно-следственной связи. Мы занимаемся наукой о данных неправильно (обычно). Большинство групп данных, с которыми я сталкивался, предоставляют аналитические данные и прогностические модели другим командам, влияющим на бизнес. Другие команды могут неправильно действовать в соответствии с этими выводами. Все мы знаем из статистики 101, что..

Понимание различий : наука о данных, машинное обучение и искусственный интеллект
В мире технологий термины «наука о данных», «машинное обучение» и «искусственный интеллект» часто используются как синонимы. Однако эти термины относятся к отдельным и специализированным областям в более широкой сфере принятия решений на основе данных. В этом блоге мы рассмотрим различия между наукой о данных, машинным обучением и искусственным интеллектом, а также то, как они используются для решения различных типов задач. Что такое наука о данных? Наука о данных — это..

Новые материалы

Как создать диаграмму градиентной кисти с помощью D3.js
Резюме: Из этого туториала Вы узнаете, как добавить градиентную кисть к диаграмме с областями в D3.js. Мы добавим градиент к значениям SVG и применим градиент в качестве заливки к диаграмме с..

Я хотел выучить язык программирования MVC4, но не мог выучить его раньше, потому что это выглядит сложно…
Просто начните и учитесь самостоятельно Я хотел выучить язык программирования MVC4, но не мог выучить его раньше, потому что он кажется мне сложным, и я бросил его. Это в основном инструмент..

Лицензии с открытым исходным кодом: руководство для разработчиков и создателей
В динамичном мире разработки программного обеспечения открытый исходный код стал мощной парадигмой, способствующей сотрудничеству, инновациям и прогрессу, движимому сообществом. В основе..

Объяснение документов 02: BERT
BERT представил двухступенчатую структуру обучения: предварительное обучение и тонкая настройка. Во время предварительного обучения модель обучается на неразмеченных данных с помощью..

Как проанализировать работу вашего классификатора?
Не всегда просто знать, какие показатели использовать С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..

Работа с цепями Маркова, часть 4 (Машинное обучение)
Нелинейные цепи Маркова с агрегатором и их приложения (arXiv) Автор : Бар Лайт Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..

Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]
Как вы сегодня, ребята? В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..


Для любых предложений по сайту: [email protected]