Публикации по теме 'clustering'
Capstone Project: отчет о сегментации клиентов
Проект по кластеризации и контролируемым методам обучения
Введение
В качестве заключительной части Наностепени Udacity Data Scientist у меня была возможность создать свой собственный завершающий проект, чтобы продемонстрировать навыки, освоенные в ходе курса. Данные предоставлены Arvata Financial Solutions.
Целью этого проекта было создание модели, предсказывающей вероятность того, что человек станет клиентом компании, занимающейся доставкой по почте в Германии. Первая часть..
#SuperNaive: кластеризация K-медоидов
реализация грубой силы
ВВЕДЕНИЕ
Кластеризация является одной из основных проблем в науке о данных и других областях AI/ML. Было изобретено множество алгоритмов кластеризации с разными подходами и целями. На мой взгляд, кластеризация на основе центроидов проще всего понять новичкам в науке о данных .
K-means — самый популярный из них. Поиск в Google термина дает вам более 1 миллиарда результатов менее чем за секунду. Однако K-medoids , напоминающий K-means , не..
Как это работает: кластеризация K-средних
Обзор
K-Means Clustering — простой, но мощный алгоритм в науке о данных. Существует множество реальных приложений кластеризации K-средних (некоторые из которых мы рассмотрим здесь). Это подробное руководство познакомит вас с миром кластеризации и кластеризации K-средних, а также с реализацией на Python для реального набора данных.
Введение: что такое кластеризация?
«Кластеризация помогает нам понять наши данные уникальным способом — группируя вещи в — как вы уже догадались —..
Начинающие проекты ML Python
Линейная регрессия . Это базовая модель машинного обучения, которая прогнозирует непрерывное значение. Вы можете использовать библиотеку sklearn для построения модели линейной регрессии в Python. Вот пример:
import numpy as np
from sklearn.linear_model import LinearRegression
# Training data
X = np.array([[1], [2], [3], [4], [5]])
y = np.array([1, 2, 3, 4, 5])
# Create the model
model = LinearRegression()
# Fit the model to the data
model.fit(X, y)
# Make predictions
predictions =..
Навигация по кластерам: раскрытие оптимального K в кластеризации K-средних
Откройте для себя методы определения наилучшего количества кластеров для K-средних, от интуитивно понятных методов до практических реализаций Python.
Кластерный анализ — важный метод в области неконтролируемого машинного обучения для извлечения информации из базовой структуры данных. Среди множества алгоритмов кластеризации К-средних занимает видное место. Тем не менее, часто возникает ключевой вопрос: Как мы определяем оптимальное количество кластеров, K? В этой статье мы..
Давайте понятно объясним: K-Means
В этой серии я собираюсь объяснить наиболее распространенные алгоритмы машинного обучения, начиная с основ и заканчивая гораздо более сложными.
Это вторая часть этой серии, и если вы не читали предыдущую о модели KNN, которая очень похожа на эту, нажмите здесь, чтобы ознакомиться с ней :
Давайте понятно объясним: KNN В этой серии я собираюсь объяснить наиболее распространенные алгоритмы машинного обучения, начиная с основ и заканчивая… средним уровнем. ком..
Кластеризация кредитных карт
Автоматическая кластеризация с AuDaS
Проблема номер один, с которой сталкиваются маркетологи, - это понять, кому они продают. Когда вы знаете, как выглядят ваши покупатели, вы можете адаптировать таргетинг и предложения, чтобы повысить их удовлетворенность и, как следствие, свой доход. Когда у вас уже есть группа клиентов и достаточно данных о них, может быть очень полезно их сегментировать. В этой статье мы увидим, как мы можем использовать кластеризацию для сегментации некоторых..
Новые материалы
Объяснение документов 02: BERT
BERT представил двухступенчатую структуру обучения: предварительное обучение и тонкая настройка.
Во время предварительного обучения модель обучается на неразмеченных данных с помощью..
Как проанализировать работу вашего классификатора?
Не всегда просто знать, какие показатели использовать
С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..
Работа с цепями Маркова, часть 4 (Машинное обучение)
Нелинейные цепи Маркова с агрегатором и их приложения (arXiv)
Автор : Бар Лайт
Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..
Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]
Как вы сегодня, ребята?
В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..
Использование машинного обучения и Python для классификации 1000 сезонов новичков MLB Hitter
Чему может научиться машина, глядя на сезоны новичков 1000 игроков MLB? Это то, что исследует это приложение.
В этом процессе мы будем использовать неконтролируемое обучение, чтобы..
Учебные заметки: создание моего первого пакета Node.js
Это мои обучающие заметки, когда я научился создавать свой самый первый пакет Node.js, распространяемый через npm.
Оглавление
Глоссарий
I. Новый пакет
1.1 советы по инициализации..
Забудьте о Matplotlib: улучшите визуализацию данных с помощью умопомрачительных функций Seaborn!
Примечание. Эта запись в блоге предполагает базовое знакомство с Python и концепциями анализа данных.
Привет, энтузиасты данных! Добро пожаловать в мой блог, где я расскажу о невероятных..