WedX - журнал о программировании и компьютерных науках

Публикации по теме 'exploratory-data-analysis'


Что такое исследовательский анализ данных?
Исследовательский анализ данных (EDA) — это важный этап в процессе анализа данных, основная цель которого — понять набор данных и извлечь из него ценную информацию. Основная цель EDA — исследовать данные, обнаруживать закономерности, выявлять аномалии и проверять предположения, прежде чем применять более сложные статистические методы или создавать модели машинного обучения. Вот некоторые ключевые аспекты исследовательского анализа данных: Обобщение данных: EDA начинается с суммирования..

Исследовательский анализ данных с помощью Python Jupyter Notebook: руководство о том, как выполнять исследовательский…
Введение Исследовательский анализ данных — важный первый шаг при работе с любыми новыми данными. Это позволяет нам ознакомиться с данными, выявить любые проблемы или аномалии и получить информацию, которая поможет направлять остальную часть процесса анализа. В этом сообщении блога я расскажу о выполнении исследовательского анализа данных в Python с использованием Jupyter Notebook. Импорт данных Первый шаг — импортировать данные в блокнот Jupyter. Например, мы будем использовать..

Как предсказать победителя матча по крикету с помощью машинного обучения
Мы все продолжаем проверять результаты матчей по крикету на Cricbuzz. Cricbuzz собирал данные о результатах матчей за последние 4 года, используя их, они хотят создать сервис, который будет предсказывать, кто выиграет матч. Увлекательно, правда? Они используют алгоритмы машинного обучения , чтобы предсказать, какая команда выиграет матч, на основе определенных точек данных. Прямая трансляция проекта 12 февраля, суббота, 19:00. Записаться сейчас Для этого мы выполним следующие..

Прогнозирование вероятности совершения покупателем повторных покупок с помощью логистической регрессии
Для бизнеса привлечение клиента - это увлекательное занятие не только потому, что оно помогает вам `` обезопасить сумку '', принося столь необходимый доход, но также создает возможность завоевать лояльность у этого новообретенного клиента, что, в свою очередь, может помочь вам получить больше мешков за счет повторных покупок. Предполагая, что ваш бизнес продолжает стимулировать и оптимизировать действия, которые имеют наибольшее положительное влияние на создание повторных покупок,..

Прогноз продаж Россманна
Прогноз продаж Россманна 1. Бизнес-проблема Rossmann управляет более чем 3000 аптеками в 7 европейских странах. В настоящее время менеджерам магазинов Rossmann поручено прогнозировать свои ежедневные продажи на срок до шести недель. Продажи в магазине зависят от многих факторов, включая рекламные акции, конкуренцию, школьные и государственные праздники, сезонность и местоположение. Поскольку тысячи отдельных менеджеров прогнозируют продажи на основе своих уникальных обстоятельств,..

Линейная регрессия и исследовательский анализ данных в базе данных счастья 2019 г.
В этой истории исследовательский и регрессионный анализ будут проводиться в базе данных счастья от Kaggle. Мы будем использовать показатель счастья в качестве нашей зависимой переменной, а все остальные переменные в наборе данных — в качестве независимых переменных. Ссылка указана, как показано ниже. Сначала мы будем читать в базе данных в кадр даты # Чтение данных happy = read.csv("happiness.csv") Структура данных состоит из числовых переменных, 156 строк и 7 признаков. Первые..

📈 Маркетинговый набор данных банка UCI. Часть 1. Исследовательский анализ данных (EDA)
Эта статья — просто копия моего Jupyter Notebook, но почти без кода — только рисунки. Если вы хотите получить код, он у меня есть: * Github: https://github.com/alexkataev/Case-Study-UCI-Bank-Marketing-Dataset * И Kaggle: https://www.kaggle.com/alexkataev/uci-bank-marketing-dataset-part-1-eda Иногда я буду использовать изображения кода и его вывода, потому что это более компактно, чем уценка кода Medium. Информация в первых двух главах взята из репозитория машинного обучения UCI:..

Новые материалы

Объяснение документов 02: BERT
BERT представил двухступенчатую структуру обучения: предварительное обучение и тонкая настройка. Во время предварительного обучения модель обучается на неразмеченных данных с помощью..

Как проанализировать работу вашего классификатора?
Не всегда просто знать, какие показатели использовать С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..

Работа с цепями Маркова, часть 4 (Машинное обучение)
Нелинейные цепи Маркова с агрегатором и их приложения (arXiv) Автор : Бар Лайт Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..

Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]
Как вы сегодня, ребята? В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..

Использование машинного обучения и Python для классификации 1000 сезонов новичков MLB Hitter
Чему может научиться машина, глядя на сезоны новичков 1000 игроков MLB? Это то, что исследует это приложение. В этом процессе мы будем использовать неконтролируемое обучение, чтобы..

Учебные заметки: создание моего первого пакета Node.js
Это мои обучающие заметки, когда я научился создавать свой самый первый пакет Node.js, распространяемый через npm. Оглавление Глоссарий I. Новый пакет 1.1 советы по инициализации..

Забудьте о Matplotlib: улучшите визуализацию данных с помощью умопомрачительных функций Seaborn!
Примечание. Эта запись в блоге предполагает базовое знакомство с Python и концепциями анализа данных. Привет, энтузиасты данных! Добро пожаловать в мой блог, где я расскажу о невероятных..


Для любых предложений по сайту: [email protected]