Публикации по теме 'exploratory-data-analysis'
Исследовательский анализ данных с конвейером кластеризации Lightning
Использование набора данных NOAA GOES-R GLM
Введение
В этом посте я выполняю исследовательский анализ данных (EDA) , применяя алгоритм кластеризации k-средних к набору данных, содержащему геопространственные координаты событий вспышки молнии. . Затем я организую этот процесс в конвейере операций машинного обучения , ежечасно производя активы кластеров молнии. Разработанный мной конвейер кластеризации молнии можно разделить на два этапа:
Прием данных Кластерный анализ..
Криминальные хроники: изучение закономерностей и тенденций в Сан-Франциско | Картик Маханкали
Введение
Сан-Франциско, оживленный коммерческий и финансовый центр, столкнулся с серьезными проблемами из-за тревожного роста числа бездомных. С 2017 года к ним присоединилось почти 7000 человек, и проблемы с психическими заболеваниями и зависимостью способствовали эскалации преступной деятельности. Пандемия еще больше усугубила бедность и безработицу, что может повлиять на уровень преступности в городе.
Современный сценарий преступления в Сан-Франциско — сложная и многогранная тема,..
#Ваш #ИскусственныйИнтеллект #ЦифровоеПутешествие
Важность категориальных данных в процессе принятия решений и как с ними работать в машинном обучении
Деловые люди , независимо от того, являются ли они специалистами по данным или нет, вполне вероятно, что они ежедневно сталкиваются с категориальными данными в рамках своих стратегических и/или оперативных задач.
Мы используем категориальные данные в нескольких областях, от маркетинга до операций и рисков :
в маркетинге мы имеем дело с категориальными данными при проведении..
Исследовательский анализ данных (EDA) — Часть 2
В предыдущей части мы обсудили первые несколько шагов в процессе исследовательского анализа данных, таких как идентификация переменных, одномерный анализ и т. Д. Теперь мы собираемся больше узнать о двумерном анализе и других шагах в EDA.
Двумерный анализ
В двумерном анализе мы находим взаимосвязь между двумя переменными. Переменные могут быть любой комбинацией непрерывных или категориальных переменных. Для разных комбинаций переменных используются разные методы.
Непрерывный и..
Я, как специалист по данным, покажу вам, почему Jupyter Notebook и Jupyter Lab хороши для работы с данными…
Для тех, кто хочет начать работу с анализом данных в Python
В этой статье будут представлены Jupyter Notebook и Jupyter Lab (совместно называемые Jupyter), очень надежные инструменты для анализа данных в Python.
Jupyter уже широко используется в мире науки о данных, но я хотел бы показать его преимущества с помощью демонстрации.
Предположения
В этой статье я анализирую данные при следующих условиях.
Анализируйте табличные данные, а не неструктурированные данные, такие как..
40 лучших ноутбуков Kaggle, удобных для начинающих, для изучения исследовательского анализа данных (EDA)
Данные изображения, текстовые данные, табличные данные (классификация, регрессия, временные ряды)
Ниже приведены гиперссылки на сорок лучших блокнотов Kaggle, удобных для начинающих, для изучения исследовательского анализа данных:
Табличные данные
Визуализация данных в Python
Практическая визуализация данных для интерактивного повествования на Python
Я хотел бы начать этот пост со старой доброй цитаты «Картинка стоит тысячи слов» . Вот что такое визуализация данных. Визуализация данных является неотъемлемой частью Data Science & Data Analysis. Нам полезно не только понимать данные, но и представлять информацию о данных в форме графического представления, которое намного легче понять.
Допустим, мы работаем над проектом Data Science. Клиента не будет..
Новые материалы
Объяснение документов 02: BERT
BERT представил двухступенчатую структуру обучения: предварительное обучение и тонкая настройка.
Во время предварительного обучения модель обучается на неразмеченных данных с помощью..
Как проанализировать работу вашего классификатора?
Не всегда просто знать, какие показатели использовать
С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..
Работа с цепями Маркова, часть 4 (Машинное обучение)
Нелинейные цепи Маркова с агрегатором и их приложения (arXiv)
Автор : Бар Лайт
Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..
Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]
Как вы сегодня, ребята?
В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..
Использование машинного обучения и Python для классификации 1000 сезонов новичков MLB Hitter
Чему может научиться машина, глядя на сезоны новичков 1000 игроков MLB? Это то, что исследует это приложение.
В этом процессе мы будем использовать неконтролируемое обучение, чтобы..
Учебные заметки: создание моего первого пакета Node.js
Это мои обучающие заметки, когда я научился создавать свой самый первый пакет Node.js, распространяемый через npm.
Оглавление
Глоссарий
I. Новый пакет
1.1 советы по инициализации..
Забудьте о Matplotlib: улучшите визуализацию данных с помощью умопомрачительных функций Seaborn!
Примечание. Эта запись в блоге предполагает базовое знакомство с Python и концепциями анализа данных.
Привет, энтузиасты данных! Добро пожаловать в мой блог, где я расскажу о невероятных..