Публикации по теме 'data-science'
Глоссарий специалиста по данным
Анализ: тщательное изучение реальной системы.
Анализ: анализ, включая математику. (Люди используют этот термин по-разному, иногда охватывая все, от общего количества животных с простыми историческими данными, используемыми до очень сложных прогностических моделей. Всегда спрашивайте!)
Связь правило : инструмент для определения комбинаций. Чаще всего правило консолидации используется при анализе потребительской корзины.
Среднее значение : все измерения, которые описывают..
Что такое алгоритм KNN в машинном обучении
Во многих интервью, посвященных машинному обучению, звучит вопрос Что такое алгоритм KNN в машинном обучении? Сегодня мы подробно обсудим его. Прочитайте полный пост, чтобы получить общее представление об алгоритме KNN.
Предположим, у нас есть тестовый вход X , и мы должны классифицировать этот X по метке на основе нашего обучающего набора данных. Как мы можем это сделать? С помощью алгоритма KNN мы должны классифицировать X на основе его K соседей. Допустим, мы классифицируем..
Раскрытие возможностей Python Левенштейн: использование потенциала подобия строк…
Откройте для себя универсальность и эффективность библиотеки Python Levenshtein
Python Levenshtein — это библиотека, которая позволяет вычислять расстояние Левенштейна между двумя строками. Расстояние Левенштейна, также известное как расстояние редактирования, представляет собой минимальное количество операций (вставок, удалений и замен), необходимых для преобразования одной строки в другую. Библиотека Python Levenshtein обеспечивает эффективную реализацию этого алгоритма, что делает его..
Основы математики для науки о данных: введение в системы линейных уравнений
ОСНОВНАЯ МАТЕМАТИКА ДЛЯ НАУКИ ДАННЫХ
Основы математики для науки о данных: введение в системы линейных уравнений
Понимать и визуализировать изображение строк и столбцов систем линейных уравнений
В этой статье вы сможете использовать то, что вы узнали о векторах (см. Здесь ), матрицах (см. Здесь ) и линейных преобразованиях ( здесь ). Это позволит вам преобразовывать данные в системы линейных уравнений. Вы также можете посмотреть Основы математики для науки о данных , чтобы..
Как генерировать строки документации для проектов по науке о данных
Создавайте четкие и хорошо отформатированные строки документации Python за считанные секунды
Введение
«Я написал эту функцию 6 месяцев назад и теперь не могу вспомнить, что она делает!» Это звучит знакомо? В погоне за сроками мы часто упускаем из виду важность хорошей документации (или строк документации) для класса, методов и функций, которые мы создали.
Так что же такое строки документации?
Строки документации, также известные как строки документации, представляют собой..
20 библиотек Python Gem, спрятанных в установке и ожидающих своего открытия
Познакомьтесь со стандартными библиотеками Python как никогда раньше
Введение
Большинство людей думают, что массовое доминирование Python связано с его мощными пакетами, такими как NumPy, Pandas, Sklearn, XGBoost и т. д. Это сторонние пакеты, написанные профессиональными разработчиками, часто с помощью других более быстрых языков программирования, таких как C, Java или C++. .
Таким образом, один из слабых аргументов, которые ненавистники могут привести против Python, заключается в..
WSDM - Музыкальная рекомендация KKBox Challange
Цель:
В этой задаче мы должны предсказать шансы того, что пользователь будет слушать песню повторно после того, как было запущено первое наблюдаемое событие прослушивания в пределах временного окна.
Обзор: https://www.kaggle.com/c/kkbox-music-recommendation-challenge/overview
Контуры:
Бизнес-проблема Обсуждение данных EDA Функциональная инженерия Предварительная обработка данных Модели Сравнение Заключение и дальнейшая работа использованная литература
Введение..
Новые материалы
Объяснение документов 02: BERT
BERT представил двухступенчатую структуру обучения: предварительное обучение и тонкая настройка.
Во время предварительного обучения модель обучается на неразмеченных данных с помощью..
Как проанализировать работу вашего классификатора?
Не всегда просто знать, какие показатели использовать
С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..
Работа с цепями Маркова, часть 4 (Машинное обучение)
Нелинейные цепи Маркова с агрегатором и их приложения (arXiv)
Автор : Бар Лайт
Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..
Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]
Как вы сегодня, ребята?
В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..
Использование машинного обучения и Python для классификации 1000 сезонов новичков MLB Hitter
Чему может научиться машина, глядя на сезоны новичков 1000 игроков MLB? Это то, что исследует это приложение.
В этом процессе мы будем использовать неконтролируемое обучение, чтобы..
Учебные заметки: создание моего первого пакета Node.js
Это мои обучающие заметки, когда я научился создавать свой самый первый пакет Node.js, распространяемый через npm.
Оглавление
Глоссарий
I. Новый пакет
1.1 советы по инициализации..
Забудьте о Matplotlib: улучшите визуализацию данных с помощью умопомрачительных функций Seaborn!
Примечание. Эта запись в блоге предполагает базовое знакомство с Python и концепциями анализа данных.
Привет, энтузиасты данных! Добро пожаловать в мой блог, где я расскажу о невероятных..