WedX - журнал о программировании и компьютерных науках

Публикации по теме 'data-science'


Глоссарий специалиста по данным
Анализ: тщательное изучение реальной системы. Анализ: анализ, включая математику. (Люди используют этот термин по-разному, иногда охватывая все, от общего количества животных с простыми историческими данными, используемыми до очень сложных прогностических моделей. Всегда спрашивайте!) Связь правило : инструмент для определения комбинаций. Чаще всего правило консолидации используется при анализе потребительской корзины. Среднее значение : все измерения, которые описывают..

Что такое алгоритм KNN в машинном обучении
Во многих интервью, посвященных машинному обучению, звучит вопрос Что такое алгоритм KNN в машинном обучении? Сегодня мы подробно обсудим его. Прочитайте полный пост, чтобы получить общее представление об алгоритме KNN. Предположим, у нас есть тестовый вход X , и мы должны классифицировать этот X по метке на основе нашего обучающего набора данных. Как мы можем это сделать? С помощью алгоритма KNN мы должны классифицировать X на основе его K соседей. Допустим, мы классифицируем..

Раскрытие возможностей Python Левенштейн: использование потенциала подобия строк…
Откройте для себя универсальность и эффективность библиотеки Python Levenshtein Python Levenshtein — это библиотека, которая позволяет вычислять расстояние Левенштейна между двумя строками. Расстояние Левенштейна, также известное как расстояние редактирования, представляет собой минимальное количество операций (вставок, удалений и замен), необходимых для преобразования одной строки в другую. Библиотека Python Levenshtein обеспечивает эффективную реализацию этого алгоритма, что делает его..

Основы математики для науки о данных: введение в системы линейных уравнений
ОСНОВНАЯ МАТЕМАТИКА ДЛЯ НАУКИ ДАННЫХ Основы математики для науки о данных: введение в системы линейных уравнений Понимать и визуализировать изображение строк и столбцов систем линейных уравнений В этой статье вы сможете использовать то, что вы узнали о векторах (см. Здесь ), матрицах (см. Здесь ) и линейных преобразованиях ( здесь ). Это позволит вам преобразовывать данные в системы линейных уравнений. Вы также можете посмотреть Основы математики для науки о данных , чтобы..

Как генерировать строки документации для проектов по науке о данных
Создавайте четкие и хорошо отформатированные строки документации Python за считанные секунды Введение «Я написал эту функцию 6 месяцев назад и теперь не могу вспомнить, что она делает!» Это звучит знакомо? В погоне за сроками мы часто упускаем из виду важность хорошей документации (или строк документации) для класса, методов и функций, которые мы создали. Так что же такое строки документации? Строки документации, также известные как строки документации, представляют собой..

20 библиотек Python Gem, спрятанных в установке и ожидающих своего открытия
Познакомьтесь со стандартными библиотеками Python как никогда раньше Введение Большинство людей думают, что массовое доминирование Python связано с его мощными пакетами, такими как NumPy, Pandas, Sklearn, XGBoost и т. д. Это сторонние пакеты, написанные профессиональными разработчиками, часто с помощью других более быстрых языков программирования, таких как C, Java или C++. . Таким образом, один из слабых аргументов, которые ненавистники могут привести против Python, заключается в..

WSDM - Музыкальная рекомендация KKBox Challange
Цель: В этой задаче мы должны предсказать шансы того, что пользователь будет слушать песню повторно после того, как было запущено первое наблюдаемое событие прослушивания в пределах временного окна. Обзор: https://www.kaggle.com/c/kkbox-music-recommendation-challenge/overview Контуры: Бизнес-проблема Обсуждение данных EDA Функциональная инженерия Предварительная обработка данных Модели Сравнение Заключение и дальнейшая работа использованная литература Введение..

Новые материалы

Объяснение документов 02: BERT
BERT представил двухступенчатую структуру обучения: предварительное обучение и тонкая настройка. Во время предварительного обучения модель обучается на неразмеченных данных с помощью..

Как проанализировать работу вашего классификатора?
Не всегда просто знать, какие показатели использовать С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..

Работа с цепями Маркова, часть 4 (Машинное обучение)
Нелинейные цепи Маркова с агрегатором и их приложения (arXiv) Автор : Бар Лайт Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..

Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]
Как вы сегодня, ребята? В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..

Использование машинного обучения и Python для классификации 1000 сезонов новичков MLB Hitter
Чему может научиться машина, глядя на сезоны новичков 1000 игроков MLB? Это то, что исследует это приложение. В этом процессе мы будем использовать неконтролируемое обучение, чтобы..

Учебные заметки: создание моего первого пакета Node.js
Это мои обучающие заметки, когда я научился создавать свой самый первый пакет Node.js, распространяемый через npm. Оглавление Глоссарий I. Новый пакет 1.1 советы по инициализации..

Забудьте о Matplotlib: улучшите визуализацию данных с помощью умопомрачительных функций Seaborn!
Примечание. Эта запись в блоге предполагает базовое знакомство с Python и концепциями анализа данных. Привет, энтузиасты данных! Добро пожаловать в мой блог, где я расскажу о невероятных..


Для любых предложений по сайту: [email protected]