WedX - журнал о программировании и компьютерных науках

Публикации по теме 'data-science'


Методы оптимизации гиперпараметров в Python: практическое руководство
Гиперпараметры играют решающую роль в производительности моделей машинного обучения. Это ручки и циферблаты, которые мы настраиваем в процессе обучения, чтобы контролировать поведение модели. В отличие от параметров модели, гиперпараметры не могут быть изучены во время обучения и должны быть установлены заранее. Однако выбор правильных гиперпараметров является сложной задачей из-за высокой размерности пространства гиперпараметров и высокой стоимости оценки модели. Вот тут-то и..

3 обязательных метода для загрузки данных в LLM и LangChain
Прием данных, процесс импорта, передачи, загрузки и обработки данных для последующего использования или хранения в векторной базе данных, является критическим этапом в конвейере данных больших языковых моделей (LLM) и LangChain. Качество полученных данных сильно влияет на эффективность и точность этих результатов. В этом сообщении блога мы обсудим три ключевых метода, которые могут…

Прогноз выживания Титаника с использованием машинного обучения
Испытание Предсказать, выжил бы пассажир Титаника или нет Данные Этапы рабочего процесса Рабочий процесс конкурентного решения проходит семь этапов, описанных в книге Data Science Solutions. 1. Вопрос или определение проблемы 2. Обработка, подготовка, очистка данных 3. Исследовательский анализ данных 4. Сбор данных для обучения и тестирования 5. Моделирование, прогнозирование и решение проблема 1. Вопрос или определение проблемы Соревнование простое: используйте данные..

Простое объяснение стационарности временных рядов
Простое и интуитивно понятное объяснение необходимости стационарности в моделировании временных рядов. Введение Пытаясь предсказать погоду, фондовый рынок или продажи продуктов, мы должны учитывать некоторую временную составляющую. Например, предсказывая, будет ли завтра снег в Великобритании, мы знаем, что вероятность будет намного выше в зимние месяцы, чем в летние месяцы. Этот тип данных, зависящих от времени, лучше всего представить с помощью временных рядов . Здесь каждая..

Метод науки о данных - идентификация проблемы
В предыдущей статье мы представили Data Science Method (DSM) как подход структурированного мышления к решению задач Data Science. Далее мы более подробно рассмотрим первый и самый важный шаг - выявление проблемы. Дополнительные шаги DSM будут подробно описаны в следующих статьях. Метод науки о данных 1. Выявление проблемы (эта статья) 2. Преодоление данных 3. Исследовательский анализ данных 4. Предварительная обработка и разработка данных для обучения 5...

Компьютерное зрение с OpenCV
Компьютерное зрение — одна из важнейших областей науки о данных. Компьютерное зрение — это область исследований, цель которой — воспроизвести человеческую зрительную систему в компьютере. Это позволяет компьютеру получать, отображать, анализировать, идентифицировать и извлекать информацию из изображений, видео или других визуальных выходных данных. Сегодня я познакомлю вас с одним из самых популярных инструментов для работы с компьютерным зрением — Open CV. OpenCV — это..

10 лучших библиотек визуализации данных в 2023 году.
Выбор правильной библиотеки для ваших потребностей в визуализации данных. Визуализация данных стала важным инструментом для бизнеса, позволяющим понимать и передавать сложную информацию. С появлением больших данных растет спрос на мощные библиотеки визуализации данных. В этой статье мы рассмотрим 10 лучших библиотек визуализации данных, которые, как ожидается, будут доминировать на рынке в 2023 году. Эти библиотеки будут предоставлять широкий спектр функций и возможностей, что делает..

Новые материалы

Я хотел выучить язык программирования MVC4, но не мог выучить его раньше, потому что это выглядит сложно…
Просто начните и учитесь самостоятельно Я хотел выучить язык программирования MVC4, но не мог выучить его раньше, потому что он кажется мне сложным, и я бросил его. Это в основном инструмент..

Лицензии с открытым исходным кодом: руководство для разработчиков и создателей
В динамичном мире разработки программного обеспечения открытый исходный код стал мощной парадигмой, способствующей сотрудничеству, инновациям и прогрессу, движимому сообществом. В основе..

Объяснение документов 02: BERT
BERT представил двухступенчатую структуру обучения: предварительное обучение и тонкая настройка. Во время предварительного обучения модель обучается на неразмеченных данных с помощью..

Как проанализировать работу вашего классификатора?
Не всегда просто знать, какие показатели использовать С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..

Работа с цепями Маркова, часть 4 (Машинное обучение)
Нелинейные цепи Маркова с агрегатором и их приложения (arXiv) Автор : Бар Лайт Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..

Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]
Как вы сегодня, ребята? В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..

Использование машинного обучения и Python для классификации 1000 сезонов новичков MLB Hitter
Чему может научиться машина, глядя на сезоны новичков 1000 игроков MLB? Это то, что исследует это приложение. В этом процессе мы будем использовать неконтролируемое обучение, чтобы..


Для любых предложений по сайту: [email protected]