Публикации по теме 'data-science'
Методы оптимизации гиперпараметров в Python: практическое руководство
Гиперпараметры играют решающую роль в производительности моделей машинного обучения. Это ручки и циферблаты, которые мы настраиваем в процессе обучения, чтобы контролировать поведение модели. В отличие от параметров модели, гиперпараметры не могут быть изучены во время обучения и должны быть установлены заранее. Однако выбор правильных гиперпараметров является сложной задачей из-за высокой размерности пространства гиперпараметров и высокой стоимости оценки модели. Вот тут-то и..
3 обязательных метода для загрузки данных в LLM и LangChain
Прием данных, процесс импорта, передачи, загрузки и обработки данных для последующего использования или хранения в векторной базе данных, является критическим этапом в конвейере данных больших языковых моделей (LLM) и LangChain. Качество полученных данных сильно влияет на эффективность и точность этих результатов. В этом сообщении блога мы обсудим три ключевых метода, которые могут…
Прогноз выживания Титаника с использованием машинного обучения
Испытание
Предсказать, выжил бы пассажир Титаника или нет
Данные
Этапы рабочего процесса
Рабочий процесс конкурентного решения проходит семь этапов, описанных в книге Data Science Solutions.
1. Вопрос или определение проблемы 2. Обработка, подготовка, очистка данных 3. Исследовательский анализ данных 4. Сбор данных для обучения и тестирования 5. Моделирование, прогнозирование и решение проблема
1. Вопрос или определение проблемы
Соревнование простое: используйте данные..
Простое объяснение стационарности временных рядов
Простое и интуитивно понятное объяснение необходимости стационарности в моделировании временных рядов.
Введение
Пытаясь предсказать погоду, фондовый рынок или продажи продуктов, мы должны учитывать некоторую временную составляющую. Например, предсказывая, будет ли завтра снег в Великобритании, мы знаем, что вероятность будет намного выше в зимние месяцы, чем в летние месяцы.
Этот тип данных, зависящих от времени, лучше всего представить с помощью временных рядов . Здесь каждая..
Метод науки о данных - идентификация проблемы
В предыдущей статье мы представили Data Science Method (DSM) как подход структурированного мышления к решению задач Data Science. Далее мы более подробно рассмотрим первый и самый важный шаг - выявление проблемы. Дополнительные шаги DSM будут подробно описаны в следующих статьях.
Метод науки о данных
1. Выявление проблемы (эта статья)
2. Преодоление данных
3. Исследовательский анализ данных
4. Предварительная обработка и разработка данных для обучения
5...
Компьютерное зрение с OpenCV
Компьютерное зрение — одна из важнейших областей науки о данных. Компьютерное зрение — это область исследований, цель которой — воспроизвести человеческую зрительную систему в компьютере. Это позволяет компьютеру получать, отображать, анализировать, идентифицировать и извлекать информацию из изображений, видео или других визуальных выходных данных.
Сегодня я познакомлю вас с одним из самых популярных инструментов для работы с компьютерным зрением — Open CV.
OpenCV — это..
10 лучших библиотек визуализации данных в 2023 году.
Выбор правильной библиотеки для ваших потребностей в визуализации данных.
Визуализация данных стала важным инструментом для бизнеса, позволяющим понимать и передавать сложную информацию. С появлением больших данных растет спрос на мощные библиотеки визуализации данных. В этой статье мы рассмотрим 10 лучших библиотек визуализации данных, которые, как ожидается, будут доминировать на рынке в 2023 году. Эти библиотеки будут предоставлять широкий спектр функций и возможностей, что делает..
Новые материалы
Я хотел выучить язык программирования MVC4, но не мог выучить его раньше, потому что это выглядит сложно…
Просто начните и учитесь самостоятельно
Я хотел выучить язык программирования MVC4, но не мог выучить его раньше, потому что он кажется мне сложным, и я бросил его. Это в основном инструмент..
Лицензии с открытым исходным кодом: руководство для разработчиков и создателей
В динамичном мире разработки программного обеспечения открытый исходный код стал мощной парадигмой, способствующей сотрудничеству, инновациям и прогрессу, движимому сообществом. В основе..
Объяснение документов 02: BERT
BERT представил двухступенчатую структуру обучения: предварительное обучение и тонкая настройка.
Во время предварительного обучения модель обучается на неразмеченных данных с помощью..
Как проанализировать работу вашего классификатора?
Не всегда просто знать, какие показатели использовать
С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..
Работа с цепями Маркова, часть 4 (Машинное обучение)
Нелинейные цепи Маркова с агрегатором и их приложения (arXiv)
Автор : Бар Лайт
Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..
Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]
Как вы сегодня, ребята?
В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..
Использование машинного обучения и Python для классификации 1000 сезонов новичков MLB Hitter
Чему может научиться машина, глядя на сезоны новичков 1000 игроков MLB? Это то, что исследует это приложение.
В этом процессе мы будем использовать неконтролируемое обучение, чтобы..