Публикации по теме 'data-science'
Введение в науку о данных: каковы этапы процесса науки о данных?
Наука о данных — это процесс обработки данных для извлечения значимой информации для бизнеса. это подход, который сочетает в себе принципы и практики из областей математики, статистики, искусственного интеллекта и опыта предметной области для анализа больших и сложных наборов данных.
Специалисты по данным используют различные методы, алгоритмы и инструменты для выявления закономерностей, тенденций и взаимосвязей в данных и принятия обоснованных решений или прогнозов.
Наука о данных..
Auto-Sklearn: как повысить производительность и эффективность с помощью автоматизированного машинного обучения
Узнайте, как использовать AutoML, чтобы максимизировать результаты ваших рабочих процессов машинного обучения.
Многие из нас знакомы с проблемой выбора подходящей модели машинного обучения для конкретной задачи прогнозирования, учитывая огромное количество моделей, из которых можно выбирать. Кроме того, нам также необходимо найти оптимальные гиперпараметры, чтобы максимизировать производительность нашей модели.
Эти проблемы в значительной степени могут быть преодолены с помощью..
Розничная аналитика: новый и интуитивно понятный способ поиска заменителей и дополнений
Розничная аналитика: анализ данных для розничной торговли
Retail Industry занимается продажей товаров и услуг покупателям. Имея много доступной истории покупок потребителей, мы можем применять аналитику данных для правильного прогнозирования потребностей в запасах, движения цепочки поставок, размещения товаров, отношений между товарами для рекомендации и т. Д., Что соответствует термину Retail Analytics.
Одна из важных частей Retail Analytics - найти взаимосвязь между такими..
На что обращают внимание компании при найме специалистов по данным
В последние годы прием на работу в области науки о данных стал очень конкурентоспособным как для компаний, так и для профессионалов. В связи с Великой перестановкой позиции в области науки о данных пользуются большим спросом, что может принести большую пользу как новым, так и опытным специалистам в области обработки данных. Но чтобы получить работу в такой конкурентной среде, кандидаты должны быть готовы продемонстрировать навыки и знания, которые в настоящее время востребованы. Начать..
16 лучших практик профессионального использования Github
10 различий между Git и Github, а также 16 лучших практик Github для обеспечения безопасности, функциональности и профессионального обслуживания ваших проектов.
Git hub — это платформа для размещения кода для контроля версий и совместной работы.
Я расскажу о двух областях: (1) десять различий между Git и Github и (2) 16 лучших практик Github.
10 различий между Git и Github
1. Git — это система контроля версий, а GitHub — веб-хостинг для контроля версий с использованием Git.
2. С..
Что подразумевается под «стратифицированным сплитом»?
Что подразумевается под «стратифицированным сплитом»?
Стратифицированное разделение (Py) помогает нам разделить наши данные на 2 выборки (например, данные обучения и данные испытаний) с дополнительной функцией указания столбца для стратификации (например, мы указываем переменную Возраст как столбец для стратификации, после чего разделение выполняется таким образом, что каждое уникальное значение возраста входит в оба набора данных (Train/test ), В общем, это способ сделать подмножества из..
Классификатор заголовков новостей
Здесь нам дан набор данных, содержащий газетные заголовки и их категорию. Здесь существует 4 категории, а именно: бизнес, образование, медицина и технологии.
Здесь вы увидите, что я использовал модуль Pickle для сохранения обученной модели для последующего использования, а также векторизатор подсчета.
import pickle
import pandas as pd
dataset = pd.read_csv(“uci-news-aggregator.csv”)
import re
import nltk
from nltk.corpus import stopwords
from nltk.stem.porter import PorterStemmer..
Новые материалы
Как создать диаграмму градиентной кисти с помощью D3.js
Резюме:
Из этого туториала Вы узнаете, как добавить градиентную кисть к диаграмме с областями в D3.js. Мы добавим градиент к значениям SVG и применим градиент в качестве заливки к диаграмме с..
Я хотел выучить язык программирования MVC4, но не мог выучить его раньше, потому что это выглядит сложно…
Просто начните и учитесь самостоятельно
Я хотел выучить язык программирования MVC4, но не мог выучить его раньше, потому что он кажется мне сложным, и я бросил его. Это в основном инструмент..
Лицензии с открытым исходным кодом: руководство для разработчиков и создателей
В динамичном мире разработки программного обеспечения открытый исходный код стал мощной парадигмой, способствующей сотрудничеству, инновациям и прогрессу, движимому сообществом. В основе..
Объяснение документов 02: BERT
BERT представил двухступенчатую структуру обучения: предварительное обучение и тонкая настройка.
Во время предварительного обучения модель обучается на неразмеченных данных с помощью..
Как проанализировать работу вашего классификатора?
Не всегда просто знать, какие показатели использовать
С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..
Работа с цепями Маркова, часть 4 (Машинное обучение)
Нелинейные цепи Маркова с агрегатором и их приложения (arXiv)
Автор : Бар Лайт
Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..
Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]
Как вы сегодня, ребята?
В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..