Публикации по теме 'data-science'
НЛП — Часть 2 — Предварительная обработка
В первой части я упомянул теорию языка, подходы и трудности задач НЛП с использованием эвристики, машинного обучения или глубокого обучения.
Сегодня мы сделаем шаг вперед и узнаем немного больше о том, «как это сделать».
Предварительная обработка.
Представьте, что у вас есть набор данных, полный текста. Это просто плагин для машинного обучения и вуаля! Полученные результаты! Не так быстро, сначала нужно сделать на нем несколько шагов. вам может не понадобиться выполнять все..
Изучение алгоритмов классификации
Логистическая регрессия, деревья решений и случайные леса.
Классификация в машинном обучении — это метод контролируемого обучения, используемый для определения категориальных переменных. Проще говоря, классификацию можно рассматривать как форму распознавания образов . Вывод модели классификации может быть двоичным (только 2 класса, т. е. 1 или 0) или может иметь несколько классов и меток.
Как вы понимаете, классификация имеет широкий спектр применений; Он используется для..
Обработка данных с помощью R или Python?
Python и R - два наиболее популярных и широко используемых сегодня языка в Data Science. Они имеют открытый исходный код и полностью бесплатны для использования.
Но какой лучше? И, что более важно, какой из них изучить? Оба являются важным стандартным инструментом в руках каждого специалиста по данным.
Хотя у R и python есть определенные варианты использования, сценарии и условия, в которых они используются, могут отличаться.
Зачем использовать Python?
Python более..
Metaflow от Netflix - хорошее, плохое и уродливое
В декабре 2019 года Netflix предоставит открытый исходный код metaflow - фреймворк для написания ориентированной на человека инфраструктуры машинного обучения для Python. Цель состоит в том, чтобы абстрагироваться от управленческой и инженерной стороны моделирования машинного обучения и позволить специалисту по данным (который, возможно, не слишком хорош в DevOps и передовых методах кодирования) сосредоточиться на Data Science. Он широко используется командой специалистов по анализу..
Специалисты по данным сталкиваются с трудностями при извлечении данных, и после того, как данные получены, данные становятся очень зашумленными и…
Специалисты по данным сталкиваются с трудностями при извлечении данных, и после того, как данные получены, данные становятся очень зашумленными, и очень важно сделать их тонким и читаемым форматом, данные проходят через процессы очистки, такие как нулевые значения, удаление повторяющихся значений, обработка данных с выбросами и т. д. на. Вам также может понадобиться нормализовать и масштабировать данные, чтобы они соответствовали определенному диапазону.
Наука о данных может..
4 важные статистические идеи, которые вы должны понимать в мире, управляемом данными
Вам не нужно быть специалистом по статистике, чтобы ориентироваться в современном мире, но вот несколько основных идей, которые вы должны понимать.
Нет смысла избегать реальности. Наука о данных и, в более широком смысле, структуры, управляемые данными, находятся в центре общества, которое мы сейчас строим.
Когда в начале 2000-х впервые возникло увлечение информатикой, многие отметили, что информатика станет неотъемлемой частью каждой области. Это оказалось правдой. Компании из..
Интервалы прогнозирования в машинном обучении
Модели машинного обучения — это мощные инструменты для прогнозирования, которые стали играть неотъемлемую роль в технологиях, финансах, науке и многих других областях. Однако их предсказания часто сопровождаются некоторой степенью неопределенности, которую необходимо учитывать для принятия обоснованных решений. Для количественной оценки этой неопределенности мы используем интервалы прогнозирования. Давайте поговорим об основных идеях, лежащих в основе интервалов прогнозирования,..
Новые материалы
Как создать диаграмму градиентной кисти с помощью D3.js
Резюме:
Из этого туториала Вы узнаете, как добавить градиентную кисть к диаграмме с областями в D3.js. Мы добавим градиент к значениям SVG и применим градиент в качестве заливки к диаграмме с..
Я хотел выучить язык программирования MVC4, но не мог выучить его раньше, потому что это выглядит сложно…
Просто начните и учитесь самостоятельно
Я хотел выучить язык программирования MVC4, но не мог выучить его раньше, потому что он кажется мне сложным, и я бросил его. Это в основном инструмент..
Лицензии с открытым исходным кодом: руководство для разработчиков и создателей
В динамичном мире разработки программного обеспечения открытый исходный код стал мощной парадигмой, способствующей сотрудничеству, инновациям и прогрессу, движимому сообществом. В основе..
Объяснение документов 02: BERT
BERT представил двухступенчатую структуру обучения: предварительное обучение и тонкая настройка.
Во время предварительного обучения модель обучается на неразмеченных данных с помощью..
Как проанализировать работу вашего классификатора?
Не всегда просто знать, какие показатели использовать
С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..
Работа с цепями Маркова, часть 4 (Машинное обучение)
Нелинейные цепи Маркова с агрегатором и их приложения (arXiv)
Автор : Бар Лайт
Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..
Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]
Как вы сегодня, ребята?
В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..