Публикации по теме 'data-science'
Python 3.10 - пять новых функций и соображений
Python 3.10 - пять новых функций и соображений
Не только перечисление, но также примеры и соображения.
Несколько дней назад наконец-то был выпущен Python 3.10. В Интернете уже есть много статей, которые были опубликованы еще до того, как он был выпущен. Однако я обнаружил, что большинство из них просто перечисляют новые функции без особого обсуждения. Поэтому в своей статье я постараюсь привести несколько примеров того, как использовать эти новые функции. Кроме того, я буду..
Выведенный статистика
Прежде чем перейти к главному, сначала я попытаюсь найти значение слова «Infer» — это значит делать какие-то выводы из доказательств. Итак, мы получаем что-то вроде «предсказания». Давайте посмотрим, каково правильное определение этого.
Логическая статистика - это еще одна отрасль статистики, которая опирается на теорию вероятностей и распределение, в частности, для прогнозирования стоимости населения на основе выборочных данных. конечно визуализация поможет нам.
Логическая..
Работа с выбросами с использованием трех надежных моделей линейной регрессии
Работа с выбросами с использованием трех надежных моделей линейной регрессии
С практическим примером использования алгоритмов регрессии Huber, RANSAC и Theil-Sen
Линейная регрессия — одна из самых простых моделей машинного обучения. Часто это отправная точка не только для изучения науки о данных, но и для создания быстрых и простых минимально жизнеспособных продуктов (MVP), которые затем служат эталоном для более сложных алгоритмов. Как правило, линейная регрессия соответствует..
Достаточно Python для науки о данных
Вам не нужно быть мастером Python, чтобы сокрушить его в науке о данных. На самом деле, «Достаточно Python для науки о данных» — это все, что вам нужно, чтобы начать свое путешествие.
Python — любимый язык программирования для специалистов по данным. Изучение Python — это первый шаг, который предпринимают большинство претендентов на науку о данных. Однако многие из них не понимают, насколько Python действительно нужен для науки о данных. И в конечном итоге тратите на Python гораздо..
Баночка данных и задач для маркировки последовательностей — Рекуррентные нейронные сети (RNN)
В последней статье мы обсуждали банк данных и задач для конкретных задач классификации последовательностей. В этой статье мы коснемся банок данных и задач для проблем с маркировкой последовательностей.
Данные и задачи для маркировки последовательностей
Давайте сначала обсудим цель маркировки последовательностей — здесь для каждого слова во входном предложении модель предсказывает вывод.
Скажем, вход состоит из ряда последовательностей, табличное представление одного и того же будет..
Простая аналитика Twitter с помощью twitter-nlp-toolkit
Twitter - один из самых богатых источников данных как для бизнес-анализа, так и для академической или педагогической обработки естественного языка; многие из лучших наборов данных на Kaggle были собраны в Twitter, одно из самых популярных встраиваний текста было обучено с помощью Twitter, и почти каждая компания активно следит за Twitter.
Для этого есть ряд причин: Twitter имеет доступный API, а его система хэштегов упрощает сбор и сортировку данных. Это еще и потому, что Twitter -..
Как мы, двое новичков, попали в 4% лучших в соревновании Kaggle
Как мы вошли в 4% лучших в соревновании Kaggle
и как ты тоже можешь
Если вы следите за новостями Kaggle, возможно, вы знакомы с недавно закрытой Лабораторией инновационных наук в Гарварде Механизм действия конкурса . С гордостью могу сказать, что мне и моему партнеру Энди Вангу удалось попасть в 4% лучших - 152-е место из 4373 команд.
Что интересно, мы относительно новички в соревнованиях Kaggle. Что касается машинного обучения, то мы не совсем профессионалы - мы оба учащиеся,..
Новые материалы
Как создать диаграмму градиентной кисти с помощью D3.js
Резюме:
Из этого туториала Вы узнаете, как добавить градиентную кисть к диаграмме с областями в D3.js. Мы добавим градиент к значениям SVG и применим градиент в качестве заливки к диаграмме с..
Я хотел выучить язык программирования MVC4, но не мог выучить его раньше, потому что это выглядит сложно…
Просто начните и учитесь самостоятельно
Я хотел выучить язык программирования MVC4, но не мог выучить его раньше, потому что он кажется мне сложным, и я бросил его. Это в основном инструмент..
Лицензии с открытым исходным кодом: руководство для разработчиков и создателей
В динамичном мире разработки программного обеспечения открытый исходный код стал мощной парадигмой, способствующей сотрудничеству, инновациям и прогрессу, движимому сообществом. В основе..
Объяснение документов 02: BERT
BERT представил двухступенчатую структуру обучения: предварительное обучение и тонкая настройка.
Во время предварительного обучения модель обучается на неразмеченных данных с помощью..
Как проанализировать работу вашего классификатора?
Не всегда просто знать, какие показатели использовать
С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..
Работа с цепями Маркова, часть 4 (Машинное обучение)
Нелинейные цепи Маркова с агрегатором и их приложения (arXiv)
Автор : Бар Лайт
Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..
Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]
Как вы сегодня, ребята?
В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..