Публикации по теме 'data-science'
Введение в обработку естественного языка для анализа текста
Введение
Обработка естественного языка (NLP) — это область искусственного интеллекта и лингвистики, которая фокусируется на взаимодействии между компьютерами и человеческим языком. Анализ текста, важное применение НЛП, направлен на извлечение осмысленной информации из больших объемов неструктурированных текстовых данных. В этом блоге мы рассмотрим ключевые методы НЛП, используемые для анализа текста, а также примеры Python, демонстрирующие их реализации и результаты.
2...
СКАЗКА О ТРЕХ УЧЕНЫХ ДАННЫХ
СКАЗКА О ТРЕХ УЧЕНЫХ ДАННЫХ
Автор: Кришна Гопалуни , Хариш Дашика , Манджур Рахаман , Нитин Мишра
Мне нравятся хорошие истории, и мне также нравится смотреть на море - мне нужно выбирать между двумя? - Дэвид Бирн, Как работает музыка
Если вы специалист по данным, ответ - нет! Вы можете иметь и то, и другое; до тех пор, пока ваши истории, основанные на данных, построены на прочной исследовательской базе. Специалист по анализу данных использует методы и инструменты,..
Могут ли модели машинного обучения деградировать?!
Случалось ли вам когда-нибудь хорошо учиться чему-то, например, собирать пазлы или кататься на лыжах, но со временем забывали, как это делать?
То же самое, к сожалению, может случиться с вашей моделью ML…
вступление
В качестве предисловия к этой истории позвольте мне рассказать вам, как я пришел к этой теме.
Представляем fklearn: библиотеку машинного обучения Nubank (часть I)
Эта статья перенесена в наш новый блог. Найдите его на странице https://building.nubank.com.br/introduction-fklearn-nubanks-machine-learning-library-part-i-2/ .
Прочтите вторую часть этой истории здесь .
Nubank только что выпустил в открытый доступ fklearn , нашу библиотеку Python для машинного обучения!
В Nubank мы в значительной степени полагаемся на машинное обучение для принятия масштабируемых решений на основе данных. Хотя существует множество других библиотек..
Неравенство Дженсена (часть I): доказательство
Представьте, что вы фотограф и пытаетесь сфотографировать красивый пейзаж. Вы хотите захватить всю сцену, но ваша камера может сфокусироваться только на одной части за раз. Итак, вы делаете несколько снимков, каждый из которых фокусируется на разных частях пейзажа.
Теперь вы хотите создать единую картинку, представляющую весь пейзаж. Один из способов сделать это — взять средневзвешенное значение изображений. Вы придаете большее значение изображениям, которые представляют наиболее..
Уничтожитель жаргона данных
– Кэролайн Роузберри, AVADO Learning
Скоро наука о данных станет просто еще одним навыком, в котором мы все хотя бы немного разбираемся. Однако одним из основных препятствий является жаргон, используемый экспертами по данным, что делает эту тему недоступной для обычного человека. А чтобы разобраться, нам нужно начать избавляться от жаргона или хотя бы овладеть им.
Только 33% штатных сотрудников в США уверены в своей грамотности в работе с данными — и нетрудно понять, почему...
A42: машины опорных векторов (SVM) [за кулисами!]
Гиперплоскость с максимальным запасом, кросс-энтропия и потеря шарнира, трюк с ядром, резервные переменные, норма, ядро rbf, происхождение персептрона, регуляризующий гиперпараметр
Эта статья является частью серии книг Наука о данных с нуля — Могу ли я, чтобы я смог . ( Нажмите здесь, чтобы получить копию сегодня !)
Нажмите здесь, чтобы просмотреть предыдущую статью/лекцию на тему «A41: Начальная загрузка и доверительный интервал — за кулисами!! »
💐Нажмите здесь,..
Новые материалы
Как создать диаграмму градиентной кисти с помощью D3.js
Резюме:
Из этого туториала Вы узнаете, как добавить градиентную кисть к диаграмме с областями в D3.js. Мы добавим градиент к значениям SVG и применим градиент в качестве заливки к диаграмме с..
Я хотел выучить язык программирования MVC4, но не мог выучить его раньше, потому что это выглядит сложно…
Просто начните и учитесь самостоятельно
Я хотел выучить язык программирования MVC4, но не мог выучить его раньше, потому что он кажется мне сложным, и я бросил его. Это в основном инструмент..
Лицензии с открытым исходным кодом: руководство для разработчиков и создателей
В динамичном мире разработки программного обеспечения открытый исходный код стал мощной парадигмой, способствующей сотрудничеству, инновациям и прогрессу, движимому сообществом. В основе..
Объяснение документов 02: BERT
BERT представил двухступенчатую структуру обучения: предварительное обучение и тонкая настройка.
Во время предварительного обучения модель обучается на неразмеченных данных с помощью..
Как проанализировать работу вашего классификатора?
Не всегда просто знать, какие показатели использовать
С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..
Работа с цепями Маркова, часть 4 (Машинное обучение)
Нелинейные цепи Маркова с агрегатором и их приложения (arXiv)
Автор : Бар Лайт
Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..
Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]
Как вы сегодня, ребята?
В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..