Публикации по теме 'naturallanguageprocessing'
5 каналов YouTube, на которые стоит подписаться, чтобы быть в курсе последних новостей об искусственном интеллекте!
Будьте впереди игры с этими информативными каналами искусственного интеллекта!
Искусственный интеллект (ИИ) — это одна из наиболее быстро развивающихся технологий в современном мире, в которой регулярно появляются новые прорывы и приложения.
Вы энтузиаст искусственного интеллекта и хотите быть в курсе последних тенденций и новостей в этой области? Тогда обратите внимание на эти пять обязательных каналов YouTube! От глубокого обучения и обработки естественного языка до робототехники и..
Внедрение и обучение моделей преобразователей классификации текста - простой способ
Узнайте, как реализовать и обучить модели преобразования классификации текста, такие как BERT, DistilBERT и другие, с помощью всего нескольких строк кода
Классификация текстов, несомненно, является наиболее распространенным применением НЛП. И, как и в большинстве приложений НЛП, в последние годы преобладают модели трансформаторов. В этой статье мы обсудим, как реализовать и обучить модели трансформатора классификации текста с помощью всего нескольких строк кода с использованием..
Сжатие нескольких предложений: поиск кратчайших путей в графах слов
Резюме исследования НЛП
В этом блоге я попытался резюмировать статью Сжатие нескольких предложений: поиск кратчайших путей в графах слов в соответствии с моим пониманием. Не стесняйтесь комментировать то же самое!
Постановка задачи
Сжатие предложений - это задача сжатия длинного предложения в более короткое путем удаления повторяющихся слов. В этой статье предлагается новый метод сжатия нескольких предложений без учителя , цель которого состоит в том, чтобы представить набор..
Руководство по встраиванию слов в НЛП
Введение
Обработка естественного языка (NLP) — это междисциплинарная область компьютерных наук, искусственного интеллекта и лингвистики, связанная со способностью компьютеров понимать человеческий язык. Word Embeddings – это усовершенствование НЛП, которое резко увеличило способность компьютеров лучше понимать текстовый контент. Это подход к представлению слов и документов в виде числовых векторов, позволяющий похожим словам иметь аналогичные векторные представления. Разве это не..
Обновление от 9/75 — Набор данных: сделай или возьми
На этой неделе я пытался выбрать между использованием существующего набора данных для ответов на вопросы для финансовых документов и созданием нового набора данных.
Я собрал некоторые плюсы и минусы и определил потенциальные наборы данных. Создание нового набора данных с нуля требует усилий. Но он также может быть основой для публикации. Кроме того, похоже, не существует набора данных, соответствующего моему исследовательскому вопросу.
Мой руководитель и я обсудим результаты и примем..
Введение в обработку естественного языка
Мы почти всегда работали с числовыми наборами данных в наших стандартных задачах машинного обучения/науки о данных. Всякий раз, когда мы сталкивались со столбцом с текстовыми данными, мы всегда преобразовывали его в числовые данные, используя методы предварительной обработки данных, такие как горячее кодирование и кодирование меток.
Давайте представим, что у нас есть набор данных с простыми текстовыми данными, и мы хотим предсказать, какие комментарии в Твиттере хорошие, а какие..
Шаг 4. Освоение предварительной обработки текста — 3
На этом этапе мы изучаем более продвинутые методы преобразования наших текстовых данных в числовые векторы, что делает их пригодными для алгоритмов. Эти методы в основном относятся к категории распределенных представлений.
Распределенные представления
Распределенные представления являются противоположностью локальных представлений. Это плотные векторы, которые обычно намного меньше размера словаря и разработаны таким образом, чтобы улавливать сходство между связанными словами...
Новые материалы
Объяснение документов 02: BERT
BERT представил двухступенчатую структуру обучения: предварительное обучение и тонкая настройка.
Во время предварительного обучения модель обучается на неразмеченных данных с помощью..
Как проанализировать работу вашего классификатора?
Не всегда просто знать, какие показатели использовать
С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..
Работа с цепями Маркова, часть 4 (Машинное обучение)
Нелинейные цепи Маркова с агрегатором и их приложения (arXiv)
Автор : Бар Лайт
Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..
Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]
Как вы сегодня, ребята?
В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..
Использование машинного обучения и Python для классификации 1000 сезонов новичков MLB Hitter
Чему может научиться машина, глядя на сезоны новичков 1000 игроков MLB? Это то, что исследует это приложение.
В этом процессе мы будем использовать неконтролируемое обучение, чтобы..
Учебные заметки: создание моего первого пакета Node.js
Это мои обучающие заметки, когда я научился создавать свой самый первый пакет Node.js, распространяемый через npm.
Оглавление
Глоссарий
I. Новый пакет
1.1 советы по инициализации..
Забудьте о Matplotlib: улучшите визуализацию данных с помощью умопомрачительных функций Seaborn!
Примечание. Эта запись в блоге предполагает базовое знакомство с Python и концепциями анализа данных.
Привет, энтузиасты данных! Добро пожаловать в мой блог, где я расскажу о невероятных..