WedX - журнал о программировании и компьютерных науках

Публикации по теме 'naturallanguageprocessing'


5 каналов YouTube, на которые стоит подписаться, чтобы быть в курсе последних новостей об искусственном интеллекте!
Будьте впереди игры с этими информативными каналами искусственного интеллекта! Искусственный интеллект (ИИ) — это одна из наиболее быстро развивающихся технологий в современном мире, в которой регулярно появляются новые прорывы и приложения. Вы энтузиаст искусственного интеллекта и хотите быть в курсе последних тенденций и новостей в этой области? Тогда обратите внимание на эти пять обязательных каналов YouTube! От глубокого обучения и обработки естественного языка до робототехники и..

Внедрение и обучение моделей преобразователей классификации текста - простой способ
Узнайте, как реализовать и обучить модели преобразования классификации текста, такие как BERT, DistilBERT и другие, с помощью всего нескольких строк кода Классификация текстов, несомненно, является наиболее распространенным применением НЛП. И, как и в большинстве приложений НЛП, в последние годы преобладают модели трансформаторов. В этой статье мы обсудим, как реализовать и обучить модели трансформатора классификации текста с помощью всего нескольких строк кода с использованием..

Сжатие нескольких предложений: поиск кратчайших путей в графах слов
Резюме исследования НЛП В этом блоге я попытался резюмировать статью Сжатие нескольких предложений: поиск кратчайших путей в графах слов в соответствии с моим пониманием. Не стесняйтесь комментировать то же самое! Постановка задачи Сжатие предложений - это задача сжатия длинного предложения в более короткое путем удаления повторяющихся слов. В этой статье предлагается новый метод сжатия нескольких предложений без учителя , цель которого состоит в том, чтобы представить набор..

Руководство по встраиванию слов в НЛП
Введение Обработка естественного языка (NLP) — это междисциплинарная область компьютерных наук, искусственного интеллекта и лингвистики, связанная со способностью компьютеров понимать человеческий язык. Word Embeddings  – это усовершенствование НЛП, которое резко увеличило способность компьютеров лучше понимать текстовый контент. Это подход к представлению слов и документов в виде числовых векторов, позволяющий похожим словам иметь аналогичные векторные представления. Разве это не..

Обновление от 9/75 — Набор данных: сделай или возьми
На этой неделе я пытался выбрать между использованием существующего набора данных для ответов на вопросы для финансовых документов и созданием нового набора данных. Я собрал некоторые плюсы и минусы и определил потенциальные наборы данных. Создание нового набора данных с нуля требует усилий. Но он также может быть основой для публикации. Кроме того, похоже, не существует набора данных, соответствующего моему исследовательскому вопросу. Мой руководитель и я обсудим результаты и примем..

Введение в обработку естественного языка
Мы почти всегда работали с числовыми наборами данных в наших стандартных задачах машинного обучения/науки о данных. Всякий раз, когда мы сталкивались со столбцом с текстовыми данными, мы всегда преобразовывали его в числовые данные, используя методы предварительной обработки данных, такие как горячее кодирование и кодирование меток. Давайте представим, что у нас есть набор данных с простыми текстовыми данными, и мы хотим предсказать, какие комментарии в Твиттере хорошие, а какие..

Шаг 4. Освоение предварительной обработки текста — 3
На этом этапе мы изучаем более продвинутые методы преобразования наших текстовых данных в числовые векторы, что делает их пригодными для алгоритмов. Эти методы в основном относятся к категории распределенных представлений. Распределенные представления Распределенные представления являются противоположностью локальных представлений. Это плотные векторы, которые обычно намного меньше размера словаря и разработаны таким образом, чтобы улавливать сходство между связанными словами...

Новые материалы

Объяснение документов 02: BERT
BERT представил двухступенчатую структуру обучения: предварительное обучение и тонкая настройка. Во время предварительного обучения модель обучается на неразмеченных данных с помощью..

Как проанализировать работу вашего классификатора?
Не всегда просто знать, какие показатели использовать С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..

Работа с цепями Маркова, часть 4 (Машинное обучение)
Нелинейные цепи Маркова с агрегатором и их приложения (arXiv) Автор : Бар Лайт Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..

Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]
Как вы сегодня, ребята? В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..

Использование машинного обучения и Python для классификации 1000 сезонов новичков MLB Hitter
Чему может научиться машина, глядя на сезоны новичков 1000 игроков MLB? Это то, что исследует это приложение. В этом процессе мы будем использовать неконтролируемое обучение, чтобы..

Учебные заметки: создание моего первого пакета Node.js
Это мои обучающие заметки, когда я научился создавать свой самый первый пакет Node.js, распространяемый через npm. Оглавление Глоссарий I. Новый пакет 1.1 советы по инициализации..

Забудьте о Matplotlib: улучшите визуализацию данных с помощью умопомрачительных функций Seaborn!
Примечание. Эта запись в блоге предполагает базовое знакомство с Python и концепциями анализа данных. Привет, энтузиасты данных! Добро пожаловать в мой блог, где я расскажу о невероятных..


Для любых предложений по сайту: [email protected]