WedX - журнал о программировании и компьютерных науках

Публикации по теме 'word-embeddings'


Трансформационные и репрезентативные методы в НЛП
Эта статья даст вам краткое описание различных методов преобразования и представления в обработке естественного языка. К концу этой статьи вы сможете понять концепцию каждого метода. Трансформационные методы Это методы, используемые для извлечения информации из контекста/ Методы, о которых мы будем говорить, TF-IDF Кодирование горячим кодом Вложения слов TF-IDF TF-IDF расшифровывается как частота документа, обратная частоте, и представляет собой метод присвоения веса каждому..

Руководство по встраиванию слов в НЛП
Введение Обработка естественного языка (NLP) — это междисциплинарная область компьютерных наук, искусственного интеллекта и лингвистики, связанная со способностью компьютеров понимать человеческий язык. Word Embeddings  – это усовершенствование НЛП, которое резко увеличило способность компьютеров лучше понимать текстовый контент. Это подход к представлению слов и документов в виде числовых векторов, позволяющий похожим словам иметь аналогичные векторные представления. Разве это не..

Используйте FastText на модели, обученной на GloVe
Примечание: эта статья предназначена для читателей, которые уже знакомы с встраиванием слов и их использованием TL;DR Возьмите 10 самых распространенных английских слов и используйте их в качестве обучающего набора. Используйте линейную регрессию, чтобы научиться отображать одно на другое. Подключение этого усвоенного преобразования работает достаточно хорошо, даже если ценность потерь при обучении / проверке не так низка. Структура статьи Проблема: Я описываю, почему было..

Вложения слов в НЛП и его приложениях
Вложения слов - это, по сути, форма представления слов, которая связывает человеческое понимание языка с машинным. Вложения слов - это распределенные представления текста в n-мерном пространстве. Они необходимы для решения большинства проблем НЛП. Адаптация предметной области - это метод, который позволяет моделям машинного обучения и трансферного обучения отображать нишевые наборы данных, которые написаны на одном языке, но все же лингвистически различны. Например, юридические..

Новые материалы

Я хотел выучить язык программирования MVC4, но не мог выучить его раньше, потому что это выглядит сложно…
Просто начните и учитесь самостоятельно Я хотел выучить язык программирования MVC4, но не мог выучить его раньше, потому что он кажется мне сложным, и я бросил его. Это в основном инструмент..

Лицензии с открытым исходным кодом: руководство для разработчиков и создателей
В динамичном мире разработки программного обеспечения открытый исходный код стал мощной парадигмой, способствующей сотрудничеству, инновациям и прогрессу, движимому сообществом. В основе..

Объяснение документов 02: BERT
BERT представил двухступенчатую структуру обучения: предварительное обучение и тонкая настройка. Во время предварительного обучения модель обучается на неразмеченных данных с помощью..

Как проанализировать работу вашего классификатора?
Не всегда просто знать, какие показатели использовать С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..

Работа с цепями Маркова, часть 4 (Машинное обучение)
Нелинейные цепи Маркова с агрегатором и их приложения (arXiv) Автор : Бар Лайт Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..

Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]
Как вы сегодня, ребята? В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..

Использование машинного обучения и Python для классификации 1000 сезонов новичков MLB Hitter
Чему может научиться машина, глядя на сезоны новичков 1000 игроков MLB? Это то, что исследует это приложение. В этом процессе мы будем использовать неконтролируемое обучение, чтобы..


Для любых предложений по сайту: [email protected]