Публикации по теме 'word-embeddings'
Трансформационные и репрезентативные методы в НЛП
Эта статья даст вам краткое описание различных методов преобразования и представления в обработке естественного языка.
К концу этой статьи вы сможете понять концепцию каждого метода.
Трансформационные методы
Это методы, используемые для извлечения информации из контекста/
Методы, о которых мы будем говорить,
TF-IDF Кодирование горячим кодом Вложения слов
TF-IDF
TF-IDF расшифровывается как частота документа, обратная частоте, и представляет собой метод присвоения веса каждому..
Руководство по встраиванию слов в НЛП
Введение
Обработка естественного языка (NLP) — это междисциплинарная область компьютерных наук, искусственного интеллекта и лингвистики, связанная со способностью компьютеров понимать человеческий язык. Word Embeddings – это усовершенствование НЛП, которое резко увеличило способность компьютеров лучше понимать текстовый контент. Это подход к представлению слов и документов в виде числовых векторов, позволяющий похожим словам иметь аналогичные векторные представления. Разве это не..
Используйте FastText на модели, обученной на GloVe
Примечание: эта статья предназначена для читателей, которые уже знакомы с встраиванием слов и их использованием
TL;DR
Возьмите 10 самых распространенных английских слов и используйте их в качестве обучающего набора. Используйте линейную регрессию, чтобы научиться отображать одно на другое. Подключение этого усвоенного преобразования работает достаточно хорошо, даже если ценность потерь при обучении / проверке не так низка.
Структура статьи
Проблема: Я описываю, почему было..
Вложения слов в НЛП и его приложениях
Вложения слов - это, по сути, форма представления слов, которая связывает человеческое понимание языка с машинным. Вложения слов - это распределенные представления текста в n-мерном пространстве. Они необходимы для решения большинства проблем НЛП.
Адаптация предметной области - это метод, который позволяет моделям машинного обучения и трансферного обучения отображать нишевые наборы данных, которые написаны на одном языке, но все же лингвистически различны. Например, юридические..
Новые материалы
Я хотел выучить язык программирования MVC4, но не мог выучить его раньше, потому что это выглядит сложно…
Просто начните и учитесь самостоятельно
Я хотел выучить язык программирования MVC4, но не мог выучить его раньше, потому что он кажется мне сложным, и я бросил его. Это в основном инструмент..
Лицензии с открытым исходным кодом: руководство для разработчиков и создателей
В динамичном мире разработки программного обеспечения открытый исходный код стал мощной парадигмой, способствующей сотрудничеству, инновациям и прогрессу, движимому сообществом. В основе..
Объяснение документов 02: BERT
BERT представил двухступенчатую структуру обучения: предварительное обучение и тонкая настройка.
Во время предварительного обучения модель обучается на неразмеченных данных с помощью..
Как проанализировать работу вашего классификатора?
Не всегда просто знать, какие показатели использовать
С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..
Работа с цепями Маркова, часть 4 (Машинное обучение)
Нелинейные цепи Маркова с агрегатором и их приложения (arXiv)
Автор : Бар Лайт
Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..
Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]
Как вы сегодня, ребята?
В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..
Использование машинного обучения и Python для классификации 1000 сезонов новичков MLB Hitter
Чему может научиться машина, глядя на сезоны новичков 1000 игроков MLB? Это то, что исследует это приложение.
В этом процессе мы будем использовать неконтролируемое обучение, чтобы..