Публикации по теме 'information-retrieval'
Используйте FastText на модели, обученной на GloVe
Примечание: эта статья предназначена для читателей, которые уже знакомы с встраиванием слов и их использованием
TL;DR
Возьмите 10 самых распространенных английских слов и используйте их в качестве обучающего набора. Используйте линейную регрессию, чтобы научиться отображать одно на другое. Подключение этого усвоенного преобразования работает достаточно хорошо, даже если ценность потерь при обучении / проверке не так низка.
Структура статьи
Проблема: Я описываю, почему было..
Освоение информационного поиска: создание интеллектуальных поисковых систем (глава 2)
Глава 2: TF-IDF и модели векторного пространства: помимо поиска по ключевым словам
Справочная глава: «Оценка моделей поиска информации: подробное руководство по показателям производительности » Глава 1: «Поиск по ключевым словам: основа поиска информации » Глава 2: «TF-IDF и Модели векторного пространства: Помимо поиска по ключевым словам » Глава 3: «Скрытое семантическое индексирование: выявление скрытых отношений » Глава 4: «Word2Vec и Doc2Vec: определение семантических отношений..
Краткое объяснение перевернутого индекса
Инвертированный индекс - это индекс базы данных, в котором хранится сопоставление содержимого, такого как слова или числа, с его местоположениями в базе данных, в документе или наборе документов. Инвертированный индекс предназначен для быстрого полнотекстового поиска.
Чтобы лучше понять, что такое инвертированный индекс и как использовать этот индекс, давайте рассмотрим простой пример с двумя документами:
Документ №1 с текстом « Рецепт пасты с соусом песто » Документ №2 с текстом «..
Что я узнал на SIGIR 2019
Автор Виктор Бувье , аспирант CentraleSupelec MICS и Sidetrade .
Несколько недель назад я посетил SIGIR 2019 , конференцию по исследованиям и разработкам в области Поиск информации , которая проходила в Париже в La Villette в течение 5 полных дней! Для нашей группы исследований и разработок это была прекрасная возможность ближе познакомиться с современными методами информационного поиска.
Начнем с того, почему и что! Поиск информации (IR) - это задача предоставления пользователю..
Новые материалы
Я хотел выучить язык программирования MVC4, но не мог выучить его раньше, потому что это выглядит сложно…
Просто начните и учитесь самостоятельно
Я хотел выучить язык программирования MVC4, но не мог выучить его раньше, потому что он кажется мне сложным, и я бросил его. Это в основном инструмент..
Лицензии с открытым исходным кодом: руководство для разработчиков и создателей
В динамичном мире разработки программного обеспечения открытый исходный код стал мощной парадигмой, способствующей сотрудничеству, инновациям и прогрессу, движимому сообществом. В основе..
Объяснение документов 02: BERT
BERT представил двухступенчатую структуру обучения: предварительное обучение и тонкая настройка.
Во время предварительного обучения модель обучается на неразмеченных данных с помощью..
Как проанализировать работу вашего классификатора?
Не всегда просто знать, какие показатели использовать
С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..
Работа с цепями Маркова, часть 4 (Машинное обучение)
Нелинейные цепи Маркова с агрегатором и их приложения (arXiv)
Автор : Бар Лайт
Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..
Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]
Как вы сегодня, ребята?
В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..
Использование машинного обучения и Python для классификации 1000 сезонов новичков MLB Hitter
Чему может научиться машина, глядя на сезоны новичков 1000 игроков MLB? Это то, что исследует это приложение.
В этом процессе мы будем использовать неконтролируемое обучение, чтобы..