1. Семантический анализ с использованием лексикона для ориентированного на задачу диалога(arXiv)

Автор:Сяоцзюнь Мэн, Вэньлинь Дай, Яшэн Ван, Баоцзюнь Ван, Чжиюн Ву, Синь Цзян, Цюнь Лю

Аннотация: В последнее время семантический анализ с использованием иерархических представлений для диалоговых систем привлек значительное внимание. Для разбора пользовательских высказываний был предложен Task-Oriented Parse (TOP), древовидное представление с намерениями и слотами в качестве меток вложенных узлов дерева. Предыдущие методы синтаксического анализа TOP ограничены обработкой невидимых значений динамических слотов (например, добавленных новых песен и локаций), что является неотложной задачей для реальных диалоговых систем. Чтобы смягчить эту проблему, мы сначала предлагаем новое представление разбиения диапазона для синтаксического анализатора на основе диапазона, которое превосходит существующие методы. Затем мы представляем новый семантический синтаксический анализатор с добавлением лексики, который собирает метки слотов представления дерева в виде лексикона и вводит лексические признаки в представление синтаксического анализатора span. Для удаления из лексикона неуместных совпадений интервалов используется дополнительный метод устранения неоднозначности слотов. Наш лучший синтаксический анализатор дает новый современный результат (87,62%) в наборе данных TOP и демонстрирует свою адаптируемость к часто обновляемым записям лексикона слотов в реальном диалоговом окне, ориентированном на задачу, без необходимости повторного обучения.

2.CST5: Увеличение данных для семантического анализа с переключением кода(arXiv)

Автор: Анмол Агарвал, Джигар Гупта, Рахул Гоэль, Шьям Упадхьяй, Панкадж Джоши, Ренгараджан Аравамудхан.

Аннотация: Расширение семантических парсеров для ввода с переключением кода было сложной проблемой, в первую очередь из-за отсутствия контролируемых обучающих данных. В этой работе мы представляем CST5, новый метод увеличения данных, который точно настраивает модель T5, используя небольшой начальный набор (≈100 высказываний) для создания высказываний с переключением кода из английских высказываний. Мы показываем, что CST5 генерирует высококачественные данные с кодовой коммутацией, как внутренние (для оценки человека), так и внешние, сравнивая базовые модели, которые обучены без дополнения данных, с моделями, которые обучены с дополненными данными. Эмпирически мы наблюдаем, что с помощью CST5 можно достичь той же производительности семантического анализа, используя до 20 раз меньше помеченных данных. Чтобы помочь дальнейшим исследованиям в этой области, мы также выпускаем (a) Hinglish-TOP, крупнейший на сегодняшний день набор данных семантического синтаксического анализа, аннотированный человеком, с переключением кода, содержащий 10 000 аннотированных человеком высказываний хинди-английского (хинглиш) с переключением кода, и (b ) Более 170 000 CST5 сгенерировало фразы с кодовым переключением из набора данных TOPv2. Оценка человека показывает, что как данные, аннотированные человеком, так и данные, сгенерированные CST5, имеют хорошее качество.

3. На пути к системе нейросемантического анализа для ответов на вопросы ЭУЗ

(arXiv)

Автор:Сарвеш Сони, Кирк Робертс

Аннотация. Клинический семантический анализ (SP) — это важный шаг к определению точной потребности в информации (как машинопонятная логическая форма) из запроса на естественном языке, направленного на получение информации из электронных медицинских карт (EHR). . Текущие подходы к клиническому SP в значительной степени основаны на традиционном машинном обучении и требуют ручного создания словаря. Недавние достижения в нейронной СП показывают перспективу создания надежного и гибкого семантического синтаксического анализатора без особых человеческих усилий. Таким образом, в этой статье мы стремимся систематически оценивать эффективность двух таких нейронных моделей SP для ответов на вопросы EHR (QA). Мы обнаружили, что производительность этих передовых нейронных моделей на двух наборах клинических данных SP является многообещающей, учитывая их простоту применения и обобщаемость. Наш анализ ошибок выявляет распространенные типы ошибок, допускаемых этими моделями, и может дать информацию для будущих исследований по улучшению производительности нейронных моделей SP для EHR QA.