- Итеративное извлечение информации на уровне документа с помощью имитационного обучения(arXiv)
Автор: Юнмо Чен, Уильям Гант, Вэйвэй Гу, Тунфэй Чен, Аарон Стивен Уайт, Бенджамин Ван Дурме.
Аннотация: мы представляем новую модель итеративного извлечения (IterX) для извлечения сложных отношений или шаблонов, то есть N-кортежей, представляющих сопоставление именованных слотов с фрагментами текста, содержащимися в документе. Документы могут поддерживать ноль или более экземпляров шаблона любого конкретного типа, что приводит к задачам идентификации шаблонов в документе и извлечения значений слотов каждого шаблона. Наш подход к имитационному обучению устраняет необходимость использования предопределенных порядков шаблонов для обучения экстрактора и приводит к самым современным результатам на двух установленных тестах — извлечении 4-мерных отношений в SciREX и извлечении шаблонов в MUC-4, а также прочная основа для новой задачи BETTER Granular.
2.Политики графических нейронных сетей и имитационное обучение для многодоменных диалогов, ориентированных на задачи(arXiv)
Автор:Тибо Кордье, Танги Урвой, Фабрис Лефевр, Лина М. Рохас-Барахона
Вывод: диалоговые системы, ориентированные на задачи, предназначены для достижения конкретных целей при общении с людьми. На практике им, возможно, придется обрабатывать одновременно несколько доменов и задач. Следовательно, менеджер диалогов должен иметь возможность учитывать изменения домена и планировать различные домены/задачи, чтобы иметь дело с многодоменными диалогами. Однако обучение с подкреплением в таком контексте становится трудным, потому что размер состояния-действия больше, а сигнал вознаграждения остается скудным. Наши экспериментальные результаты показывают, что структурированные политики, основанные на графовых нейронных сетях в сочетании с разной степенью имитационного обучения, могут эффективно обрабатывать многодоменные диалоги. Опубликованные эксперименты подчеркивают преимущества структурированных политик по сравнению со стандартными политиками.
3.Перерисовка и имитация обучения для обнаружения полосы движения(arXiv)
Автор:Юэ Хэ, Миньюэ Цзян, Сяоцин Е, Лян Ду, Чжикан Цзоу, Вэй Чжан, Сяо Тан, Эрруй Дин
Аннотация. Существующие методы определения полосы движения борются с проблемой невидимости полосы движения, вызванной тяжелыми тенями, серьезным ухудшением дорожной разметки и серьезным перекрытием транспортных средств. В результате, отличительные особенности дорожек едва ли могут быть изучены сетью, несмотря на сложные конструкции из-за присущей полосам невидимости в дикой природе. В этой статье мы нацелены на поиск расширенного пространства признаков, в котором особенности дорожек являются отличительными, сохраняя при этом аналогичное распределение дорожек в дикой природе. Для этого мы предлагаем новую структуру перерисовки и имитации обучения (RIL), содержащую пару учитель и ученик без каких-либо дополнительных данных или дополнительных трудоемких маркировок. В частности, на этапе перерисовки создается расширенный набор данных идеальной виртуальной дорожки, в котором перекрашиваются только области дорожек, а области, не относящиеся к полосам, остаются неизменными, сохраняя аналогичное распределение дорожек в дикой природе. Модель учителя изучает расширенное дискриминационное представление на основе виртуальных данных и служит руководством для имитации модели ученика. На этапе имитации обучения с помощью модуля дистилляции слияния масштабов студенческой сети предлагается генерировать функции, которые имитируют модель учителя как в одном масштабе, так и в перекрестных масштабах. Кроме того, связанный состязательный модуль создает мост для соединения не только моделей учителя и ученика, но также виртуальных и реальных данных, динамически настраивая процесс имитации обучения. Обратите внимание, что наш метод не требует дополнительных временных затрат во время логического вывода и может работать по принципу plug-and-play в различных передовых сетях обнаружения дорожек. Экспериментальные результаты доказывают эффективность инфраструктуры RIL как на CULane, так и на TuSimple для четырех современных методов обнаружения дорожек. Код и модель будут доступны в ближайшее время.