Недавно я встретился с Самадом Эчихаби, вице-президентом по исследованиям и разработке продуктов в исследовательском центре SDL MT Research в Лос-Анджелесе, чтобы получить информацию об их технологии Adaptive MT. Команда в Лос-Анджелесе происходит из основной группы Language Weaver, но в полную команду также входят участники из Кембриджа, Великобритания, и Клужа, Румыния. Исследовательская группа, которую возглавляет Самад, всегда была в авангарде исследований машинного перевода, несмотря на многочисленные потрясения и смены руководства в команде. В этом посте я собрал информацию о конкретном продукте от Самада и его команды, а также информацию о стратегии и видении из публичных презентаций, представленных новым высшим руководством SDL, чтобы собрать воедино более полное представление о том, что может означать эта новая технологическая инициатива.
Адаптивный машинный перевод
Ранее в этом году я смотрел презентацию «100 days», представленную Адольфо Эрнандесом и командой управления «новой SDL» осенью 2016 года, и это снова пробудило во мне интерес к технологии SDL MT. Всегда приятно видеть, как кто-то смотрит на старую проблему новыми глазами. Было ясно, что новое руководство рассматривало передовую технологию машинного перевода как основной бизнес-двигатель и, похоже, серьезно относилось к тому, чтобы вернуть машинное обучение SDL в нужное русло и исправить маргинализацию машинного перевода, которую создало предыдущее руководство. Было интересно услышать, как новая команда ответила инвестиционным аналитикам, которые поставили под сомнение этот новый акцент на машинном переводе, когда фактический прямой доход от машинного перевода был настолько сокращен. Они неоднократно объясняли, что у них «иное представление о МТ, чем у старого режима». Однако, как показывают следующие слайды из этой презентации «промежуточных результатов», новая команда видит большую и основополагающую роль машинного перевода и рассматривает его как технологию, обеспечивающую импульс для дальнейшего развития бизнеса.
Преимущества экосистемы SDL?
У команды SDL MT есть целый набор инструментов NLP, готовых к действию, в дополнение к их технологии MT. Эти инструменты можно использовать для подготовки и преобразования лингвистических данных для различных потребностей языковых проектов, которые могут быть связаны или не связаны с машинным переводом. Samad представил обзор своей существующей технологии машинного перевода, которая включает как локальные (SDL ETS), так и облачные (SDL BeGlobal) решения, которые являются надежными и протестированы в полевых условиях в основном корпоративными и государственными пользователями. Он продемонстрировал, как легко с помощью удаленной консоли можно настроить один сервер или 100 серверов за считанные минуты. Это был самый простой процесс настройки и установки сервера MT, который я когда-либо видел. Для установки некоторых установок может потребоваться несколько дней, и для этого потребуется, чтобы технические специалисты поставщика даже попытались это сделать.
Облачная архитектура также очень гибкая и предназначена для масштабирования и эластичности, позволяющей адаптироваться к самым разнообразным рабочим нагрузкам. например когда большие базы знаний повторно переводятся с основным обновлением ядра. Архитектура также контейнеризована. (Контейнеры — это решение проблемы обеспечения надежной работы программного обеспечения при перемещении из одной вычислительной среды в другую. Это может быть перенос с ноутбука разработчика в тестовую среду, из промежуточной среды в производственную и, возможно, из физическую машину в центре обработки данных на виртуальную машину в частном или общедоступном облаке. Мне сказали, что это важно, и это имеет значение.)
Преимущества адаптивного машинного перевода
С тех пор, как я впервые увидел переводчика, работающего с Lilt, в начале 2016 года, я был поклонником адаптивного машинного перевода и чувствовал, что этот подход имеет большой смысл, поскольку многие проекты машинного перевода спотыкаются на этапе настройки. В механизмах адаптивного машинного перевода, как правило, движки обучаются по мере того, как вы переводите, а не посредством процесса пакетного обучения, управляемого поставщиком машинного перевода, как в большинстве других систем машинного перевода. Я думаю, будет справедливо сказать, что это подход следующего поколения к постредактированию, поскольку корректирующие правки обучают систему, а задача редактирования не является бездумно повторяющейся. Кроме того, это гораздо лучшее решение для тех проектов агентств, которым не хватает данных или которые просто нуждаются в быстром изменении без длительного процесса настройки, который может занять месяцы и все равно потерпит неудачу.
Я уверен, что адаптивный машинный перевод является лучшим подходом для агентства или фрилансера, чем любое самодельное решение Moses, и я думаю, что он может стать технологией машинного перевода, наиболее распространенной в профессиональной сфере. мир переводов, потому что он динамически обучается, управляется лингвистически и совершенствуется за счет постоянной корректирующей обратной связи с человеком. Кроме того, в отличие от NMT, он не требует ресурсов. Всегда существует вероятность того, что высокочувствительная нейронная технология МТ может появиться и преобладать, но я сомневаюсь, что это возможно в ближайшем будущем (не ранее 2018 года). Пользовательский интерфейс Adaptive MT больше похож на виртуального помощника, который учится быть лучшим помощником, когда вы работаете вместе. SDL Adaptive MT будет работать с общими (базовыми), вертикальными (отраслевыми, такими как ИТ или Life Sciences) и уникальные специализированные движки, адаптированные к предметной области. Эта возможность формировать и контролировать начальную точку базового уровня адаптивного машинного перевода является мощной функцией, поскольку теоретически она ускоряет кривую обучения системы, и пользователи могут быстрее достигать более высоких пороговых значений производительности. При правильной реализации и использовании адаптивный Двигатели MT будут постоянно улучшаться при постоянном использовании.
Сегодня SDL переводит 20 миллиардов слов в месяц для клиентов с MT и 100 миллионов слов в месяц с помощью традиционного TEP. (Это означает, что 95 % того, что SDL ежемесячно переводит, выполняется компьютерами). Это говорит о том, что они знают, как делать и то, и другое, и они уже установили, что использование собственного машинного перевода повышает прибыль. (фактически 2%, как они сообщили 6 декабря 2016 г., хотя я подозреваю, что это больше).
Adaptive MT доступен сегодня от Lilt и SDL, а вскоре и от ModernMT, инициативы с открытым исходным кодом, финансируемой ЕС, при активном участии Translated.net. После многих лет бездействия, показывая лишь небольшой постепенный прогресс и множество неудач из-за безумия Моисея, рынок машинного машинного перевода снова гудит благодаря импульсу нейронного и адаптивного машинного перевода. Интересно, что в 2015 году компания SDL получила патенты на адаптацию онлайн-домена и на персонализированный машинный перевод посредством онлайн-адаптации, поэтому вполне возможно, что они были идейными лидерами в отношении основной идеи адаптивного машинного перевода, которые просто не обошли стороной к внедрению работающего решения, чтобы быть первым игроком на рынке, возможно, из-за разных приоритетов в команде высшего руководства в то время.
Самад описал некоторые оценочные тесты, которые он провел, чтобы оценить, насколько выгоден адаптивный MT по сравнению с любыми рычагами, обеспечиваемыми стандартным MT. Его тщательный процесс тестирования и консервативные оценки для выделения преимущества адаптивного машинного перевода показали, что это число составляет от 5% до 25% для очень специфических тестов, которые он описал. От 5% до 25% улучшение по сравнению со стандартным MT без учета повышения производительности за счет других функций Trados. Хотя большинство представителей индустрии машинного перевода склонны преувеличивать преимущества технологии, здесь есть случай, когда преимущества преуменьшаются и стараются не обещать слишком много, в отличие от недавней гиперболы Google. Я также собираюсь поспорить, что человеческие оценки SDL, выполненные штатными переводчиками, гораздо более значимы и точны, чем человеческие оценки, основанные на механическом турке Google. Исходя из того, насколько консервативной и строгой была его процедура тестирования, я ожидаю, что реальная выгода для клиента будет намного выше. В последней версии Trados представлена таблица (показана ниже), в которой количественно оцениваются преимущества TM и Adaptive MT, но расчет остается загадкой, и мы надеемся, что SDL ясно объяснит, как они пришли к этому числу, если они хотят, чтобы ему доверяли и относились к нему серьезно.
У них более глубокий доступ к предприятию, чем у любого другого поставщика машинного перевода, и они, возможно, могут легче находить НОВЫЕ ценные возможности машинного перевода.
У SDL есть потенциал стать доминирующим игроком в этом сегменте рынка, т. е. в сегменте корпоративного и профессионального перевода со своим набором продуктов для машинного перевода и особенно с адаптивным машинным переводом. Некоторые причины, почему я говорю это, включают:
Хотя SDL не может заявлять, что все ее программные компоненты являются лучшими в своем классе, можно ожидать, что SDL действительно глубоко понимает, как ключевые компоненты должны быть связаны друг с другом, чтобы создать действительно лидирующую на рынке автоматизацию процесса перевода, которую ценят клиенты. Новая управленческая команда также кажется гораздо более открытой для создания «соединителей», позволяющих контенту перемещаться между созданием контента в/из процессов перевода и далее к распространению. Надежная поддержка приема данных из других (не SDL, например Adobe) программных сред является критическим требованием для многих глобальных предприятий и часто может стать препятствием при выборе основных бизнес-систем. Надеемся, что это открытость для соединителей также будет распространяться на MemoQ, Memsource и другие сервисы, поскольку такой уровень открытости принесет пользу и поощрит многих потенциальных клиентов и, в частности, будет использовать предложения SDL MT.«Открытость», требующая использования только компонентов SDL, не является действительно открытым, и, как стало известно Microsoft, не работает. Индустрия переводов остро нуждается в настоящей открытости, чтобы предприятия могли «легко связать переводимый контент с различными процессами, связанными с переводом».
- У них есть лидирующий на рынке продукт ТМ для фрилансеров с большой установленной базой, которую можно привлечь для активного использования адаптивного машинного перевода с правильными стимулами, например. бесплатно.
- У них самая совершенная экосистема переводческого производства, которую потенциально можно было бы интегрировать в единое целое, хотя исторически они были неспособны на это. ( Я предполагаю, что Lionbridge и TransPerfect не согласятся, но я совершенно уверен, что системы SDL MT имеют более высокий уровень, а у LIOX и Transperfect в настоящее время есть другие проблемы, которыми нужно заняться). Эта экосистема включает в себя программное обеспечение для управления контентом, системы управления переводами, машинный перевод, NLP и инструменты для повышения производительности перевода в дополнение к компетентности в управлении проектами перевода, выполняемыми людьми, в масштабе.
- SDL Adaptive MT тесно интегрирован с новой Trados Studio 2017, которая обеспечивает более богатый интерфейс в механизме MT, чем Lilt. Это включает в себя upLIFT Fragment Recall и upLIFT Fuzzy Repair, а также все устаревшие функции Trados для использования и поддержки пользователя-переводчика, который также может использовать обучающийся механизм машинного перевода для своей поддержки. («upLIFT — это мощный поиск соответствия» который по-новому открывает возможности повышения производительности за счет сегментов с несовпадениями и нечеткими совпадениями.) Массимо Гисланди показал мне демо-версию, показывающую, как мощные функции Trados легко интегрируются с Adaptive MT, включая нечто под названием Autosuggest, которое использует доступные данные, чтобы помочь с подпрограммами. параметры сегмента перед переводом. В некотором смысле это похоже и эквивалентно интерактивному компоненту MT в Lilt. SDL будет использовать как корпоративный, так и независимый фрилансерский подход к своей технологии Adaptive MT , которая на данный момент ограничена 5 языками (скоро будет больше, поскольку для Adaptive MT требуется другая вспомогательная инфраструктура данных/программного обеспечения, чем для стандартного SMT). . Вы получаете Adaptive MT Engine бесплатно с новой лицензией Trados. В настоящее время вам нужен Trados для взаимодействия с механизмом Adaptive MT, но они рассматривают другие варианты, включая интеграцию со сторонними интерфейсами.
Массимо предположил, что многофункциональный интерфейс Trados будет наиболее предпочтительным интерфейсом для опытных переводчиков, которые, скорее всего, будут использовать Adaptive MT. Интерфейс Lilt элегантен и легок, но требует, чтобы переводчик адаптировался к новому типу интерфейса и подхода к переводу. Новый подход действительно затрудняет широкое распространение (как знает Lilt), поскольку старые собаки-переводчики не так легко учатся новым трюкам. Память переводов — действительно единственный CAT-инструмент, который на сегодняшний день широко прижился среди переводчиков. На сегодняшний день никому не удалось продать МТ в больших объемах фрилансерам, и я не уверен, что первоначальный подход, который использует SDL, также будет успешным, даже несмотря на то, что эта технология действительно имеет смысл для мощного переводчика или любого другого переводчик, который учится создавать и использовать повышение производительности Adaptive MT. Инфраструктура управления проектами, окружающая Trados, также позволяет использовать его для крупномасштабных корпоративных проектов, но я считаю, что существует потребность в облачном постредакторском интерфейсе, который может упростить консолидацию распределенных работа по редактированию, а также надзор и мониторинг групп, работающих над многомиллионными проектами. Вчерашние инструменты не всегда работают автоматически для решения сегодняшних проблем. - Однако в прошлом мы также видели, что SDL не может связать все вместе в элегантное, должным образом интегрированное решение, занимающее доминирующее положение на рынке. Исторически интеграция их программного обеспечения была беспорядочной и проблематично из того, что я мог собрать. Команда менеджеров изменилась, поэтому возможность реальной синергии снова существует, но на самом деле еще слишком рано говорить. Приобретение программного обеспечения является грязным делом для любой компании, поскольку каждый программный продукт часто имеет ограниченное мировоззрение и архитектурные барьеры, которые затрудняют или даже делают невозможным наведение мостов и создание новой, более сложной, комбинированной и мощной структуры. Новая команда существует всего 9 месяцев, так что опять слишком рано говорить, но история, которую они рассказывают, более правдоподобна (по крайней мере, для меня).
Это так. сказал, что компании, которые могут создать имидж бренда, «который нравится» », имеют тенденцию расти и завоевывать долю рынка просто потому, что они аутентичны, прозрачны, надежны, круты и симпатичны, например. FaceBook, Apple, Harley Davidson, Google, Sony, Amazon, BMW, Tom’s. «Вот рейтинг», который, возможно, объясняет, почему это важно, и сравните его со «списком Forbes», который ранжируется по стоимости и включает такие компании, как IBM (создатели подхода «FUD») в их топ-10. (Когда вы в последний раз слышали, как кто-то сказал: «Парень, я очень люблю IBM».Исторически я замечал, что у SDL есть противоположная проблема, они часто вызывает активную неприязнь и недоверие со стороны клиентов, партнеров, конкурентов и других представителей отрасли. Это проблема, которую новое руководство также должно решить, так как, на мой взгляд, это важный фактор, определяющий будущий успех. Для меня это означает общаться аутентичным голосом, а не «корпоративным маркетинговым языком», который имеет определенную информационную ценность, но «обычно не вызывает энтузиазма» у клиентов и партнеров, которые также эффективно продают от вашего имени.
Одно время у SDL была мощная технология машинного перевода, которая на короткое время имела самую большую корпоративную базу доходов от машинного перевода на рынке (т.е. › SYSTRAN), которая, к сожалению, была близка к уничтожению из-за неумелого управления и пренебрежения предыдущими руководство. Кто-то может даже сказать, что в отрасли машинного перевода было больше проблем с бесхозяйственностью и плохой стратегией коммерциализации, чем в тех, которые связаны с технологиями.
SDL выглядит хорошо с их технологией Adaptive MT, и я думаю, что как агентства, так и внештатные клиенты могли бы извлечь выгоду из активного использования (не случайного, случайного использования) этой технологии. Как Adaptive MT, так и NMT могут помочь обеспечить устойчивую эффективность производства, которую будет трудно достичь с помощью старых технологий, и я ожидаю, что те LSP и фрилансеры, которые научатся правильно использовать эти технологии, окажутся победителями. SDL — это ЕДИНСТВЕННЫЙ LSP с опытом и опытом, достаточными, по моему мнению, для разработки решений NMT (но я уверен, что многие другие LSP также будут тратить время и ресурсы впустую , и создавать паршивые субоптимальные системы). Однако у SDL также есть история проигрышей или отставаний в играх, где они казались явными фаворитами. Управление «новым SDL» намного легче слушать, и, надеюсь, они работают так же хорошо, как и говорят. Я буду продолжать делиться информацией об эволюции этой технологии, поскольку я могу извлечь из этого пользу. точки зрения, и, надеюсь, SDL останется столь же открытым для обмена, как и до сих пор. Люди покупают технологии, которые они понимают, и до сих пор поставщики машинного перевода не очень хорошо объясняли, что, почему и где, и сосредоточились в основном на чрезмерно технических описаниях того, «как» эта технология. strong>
В любом случае, 2017 год, похоже, будет захватывающим и запоминающимся для MT. Желаю всем больших успехов в ваших начинаниях.
Полный текст статьи с дополнительными иллюстрациями доступен здесь: Пристальный взгляд на адаптивную технологию машинного перевода SDL
Более пристальный взгляд на адаптивную технологию машинного перевода SDL
Недавно я встретился с Самадом Эчихаби, вице-президентом по исследованиям и разработке продуктов в исследовательском центре SDL MT Research в Лос-Анджелесе, чтобы получить информацию об их адаптивной…