Взлом
Почти вся моя ежедневная корреспонденция ведется на английском языке. Я чувствую себя комфортно в чате и отвечаю на большинство своих электронных писем с помощью простой проверки орфографии. Но печальная правда такова: если вы не являетесь носителем английского языка, вы не будете все время писать на 100% чистом и естественном английском языке.
Чтобы лучше писать по-английски, я использую приложения для машинного перевода, такие как Google, чтобы исправить свое письмо. Как это делается? Переведите свой английский текст кандидата на свой родной язык (для меня это немецкий), проверьте, соответствует ли смысл вашему замыслу. Затем переведите обратно на английский.
Вот пример:
Английский: «Я играю на пианино каждую среду».
Немецкий: «Ich spiele jeden Mittwoch Klavier».
Перевод на английский: «Я играю на пианино каждую среду».
В этом примере обратный перевод на английский язык исправляет грамматическую ошибку и делает предложение более родным, добавляя «the» перед «piano» (я понятия не имел!). Приятно видеть, что машинный перевод добился такого прогресса. Настоятельно рекомендуется использовать приложение Google для перевода.
Индустриализация взлома
Я работал над оценкой и индустриализацией этого подхода (здесь — ссылка на решение). Поскольку я хорошо владею английским языком, я в основном заинтересован в том, чтобы мое письмо выглядело более родным, как в приведенном выше примере.
Возникает вопрос: какой язык-посредник (в примере я использовал немецкий) лучше всего подходит? Так как английский и немецкий языки имеют недалекого общего предка, а немецкий язык достаточно сложен, моя ставка была на немецкий (спойлер: этот я проиграл).
Какой язык наиболее совместим с английским?
Вот наш эксперимент: мы начинаем с совершенно хорошего английского текста, переводим его на другой язык, а затем снова возвращаемся на английский. Мы можем измерить разницу между результирующим текстом и исходным текстом, используя стандартную метрику машинного перевода под названием BLEU.
Например, мы начинаем с «чем ближе машинный перевод к профессиональному переводу человека, тем он лучше» и получаем «чем ближе машинный перевод к профессиональному переводу человека, тем лучше», в результате чего оценка BLEU составляет 86,69.
Язык с лучшими оценками побеждает в соревновании.
Мы тестировали шведский, французский, немецкий и упрощенный китайский языки на обзорах книг и новостях.
Углубившись в данные, становится ясно, что шведский язык опережает французский. Таким образом, шведский › французский › немецкий › китайский (упрощенное письмо).
Поэтому я использовал шведский как язык-посредник. Попробуй!