Только 20% населения мира говорит по-английски ... так почему же большая часть наших накопленных технических знаний по-прежнему доступна только на английском языке?
В Roboflow мы заинтересованы в поиске решений ранее неразрешимых проблем, используя последние достижения в области машинного обучения. Хотите узнать больше? Протяни руку!
В последнее время я много времени трачу на Переполнение стека. Сайт вопросов и ответов - находка для программистов. На большинство проблем, с которыми сталкивается программист, уже ответили эксперты по Stack Overflow. Достаточно простого поиска, и ваши проблемы будут решены.
К сожалению, почти все накопленные знания недоступны для подавляющего большинства населения мира! Stack Overflow - это в первую очередь англоязычный сайт, но только 20% людей в мире говорят по-английски.
У Stack Overflow есть сайты на нескольких других языках (испанский, русский, японский и португальский), но, к сожалению, гораздо меньше контента от гораздо меньшего сообщества, доступного на каждом из этих языков.
Как мы можем сделать это лучше?
Недавнее исследование, проведенное компаниями Google, Facebook и другими, показало революционные достижения в области автоматического перевода, основанные на новых методах машинного обучения. Это позволило нам предоставлять высококачественные переводы контента на английский язык для пользователей по всему миру (независимо от того, на каком языке они говорят).
Итак, мы можем просто запустить архив переполнения стека через Google Translate, и все готово, верно? Не совсем так! Хотя Google Translate теперь работает на продвинутой нейронной сети, он обучается на общем тексте, а не на техническом языке. Но мы можем обучить нашу собственную модель нейронного машинного перевода, используя архивы Stack Overflow, основываясь на их методах!
Это именно то, что мы планируем сделать!
Но ждать
Если у нас есть контент только на английском языке, как мы узнаем, хорошо ли справляется наша модель машинного обучения с его переводом? Похоже, что эти причудливые методы машинного обучения потребуют много времени и усилий, чтобы разобраться в них; мы уверены, что есть спрос на этот контент на других языках?
Примите участие в «Тесте на дым и зеркала»
Чтобы ответить на эти два вопроса, сегодня мы выпускаем PreguntaRepuesta.com, 10 самых популярных вопросов от Stack Overflow, переведенных (профессиональным переводчиком) на испанский.
Впервые я услышал о концепции теста «Дым и зеркала» от Тима Ферриса. Идея проста: проверить спрос на идею, создать поддельную целевую страницу для продукта, попытаться привлечь клиентов и посмотреть, сколько людей на самом деле нажимают «купить». Если этого никто не сделает, вы сэкономите много времени и усилий, создав продукт, который никому не нужен (или который вы не смогли бы эффективно продавать). Если многие люди это сделают, вы знаете, что у вас есть хорошие руки, еще до того, как вы сделали продукт!
Вот что такое PreguntaRepuesta.com; это способ определить, много ли испаноговорящих людей ищут помощь по программированию на своем родном языке. Если на сайт будет заходить много людей, вероятно, стоит попробовать модель нейронного машинного перевода, которую я почти уверен, что смогу построить (если у меня будет достаточно времени). Если нет, я перейду к следующей идее в моем списке!
Теперь ждем
Я позаботился о том, чтобы поисковая система максимально оптимизировала страницу (я даже добавил AMP). Надеюсь, это небольшое подмножество переведенного контента подтвердит потребность рынка!
А пока мы продолжаем прототипировать другие идеи в Roboflow. Наш следующий выпуск будет в области дополненной реальности. Следите за мной в Twitter, чтобы быть в курсе всех наших последних разработок!