Отказ от ответственности: я имею в виду этот репозиторий.
На данный момент проект «Универсальный переводчик» отлично справляется со своей задачей: берет файл с определенной структурой, анализирует содержимое и конвертирует заданные единицы в нужные, выгружая их в файл, на который также указывает пользователь. Однако мы заинтересованы в постоянном улучшении приложения, и следующим шагом, безусловно, будет машинное обучение.
Текущее поведение
Если мы изучим текущее поведение приложения, то это довольно просто: достаточно запустить CLI-приложение, указать два флага pathname и writepath, и приложение сделает свою работу. . Есть несколько вещей, которые в долгосрочной перспективе могут раздражать:
- Пользователь должен каждый раз указывать путь для ввода и путь записи для вывода.
- Данные должны быть должным образом очищены, чтобы они работали: не может быть ни одной ошибки.
- Он ограничен набором входов и выходов, которые очень определены.
Идеи по улучшению
Несколько идей о том, как мы могли бы улучшить приложение для машинного обучения:
- Используйте обработку естественного языка, чтобы научить приложение читать тексты и распознавать разные единицы измерения, а также преобразовывать / нормализовать их все в одну единицу (например, из сантиметров в метры).
- Обработка естественного языка, позволяющая распознавать различные системы единиц и преобразовывать их в единую систему. Это принесет большую пользу международным пользователям, так как может возникнуть много проблем с использованием нестандартных единиц измерения; Был марсоход, который разбился из-за проблемы с конверсией.
- Будьте устойчивы к ошибкам в формате записи и обучайте модель машинного обучения, которая может исправить эти ошибки и точно преобразовать и нормализовать единицы для дальнейшего использования.
Все эти идеи, конечно, изменят перспективы и будущую разработку приложения, но они потенциально могут использоваться в отрасли для автоматической стандартизации документов и возможности отправки их в ту часть мира, которая использует совершенно другую систему преобразования.