Что такое OCR, почему автоматизация документооборота редко используется и чему мы научились в процессе разработки собственного решения RPA.

В настоящее время искусственный интеллект охватывает все больше и больше областей. Он проверяет готовность пиццы, ищет преступников и анализирует происхождение Большого взрыва. В этой статье мы поговорим о гораздо более повседневном использовании: как автоматизировать документооборот и сократить время обработки до нескольких секунд и почему, если вы этого не сделаете, рост практически любой компании может остановиться.

OCR как часть RPA - что это?

С увеличением документооборота - бесконечной подготовки документов, договоров, заполнений, соглашений и форм, затраты на бэк-офис тоже растут. Отдел, в свою очередь, требует не только управления, но и стоит немалых денег. Роботизированная автоматизация процессов (RPA) может значительно снизить ваши расходы за счет оптимизации всех процессов без изменения их структуры. В основе технологии на основе RPA лежит оптическое распознавание символов, проще говоря - OCR.

Представим, что вы берете ссуду. Ваш паспорт быстро сканируется, данные проверяются автоматически, и через несколько минут ваша заявка одобряется. Это становится возможным, если убрать необходимость выполнять рутинные действия сотрудника, такие как ручной ввод данных в систему. Именно так работает технология OCR. Он распознает картинку, за секунду разделяет ее на отдельные поля, извлекает необходимые данные и автоматически вводит их в формы, контракты, CRM, приложения и так далее. Таким образом, объем ручной работы сводится к минимуму, а все процессы, связанные с обработкой документов, значительно ускоряются.

В результате технология сокращает расходы на бэк-офис вплоть до полного закрытия отдела и в то же время повышает удовлетворенность операторов: теперь они могут уделять больше времени клиентам.

Случаи применения

В повседневной жизни OCR используется во многих случаях. Вот некоторые из них:

  • автоматическое считывание банковских карт;
  • мгновенное распознавание паспортов;
  • данные для автозаполнения платежей в вашем онлайн-аккаунте;
  • быстрый ввод данных в контракты;
  • сверка данных о клиентах из разных источников;
  • автозаполнение CRM;
  • и многое другое. Чуть позже мы вернемся к этому.

Теперь поговорим о недостатках технологии.

Точность распознавания текста

Первый вариант OCR был изобретен в 1950 году в США. На сегодняшний день она представлена ​​разными игроками рынка, но в процессе разработки собственных технологий и развития клиентов мы поняли, что существующие решения подходят далеко не каждому клиенту. Вот почему.

На данный момент качество распознавания текста, скажем, в идентификаторе не превышает 85%. Алгоритм по-прежнему работает с ошибками при обработке нечетких, блеклых или помятых изображений. Все эти факторы влияют на качество и мешают системе правильно распознавать текст. Чтобы улучшить его, мы внедрили в технологию две новые функции.

  • Анализ контекста. Полученный текстовый результат дополнительно обрабатывается нейронной сетью, которая обучена учитывать контекст и автоматически исправлять ошибки. Это очень похоже на то, как поисковые системы исправляют опечатки, когда вы что-то гуглите.
  • Постоянный человек. Текст, извлеченный системой, передается на проверку квалифицированным специалистам на борту. Они дополняют работу ИИ и исключают возможные ошибки. Сочетание алгоритма и человеческого труда увеличивает точность распознавания с 85% до 99% в любых текстах. Вишенка на торте заключается в том, что ручная проверка решает проблемы рукописных текстов: она учит алгоритм находить и исправлять ошибки, и со временем качество распознавания повышается, а затраты остаются прежними.

Безопасность данных

Поскольку мы используем концепцию «человек в цикле» и текст распознается в наших силах, возникает вопрос о передаче данных и их надлежащем хранении. Как гарантировать безопасность данных клиентам? Мы используем анонимность, избегая хранения данных на наших серверах. Это также можно сделать с помощью серверов и персонала клиента.

Вот пример. Алгоритм размывает картинку и разбивает паспорт на несколько полей на стороне клиента. Информация попадает на наши серверы в анонимном виде: невозможно определить, какое поле принадлежит конкретному человеку. Поля распознаются отдельно и отправляются обратно клиенту с использованием HTTPS-шифрования. Весь процесс занимает меньше секунды.

Вы можете подключить технологию через REST API - это очень просто, так как ее поддерживают почти все системы.

В двух словах

OCR как часть RPA снижает затраты на бэк-офис и может значительно повысить производительность компании. Даже когда ИИ работает с личными данными, вы можете не беспокоиться о результатах, так как есть решения, гарантирующие полную безопасность данных и качество распознавания текста до 99%. Технология применима к множеству повседневных дел, о которых мы расскажем в следующей статье.