1 год назад 17 июля 2023 в 20:44 5470

Функция распознавания русского рукописного текста появилась в новой версии платформы для интеллектуальной обработки информации ContentCapture. Обновленный релиз своего флагманского продукта представил российский разработчик ИИ-решений Content AI.

Программа с новой функциональностью способна с высокой точностью распознавать в документах заполненные от руки поля на русском языке. Ранее ContentCapture могла распознавать только рукопечатный текст, где каждая буква прописывалась в отдельных полях заполняемой формы, например, анкеты или опроса. В новом релизе эти возможности объединены: система автоматически определяет, как написан текст, и распознает символы.

Важное технологическое новшество – способность распознавать курсив, то есть фразы, написанные без отрыва ручки от бумаги. Это одна из самых сложных задач, с которой ранее OCR-редакторы справлялись менее успешно. Кроме того, в новом выпуске существенно оптимизировано качество распознавания рукописного английского текста.

В ходе тестирования новой функциональности ContentCapture подтверждена точность распознавания данных в документах определенного типа в диапазоне 85-95%: речь идёт о паспортах и других документах, удостоверяющих личность, тестовых формах, служебных записках, подготовленных в свободном стиле.

«Качество распознавания в рамках данной задачи сильно зависит от разборчивости почерка и вида документа. Во внутренних тестах мы ориентировались на лучшие образцы технологий, имеющиеся на российском рынке. По ряду сценариев распознавание русского рукописного текста в ContentCapture демонстрирует самые высокие показатели среди всех протестированных продуктов, – уточнил технический директор Content AI Иван Волков. – Мы готовы индивидуально обучать и настраивать систему для более точной обработки конкретного, даже самого редкого, типа документа, если у заказчиков будет такая необходимость».

«Сценарии применения технологии распознавания рукописного текста востребованы в различных сферах, в которых ведется работа с документами, заполненными от руки, например в финансовых организациях и государственных структурах. Через специалистов этих ведомств ежедневно проходят десятки и сотни документов с элементами рукописного текста – паспортов, свидетельств, анкет, заявлений. Ввод данных в информационные системы зачастую осуществляется вручную. Автоматическая обработка и распознавание не только значительно повысит скорость работы сотрудников, но и сократит количество ошибок, которые могут быть допущены при ручном переносе данных», – отметила генеральный директор Content AI Светлана Дергачева.

Никто не прокомментировал материал. Есть мысли?