
Микросервис предназначен для автоматизированного распознавания сканированных изображений паспортов граждан Российской Федерации. Он ориентирован на массовую обработку пакетов сканов внутренних российских паспортов, что позволяет автоматизировать процесс получения данных из паспортов в цифровом виде.
Решение эффективно обрабатывает документы, извлекая ключевые данные с паспортных страниц, и поддерживает интеграцию с инфраструктурой заказчика. Предусмотрен интерфейс удобной визуальной валидации результатов сканирования паспортов сотрудниками.
Микросервис распознаёт данные со 2 и 3 страниц паспорта: серия и номер, ФИО владельца, пол, дата и место рождения, дата выдачи, код подразделения и наименование выдавшего органа, а также предоставляет изображения этих страниц.
С 5 страницы и далее извлекается адрес регистрации и изображения штампов о регистрации. Это позволяет получить полный цифровой профиль клиента на основе паспортных данных.
Использование микросервиса позволяет организовать автозаполнение паспортных данных в анкетах клиентов, что значительно экономит время и упрощает работу.
Полученные данные в цифровом виде дают возможность автоматически формировать документы через шаблонизаторы и проводить проверку действительности паспортов с помощью интеграции со СМЭВ 4.0.
Все данные передаются по защищённому протоколу HTTPS. Реализована аутентификация и авторизация через API-ключи или токены. Микросервис соответствует требованиям законодательства РФ по защите персональных данных.
Данные распознанных паспортов и их изображения не сохраняются на сервере после обработки, что гарантирует конфиденциальность. Исключение — временное хранение изображений в процессе распознавания.
Микросервис реализован на Python, предоставляет RESTful API и использует JSON для обмена данными. Для удобства развёртывания применяется контейнеризация через Docker, код хранится в GitLab.
Разработчик оказывает полную техническую поддержку и помощь при интеграции, предоставляет подробную документацию по API, настройке и установке. Доступны варианты как с открытым, так и с закрытым исходным кодом.
Для высокой производительности рекомендуется использование GPU или тензорных ядер. Качество распознавания напрямую зависит от качества сканов: при отсутствии дефектов точность достигает не менее 95% для основных страниц.
Встроенная система логирования отслеживает все запросы и ошибки. В случае проблем пользователь получает детализированное сообщение с указанием причины сбоя. Микросервис не обрабатывает рукописные данные — при их обнаружении процесс прерывается с соответствующим уведомлением.