Компания Cognitive Technologies объявляет о выходе новой версии Cognitive Passport 3.0. Система обеспечивает сканирование, идентификацию и распознавание документов удостоверяющих личность.
В новой версии качество распознавания новых российских паспортов формата А6 выросло на 20%. Это во многом стало возможным благодаря реализации новых технологий интеллектуального поиска, идентификации и удаления помех в документе. К помехам относятся текстурный фон, линии, голограммы и другие элементы на цветном изображении, которые нередко накладываются на полезную текстовую информацию и препятствуют ее распознаванию традиционными средствами.
Необходимо отметить, что до последнего момента именно линии и голограммы оставались основным препятствием для решения задачи удаления помех. В версии Cognitive Passport 3.0 этой проблеме было уделено основное внимание. Разработчиками был реализован специальный алгоритм детекции и подавления линий в цвете. А задача снятия голограмм решалась с использованием модели построения картины помех по трем объектам. Суть этого алгоритма состоит в том, что в силу топологии голографического фона российского паспорта, для восстановления полной картины голографических помех на документе достаточно знать положение трех любых голограмм.
По словам руководителя лаборатории Cognitive Forms к.т.н. Владимира Арлазарова: «важно, что при добавлении в Cognitive Passport нового математического и алгоритмического аппарата, нам удалось не только сохранить, но и повысить скорость обработки документов на 27%, увеличив при этом качество. Это было очень непросто».
Другой задачей, решенной в новой версии, стала возможность распознавания машиночитаемой зоны (МЧЗ), появившейся в российских паспортах нового поколения, как и в аналогичных документах во многих странах мира. Основной целью введения зоны МЧЗ является упрощение процедуры считывания и значительное сокращение времени считывания основных данных. МЧЗ также является дополнительной мерой защиты бланка паспорта от подделок. При этом она выполняет функцию корректировки результатов оптического распознавания персональных данных паспорта и минимизации числа возможных ошибок распознавания. МЧЗ состоит из двух строк длиной по 44 символа каждая. В соответствии с требованиями и стандартами, предъявляемыми к машиночитаемым документам, МЧЗ содержит основную информацию, имеющуюся в этом документе: фамилию, имя, отчество, дату рождения (число, месяц, год) владельца паспорта, пол владельца паспорта, серию и номер паспорта, код подразделения, выдавшего паспорт, дату выдачи паспорта, а также обозначения типа документа, государства, выдавшего паспорт, гражданства владельца паспорта.
МЧЗ также содержит контрольные цифры (контрольные суммы значений определенных полей персональных данных), которые позволяют распознавать ее с высоким качеством. Шрифт, а также межстрочное и межсимвольное расстояние МЧЗ жестко регламентированы. Однако, на практике при выдаче паспортов нередко встречаются производственные ошибки нескольких типов, когда пропечатывается лишь один из элементов МЧЗ, либо часть строчки выходит за границы печати.
Новая версия научилась успешно справляться с такого рода недостатками. При этом общее качество распознавания паспортов с МЧЗ выросло примерно на 10%. «При существующем высоком качестве распознавания данных, содержащихся в МЧЗ строке увеличение этого показателя еще на 10%, является очень серьезным результатом», говорит Владимир Арлазаров.
Другим достоинством новой версии стало повышение стабильности ее работы. А расширение интерфейса Cognitive Passport API с сохранением обратной совместимости поможет разработчикам не переделывать собственные приложения под новую версию.
По словам Президента Cognitive Technologies Ольги Усковой, «В области систем распознавания сложных документов, как и в других наукоемких направлениях, очень быстро происходит «старение» версий программных продуктов. Поэтому мы непрерывно инвестируем в его R&D и стараемся предлагать нашим пользователям наилучшее решение».
По традиции, сложившейся в Cognitive Technologies, пользователи предыдущих версий Cognitive Passport могут сделать upgrade бесплатно.
Информация о компании Cognitive Technologies
Компания Cognitive Technologies – технологический лидер на рынке систем корпоративной автоматизации, распознавания, ввода и обработки документов. С 1993 года компания проводит системные научные исследования и разработки, позволяющие ей использовать в своих продуктах и решениях наиболее современные и мощные технологии, многие из которых не имеют аналогов в мире.
Более 15 лет одним из основных направлений деятельности компании является разработка и внедрение систем автоматизации бизнес-процессов, электронного документооборота, а также электронных архивов.
За этот период было реализовано свыше 600 крупных проектов более чем на 1 млн. лицензий каждый.
Кроме того, компания Cognitive Technologies известна как ведущий российский разработчик систем оптического распознавания текстов и промышленного ввода документов, а также как разработчик систем электронных закупок.