Любые документы можно вводить автоматически
Ввод данных из любых бумажных документов в информационные системы, базы данных и электронные архивы может быть автоматизирован с помощью системы Cognitive Forms.
Подход, реализованный в Cognitive Forms, позволяет ускорить ввод документов в 5-10 раз по сравнению с ручным вводом, при минимальном участии человека в этом процессе. Точность данных составляет 100% — благодаря технологиям обработки изображений, распознавания текста (OCR, ICR), меток (OMR), штрихкодов и интеллектуального распознавания документов (IDR).
Процесс по шагам
Процесс автоматизированного ввода и обработки документов делиться на несколько этапов (сканирование, обработка изображений, распознавание, верификация и экспорт).
Сканирование
Для автоматизированного ввода в системе Cognitive Forms используются электронные копии (изображения, образ) бумажных документов. В самом распространенном случае изображение документа получается при его сканировании.
Сканирование ведется с помощью обычного сканера или специального сканера с системой автоматической подачи бумаги. При использовании специального сканера, его еще называют промышленным или документным, для начала процесса ввода от человека требуется только разместить в него стопку документов.
На этапе сканирования система Cognitive Forms обеспечивает некоторые специфические возможности: постраничное сканирование документов (однопользовательское и многопользовательское), пакетное сканирование, контроль целостности пакетов документов и ошибок сканирования.
После завершения процесса сканирования, изображения документов передаются на обработку.
Обработка изображения
После сканирования изображение документа требует некоторой обработки и подготовки для распознавания. Удаляются фоновые цвета и гербовый фон, изображение очищается от погрешностей сканирования.
Этот этап полностью автоматический. После его завершения образ документа передается на распознавание.
Распознавание
Распознавание — один из основных этапов обработки бумажных документов в процессе ввода.
На этом шаге происходит идентификация документа и выделение его объектов (полей, пометок, штрихкодов и прочего), удаляются помехи, которые мешают распознаванию (например, разграфка). Далее происходит распознавание полей документа. Затем проводится оценка достоверности результатов распознавания, после чего производится обобщенный лингвистический анализ поля.
После распознавания может следовать специальная обработка его результатов на основании априорной лингвистической и структурной информации о поле. После этого принимается решение о достоверности результатов распознавания. В системе реализована схема, признающая поле недостоверным в случае наличия в нем хотя бы одного недостоверного символа. После этого происходит сохранение результатов распознавания во внутренний формат системы и выполняется контроль логической непротиворечивости данных.
Кроме всего этот этап выполняет дополнительные функции: автоматическое определение угла поворота страницы и его автоматическая коррекция.
Процесс распознавания полностью автоматический, не требует наличия оператора, при этом возможно распараллеливание распознавания в рамках локальной сети.
При необходимости, после распознавания документ передается на верификацию. Если же необходимости в верификации нет, распознанные данные могут экспортироваться во внешние информационные системы и базы данных.
Верификация
Верификация документа: исправление ошибок заполнения и распознавания, подтверждение результатов распознавания «сомнительных» полей, просмотр полей, не прошедших логический контроль, и принятие решения о дальнейшей судьбе таких документов.
На этом этапе оператор производит визуальный контроль результатов распознавания и принимает решение о дальнейшем маршруте документа. Процесс реализован в двухоконном редакторе форм. В одном окне показано изображение бумажного документа, в другом — электронная форма, содержащая распознанные данные.
Процесс верификации документа идет по следующей схеме. Оператору предъявляется изображение и электронная форма с распознанными данными. При этом поля, не прошедшие контроль достоверности и логической непротиворечивости, подсвечены цветом для привлечения внимания оператора. Оператор, перемещая фокус между полями электронной формы, видит диагностику ошибок и либо исправляет ошибку, либо, если ошибку нельзя исправить, принимает решение передать документ на этап обработки «плохих» документов. При передвижении по полям модуль автоматически подсвечивает рамку поля на изображении.
Для повышения эффективности работы оператора предусмотрены два режима: проход только по полям, не прошедшим контроль, и режим пропуска незаполненных полей. Кроме этого, если прикреплен словарь, содержащий допустимые значения для поля, то имеется возможность указать в описании поля необходимость предъявления словаря оператору и разрешить оператору вставлять в поле значения из словаря.
После окончания верификации документа оператору предлагается либо отложить его, либо передать на этап экспорта данных.
Возможно распараллеливание процесса верификации в рамках локальной сети. В крупных проектах массового ввода могут быть одновременно задействованы десятки операторов, выполняющих функцию верификации потока документов.
После верификации, данные могут экспортироваться во внешние информационные системы и базы данных.
Экспорт
Экспорт данных: преобразование данных из внутреннего формата системы в формат внешней информационной системы, контроль целостности данных в соответствии с описанием, а также передача данных во внешние системы.
Экспорт данных заключается в преобразовании данных из внутреннего формата системы в формат внешней информационной системы. После чего производится проверка их корректности в соответствии с бизнес-логикой процесса. Если данные прошли проверку, то осуществляется их передача в информационную систему. Передача изображений осуществляется аналогично.
Если же данные не проходят проверку, соответствующие поля помечаются как «некорректные», и пакет возвращается на верификацию.
Процесс автоматизированный, выполняется совместно с верификацей и может не требовать взаимодействия с оператором.
Среди возможных вариантов экспорта данных — выгрузка в форматах DBF, XML (два варианта), текстовый формат и пр. При необходимости возможно создание специализированной библиотеки, взаимодействующей с ИС заказчика в соответствии с бизнес-логикой процесса. Альтернативным вариантом является передача заказчику API доступа к внутреннему формату системы.
Задайте вопрос
Ваш менеджер-консультант:
Денис Володькин
402375357

