Бумажный документооборот — это надолго

Банковская автоматизация в России — пожалуй, одна из самых благополучных областей информационных технологий. Где-где, а в банках быстро поняли, каким может быть экономический эффект от использования производительного Интернет-канала, банковской информационной системы, электронной бухгалтерии, грамотно организованной системы расчетов и защищенной корпоративной электронной почты.

Но на нижних звеньях автоматизация, как правило, заканчивается. Подсистема обработки и ввода первичных документов (например, платежных поручений) — это по-прежнему много пар женских рук, резво «бегающих» по клавиатурам офисных ПК. Связано это с особенностями российской инфраструктуры расчетов. Безбумажный оборот или электронные системы «клиент-банк» еще долго будут оставаться утопией для массы госструктур, малых и средних производственных предприятий, многих других российских фирм и организаций. Один из косвенных симптомов, подтверждающих такое состояние дел, — рекордные продажи принтеров, объявленные в этом году многими ведущими вендорами. В результате роль шлюза между двумя мирами отводится операционисткам — тому персоналу, который принимает первый удар на стыке «почти-безбумажных» банковских технологий с «почти-всегда-только-бумажными» внутриофисными технологиями клиентов. Именно на них обрушиваются горы бумаги — хорошо и плохо отпечатанных первичных документов, предназначенных для ручного преобразования в электронный вид.

А ведь надежное оптическое распознавание документов — задача, практически решенная уже два-три года назад. Конечно, процент ошибок распознавания сильно зависит от качества исходного документа. Но специально разработанные программы автоматизированного ввода документов вполне успешно обходят многие естественные ограничения, превращаясь в мощный инструмент банковской автоматизации «снизу».

Данная статья раскрывает лишь узкий аспект применения систем автоматизированного ввода документов на примере ABBYY FineReader 4.1b. Публикации материала предшествовало посещение московского банка «Еврофинанс» и изучение многочисленных отзывов, полученных от специалистов банков, решившихся на инсталляцию системы. Во всех случаях речь идет о потоковом распознавании платежных поручений — наиболее хорошо изученном способе применения подобных систем в банках.

Автоматизированный ввод «платежек». Проблемы и эффективность

Так как же обстоят дела на практике? Первичные банковские документы — например, оригиналы платежных поручений, доставляемые клиентами в офис обслуживающего их банка, обычно грешат непостоянством оформления. Конечно, они создаются «приблизительно» по форме, определенной Центробанком PФ. Разграфка таблиц, указание реквизитов плательщика, банка плательщика, наличие графы о назначении платежа — все это жестко формализовано. А с 15 февраля 2000 года будут введены единые требования ЦБ по формату и размеру платежных поручений. Остаются «мелочи»: кто-то из плательщиков печатает «платежки» на лазерном принтере, определенным требованиями шрифтом, а другие предпочитают 9-игольные матричные принтеры и рулонную перфорированную бумагу. Даже качество бумаги, на которой отпечатаны «платежки», варьируется от «финской» 80-граммовой до желтой и «лохматой». И банкам не остается ничего, кроме как смириться с «особенностями» плательщиков. Не отказываться же от денег клиентов ради эфемерных «каллиграфических» принципов?

Значит, единственный выход — положиться на зрение и внимание операционисток и «набивать» документ вручную? Действительно, это надежно. Но дорого и, конечно же, неэффективно при большом потоке входящих документов.

И вот тут на выручку приходят недорогие ПК-станции сканирования, оборудованные дорогими сканерами с автоматизированной лотковой подачей бумажных оригиналов. И, самое главное, оснащенные специальным ПО оптического распознавания платежных поручений. Из программ такого назначения в узких кругах известны две: FineReader Bank производства компании ABBYY и Cognitive Forms от фирмы Cognitive Technologies. Обе программы — российские, но их «интеллект» — OCR-алгоритмы — не только хорошо известен в России, но и активно используется за рубежом.

Система распознавания ABBYY FineReader 4.1 Bank
Краткая справка
Программно-аппаратный комплекс оптического распознавания форм ABBYY FineReader 4.1 Bank предназначен для автоматизированного ввода печатных платежных поручений с помощью сканера в информационные системы и базы банков. В самой простой конфигурации (FineReader Bank и планшетный сканер) система стоит 840 долл. (720 долл. + 120 долл.) и вводит порядка 90, а при пиковой нагрузке до 120 платежных поручений в час. Система FineReader Bank интегрируется с большинством основных банковских информационных систем (производства R-Style Software Lab., «Диасофт», «Кворум», «Програмбанк», «ТехноСка», многими информационными системами Сбербанка РФ и др.), а специальные средства интеграции позволяют внедрить продукт в любую информационную систему силами специалистов банка.

ABBYY Software House
Российская компания-разработчик программного обеспечения. Программные продукты ABBYY: линия систем оптического распознавания (OCR) FineReader, система ICR FineReader РУКОПИСЬ, система FineReader Bank, ABBYY Retrieval & Morphology Engine (инструментарий разработчика для интеграции полнотекстового поиска и лингвистических технологий во внешние приложения), система электронных англо-русских и русско-английских словарей LINGVO и др.

Cognitive Forms
конкурирующая система ввода платежных поручений
Система автоматизированного ввода платежных поручений Cognitive Forms производства Cognitive Technologies (http://www.cognitive.ru) обеспечивает:
  • потоковый ввод и распознавание всех атрибутов платежных поручений;
  • автоматическую и операторскую проверку и корректировку правильности ввода реквизитов платежных поручений;
  • экспорт результатов распознавания в систему «Р-Макет», формат баз данных или непосредственно в используемую Сбербанком автоматизированную банковскую систему.
По информации компании-разработчика, внедрение системы Cognitive Forms позволяет ускорить ввод платежных поручений в 5–10 раз. Модуль Cognitive FormEditor позволяет пользователю не только самостоятельно контролировать точность ввода стандартных форм документов, но и интегрировать систему с существующими системами электронного документооборота, банковскими системами, электронными архивами. Оператор одновременно видит на экране распознанный текст и исходное изображение документа, полученное со сканера. Поля платежек, содержащие сомнительно распознанные символы или автоматически исправленные подсистемой контекстного контроля, подсвечиваются с признаком сомнительности.

Попробуем оценить эффективность потокового машинного ввода документов по сравнению с ручным. Самый очевидный способ — по росту производительности труда. Мои собственные замеры (подтвержденные сотрудниками банка) показали, что прирост производительности системы «оператор+машина» по сравнению с чисто ручным вводом составляет почти 30%. А если сравнивать только время, требуемое для ручной обработки платежных поручений (без учета машинного времени), — то все 100%.

В подтверждение приведем абсолютные цифры. Ручной ввод оператором одного стандартного платежного поручения в среднем занимает 4 мин. При потоковом вводе со сканером, оборудованным лотком с автоматической подачей, вы загружаете стопку из 20–30 платежек и ждете окончания процесса распознавания. На сканирование уходит 18 секунд, на распознавание — меньше минуты (обычно 45 с и не более 1 мин 15 с). Еще до двух минут уйдет на редактирование оператором плохо распознанного документа или 1 мин 45 с — на сверку хорошо распознанного оригинала. Суммарно весь процесс машинного распознавания и редактирования занимает в среднем 3 мин на одно платежное поручение. Не такой уж большой и прогресс?! Но обратите внимание, что в автоматизированном процессе операторы ведут лишь редактирование документов, а станция сканирования работает сама собой в другом конце зала, не устает и есть не просит. В результате, повышается производительность труда оператора, снижается число ошибок при наборе, повышается точность. К тому же номера счетов, БИК-коды плательщиков и получателей, наименования плательщиков, их ИНН и другие данные автоматически сверяются с банковскими базами данных. И еще система позволяет производить сверку суммы цифрами и прописью, а также проверку платежных реквизитов на их существование и взаимное согласование («ключевание»). Это важно для платежного документа, иначе деньги могут «случайно» поступить не туда и не в том количестве.

Как поясняет руководство банка «Еврофинанс», прямая выгода от использования системы автоматизированного ввода платежных поручений состоит в том, что иначе вместо станции сканирования пришлось бы нанимать дополнительных операторов. В зависимости от возможного числа дополнительно нанятых сотрудников, станция сканирования (оборудование и ПО) может окупиться меньше чем за 3–4 месяца.

Акционерный Коммерческий банк «Еврофинанс»
АКБ «Еврофинанс» (Открытое акционерное общество) создан в результате преобразования АО «Североевропейская финансовая компания» («Еврофинанс») и является дочерней структурой Коммерческого банка для Северной Европы — «Евробанка» (Париж) — крупнейшего росзагранбанка, 78% акций которого принадлежит ЦБ РФ. «Евробанк» (с учетом косвенного участия) владеет 81% акций банка. Среди акционеров «Еврофинанса» выступают также Внешторгбанк, Внешэкономбанк, ФГУП «ВПК «МАПО».

АКБ «Еврофинанс» представляет собой универсальную кредитную организацию, обладающую Генеральной лицензией ЦБ РФ №2402 на осуществление банковских операций, а также лицензией на совершение операций с драгоценными металлами, рядом иных лицензий и разрешений Центробанка и ГТК Российской Федерации. По заключению ЦБ РФ на 01.10.99 года АКБ «Еврофинанс» отнесен к высшей категории надежности — 1-й категории финансово-стабильных банков (1-й группе банков без признаков финансовых затруднений). По размеру собственного капитала, составляющего на 01.01.2000 года 2 млрд. 585 млн. рублей, АКБ «Еврофинанс» входит в число 10 крупнейших российских банков.

Но технологии технологиями, а всецело полагаться на «компетентность» системы никто не рискует. И правильно. Специфика русского языка и пренебрежение чистописанием могут сыграть злую шутку: плохо распознается буква «ы» и «слипшиеся» символы. Путаются машины в трактовке символов «О» (буква O) и «0» (ноль). Точность распознавания хоть и высока, но переведенные в электронный вид «платежки» обязательно проверяются операторами вручную.

Несмотря на то что скорость распознавания сильно зависит от производительности компьютера, для потокового ввода платежных поручений можно рекомендовать использовать недорогой ПК с Windows 9x на базе процессора Intel Celeron 300-333 МГц с 32 Мбайт ОЗУ. В структуре стоимости системы основную нагрузку оказывает сканер с системой автоматической подачи документов. Для рабочего сканера важно не столько разрешение (достаточно 300–600 точек на дюйм), сколько скорость сканирования оригиналов. Скажем, рекомендованный ABBYY высокопроизводительный сканер Bell+Howell 2000F стоит около 2500 долл. Это, конечно, недорого по сравнению с профессиональными барабанными сканерами за 20–50 тыс. долл., но все же... Менее производительные решения от Hewlett-Packard, Epson и Fujitsu могут обойтись на 1000 долл. дешевле. Вообще, ABBYY разработала типовые конфигурации станции сканирования, рекомендованные для разной ежедневной нагрузки (см. http://www.abbyy.ru, http://www.finereader.ru).

Отдел банка «Еврофинанс» оборудован станциями сканирования именно упомянутой здесь конфигурации: пара ПК с процессорами класса Intel Celeron 300 МГц и два дорогих сканера Bell+Howell 2000F с автоподачей оригиналов. Обе станции сконфигурированы для независимой работы. То есть производят полный цикл обработки документа: от сканирования до распознавания. Это достаточно простой и проверенный вариант. Однако есть мнение, что эффективность потокового ввода могла бы быть выше, если бы ресурсы были распределены иначе: одна машина ведет только сканирование, а другая — только распознавание. Другие специалисты не соглашаются с оправданностью такого «разделения труда». Аргументация следующая: процесс сканирования на хорошей технике слабо нагружает компьютер, основная загрузка станции производит сам процесс распознавания. Примерное соотношение между ними — 10% на 90%, поэтому вести полный цикл обработки документа на одной станции вполне разумно.

Некоторые итоги

К настоящему моменту система оптического распознавания и потокового ввода документов (форм) ABBYY FineReader Bank 4.1 уже успешно преодолела период «обкатки». По информации представителей ABBYY, система трудится на распознавании платежных поручений уже более чем в 80 банках. Она стала уже вполне «коробочным» продуктом, то есть типовым решением. Установка и наладка (интеграция с банковской информационной системой) занимают, как правило, один-два дня. Программа поставляется со специальными средствами FineReader Development Tools, позволяющими производить тонкую настройку под требования заказчика: например, скорректировать эвристическое распознавание отдельных символов. Поэтому для ее обслуживания может потребоваться собственный программист. Кроме того, FineReader Toolkit позволяет разрабатывать собственный интерфейс рабочего места операционистки. Например, добавить кнопку «Сканирование», которая позволяет выполнить операцию сканирования, распознавания и добавления платежного поручения в базу данных.

Результаты эксплуатации FineReader Bank
Из заключения специалистов ОСБ № 1974 Новгородского банка СБ РФ:
  • возросла скорость обработки платежного поручения операционистом;
  • исключены ошибки операциониста по вводу чисел расчетного счета, БИК;
  • платежное поручение проверяется автоматически при распознавании по правилам, которые можно редактировать и вводить новые (кол-во знаков расчетного счета, БИК, соответствие суммы прописью — сумме цифрами, проверка банковских реквизитов по подключаемому справочнику ЦБ и прочее), что позволяет при необходимости оперативно решать спорные вопросы по оформлению платежных поручений;
  • выходные данные FineReader Bank легко конвертируются в банковское ПО (сопряжение с банковским ПО заняло 1 день);
  • средства разработки FineReader Development Tools позволяют встраивать распознающий модуль в банковское ПО, что на наш взгляд имеет существенное значение.

Из эксплуатационного заключения Воронежского банка СБ РФ
В настоящее время в ОПЕРУ Воронежского банка установлена программа FineReader Bank 4.0, скоростной сканер с автоподачей Fujitsu ScanPartner 600С. Режим работы организован на двух рабочих местах: одна станция сканирует, вторая станция распознает (более скоростная).
В день обрабатывается от 400 до 1000 документов, напечатанных на разных принтерах и хорошего и среднего качества. Около 50% этих документов не требуют вмешательства оператора, но обязательно просматриваются для замены некоторых символов, запретных для АС «Эскорд», остальные требуют корректировки разного объема.
Количество обрабатываемых документов ограничено только качеством печати.
Средний общий объем документов клиентов в день — 2000–2500.
Своими силами доработана программа загрузки данных в операционный день — добавлена возможность распределения документов по каждому ответственному исполнителю, обрабатывающему соответствующий счет.

Сервис со стороны поставщика, по словам Сергея Медведева, ИТ-эксперта банка «Еврофинанс», оказался достаточно оперативным и квалифицированным. По крайней мере, этот отзыв можно смело интерполировать на техническую поддержку в Москве. Основными центрами затрат «Еврофинанс» назвал стоимость самой системы FineReader Bank (692 долл. на рабочее место) и сканера Bell+Howell 2000F стоимостью 2500 долл. Кроме того, силами АВВYY и ИТ-специалистов банка «Еврофинанс» систему FineReader Bank 4.1 не только настроили на загрузку обработанных данных в программу обработки платежных поручений «Еврофинанса», но и добавили возможность распределения отсканированных пачек документов по исполнителям.

Среди общих нареканий специалистов к системе можно отметить слишком высокий процент ошибок распознавания оригиналов, набранных на печатной машинке или распечатанных на матричном принтере ( в первом случае «брак» достигает 50%) и «оптимизированность» системы на распознавание именно платежных поручений (Разработчики пояснили, что в настоящий момент FineReader Bank умеет распознавать не только платежные поручения, но и мемориальные ордера. А проблемы с распознаванием пишущих машинок в 90% случаев объясняются качеством заполнения таких документов — текст «налезает» на элементы оформления, что и приводит к столь низкому проценту распознавания). Другие формы (например, платежные требования, инкассовые формы) распознаются с выдачей ошибки и требуют ручной корректировки полей.

В целом, банковские специалисты, с которыми пришлось общаться, положительно отзывались об опыте эксплуатации системы. Чему удивляться? Систему, берущую на себя столько рутинной работы, может не любить только убежденный луддит.

С автором статьи можно связаться по адресу электронной почты crnep@crn.ru