Российская пенсионная система - источник наших постоянных тревог и надежд. Мы уже писали о некоторых аспектах автоматизации Пенсионного фонда РФ (см. Enterprise Partner №11'2000, с. 18). Отрадно отметить, что число этих аспектов довольно велико.

Пенсионный фонд (ПФ) РФ уже в течение нескольких лет использует мощную вычислительную инфраструктуру, позволяющую эффективно вести необходимые базы данных. В региональных отделениях Фонда функционируют 89 мощных серверов, связанных спутниковыми и наземными каналами с центральным сервером, на котором ведется реестр застрахованных лиц.

В 1995 году в рамках ПФ была создана система персонального учета - подразделение, собирающее, систематизирующее и анализирующее данные обо всех работающих гражданах. Это подразделение - одно из передовых в вопросе информатизации: только в Московской области в системе персонального учета используется 47 мощных серверов. Степень компьютеризации сотрудников весьма высока - на 6,5 тыс. человек, работающих в системе ПФ в Московской области, приходится более 3,5 тыс. персональных компьютеров.

Как уже говорилось, задача системы персонального учета ПФ - сбор сведений о трудовой деятельности граждан. Эти сведения - заполненные формы с индивидуальными данными о застрахованных лицах - могут приходить как в электронной форме (на дискете), так и на бумаге (в этом случае к каждой пачке документов прикладывается опись).

Профиль клиента

Организация:
Отделение Пенсионного фонда РФ по Московской области

Местонахождение:
Москва

Руководитель:
Анатолий Миклашевич, заместитель управляющего отделением

Проблема:
Ввод большого числа шаблонных документов для системы персонального учета

Профиль партнера

Компания:
ABBYY Software House

Местонахождение:
Москва

Решение:
Внедрен программно-аппаратный комплекс, включающий специализированную версию пакета FineReader "Рукопись" и средство для управления шаблонами форм в районных и региональных подразделениях Пенсионного фонда

В последнее время распространение компьютерной техники в московском регионе привело к тому, что 85% сведений от работодателей приходят в систему персонального учета на дискетах. Сейчас идет подготовка к введению электронной подписи, которая сделает еще проще и безопаснее обмен электронными документами. Однако оставшаяся "бумажная" часть материалов до сих пор весьма велика, а несколько лет назад она была еще больше. Ручной ввод в базу данных (БД) этих материалов был трудоемок и малоэффективен. Руководители системы персонального учета еще в 1995 году стали рассматривать возможности автоматизации перевода бумажных форм в электронный вид, однако сразу решить проблему не удалось из-за недостатка средств. Средства нашлись в конце 1996 года, и в ПФ были начаты проекты по автоматизации ввода бумажных документов.

В рамках одного из проектов отделение ПФ по Московской области заключило договор с компанией Bit Software (позже переименованной в ABBYY Software), поставляющей одну из ведущих российских систем оптического распознавания символов (OCR) - FineReader.

Одновременно отделение ПФ по г. Москве начало аналогичный проект с компанией Cognitive Technologies (http://www.cognitive.ru), разработчиком конкурирующей с FineReader программы CuneiForm. Положение Москвы позволяло построить централизованную систему автоматического ввода документов с использованием дорогого высокоскоростного сканера Kodak (стоимостью порядка 100 тыс. долл.).

В отличие от Московского отделения ПФ, областное не могло применить полностью централизованную схему обработки документов - районные управления довольно сильно удалены друг от друга, а установка нескольких дорогих сканеров была не по карману отделению. Вот что рассказывает заместитель управляющего отделения ПФ по Московской области Анатолий Миклашевич: "В областном отделении была выбрана распределенная схема. Мы решили использовать в наших управлениях модели сканеров нижнего ценового уровня, которые тем не менее обладают нужной производительностью. Речь идет, в частности, о скоростных сканерах Bell-Howell, Fujitsu-3093 и Fujitsu-600. Их цена составляла тогда от 2000 до 4500 долл. Устройства обеспечивают скорость ввода на уровне 10-20 листов/мин, на их лотках умещается по 50 документов. Соответственно, мы выдвинули требование: создаваемое программное обеспечение должно работать с этими моделями. Надо сказать, что на начальной стадии проекта, когда технология только отрабатывалась, сканера у нас не было. Его нам поставила фирма Bit - вместе с компьютером, на котором был установлен предварительный вариант программного обеспечения. С помощью этого экспериментального комплекса мы оценили трудоемкость и производительность процесса ввода форм. Было произведено пробное сканирование и распознавание примерно 10 тыс. документов".

Несмотря на то, что программная надстройка к пакету FineReader на момент испытания существовала лишь в виде прототипа, уже тогда стало ясно, что технология дает заметный выигрыш в скорости и снижении трудоемкости. Было составлено техническое задание, согласованное с компанией Bit и сотрудниками двух отделов ПФ - проектирования систем связи и коммуникаций и разработки и внедрения системы персонифицированного учета. Эти же отделы участвовали и в приемке готовой системы на базе пакета FineReader 3.0. Особенность этой системы - наличие средств для работы с шаблонами форм и верификации данных.

Созданная компанией Bit для ПФ система предполагает три технологических этапа обработки документов. Первый осуществляется на станциях сканирования (это могут быть компьютеры на базе процессора Pentium -166 МГц) при участии оператора. Оператор сканирования закладывает в лоток сканера пачки документов и при несоответствии числа листов заявленному в описи проверяет причину сбоя. Сканирование - самая быстрая стадия технологического процесса: за смену обрабатывается около 2000 форм (на указанных моделях сканеров).

Второй этап осуществляется автоматически на станциях распознавания, между которыми (также автоматически) распределяются файлы со сканированными изображениями.

Третий этап - верификация. Программа помечает "сомнительные" места в электронном документе, и оператор вручную устраняет несоответствия.

Программный комплекс является самообучающимся - по каждому полю стандартной формы можно вести пополняющиеся словари. Технология со временем совершенствовалась. В частности, сейчас оператору при верификации предлагается проверять не целые документы, а наборы однотипных символов из разных мест в документах (скажем, сперва все варианты распознанных цифр "1", затем "2" и т .д.). При этом ошибки выявляются гораздо быстрее и надежнее. Впрочем, при правильной настройке шаблонов процент ошибок не превышает сотых долей процента. Со временем версия FineReader 3 была заменена на более новую, сейчас планируется дальнейшая модернизация комплекса.

Поначалу обучение пользователей (операторов сканирования) велось на двух доступных сканерах в офисе отделения ПФ по Московской области. Сегодня комплексы сканирования установлены в пяти районных управлениях по Московской области (Люберцы, Королев, Жуковский, Электросталь, Подольск). По мере того как районные управления компьютеризуются, доля документов, поступающих в них на дискетах, повышается, и необходимость в сканировании там исчезает. Соответственно, комплексы сканирования передаются менее "передовым" управлениям. По оценке Анатолия Миклашевича, сегодняшняя потребность в этих комплексах по Московской области составляет примерно семь экземпляров. Однако Московской областью применение данной технологией не ограничивается. Автоматическое распознавание форм используется также в отделениях ПФ по Петербургу, Волгограду, Тамбову и Красноярску, есть планы распространения этого опыта и в других регионах.

"Разрабатывая ТЗ, мы сразу оговорили требование: продукт должен быть коробочным. Установка такого комплекса не должна быть трудоемкой и требовать высокой квалификации", - говорит Анатолий Миклашевич. В результате предложенная компанией Bit (ABBYY) технология оказалась более простой и универсальной, чем аналогичное решение, выработанное совместно с компанией Cognitive Technologies. В настоящее время в рамках ПФ идет переход на единую форму документов. Программа CuneiForm также получила распространение в подразделениях ПФ (в отделениях по Москве и Санкт-Петербургу).

"Нам понравилось работать с компанией ABBYY, - рассказывает г-н Миклашевич. - Наш договор предусматривал поддержку со стороны разработчиков в течение года, но компания продолжала нам помогать и впоследствии, когда договорные отношения формально уже закончились. Даже модификацию программного комплекса специалисты ABBYY выполняли бесплатно; правда, со временем потребность в подобном вмешательстве возникала все реже. Нам как бюджетной организации такое отношение очень важно".

Пенсионный фонд РФ

Создан в конце 1990 года для управления финансами системы пенсионного обеспечения. В 1995 году в рамках ПФ организована система персонального учета - подразделение, собирающее, систематизирующее и анализирующее данные обо всех работающих гражданах.

ABBYY Software House

http://www.abbyy.ru

Компания ABBYY (до 1997 года называвшаяся BIT Software) основана в 1989 году. Один из ведущих российских производителей лингвистических программ и систем оптического распознавания текста (OCR). Наиболее известные продукты компании - семейство OCR-систем FineReader и электронные словари Lingvo.

ABBYY имеет офисы в США (Фремонт, штат Калифорния), Европе (Мюнхен, Германия) и на Украине (Киев), а также деловых партнеров в более чем полусотне стран: Франции, Италии, Великобритании, Австралии, Индии и др. Число сотрудников - 151 человек (из них в московском офисе работает 104).