«Архив — это деньги». Причем не в смысле трат, а в смысле прибыли, возможности заработать либо на предоставлении информации, либо на ее более разумном использовании. Однако не все упирается исключительно в наличие ресурсов хранения. Нужна законодательная база, соответствующая подготовка сотрудников, очень часто - весьма специализированные сканерные устройства. Стоит воспользоваться практическим опытом, накопленным в результате уже состоявшихся проектов.

Интерес к созданию электронных архивов заметно растет. Так говорят системные интеграторы, затрудняясь, правда, этот рост оценить: оценки роста спроса различаются в несколько раз. Об этом же говорят и ИТ-руководители предприятий, причем предприятий очень разного уровня. Создавать архив, переводить всю накопленную документацию в электронный вид собираются и на заводах, где работают тысячи человек, а ИТ-служба - значительное подразделение, и в небольших проектных институтах, где трудятся сотни людей, а о создании архива думает пока только один человек. Этот ИТ-специалист пока не очень ясно представляет себе будущую организацию дела в архиве, не больше ясности у него и с техникой, которая будет нужна. "Но деньги дали, - твердо говорит он. - Как только поймем, что именно и как делать, сразу наймем операторов, а помещение уже выделили".

Специалисты компаний-интеграторов, занимающиеся внедрением систем документооборота и созданием электронных архивов, утверждают, что спрос на архивные решения пока только появляется. Число же собственно "архивных" проектов невелико. В основном это уникальные разработки очень крупных холдингов или федеральных структур. Однако многие отмечают растущую заинтересованность средних компаний и организаций в создании архивов. Высказывается мнение, что еще два-три года и этот интерес обернется реальными внедрениями. Пока еще многих останавливает цена: не менее 40-50 тыс. долл. на оборудование. ПО и его внедрение стоят в два раза больше, плюс работа по вводу материалов. Но это относительно. Еще далеко не всем руководителям высшего звена ясно, что "архив - это деньги". Причем не в смысле трат, а в смысле прибыли, возможности заработать либо на предоставлении информации, либо на ее более разумном использовании. Недопонимание возможностей, которые даст разумно организованный архив, называют как одну из главных тормозящих дело проблем.

Другая проблема связана с тем, что государственных стандартов архивного хранения электронных документов пока нет. Некоторые поставщики решений утверждают: нет никаких сомнений, что в России в ближайшее время будут введены жесткие стандарты, регламентирующие архивное хранение данных и документов в электронном виде. В Европе и США есть целый ряд подобных стандартов. В частности, они определяют те типы данных, которые должны десятилетиями храниться в неизменяемом виде. Это формирует спрос на соответствующие системы хранения, например роботизированные накопители, которые работают с дисками, физически исключающими изменение данных. Однако когда подобные регламенты будут приняты в нашей стране пока неясно. Даже теоретические вопросы еще не решены, например, что считать копией электронного документа, а что оригиналом. Так что архивы организаций, которые создаются сейчас, возникают под действием требований не закона, а бизнеса.

Еще одну проблему сформулировал Сергей Евстратов, ИТ-директор "Мотовилихинских заводов": "Электронный архив - это один из элементов общей системы проектирования, подготовки производства, непосредственно производства, послепродажного сервиса и так далее. Поэтому основная проблема - выстроить эту систему в комплексе. Решая ее комплексно, переходишь к вопросам реинжиниринга, реорганизации, реструктуризации. Выстраивание "по уму" одного элемента системы - электронного архива - конечно, даст определенный эффект, но хотелось бы большего". На фоне такой глобальной задачи вопросы финансирования, выбор техники, организация ввода данных оказываются мелкими техническими проблемами.

Особенности архивных проектов

На выставке-конференции Docflow, проходившей в Москве в конце мая, электронным архивам было посвящено несколько специальных докладов. Обсуждались условия успеха и причины неудач такого рода проектов, давались советы по оптимальному их ведению. Общий вывод был достаточно предсказуем: создание архива - такой же проект, как и другие, оно требует обычных навыков управления проектами, деятельной поддержки руководства, разумного планирования, адекватной команды. Отмечалось, что вопросы, связанные с документооборотом вообще и созданием архивов в частности, часто пытаются решать "глобально", что не всегда оправданно. Сразу вспоминаются выводы, сделанные многими через четыре-пять лет после начала первых внедрений ERP: многих проблем, ошибок и потерь удалось бы избежать, если бы не стремление решить сложные задачи непременно целиком. Движение от простого к сложному через последовательность относительно кратковременных этапов с ясным результатом было бы значительно безопаснее и выгоднее.

В частности, Арам Пахчанян, вице-президент компании Abbyy, рассказал о таком подходе. Многие российские компании проводят структурные изменения если не постоянно, то достаточно часто. В таких условиях внедрять системы документооборота - все равно что "пытаться накинуть узду на скачущую лошадь", считает Арам. Но даже если структура организации не формализована, можно, по его мнению, построить вполне эффективный электронный архив, который позволит упорядочить хранение документов, их версий и создать дополнительные возможности: удаленный доступ к документам, экономию дискового пространства за счет миграции устаревших документов на более дешевые носители и т. д. Пахчанян дает такой совет: если в организации имеется бумажный архив документов, то пытаться найти по всей сети их электронные копии для создания электронного варианта архива - дело безнадежное. Более того, это неверно в принципе, ведь электронные копии могли быть модифицированы кем угодно, и проверить это практически невозможно.

В этом случае электронный архив существующих документов нужно создавать из бумажного путем сканирования. Если же никакого архива нет, необходимо довольно долго проводить подготовительную работу. Сначала добиться, чтобы документы в каталогах хранились в едином порядке. Следует запретить (в том числе, если это возможно, техническими средствами) хранение документов на локальных дисках компьютеров. Нужно, чтобы у всех пользователей организации были в сети свои каталоги, где они хранят документы. "Это существенно облегчит дальнейшую миграцию документов в систему документооборота", - считает вице-президент Abbyy.

Но даже если фаза "предархивной" подготовки миновала и заказчик приступает непосредственно к проекту, не следует упускать из виду, что само понятие "электронный архив" не очень четкое, в нем еще много "шаманства". Ведь любая развитая система документооборота включает в себя некое "хранилище и искалище" (терминология сотрудников ЛАНИТ). Архив ли это? Видимо, да, поскольку информация хранится длительное время. Но специфических бизнес-процессов архивных служб с учетом выданных дел, их описаний и прочего такое ПО не поддерживает. Продуктов со специальным функционалом значительно меньше, чем систем документооборота. Если речь идет о инженерно-конструкторской документации, то тоже нужны специализированные решения. Кроме того, некоторые проекты имеют "частный" характер: речь может идти о переводе в электронный вид не всей документации фирмы, а только небольшой ее части, картотеки инструментов завода, например (см. врезку). Однако именно такие относительно скромные архивы, во-первых, демонстрируют руководству работоспособность идеи, сразу давая ощутимый результат, а во-вторых, постепенно приучают пользователей работать с электронными документами.

Одна из особенностей архивных проектов состоит в том, что функциональными менеджерами, с которыми ИТ-службе нужно тесно взаимодействовать, в них оказываются архивисты. В большинстве случаев об ИТ они знают не очень много, говорят на "своем языке", еще более непонятном, чем "внутренние языки" других подразделений, но пытаться обойтись без них неразумно. Правда, Олег Коробов, руководитель проектов ЛАНИТ, отмечает, что ТЗ большинства тендеров на создание архивов, с которыми он знакомился, явно написаны только специалистами ИТ-департамента без привлечения сотрудников архивов вообще. В самом ЛАНИТЕ есть сотрудник с профильным архивным образованием, который выступает "переводчиком" в трудных случаях, ну а остальным так или иначе придется искать общий язык со своими архивными службами.

Компания IBM в этом смысле также предупреждает: в больших организациях всегда будет много сотрудников, которые не смогут работать с архивом из-за неумения, нехватки знаний, в том числе предметных, из-за условий конфиденциальности, или просто потому, что они новички. Поэтому встает вопрос о создании специальной службы архивистов именно для работы с электронным архивом.

Создание электронной картотеки учета инструментов

Этот проект был выполнен на московском машиностроительном производственном предприятии «Салют». Картотека учета применяемости технологического оборудования, включающая оснастку и инструменты, велась на заводе с середины 50-х годов. Ее объем превысил 300 тысяч карточек, ежегодный прирост — 8 тысяч. В рамках постепенного перехода предприятия на электронный учет решено было перевести картотеку в цифровой вид. Специалисты предприятия разработали на базе СУБД Oracle структуру базы данных и программу для работы с этой базой. Встал вопрос о вводе данных. Бумажные карточки — крайне неоднородные документы, многие из них ветхие, многие из них заполнены и карандашом, и чернилами на пожелтевших от времени бланках. Кроме того, они постоянно нужны сотрудникам завода. Большие сложности были и с индексацией, которую осложняли неразборчивость почерка, многовариантность расположения полей, нестандартные сведения, внесенные в произвольной форме, запутанные обозначения. Требовалась тщательная верификация данных по полю «Шифр инструмента», которое служит уникальным идентификатором: не более одного ошибочного символа на миллион введенных.
Все эти вопросы были решены. Потоковый ввод компания-аутсорсер организовала на территории завода, поэтому доступ персонала к картотеке не прерывался. Проект занял шесть месяцев, вся картотека уместилась на 15 компакт-дисках.

Введите данные

Стоимость ретроконверсии (перевода в электронный вид) и хранения документов прямо связаны с объемом архива: чем он больше, тем дешевле может обойтись ввод одного документа. Это открывает неплохие перспективы для аутсорсинга. Все больше российских компаний, имеющих опыт в создании архивов и продажи техники для них, понимают, что если поставить дело "на поток", можно построить на этом серьезный бизнес.

В Европе и США Xerox оказывает услуги по созданию архивов не первый год. Теперь компания предлагает их и в России. Более того, несколько таких проектов уже идут, правда, заказчики запрещают называть свои компании. По понятным причинам Xerox берется за масштабные проекты: менеджеры фирмы говорят о вводе 1 млн. листов А4 как о том минимуме, начиная с которого проект становится экономически интересным клиенту. При объеме 100 тыс. листов цена ввода оказывается приблизительно такой же, как и для ввода 600 тыс. А в реальных проектах речь идет о вводе около 10 млн. листов А4 в год для каждого из таких клиентов, причем проекты достаточно долговременны - на год, на три. Xerox готов работать и в регионах, и на территории клиента, и, вообще говоря, с любым объемом информации. Другое дело - будет ли это интересно заказчикам.

Более гибкий подход использует корпорация "Электронный архив". Услуги по организации архивов она предоставляет уже довольно давно. Только в 2004 году было выполнено 84 проекта, из них 26 - в коммерческих компаниях (среди них издательство "Пресса", "Волжская ГЭС им. В.И. Ленина", "Воткинская ГЭС", "Кавказтрансгаз"). За все годы работы центр сканирования корпорации перевел в электронные образы более 50 млн. документов самых разных типов практически со всех возможных носителей. Минимальная сумма договора 100 000 руб., что соответствует 20 тыс. листов (очень приблизительная оценка, поскольку цена формируется с учетом многих факторов). Таким образом, речь может идти о значительно более широком круге проектов.

Этот вид аутсорсинга, так же как и многие другие, вызывает у клиентов все обычные вопросы и недоумения: а самим-то, наверное, дешевле, а как же секретность, а как контролировать процесс… Интересно следить, как постепенно один участок рутинной работы за другим (обслуживание копировально-множительной техники, систем связи, поддержка пользователей, инфраструктура) в отзывах ИТ-руководителей постепенно перекочевывают из категории "не можем отдать в чужие руки" в категорию "наконец-то избавились от головной боли". Скорость этой миграции зависит преимущественно от способности подрядчиков предложить привлекательное соотношение "цена/качество", от числа этих подрядчиков (поскольку клиент должен быть уверен, что в любой момент сможет передать работу в другие руки, не окажется "на игле" единственного поставщика) и от умения заказчиков управлять своими проектами. Можно предположить, что и аутсорсинг ретроконверсии и создания архивов тоже пройдет этот путь, причем, возможно, быстрее и проще, чем другие виды аутсорсинга. Ведь такие работы легче поддается учету и контролю и мало связаны с остальной деятельностью ИТ-подразделения.

А пока позиции клиентов оказываются очень разными. Как рассказывают сотрудники корпорации "Электронный архив", одни клиенты говорят: "У нас есть оборудование, есть персонал, мы все можем сделать сами. Но... у нас есть деньги, поэтому мы заказываем вам". Другие все же берутся за дело самостоятельно. Известны вполне удачные примеры таких работ, например на "МЗ Арсенал". Кое-кого постигла неудача: один из заказчиков "Электронного архива", имея в наличии оборудование и персонал, смог за год отсканировать 12 000 микрофиш (около 100 000 листов). В центре сканирования "Электронный архив" за год по этому проекту ввели 2 млн. 600 тыс. листов. Конечно, разница есть, но здесь явно сказывается одно обстоятельство: тот, кто никуда не торопится, может спокойно растянуть работу по вводу на годы. Тот, кто собирается с помощью архива так или иначе зарабатывать деньги, годы ждать не будет.

Многие эксперты отмечают, что, планируя проекты с ретроконверсией, нужно учесть: само сканирование - это относительно быстрая процедура. Значительно больше сил и времени отнимают подготовка документов к вводу и приведение их вновь в исходный вид. А задача распознавания, индексации, векторизации требует особенно четкого подхода. Идея "сначала все оцифруем, а потом будет разбираться" ведет к неоправданным затратам как времени, так и объема систем хранения. При вводе технической документации имеет смысл распознавать только те части документов, которые могут впоследствии быть использованы в автоматизированных процессах.

Вопросы большой политики

Термин "политика" часто используется при обсуждении вопросов организации иерархического управления хранением. Идея в том, что можно перемещать редко используемые данные с дорогих и быстрых носителей (как RAID-массивы) на более медленные и дешевые, сохраняя прозрачность доступа ко всей информации. Развитые программные и аппаратные средства, обеспечивающие такие перемещения, есть у многих вендоров. Проблема в том, чтобы сами политики выработать.

Если трактовать этот термин более широко, как определение порядка обработки архивных материалов в целом, то видно, что именно этот "политический" вопрос создает особые сложности, и четкая практика еще не сложилось.

Что включать в электронный архив, а что нет? В каком порядке вводить информацию? Что стоит распознавать, а что не нужно? Поставщики услуг подчеркивают, что наиболее эффективен залповый ввод, при котором весь массив документов оказывается в архиве за минимально возможное время. Далеко не всегда заказчики идут по этому пути, и возникают вопросы приоритетности. Для государственных и муниципальных архивов его можно решать, опираясь на естественную иерархию: более важны документы, произведенные более высокими инстанциями, с них и начинают. Другой путь - статистика обращений к действующему бумажному архиву, если она есть. Третий - ввод дел по мере их востребованности. При этом те 20% материалов, которые чаще всего запрашиваются 80% пользователей (принцип Палето верен и здесь), окажутся в архиве в первую очередь. Но общих правил нет, и лишь опыт, а также, возможно, экспертиза поставщиков решений могут помочь определить оптимальные политики.

Они необходимы не только при ретроконверсии. В тех организациях, где уже используются системы делопроизводства, начинается переход от электронных карточек документов к использованию изображений бумажных оригиналов. Использование систем корпоративного управления способствует стремительному увеличению объема электронных документов, не имеющих бумажных аналогов. При этом оказывается, что они так же мало структурированы, как и их бумажные предшественники. Создание классификаторов вручную довольно быстро теряет практический смысл и ввиду быстрого роста объема документов, и ввиду неминуемого субьективизма разработчиков таких классификаторов. Все более насущной становится задача динамической классификации, постепенно появляются и средства ее решения, но поскольку вопросы эти уже обращаются к проблемам искусственного интеллекта, от полного разрешения они пока далеки.

Есть и задачи другого порядка. Консолидация всех данных в одном хранилище - не единственный путь. Федеративный доступ, при котором информация физически остается в своих "родных" источниках, а в центральном хранилище находятся только ссылки на нее, во многих случаях оказывается эффективней. Идеи доступа к данным через порталы, использование Web-сервисов, портлетов, определение ролей различных групп пользователей и создание для них "виртуальных витрин" находят все больше сторонников. В частности, они позволяют автоматизировать многие рутинные операции поиска информации, а заодно и регламентировать доступ к ней. Такой опыт в России только начинает накапливаться, и еще множество решений предстоит опробовать ИТ-руководителям, прежде чем удастся не только обуздать лавину информации, но и научиться извлекать из нее все ценное.

Сканер сканеру рознь

Производители оборудования, необходимого для создания архивов, не стоят на месте. Однако если сканеры небольшой производительности постоянно дешевеют, то цены на модели более высоких классов, рассчитанные на поточный ввод, почти не снижаются. Планшетные сканеры обычно предполагают сканирование одной страницы в минуту. Документарные, иначе называемые поточными, работают значительно быстрее (табл.).

Таблица. Классификация документных сканеров.

Производительность Скорость, стр. в мин. Производительность, стр. в день
малая 10-25 1000-1500
средняя 25-50 2500-5000
высокая 50-90 7000-2500
для массового ввода документов 90-160 свыше 60 000

По сообщениям вендоров оборудования, дневная производительность - параметр существенный, поскольку попытки перегрузить сканер работой будет приводить к его быстрому выходу из строя. По сообщениям тех, кто уже подобные сканеры закупил, на производительности очень серьезно сказывается квалификация персонала. Кроме производительности и скорости сканирования, на цену влияют максимальный формат оригинала, наличие дуплекса (возможности двустороннего сканирования), цветное или черно-белое изображение, наличие планшета (есть протяжные и планшетные модели, в том числе и со съемными планшетами), емкость автоподатчика. В результате цена варьируется от 700 до 120 000 долл.

Устройства малой производительности применяются в небольших офисах, средней - активно используются банками, причем с одним сканером работает несколько операционисток. При создании архивов рассматриваются преимущественно высокопроизводительные модели. Специальные задачи требуют и особых устройств: бесконтактное сканирование необходимо при работе с ветхими или особо ценными документами, книжные сканеры автоматически удаляют с изображения перегиб страницы, устраняют искажения, маскируют тени и отпечатки пальцев. Некоторые модели, рассчитанные на массовый ввод, работают с документами в любом состоянии, от трамвайного билета до каротажных лент, автоматически подстраиваясь под тип поверхности и толщину бумаги, и допускают одновременное получение черно-белого, цветного, полутонового изображений за одно сканирование. Расходный элемент у них один - ремни подающего механизма, и из расчета на 2 млн. листов он дает наценку полкопейки на лист.