На мероприятиях, так или иначе посвященных теме автоматизации органов государственной власти, все чаще и чаше начинает всплывать тема «открытых данных», о которых в свое время писало и наше издание (см. например, http://www.iemag.ru/analitics/detail.php?ID=30269). И характерно, что сам эпитет открытые многих заставляет занимать в отношении к этому течению крайне осторожные, если не сказать враждебные позиции.

С одной стороны «открытые данные» является русскоязычным эквивалентом термина Open Data. И в данном случае, в отличие, кстати, от многих ситуаций в ИТ-индустрии, где адекватную трансляцию термина с языка на язык осуществить не всегда просто, перевод, казалось бы, абсолютно однозначен и единственно возможен.

Однако на практике слово открытые очень часто ассоциируется со своего рода «информационной анархией». Может быть, это происходит потому, что тема информационной безопасности в самых разных и порой даже неожиданных постановках сейчас является чрезвычайно животрепещущей как в бизнесе, так и в госуправлении. И соответственно открытость данных часто воспринимается как еще один потенциальный риск, якобы способный возникнуть по причине массовой выкладки данных для свободного распространения.

На самом же деле представляется, что не смотря на абсолютною точность перевода в понятие open традиционно вкладывался несколько иной смысл, и когда смотришь на давно устоявшиеся требования, которым должны удовлетворять открытые данные, то начинаешь это понимать.

Как известно, одно их основных требований, предъявляемых к открытым данным это их машиночитаемость. В связи с этим вспоминается одна проблема (в целом в недавнем прошлом весьма типичная), о которой докладывали профессиональны юристы на одной из специализированных конференций для CIO лет семь–восемь назад.

Суть ее состояла в том, что некоторое предприятие необходимо было заставить выложить в открытый доступ информацию, которую та пыталась предлагать на коммерческой основе, но за которую налогоплательщик на самом деле давно отдал свои деньги. Привести юридические доводы в пользу положительного решения вопроса оказалось в общем несложно, однако реально предоставить гражданам возможность пользоваться информацией оказалось задачей совсем иного уровня. Данные были выложены в открытый доступ в электронном, но не в машиночитаемом виде. Говоря проще, это были «сканы» бумажных документов набранных мелким шрифтом и при этом очень плохого полиграфического качества. Разобрать их ни вручную, но с помощью средств автоматического распознавания текста, вполне развитых уже на тот момент времени, не было никакой возможности. При этом качественные электронные документы организация продолжала предлагать на коммерческой основе.

Данный пример, надо сказать, очень показателен, и прежде всего потому, что помогает увидеть очень важный акцент, который на самом деле делается не столько на открытости данных, сколько на технологичности процессов работы с ними. Иными словами основная задача концепции Open Data не принудить кого-либо выложить тот или иной ресурс для всеобщего доступа. Если вопрос ставиться именно так, то для его решения существуют совсем другие методы. Но если уж установлено, что данные должны находиться в открытом доступе, необходимо создать условия для максимально эффективного их использования, что собственно и связано с требованиями технологичности их обработки.

Машиночитаемость при этом остается по сути базовым, абсолютным требованием к открытым данным, неразрывно связанным с этой концепцией. За ним следуют, быть может, на сегодня куда менее жесткие, но при этом все также направленные на повышение технологичности. Одно их них – доступ к открытым данным через API.

Связано это с тем, что оффлайновая выгрузка, преобразование и фильтрация информации при сегодняшних ее объемах, а также высоких требованиях к оперативности решения задач, перестают кого-либо устраивать. Необходимые данные должны фактически «хвататься на лету» для чего может подходить только API-ориентированная технология.

По мере ее распространения начинает обратная связь. Сами организации, владеющие тем или иным ИТ-ресурсам, начинаю понимать, что открытость некоторых из их источников способно в самом ближайшем будущем принести дивиденты и им самим. И уже после этого практическое принятие идей Open Data становится действительно необратимым.

Вопросы безопасности, конфиденциальности и обеспечения законодательных требования, которые, конечно же, возникают в связи с публичностью информационных источников. Некоторые из них (такие как, например, деперсонификация данных) сегодня пытаются решать с помощью тех же автоматизированных систем, хотя за большинством потенциальных рисков пока все-таки приходится следить вручную. Но в любом случае это уже другие, совершенно самостоятельные проблемы.