Одной из основных стратегических целей акционерного общества «Федеральная грузовая компания» (АО «ФГК») является повышение технологической эффективности работы парка вагонов наряду с развитием клиентских сервисов. Сегодня подобные задачи бизнес вынужден решать в режиме реального времени. О том, как работа в данном направлении ведется на предприятии и какие продукты для этого внедряются, рассказывает начальник Департамента информационных технологий Московского представительства АО «ФГК» Дмитрий Богомазов.

Intelligent Enterprise: Прежде чем говорить о продукте, который ориентирован на предельно оперативную обработку данных и доставку их из разных источников, хотелось бы понять, существуют ли в АО «ФГК» задачи класса real-time и в связи с чем они становятся актуальными. Пока на рынке бытует устойчивое мнение, что подобные проблемы решают в основном розничные компании, работающие с большим количеством клиентов.

Дмитрий Богомазов: Действительно, повсеместно считается, что работа с внушительными объемами данных в реальном времени сейчас характерна для крупных розничных предприятий, продающих товары и услуги большому количеству покупателей. Сегмент B2B с подобными технологиями ассоциируют в меньшей степени. И при обсуждении технологий процессинга данных в режиме real-time мало кто сразу подумает о холдинге «РЖД» и его дочерних структурах. Однако, надо сказать, напрасно.

Начнем с того, что организация перевозок, равно как и всё с ним связанное, представляют собой высокотехнологичный процесс. Железнодорожный комплекс — это сложный часовой механизм, работа которого зависит от слаженных и умелых действий множества участников с огромным числом объектов. Поэтому отрасль на протяжении нескольких десятилетий отличалась высокой степенью автоматизации технологических процессов. Новые ИТ-инструменты, появившиеся в последние годы, открыли и новые возможности, которые стремительно меняют облик стальных магистралей.

Что касается непосредственно взаимодействия с клиентами и партнерами, то напомню: система электронного документооборота российского перевозчика — одна из крупнейших в мире.

Каковы типичные для вашего внутреннего бизнеса задачи, требующие безотлагательной реакции?

Само существование таких крупных сетевых операторов, как АО «ФГК», было бы невозможно в иную, неинформационную эпоху. В термин «сетевой» мы вкладываем особый смысл. Оказывая услугу по перевозке высокодифференцированной номенклатуры грузов на всем пространстве 1520 (пространство железных дорог стран Содружества Независимых Государств, Балтии, Монголии и Финляндии, определяемое единой шириной колеи, равной 1520 мм. — Прим. ред.), мы сталкиваемся с необходимостью формирования логистики в реальном времени.

Эффективное решение данной задачи требует не только оперативной обработки информации о событиях, происходящих с каждым из 156 тысяч оперируемых нами грузовых вагонов, и принятия решений об их дальнейшей «судьбе», но и незамедлительного взаимодействия с клиентами. Вот почему мы постоянно развиваем интерактивные сервисы и функциональность корпоративного Web-портала. В 2016 году наши клиенты получили новые возможности для обратной связи с компанией — через персональные кабинеты в системе перевозчика и через электронную торговую площадку ОАО «РЖД». В 2017-м мы предложим клиентам и партнерам качественно новый кабинет, который предоставит максимальный набор интерактивных сервисов.

Надо сказать, что вместе с появлением новых бизнес-задач соответствующим образом трансформируется и ИТ-ландшафт предприятия, а также предложения поставщиков в области оперативной обработки данных. Таким образом у нас появляются и новые продукты, рассчитанные в том числе на обработку данных в реальном времени. Таковы, к примеру, SAP HANA и Informatica PowerExchange Change Data Capture (CDC).

Способность обеспечивать информационную поддержку бизнес-задач реального времени прежде всего зависит от ключевых прикладных систем, которые используются в компании, и от их интеграции. Что вы могли бы сказать по этому поводу?

Сущность нашей производственной деятельности — это логистика вагонопотоков. Поэтому у нас есть специальное решение, вычислительное ядро которого реализует различные математические модели, позволяющие сформировать оптимальный набор перевозок, как порожних, так и с грузами. То есть система способна указать, откуда и куда целесообразнее возить грузы и как лучше организовать потоки порожних вагонов.

Целый комплекс задач решают системы автоматической диспетчеризации.

Не менее важное значение для нас имеет система тарифообразования, которая позволяет автоматически рассчитать стоимость услуги, оценить степень ее доходности, обеспечить необходимый документооборот по согласованию тарифных условий. Тарификация фактических перевозок также осуществляется в автоматическом режиме.

С вагоноремонтными компаниями нас связывает электронный документооборот с применением электронной подписи. Специальное интеграционное решение обеспечивает наполнение электронными документами производственных систем, ответственных за учет состояния парка и управление ремонтами.

Активный обмен информацией между нашими системами и с внешней средой требует постоянной передачи больших объемов данных, и передача эта осуществляется через корпоративное информационное хранилище, основу которого составляют решения Oracle; частично для этой цели мы используем и SAP HANA.

Производственные системы мы либо создаем сами, либо пользуемся разработками подрядчиков.

Вы выбрали продукт Informatica PowerExchange CDC, в котором используются своего рода особые алгоритмы интеграции, заметно отличающиеся в лучшую сторону от тех, что встроены в другие ETL-средства. Их, равно как и связанные с ними коммерческие продукты, на российском рынке пока применяют нечасто. Какие преимущества вы в результате получили и какие особенности внедрения могли бы отметить?

Считаю, что мы получили целый ряд преимуществ. Прежде всего речь, безусловно, идет об оперативности преобразований данных. Собственно, о необходимости этого и о том, что наши нынешние потребности зачастую связаны с обработкой данных в режиме real-time, я уже говорил. Выражаясь в технических терминах, с помощью Informatica PowerExchange CDC мы теперь работаем с логами баз данных, а если применять язык бизнеса, то у нас появляется возможность следить за бизнес-событиями, выделяя лишь изменения в информационном поле, причём делать это фактически мгновенно. Это очень эффективная схема работы, абсолютно свободная от выполнения каких-либо «лишних» вычислений. При этом информация максимально оперативно попадает в наше хранилище, минуя промежуточные этапы. Результат таков, что работы по преобразованию данных у нас немного, и темп выполнения необходимых нам операций тем более оказывается впечатляющим.

Кроме оперативности мы получаем возможность обойтись без модификации работающих у нас систем, среди которых, как я уже говорил, есть заказные. Если бы мы использовали любые другие ETL-средства, нужно было бы выстраивать длинные очереди на сохранение документов, пришлось бы заказывать подрядчикам, которые создавали системы, дополнительные разработки. Всего этого нам удалость избежать.

То, о чём я сказал, можно назвать некими «чистыми» преимуществами выбранного нами решения, хорошо понятными ИТ-специалистам и, очевидно, ряду профильных сотрудников функциональных подразделений. Бизнес же в целом получил возможность с гарантированной надежностью решать свои задачи в нужном ему темпе. А отсутствие необходимости дорабатывать ключевые ИТ-системы конвертировалось в экономию финансовых, временных и кадровых ресурсов. Что касается внедрения, то нашим партнером выступила компания DIS Group, которая представляет корпорацию Informatica в России и СНГ.

Партнер оказал нам очень ценную методическую поддержку и предложил гибкий подход в работе и в ценовой политике. И это было тем более важно, если учесть, что в АО «ФГК» фактически состоялось первое промышленное внедрение этого продукта в России в связке с SAP HANA. В эксплуатацию мы его запустили довольно быстро, что типично для подобных решений. Хотя потом был период тюнинга под уже сложившуюся ИТ-инфраструктуру компании. После этого все работы по реинжинирингу ранее настроенных и вновь создаваемых потоков данных выполнялись силами наших специалистов.

Сейчас функции Informatica PowerExchange CDC полностью устраивают нас и по оперативности, и по трудозатратам на эксплуатацию системы, и по масштабируемости в смысле добавления новых источников данных.

На текущий момент с помощью технологий Informatica корпоративное информационное хранилище передает и получает данные из основных производственных систем, отвечающих за планирование и оптимизацию вагонопотоков, диспетчеризацию парка, ремонт вагонов, тарифную политику и тарификацию услуг, взаимодействие с клиентами, интерактивные сервисы, внутренний и внешний документооборот, в том числе с применением электронной подписи. Интеграция информационных систем с использованием корпоративного хранилища и продукта Informatica позволила реализовать и принципы сервисно-ориентированной архитектуры, преимущества которой известны.

Хочу ещё сказать, что по нашей приблизительной оценке семьдесят процентов ресурсов продукта Informatica приходится на репликацию изменений в хранилище в реальном времени и около тридцати процентов — на расчет показателей и наполнение витрин.

С внедрением ключевых для компании ИТ-систем нередко трансформируется сама культура работы с информацией и в частности меняется структура взаимоотношений между бизнесом и ИТ-службой. Можно ли говорить, что после установки Informatica PowerExchange CDC произошло что-то подобное?

Наш стратегический подход состоит в том, чтобы вырастить в компании слой аналитиков, которые сами, без помощи ИТ-подразделения, могли бы анализировать данные.

Часто достижение этой цели связывают с созданием удобного пользовательского интерфейса, с наличием хороших справочников и единого хранилища. Это, конечно, очень значимо, но инструменты информационной интеграции и здесь чрезвычайно важны. При необходимости мы легко меняем те или иные параметры выгрузки или трансформации данных в Informatica PowerExchange CDC, рассчитываем требуемые метрики и полагаем, что работа специалистов ИТ-подразделения в принципе должна сводиться к подобным задачам, а не к самому анализу данных.

Необходимо отметить, что у нас развернута еще и BI-система на базе SAP BusinessObjects, которую мы не в последнюю очередь развиваем для достижения той же цели — предоставить пользователям независимость в вопросах обработки информации. Именно поэтому мы стремимся к тому, чтобы развитие заключалось не в постоянном пополнении функционала новыми шаблонами отчетов, а в создании витрин данных.

Каковы ваши планы по развитию функционала Informatica PowerExchange Change Data Capture?

В ближайшее время мы планируем перейти на версию 10.1 и в пределах существующей схемы лицензирования начать использовать свойства High Availability, то есть высокую доступность решения. Совсем недавно через нашего партнера DIS Group мы приобрели лицензию Informatica PowerCenter Advanced Edition и в обозримой перспективе собираемся с помощью этого инструментария строить полноценные процессы Data Governance, такие как управление метаданными, построение диаграмм зависимости метаданных по всем процессам (data lineage), а также создать бизнес-глоссарий для единого взгляда на данные со стороны бизнеса и ИТ-поддержки. Помимо этого нам весьма интересно использовать вычислительную архитектуру grid для решений компании Informatica, когда процессы могут выполняться на серверном кластере с автоматической балансировкой нагрузки и отказоустойчивостью.

Есть планы по дальнейшему развитию и масштабированию системы до 2018 года, по обучению персонала и совершенствованию процессов управления корпоративными данными (Data Governance).

По итогам двухгодичного использования решений могу сказать, что инвестиции в технологии Informatica полностью себя оправдали и позволили не только выполнить текущие задачи, но и заложить надежную и гибкую основу интеграционного слоя для будущих бизнес-инициатив.

С Дмитрием Богомазовым беседовал ведущий обозреватель Intelligent Enterprise Сергей Костяков