Потребность в мощной системе хранения данных (СХД) в розничной сети «Банана-мама» была продиктована вполне ясной бизнес-целью — ликвидировать недопустимые временные задержки при формировании аналитической отчетности. Решением этой проблемы стало внедрение системы CLARiiON CX3-40 компании ЕМC. Об этом рассказывает ИТ-директор сети Кирилл Дубчак.

Intelligent Enterprise: Вы установили у себя специализированную систему физического хранения информации. Каковы были основные мотивы такого решения и связаны ли они со спецификой деятельности вашей компании?

Кирилл Дубчак: Прежде всего я назвал бы общие мотивы, которые для нас важны, но со спецификой бизнеса их все же вряд ли целесообразно связывать. Да и вообще эти мотивы весьма просты, если не сказать тривиальны. В прошлом году бизнес развивался серьезными темпами, и соответственно резко увеличился объем данных, порождаемых нашими прикладными информационными системами. В результате мы уже подходили к тому порогу, за которым качественный скачок в развитии технологий физического хранения был просто необходим. Иными словами, имеющиеся в арсенале нашей компании так называемые «отдельно стоящие» серверы, имеющие, разумеется, каждый свой дисковый массив, уже совершенно не удовлетворяли требованиям бизнеса. Такая своего рода унасле­дованная архитектура системы хранения уже существенно тормозила развитие информационной поддержки, и было ясно, что со временем положение будет только усугубляться. Это подтолкнуло нас к приобретению системы хранения CLARiiON CX3-40 компании ЕМC — одного из лидеров на рынке подобных решений. В рамках данного проекта в части поставки и ввода системы в эксплуатацию мы сотрудничали с компанией IBS Platformix.

Когда я говорю о факторе торможения бизнеса, я имею в виду в том числе аналитическую отчетность. Сотрудники наших коммерческих департаментов (категорийные менеджеры, специалисты по продажам и пр.) очень широко используют отчетность уже сейчас, и в будущем, очевидно, будут применять подобные инструменты еще активнее. Думаю, в тесном сопряжении потребности в физических хранилищах с потребностями в аналитических решениях розничная торговля не уникальна.

Применение СХД позволяет сущест­венно разгрузить транзакционные системы предприятия. На основе корпоративного хранилища данных в компании построены стандартные пользовательские отчеты и OLAP-кубы, в которых данные сгруппированы соответствующим образом, так, чтобы максимально ускорить доступ пользователей к интересующим их показателям. Запросы пользователей не влияют на производительность транзакционных систем, потому что все массивы данных, используемых аналитической системой, базируются на СХД.

Вообще же отраслевые особенности, как я уже сказал, играли при выборе решения второстепенную роль. В частности, система хранения задействована, например, также для целей корпоративной почтовой системы в качестве основного почтового хранилища, что позволило повысить скорость доступа к этим данным и отказоустойчивость почтовой системы в целом. Я хочу сказать, что иногда внедрение мощных аппаратных хранилищ связывают с необходимостью централизации информационных ресурсов (и даже с централизацией управления), поскольку на этом якобы необходимо делать особый акцент, когда торговая сеть активно расширяется в регионы и упускать единый контроль за ресурсами крайне нежелательно. А географическое расширение действительно является сейчас характерной особенностью развития бизнеса многих розничных сетей. Иногда также можно слышать, что важным требованием становятся детальные информационные срезы, что наряду с количественным ростом объема корпоративных данных обуславливает качественное усложнение их структуры. Могу сказать, что ни то, ни другое сильного влияния на выбор системы хранения, равно как и на принципиальное решение по переходу на соответствующую архитектуру, в нашем случае не оказало. Мы традиционно придерживаемся политики централизации информационных ресурсов и централизованного управления бизнесом. Что касается усложнения структур данных, то тут мы тоже вполне успешно могли вводить, скажем, дополнительные размерности, например, характеризующие размерно-цветовую матрицу для целого ряда наших товаров, и работали с ними. Так что и здесь те факторы, которые с полным правом можно отнести к отраслевым, существенного влияния на выбор не оказали.

Если, как вы говорите, системы хранения существенно сопряжены с задачами построения корпоративного хранилища данных и аналитическими решениями, то, наверное, должна существовать некая вертикальная концепция работы с данными, охватывающая всю цепочку от низкоуровневых механизмов хранения до собственно предоставления аналитических отчетов? Кроме того, физические хранилища являются частью инфраструктурных решений, которые в настоящее время становятся все более сложными и технологичными. Это тоже наводит на мысль о единой концепции, но на сей раз о концепции архитектурного построения серверных решений. Что вы могли бы сказать по этому поводу?

Что касается вертикальной цепочки работы с данными, то тут вполне можно говорить об определенной концепции. Активное применение аналитических решений по сути требует этого в обязательном порядке, даже если имеющиеся подходы и не зафиксированы на бумаге. Причем все это касается как применяемых нами продуктов и решений, так и в определенной степени вопросов методологии. Для использования аналитики мы, разумеется, имеем как хранилище данных, созданное собственными силами на основе Oracle, так и OLAP-кубы, в нашем случае базирующиеся на технологиях Microsoft. В хранилище поступают практически все данные о движении материальных потоков вплоть до информации по каждому чеку, пробитому в том или ином магазине. Она более полная, чем та, которая порождается ERP-системой. Хранилище, как известно, это не только место, куда в принципе можно класть значительные объемы данных, но еще и модель, в известном смысле отображающая реальный бизнес на корпоративное информационное пространство. И коль скоро это так, у нас существует специальный аналитический отдел, который строит эти модели и развивает их в соответствии с развитием бизнеса. И хранилище, и кубы, и соответственно модели у нас появились раньше СХД, так что внедрение этой последней действительно можно рассматривать как некое замыкающее звено на пути построения современной высокопроизводительной продуктовой цепочки обработки корпоративных данных — от их физического хранения через средства физического доступа и до логических моделей, стоящих уже куда ближе к складывающейся на текущий момент структуре потребностей бизнеса в информации.

Кроме технологических звеньев в этой цепочке существуют и методические. Продолжая разговор о модели, важно подчеркнуть, что пользователям необходимы условия для выполнения произвольной, творческой работы, то есть они должны иметь широкие возможности по доступу и использованию корпоративных данных, но в то же время должны существовать известные им всем шаблоны отчетов, принятые на текущий момент развития компании. Это, в частности, делает работу по оптимизации и развитию модели данных уже упомянутого нами аналитического отдела куда более эффективной.

Кроме того, в процессе развития направления, связанного с аналитической обработкой вообще и внедрением СХД в частности, крайне полезно иметь хотя бы ориентировочные измеримые показатели, может быть, не полно, но кратко, ясно и адекватно описывающие информационный ресурс в целом и его использование в компании. Я имею в виду, например, долю неструктурированной или слабоструктурированной информации в общем ее объеме — скажем, какая именно часть ресурса требуется пользователям в ежедневном режиме, а какая в еженедельном. Очень полезно знать, например, интенсивность запросов того или иного вида, которые должна обработать информационная система за определенный срок. Иными словами, если работа с данными на логическом уровне в значительной степени налажена и ясна как для ИТ, так и для бизнеса (а это, я считаю, вполне можно отнести к нашей компании), то и те преимущества, которые получает организация от внедрения непосредственно СХД, становятся вполне понятны для бизнеса. Даже если принять во внимание, что нюансы выбора и эксплуатации аппаратных платформ всегда были и по понятным причинам остаются существенно дистанцированы от бизнеса.

Вместе с тем понятно и то, что СХД по сути является не только «нижним» звеном технологической цепочки движения корпоративных данных наверх к аналитической отчетности, но и частью идеологии построения всей функциональной инфраструктуры, которая помимо СХД включает в себя по меньшей мере серверное и сетевое оборудование, возможно, датацентры и т. д. Кроме того, важным критерием является безусловно и то, что использование СХД позволяет снизить совокупную стоимость владения серверным парком компании. По-хорошему здесь тоже можно, да и нужно говорить о единой архитектурной концепции, которую следует принять, а потом, руководствуясь этим, целенаправленно развивать инфраструктурные решения в течение длительного промежутка времени. Однако на практике не всё получается так стройно и красиво, как должно быть, и некоторые расхождения теории с практикой мы наблюдаем в том числе и на примере нашей компании.

Скажу честно, что четких и очень детальных проработок на длительную перспективу у нас в компании сейчас нет, хотя мы понимаем, что наша ИТ-инфраструктура в настоящее время не оптимальна, и в ближайшем будущем планируем провести более глубокий анализ этого вопроса. Однако как бы то ни было, но закупать те современные ее элементы, которые послужат нам в том числе и в будущем, необходимо уже сегодня, и ситуация с СХД, которую мы, собственно, обсуждаем, служит здесь весьма показательным примером. Поэтому пока, наверное, целесообразно соблюдать по меньшей мере два условия. Во-первых, нужно приобретать и внедрять оборудование, которое фактически при любом сценарии будущего развития архитектурных решений в нашей компании гарантированно впишется в это развитие. И СХД компании EMC в этом смысле выглядит как весьма надежные инвестиции. А во-вторых, требуется грамотная структура принятия решений внутри компании, гарантирующая, что мы не только приобретаем продукты, которые поддерживают все необходимые технические спецификации, обеспечивающие архитектурную совместимость (их на рынке в принципе немало), но и гарантируем бизнесу оптимальное вложение с точки зрения стоящих перед ним задач.

Тут хотелось бы остановиться на организационных моментах выбора. Ведь ясно, что система хранения, с одной стороны, может быть связана только с набором тех или иных характеристик и в этом смысле по определению не будет ассоциироваться с какими-либо бизнес-задачами. А с другой стороны, как вы говорите, нужна уверенность в том, что сегодня мы ориентируемся не только на набор спецификаций, но и приобретаем систему, которая окажется оптимальной в отношении информационных потребностей конкретного бизнеса.

Действительно, эту проблему надо решать, тем более в той ситуации, в которой мы находимся сейчас. Дело в том, что в условиях жесткой, детально проработанной и согласованной с бизнесом архитектурой концепции мы скорее всего имели бы более четко заданные направления, показывающие, что следует выбирать. В качестве корпоративного стандарта по тому или иному типу оборудования даже мог бы быть определен конкретный вендор, и тогда было бы еще проще. Но у нас, как я уже сказал, ситуация не совсем такая. В то же время сложность действительно в том, что тематика, связанная с системами хранения данных, взятыми отдельно, никак не может быть приближена к бизнесу. Она по определению дистанцирована от него. На практике, скажем, генеральный директор да и другие топ-менеджеры никогда не будут вникать в соответствующие тонкости, хотя скорость, с которой формируются отчеты, надежность процедуры их получения в любой момент времени конечно же не может не интересовать их. Это обстоятельство необходимо учитывать, и кроме того, при формировании оптимальной структуры внутренних заказчиков и исполнителей мы в максимальной степени должны использовать технологическое единство той вертикальной цепочки работы с данными, о которой мы говорили выше.

Иными словами, одной из ключевых фигур здесь становится тот самый аналитический отдел. Он занят тем, что работает с моделью хранилища, разрабатывает отчетность, и для бизнеса именно он является олицетворением всех тех функциональных возможностей, которых он ждет от информационной системы на сегодняшний день. То есть аналитический отдел является исполнителем работ по формированию аналитической отчетности, где заказчик, естественно, — бизнес. Он же в свою очередь и внутренний заказчик СХД, где исполнителем уже являемся мы.

Внедрение систем хранения данных часто бывает сопряжено с использованием разного рода системных программ — от средств информационной безопасности до систем архивирования и планирования этого процесса. Не могли бы вы в отношении подобных инструментов расставить собственные акценты?

Такие программные средства действительно существуют, и полезно иметь их в виду уже на этапе планирования приобретения системы. Я бы отметил так называемые снапшоты, или продукты быстрого создания резервных копий, позволяющие осуществлять данный процесс без остановки системы и без потери производительности. В настоящее время мы используем СХД для быстрого формирования резервных копий, которые потом записываются на ленточные носители.