Исторически складывается так, что большинство организаций приобретают системы хранения данных в процессе реализации вертикальных проектов. Со времени истерий конца 90-х, связанных с Web и «проблемой 2000 года», и до недавних инициатив в области цепочек поставок и CRM подсистемы хранения данных считались просто одним из элементов общей архитектуры.

Этот подход был хорош и адекватен в прошлом, но новые стратегические бизнес-приложения, такие, как современные корпоративные системы и BI-решения (Business Intelligence), становятся все требовательнее к хранилищам информации, причем потребности компаний в этих устройствах могут ежегодно удваиваться. «Вертикальный» подход влечет за собой быстрое разрастание систем хранения данных, и без разумного управления этим ростом не удастся обеспечить эффективное и рентабельное их масштабирование.

В средней компании затраты на приобретение и сопровождение систем хранения вскоре станут основной статьей расходов на ИТ. Согласно данным группы Enterprise Storage Group, в настоящее время на системы хранения уходит до 70% типичного бюджета долгосрочных расходов на ИТ. Любая деятельность, занимающая такую большую долю общих расходов, требует стратегического подхода — компания должна по-другому расставить акценты и подойти к управлению системами хранения как к отдельной инициативе, а также ставить цели, в которых бизнес-задачи согласуются с инфраструктурными решениями и финансовыми затратами. Уделив проблеме хранения данных внимание, достойное ее огромной доли в ИТ-бюджете, компании смогут добиться значительного повышения эффективности и производительности бизнес-операций.

Как и в любом серьезном мероприятии, основная задача здесь заключается в разработке стратегии. Существует общепринятое мнение, что единственный эффективный способ обеспечить масштабирование уровня хранения данных в будущем — создать централизованную систему хранения информации. Тем не менее централизация систем хранения не налагает никаких ограничений на выбор технологии — будь то сети хранения данных (Storage Area Network, SAN), подключаемые к сети устройства хранения данных (Network Attached Storage, NAS) или системы хранения с прямым подключением (Direct Attached Storage, DAS), — а лишь указывает на необходимость общекорпоративного подхода.

Создав стратегию, компания сможет разработать каркас технологий, который обеспечит поддержку пользователей, финансовых и ИТ-подразделений. Основные составляющие такой стратегии в отношении хранения данных таковы:

  • инвентаризация систем хранения;
  • классификация и распределение данных;
  • моделирование затрат;
  • обеспечение достаточного уровня компетентности персонала;
  • выбор и внедрение подходящих технологий;
  • мониторинг и отчетность.

Инвентаризация систем хранения

К рационализации хранения данных следует подходить так же, как к интеграции разнородных приложений, связанных с CRM- или SCM-инициативами. Прежде всего нужно разобраться, какие системы хранения уже есть в компании и какие функции они выполняют: чьи данные хранятся на том или ином устройстве, почему они там находятся и как именно поддерживают бизнес-операции. Эта оценка важна не только для изменения видимой пользователям части стратегии, но и для «технической» части, где, собственно, и будет выполняться перенос данных. Инвентаризация должна охватывать не только оборудование и ПО, но также навыки сотрудников и внутренние процессы и политики. Инвентаризация имеющихся активов расчищает путь для следующего этапа — классификации данных.

Классификация и распределение данных по категориям

Самая простая классификация данных предусматривает их деление на три категории: данные, необходимые для работы внешних служб (service-affecting data); внутренние данные (internal-affecting data); постоянно хранимые данные (retained data). Данные первого вида жизненно важны для бизнеса, и их доступность и целостность самым непосредственным образом определяют способность компании предоставлять услуги клиентам. Недоступность внутренних данных чревата нарушением внутренних бизнес-операций, но никак не затрагивает клиентов. Хранимые данные должны оставаться в организации, но обычно к ним редко обращаются. К таким данным относятся, например, медицинские карты пациентов, которые, согласно нормативным документам в здравоохранении, предписывается хранить на протяжении определенного срока. Важно иметь в виду, что приведенная классификация схематична и в каждой конкретной ситуации или отрасли может потребоваться большая или меньшая детализация категорий.

Распределение данных — это доля данных той или иной категории в общем объеме хранимой информации. Распределение не следует путать с утилизацией, относящейся к управлению устройствами хранения и виртуализации, которые могут обеспечить улучшение использования средств хранения, скажем, с 30 до 60% за счет усовершенствованной локализации вычислительных ресурсов и устройств. В противоположность этому, оценка распределения данных позволяет сказать, что две организации, в одной из которых 90% активно используемой информации приходится на service-affecting data, а оставшиеся 10% — на retained data, в то время как во второй это соотношение составляет 20/80, должны иметь различные структуры расходов на системы хранения данных.

Моделирование затрат

Моделирование стоимости помогает определить ряд стандартных инфраструктурных решений хранения данных. Обычно для каждой категории данных разрабатывается отдельный стандарт инфраструктуры. Из-за того, что новые продукты появляются на рынке очень быстро, трудно обеспечить единообразие стандартов в рамках всего предприятия. Поэтому при моделировании затрат рациональнее определять параметры архитектуры.

Как же этот подход применить, к примеру, для определения методов резервного копирования постоянно хранимых данных и данных, необходимых для работы внешних служб? Постоянно хранимые данные можно копировать на ленту и дополнительно хранить ее дубликат за пределами офиса. Данные же, постоянно необходимые для работы, лучше хранить на локальном диске, копию данных — на удаленном диске, а сам удаленный диск копировать на две ленты: одна должна храниться в компании, а вторая — за ее пределами.

Трудно смоделировать затраты, не получив от поставщиков исчерпывающей информации о стоимости каждого выбранного решения, однако понимание необходимых параметров для каждой категории данных позволит четко сформулировать модель затрат и связанные с ней преимущества на каждом уровне. В организациях, выставляющих клиентам счета задним числом, эта информация неоценима, особенно ввиду постоянного снижения цен на диски. Способность четко сформулировать модель затрат для той или иной категории систем хранения позволяет быстро и четко аргументировать оправданность высоких затрат на устройства хранения при том, что на рынке они относительно дешевы. Среди параметров, которые необходимо учесть, — модели доступности, создания резервных копий, управления и подключения.

Усиление организационного базиса

Теперь, обладая новым пониманием того, какие данные нужны и как их разместить, логично было бы перейти к реализации технологии. А вот и нет! Обслуживание систем хранения обходится намного дороже их приобретения. Вот почему так важно позаботиться о готовности организации к поддержке новой стратегической ИТ-системы.

Для поддержки непрекращающегося роста объема данных компаниям придется перейти от распределенного к централизованному управлению хранением данных. При таком переходе многие из ранее адекватных и эффективных процессов и политик перестанут соответствовать новым задачам.

Вот два простых примера: управление изменениями и коммуникации. В мире распределенного хранения данных, где администраторы управляют лишь небольшими подмножествами устройств, при каждой модификации (например, установке программной «заплаты») уведомляются лишь пользователи того или иного устройства, а самый большой риск заключается в недоступности этого устройства на протяжении какого-то времени, затрагивающей только его пользователей. С другой стороны, в новом мире централизованного хранения данных нет отдельных администраторов для управления небольшими частями общей системы хранения. А теперь представьте себе администраторов, управляющих различными данными на общих для всех устройствах. Любое изменение обязательно затронет всех пользователей, которые связаны с макросистемой. У централизованной системы много администраторов, поэтому жизненно необходимо создать и задокументировать порядок управления изменениями, планы тестирования и отката системы. Сбой единой системы отрицательно сказывается на работе всех пользователей.

Часто думают, что переход к централизованной системе хранения сводится к технологической задаче, — это одно из самых распространенных заблуждений. Никоим образом не умаляя важности решения технологических задач, мы хотим отметить, что правильная реализация технологии — только один пункт в ряду критически важных факторов успеха проекта перехода к централизованному хранению данных. Вспомните, сколько пришлось обучать и повышать уровень компетентности пользователей всех уровней при внедрении CRM- и ERP-решений, и воспользуйтесь приобретенными ранее умениями при создании и поддержке централизованной системы хранения данных. Повторюсь еще раз: речь идет не о выборе того ли иного поставщика, а о разработке политик, определении процессов, отчетности о метриках, каналах связи и управлении пользователями.

Реализация

Итак, мы наконец добрались до реализации технологического решения. Выбор и внедрение технологий — один из последних этапов описываемого процесса, и это не случайно. Остерегайтесь поставщиков, которые с порога предлагают провести «бесплатную» оценку, — вы когда-нибудь видели, чтобы после такой оценки поставщик порекомендовал продукт другого разработчика? Чтобы получить независимое, непредвзятое мнение при выборе между покупкой нового или ремонтом старого автомобиля, обычно обращаются к механику, а не к дилеру, торгующему автомобилями.

В любой стратегии хранения данных следует в первую очередь определить, как повторно использовать существующие ресурсы. Это вполне реально при условии выполнения описанной ранее классификации данных и основанной на параметрах модели архитектуры. Существуют две причины, по которым ресурс используют повторно: соответствие определенному стандарту основанной на параметрах инфраструктуры и положительное влияние на модель затрат (фактически экономия средств). Новые технологии выбираются для каждой категории данных в соответствии со строгими стандартами основанной на параметрах архитектуры. В результате удается разработать и предоставить потенциальным поставщикам гораздо более строгий и совершенный запрос, что разительно отличается от традиционного подхода, в котором системы хранения данных выступают как «довесок» к основному проекту.

Мониторинг и отчетность

И, наконец, следует решить задачу мониторинга и отчетности. Необходимо обеспечить создание обязательных диаграмм доступности, производительности и времени, благоприятного для резервного копирования. А как насчет того, чтобы измерять, насколько затраты и качество соответствуют плану? Например, сколько стоит создание резервной копии 1 Тбайт данных? Каково значение этого показателя для данных, необходимых для работы внешних служб, и постоянно хранимых данных? И как оно изменяется со временем по мере износа ленты, нарушений целостности резервной копии и появления других качественных изменений, отрицательно влияющих на эффективность?

Если измерения выполняются только по схеме «да–нет», например, «создана или нет резервная копия», то лучшее, на что можно надеяться, — неэффективная, но функциональная работа системы. Гораздо более интересно узнать, каковы затраты на создание одной резервной копии и как удешевить резервирование без ущерба для качества. Следующий уровень метрик систем хранения данных позволит вам быть впереди не только топ-менеджмента, но и всей отрасли, которая до недавнего времени ориентировалась прежде всего на увеличение емкости дисков от мегабайтов до гигабайтов, от них к терабайтам и так далее.

Известно, что в процессе обновления возникают постоянные расходы, которые заканчиваются только по его завершении (эту проблему называют проблемой преодоления разрывов). Цель заключается в обеспечении максимальной эффективности перехода, от начала изменений и до их завершения. При разработке стратегии хранения данных создают и план преодоления разрывов. Емкости установленных систем хранения растут с огромной скоростью, и сама эта скорость также быстро растет, поэтому организации должны быстро решать проблему разрывов — в противном случае они останутся с огромным массивом систем хранения данных и вышедшими из-под контроля бюджетами, что еще больше увеличит разрыв.

Последние изменения в экономике вынуждают ИТ-директоров уделять намного больше внимания издержкам. Есть ли возможности приложить совсем немного усилий и улучшить имеющуюся архитектуру хранения данных, которая в текущем состоянии характеризуется неэффективностью, громоздкостью и даже нарушениями целостности во многих областях? Есть ли смысл разрабатывать стратегию хранения данных или по крайней мере выполнить инвентаризацию и классификацию данных, чтобы хотя бы оценить масштаб проблемы? Какие отчеты необходимы для эффективной оценки масштаба проблемы и в состоянии ли ИТ-отдел четко сформулировать структуру текущих расходов? Если вопросов много, стоит подумать о перемещении систем хранения данных на верхнюю позицию в списке приоритетных задач на этот год.

Источники информации

Базовые сведения о грамотной стратегии технологий хранения данных можно найти в статье Аруна Танеджа (Arun Taneja) Intelligent Storage: The Big Picture (May 24, 2001). Она доступна по адресу http://www.intelligententerprise.com/010524/feat1_1.shtml).

Ричард Сканнелл (Richard Scannell) — соучредитель и вице-президент по корпоративному развитию и стратегии в GlassHouse Technologies (http://www.glasshousetech.com), независимой компании, специализирующейся в области стратегии и услуг по созданию систем хранения данных. С ним можно связаться по e-mail: rscannell@glasshousetech.com.