Темой нашей беседы с представителями компаний Перми и Пермского края стал целый ряд вопросов, связанных с хранением данных в корпоративных системах, а также с внедрением разного рода технологических решений, призванных облегчить этот процесс. Данная встреча состоялась в Перми, в рамках 5-го Форума IBM «Опыт инноваций для преобразования бизнеса».

Участники круглого стола:
Павел Гущин
и. о. ИТ-директора Чусовского металлургического завода
Владимир Сушин
директор ИВЦ Пермского государственного университета
Станислав Холманских
руководитель направления «Серверы и системы хранения»,
«ЭР-Телеком Холдинг»
Ведущий – Яков Шпунт
редактор Intelligent Enterprise

Intelligent Enterprise: Актуальна ли для вас тема роста объемов данных? Насколько важным компонентом при реализации ваших инфраструктурных проектов были подсистемы, связанные с хранением данных?

Павел Гущин: Для нас эта подсистема была ключевым элементом. В нашей виртуализованной системе, непосредственно на серверах ничего не хранится: операционные системы, бизнес-приложения и сами данные находятся на СХД.

Наша ERP-система долгое время использовала общую базу данных с другими предприятиями компании. При миграции данных на собственную технологическую площадку мы получили базу большего объема, в которой собственно наших данных меньше 20%. Но сжать их без потери связности мы пока не можем. Поэтому проблема быстрого роста данных все равно имеет место. И над решением этой проблемы мы работаем. Но пока идем экстенсивным путем: нашу вторую систему покупаем уже с увеличенными емкостями. Кроме того, мы изначально выбрали такие СХД, которые позволяют подключать другие и тем самым обладают расширенными возможностями масштабирования. Так что проблема роста данных на ближайшую перспективу решена. Что, однако, не мешает нам использовать вторую систему в качестве резервной для построения катастрофоустойчивого решения, поскольку таковы требования бизнеса. Простой ERP-системы допустим лишь в течение нескольких часов.

Владимир Сушин: У ПГНИУ имеются СХД и среднего уровня и hi end, но СХД среднего уровня DS более старая, а Павел рассказывал о новинке в области СХД среднего уровня, опыт эксплуатации которой нам очень интересен.

Павел Гущин: Очень многие СХД высокого уровня, в том числе и IBM Storwize, имеют встроенные средства виртуализации. А это дает очень широкие возможности по использованию совместно с другими системами, в том числе и с имеющимися в наличии старыми моделями. В СХД IBM DS такой функциональности не предусмотрено. Плюс много других возможностей, которые существенно облегчают жизнь ИТ-службе. Например, средства, позволяющие в автоматическом режиме перемещать данные по уровням хранения. Мы этот функционал не задействовали, по крайней мере пока. Для нас пока приоритетнее получить необходимые объемы. И скорость ввода/вывода нас вполне устраивает.

Станислав Холманских: Системы хранения данных — ключевой элемент инфраструктуры нашей компании. Активно используются СХД начального и среднего уровня производства основных вендоров. Сейчас идет проект консолидации на базе СХД уровня hi end.

Intelligent Enterprise: Часто говорят, что удобнее и выгоднее докупить новые емкости хранения, чем наводить порядок в уже накопленных данных. Так ли это?

Павел Гущин: Наведение порядка в данных — действительно дело трудоемкое и к тому же неблагодарное. Сотрудники ИТ-службы тратят на это много сил и времени, а бизнес-пользователи эту работу не видят. К тому же часто бывает и так, что данные вроде бы удаляются, но место при этом все равно не освобождается в силу целого ряда технологических особенностей, связанных с организацией хранения информации. Речь идет о фрагментации хранения данных на логическом уровне. Для нас именно это особенно актуально. За счет решения этой задачи мы сможем высвободить до 30% емкостей.

Положение осложняется и тем, что ИТ-служба не играет ведущей роли в определении политики хранения данных. Тут все решает бизнес, а на него, в свою очередь, давят требования законодательства. Например, информацию о сотрудниках необходимо хранить 75 лет. Требуется хранить и организационно-распорядительную документацию, например всевозможные приказы. Также очень часто приходится поднимать различную бухгалтерскую документацию за прошлые годы по запросам аудиторов.

Впрочем, это не мешает нам выступать с различными инициативами. Например, удалось убедить руководство и службу безопасности сократить срок хранения данных пропускной системы с пяти лет до одного года. То же самое с информацией о движении локомотивов, где фиксируется довольно большое количество параметров. Мы настояли, что хранить эту информацию в течение длительного времени не имеет никакого смысла. Проблема в том, что бизнес сам с такими инициативами не выступает.

Есть и проблема элементарной дисциплины со стороны пользователей. В итоге сетевые хранилища быстро превращаются в самую настоящую цифровую свалку, в которой никто, кроме самих пользователей, разобраться не может. Мы пытались упорядочивать эти вопросы аналогично тому, как поставлен вопрос с оборотом бумажных документов. И многие службы подошли к данному вопросу очень ответственно. Имеет место и фактор, связанный с недостатком квалификации пользователей. Это выражается, например, в том, что документ сканируется с завышенным разрешением, избыточным для его обработки. В итоге документы занимают намного больше места.

Станислав Холманских: Задачу расширения емкости хранения можно решать несколькими способами: приобретать полки расширения, дополнительные диски в текущие системы; приобретать новые СХД. Все способы разные и требуют различного уровня затрат, как денежных, так и временных. И тут проще и дешевле может оказаться навести, наконец, порядок в том, что хранится в системах. Поэтому к каждой задаче увеличения емкости хранения следует подходить индивидуально.

Владимир Сушин: Не стоит забывать и о том, что нельзя до бесконечности наращивать емкости. Скорее рано, чем поздно контроллер СХД перестает справляться с нагрузкой. И тут уже ничего не сделаешь.

Яков Шпунт: Могу добавить, что часто проблему представляют устаревшие приложения на базе плоскофайловых СУБД. Точнее, не они сами, а их файлы данных и индексы, залежи которых хранятся многие годы. И внедрение современных приложений отнюдь не гарантия того, что этим ПО перестают пользоваться. Ведь перенос их в современные бизнес-приложения является очень непростой задачей.

Intelligent Enterprise: Каковы самые типовые нештатные ситуации, которые имеют место при внедрении систем хранения?

Яков Шпунт: В моей практике был случай: в процессе комплексной модернизации систем, когда модернизировались серверы и СХД, пришлось обновлять и СУБД, поскольку бизнес-приложения просто перестали нормально работать (Снизить требования к оборудованию на 30%? Это реально//Intelligent Enterprise, № 3/2010).

Павел Гущин: У нас была задача переноса данных с одной и той же версии СУБД на другую аппаратную платформу. Это потребовало тщательного подбора и согласования версий системного и прикладного ПО IBM и Oracle. При этом каждое из приложений мы тщательно тестировали. В итоге данный процесс в тестовой фазе занял довольно много времени. И был он далеко не беспроблемным, сложности с сохранением логики возникали постоянно. Однако перенос продуктивных систем прошел без последствий. Он был проведен в выходные дни, и бизнес просто ничего не заметил. То есть, по моему мнению, большинство проблем консолидации данных на системах хранения связано с недостаточно тщательным проведением предварительного тестирования и опытной эксплуатации.

Станислав Холманских: При любой консолидации ресурсов риск возрастает. Мы консолидируем несколько наших приложений на одной СХД. Поэтому СХД становится единой точкой отказа, к которой предъявляются повышенные требования по производительности и надежности. А значит, требуется серьезный комплекс инженерной инфраструктуры и квалифицированные кадры.

Владимир Сушин: Да, проблема с потенциальной точкой отказа всегда имеет место при любом проекте, связанном с консолидацией мощностей. И никакое резервирование не снимает проблему. Ведь любой останов крупного центра все равно является аварией. Другое дело, что наличие резерва позволяет обойтись без серьезных последствий.

У нас главные трудности были связаны с тем, что все операции по модернизации ЦОД проводились вживую. Найти «окно» для отключения тех или иных систем было очень сложно. Учебный процесс проходит с утра до позднего вечера. Даже ночью вести работы было не всегда возможно.

Intelligent Enterprise: Какие решения для оптимизации данных и рационального использования СХД вы используете: дедупликацию, виртуализацию СХД с целью продления срока эксплуатации уже имеющихся систем, иерархическое хранение и применение элементов ILM, оптимизацию ПО (сжатие данных на уровне СУБД, файловых систем)? Насколько сложно внедрялись эти решения?

Павел Гущин: ILM — в принципе хорошая технология. Но, как я уже говорил, пока для нас приоритетом остается обеспечение необходимого объема. Нам предлагали внедрить такого рода средства, но мы сочли это нецелесообразным.

Виртуализация СХД нам помогла. Мы воспользовались соответствующими возможностями IBM Storwize, что избавило нас от приобретения новой СХД, когда в этом возникла необходимость. В итоге были сэкономлены значительные средства.

Как сказано выше, для нас актуальна задача фрагментации при размещении данных. Помимо издержек с неоптимальным управлением емкостями, это сильно сказывается на производительности. Так что решение этой проблемы для нас крайне важно.

Владимир Сушин: Дедупликация имеет смысл тогда, когда используется много виртуальных машин в типовых конфигурациях. Или при работе с офисной документацией. Тут выигрыш будет огромным, и расчеты вендоров, несмотря на всю фантастичность, оказываются очень близки к истине. Действительно, в этом случае имеется много повторяющихся данных. Другое дело, что средства, которые позволяют воспользоваться этим, являются опциями, причем довольно дорогими, на которые далеко не всегда находятся средства. Что касается ILM, то могу только присоединиться к тому, что сказал Павел.

Станислав Холманских: Насчет дедупликации соглашусь с Владимиром, могу также добавить, что и для резервных копий выигрыш будет большим. Есть продукты, как программные, так и программно-аппаратные, которые ориентированы как раз на резервное копирование.

Могу напомнить еще об одной тенденции — разрабатывать сложные решения из простых физических компонент. Мы посмотрели внутрь IBM XIV. Вся «изюминка» этой системы — именно в ПО, в то время как аппаратная часть этой СХД представляет собой набор серверов стандартной архитектуры. Помимо коммерческих систем, активно развиваются решения с открытым исходным кодом, позволяющие организовывать мощные и емкие системы хранения на базе существующих серверных мощностей.

Систем, которые имело бы смысл виртуализировать, у нас просто нет. Мы понимаем, что устаревающие системы начального и среднего уровня в обозримый период будут сняты с эксплуатации. Поэтому мы оставляем на них «второстепенные» сервисы. Кроме того, виртуализация СХД, в отличие от виртуализации серверов, является делом довольно затратным. Хотя если речь идет о старших системах, заменить которые нет возможности, то тут виртуализация может быть полезной.

Что касается внедрения элементов ILM, то это остается уделом старших систем. Есть попытки включить соответствующий функционал и в системы среднего уровня, EMC и IBM такие продукты уже предлагают, но они (продукты), на мой взгляд, не вполне последовательны. Кроме того, у нас были опасения, что перемещение данных в автоматическом режиме может привести к различного рода издержкам, и мы посчитали использование таких технологий на текущий момент нецелесообразным.

Для наших задач сжатие данных неприменимо. Оно ведет к затратам процессорного времени, что заметно влияет на производительность бизнес-приложений.

Intelligent Enterprise: Тут была поднята проблема кадров. В итоге многие откладывают свое «знакомство» с СХД, применяя серверы с большим количеством посадочных мест для дисков так долго, насколько этого возможно. Насколько остро стоит данная проблема?

Станислав Холманских: Для нас она весьма актуальна. Проблема недостатка квалифицированных кадров, насколько я знаю, остро стоит и в Москве. А у нас в городе людей меньше. В корпоративном центре нашей компании в Перми работает много людей, переехавших из других регионов.

Павел Гущин: Мы используем аутсорсинг. Обслуживание рабочих мест пользователей, администрирование систем и сервисов мы отдали сторонней компании. Кроме того, мы обращались к внешним специалистам, когда осуществляли процесс миграции с прежней системы. Но в целом мы в еще более сложном положении. К нам в Чусовой из Перми далеко не всякий поедет, в то время как имеющиеся кадры активно переманивают туда, где более высокие перспективы в плане зарплат и возможного профессионального роста. Используя аутсорсинг, мы решаем проблему поддержания работоспособности систем. Однако разработчики функционала для ERP-системы у нас свои. Это наш стратегический ресурс.