IBM® FlashSystem™ значительно повышает производительность приложений и снижает стоимость центров обработки данных.

Время — ключевой фактор в бизнесе, особенно в критически важных бизнес-приложениях

Те, кто видел фильм «Аполлон-13», или люди постарше, помнящие этот злополучный космический полет, знают, что бывает, когда критически важные системы выходят из строя. По сюжету фильма три американских космонавта отправляются на Луну, но в пути космический аппарат взрывается и получает серьезные повреждения, а они лишь чудом остаются в живых. Космонавтам удается вернуться домой только благодаря героическим усилиям и толике везения. К счастью, последствия сбоя критически важных бизнес-приложений редко бывают столь же серьезными (по сравнению, скажем, с приложениями, от которых зависит работа служб и учреждений, например в отделениях интенсивной терапии, авиадиспетчерских службах и т. д.). Но с другой стороны — сбои таких приложений напрямую отражаются на жизнеспособности компании: если системы работают безупречно, компания экономически здорова и развивается, если нет — она с трудом удерживается на плаву.

К разряду критически важных для бизнеса относятся приложения для самых разных задач, например: бизнес-аналитика (BI — business intelligence), оперативная транзакционная обработка (OLTP — online transaction processing), оперативная аналитическая обработка (OLAP — online analytical processing), инфраструктура виртуальных рабочих столов, высокопроизводительные вычислительные системы и приложения для доставки содержимого (облачные системы хранения, предоставление видео по запросу и т. д.).

Все эти важные задачи объединяет одно: высокие требования к скорости работы, ведь от нее зависит то, насколько быстро руководство, сотрудники, клиенты и другие ключевые деловые партнеры получат доступ к нужной информации.

Невозможность быстро получить доступ к важным данным и обработать их приводит к существенным деловым и финансовым рискам. В частности, такие задержки вызывают:

  • Неспособность своевременно и правильно оценить ситуацию – не имея доступа к критически важным данным в нужное время и в нужном месте, люди не видят полной картины происходящего и, как следствие, принимают неправильные решения, допуская совершенно необязательные ошибки.
  • Резкое снижение способности прогнозировать результаты бизнеса – качество финансовых прогнозов на уровне отдельного проекта, отдельного направления деятельности и всей компании зависит от возможности своевременно получать самые точные данные. Не имея доступа к таким данным, компания не может их проанализировать, что негативно отражается на ее деятельности.
  • Рост недовольства клиентов – во многих отраслях (финансовые услуги, здравоохранение, туризм и т. п.) качество сервиса напрямую зависит от наличия мгновенного доступа к актуальной информации, особенно в связи с тем, что современный клиент ожидает обслуживания в круглосуточном режиме 7 дней в неделю и 365 дней в году. В этих условиях неспособность оперативно предоставить клиентам нужную информацию не только означает упущенную прибыль, но и зачастую ведет к потере клиента, а то и доли рынка.
  • Слишком большие объемы, разнообразие и скорость поступления информации – взрывной рост объемов данных ведет к неизбежному падению производительности основных приложений на многих предприятиях. Увеличение задержек становится источником недовольства пользователей, и предприятия упускают возникающие возможности.

Руководителям отделов ИТ, ищущим решение этих проблем, которое бы имело оптимальное сочетание функционала, времени внедрения, масштабируемости и стоимости систем, не позавидуешь. В конечном счете верное решение может оказаться далеко не очевидным.

Постановка задачи

Как правило, на замедление работы системы отдел ИТ реагирует в первую очередь добавлением или модернизацией процессоров и памяти. Однако слишком часто прирост производительности от этой модернизации минимален, тогда как стоимость высока. Второй метод, зачастую сопутствующий первому, по крайней мере применительно к базам данных, — это оптимизация инструкций SQL. Предприятия тратят на нее миллионы долларов и даже получают какие-то результаты. Но упускают из виду тот факт, что и самая идеальная база данных будет бессильна перед низкой скоростью работы системы хранения данных, а именно последняя часто и является источником проблемы.

На самом деле первопричина проблем с производительностью приложений зачастую кроется именно в системе хранения данных, а не в скорости процессора или нехватке памяти.

Когда процессор простаивает в ожидании информации от системы хранения, драгоценное время и ресурсы расходуются впустую. А учитывая то, что в последние 20 лет вычислительная мощность процессоров растет в геометрической прогрессии, этот простой становится все больше и больше. Проще говоря, вычислительные ресурсы современных процессоров намного превосходят скорость, с которой жесткие диски могут доставлять им данные. Особенно остро этот разрыв в производительности ощущается в серверах баз данных, где количество операций ввода-вывода обычно гораздо больше, чем в других системах. В итоге сверхбыстрые процессоры и огромная пропускная способность часто задействованы далеко не на полную мощность, потому что на доступ к данным на жестких дисках уходит по несколько миллисекунд, что для современных процессоров — целая вечность. А когда серверы долго ждут данных от систем хранения, пользователи долго ждут ответа от серверов. Вот где реальный источник проблемы с низкой скоростью операций ввода-вывода.

Эта проблема обусловлена чисто физическими причинами. Перемещение данных через твердотельные накопители и сеть происходит на скорости, сопоставимой со скоростью тока в электрической цепи, т. е., по сути, скорости света, тогда как жесткие диски — это устройства механические, считывающие информацию за счет вращения пластины. Таким образом, при всей своей надежности и работоспособности жесткие диски в плане скорости доступа являются однозначно самым слабым звеном в цепи передачи информации.

Недостатки традиционных подходов

Проблемы с производительностью из-за неэффективности жестких дисков пытаются решать несколькими способами, в частности созданием массивов JBOD (just a bunch of disks — просто набор дисков) или RAID (redundant array of independent disks — избыточный массив независимых дисков). С увеличением количества дисков появляется возможность распределять операции ввода-вывода, осуществляемые базой данных, по нескольким дискам. К сожалению, это дает слишком скромный прирост производительности HDD.

Еще принято перемещать часто используемые файлы на отдельный диск. Скорость операций ввода-вывода у одного диска при этом действительно вырастает до своего максимума, только вот даже на максимуме эта скорость по-прежнему невысока. В лучшем случае один жесткий диск выдает 300 операций ввода-вывода в секунду (IOPS — input/output operations per second), что в разы ниже скорости, которая могла бы сократить разрыв в производительности между процессором и HDD.

Третьим традиционным способом повысить производительность HDD является замена JBOD на RAID. Производительность в результате действительно вырастает, особенно если подключить диски к контроллеру с большим кешем, который будет распределять данные по разным дискам. Но при этом, чтобы достичь высокой скорости операций ввода-вывода, ожидаемой пользователями, потребуется такое количество дисков, что их стоимость, занимаемое пространство и вес окажутся просто-напросто неприемлемыми.

Ответ: системы хранения только на базе флеш-памяти

Разрыв в производительности между вычислительной мощностью серверов и системами хранения данных на жестких дисках, особенно остро ощущаемый в критически важных бизнес-приложениях, требует принципиально иных, более быстрых систем хранения.

Системы хранения на базе флеш-памяти — это устройства с твердотельными накопителями, призванные решить проблему с недостаточной скоростью операций ввода-вывода; их скорость доступа к данным и операций ввода-вывода в разы лучше, чем у жестких дисков. Эти системы хранения могут дополнять или полностью заменять традиционные массивы из жестких дисков для многих критически важных бизнес-приложений, включая ERP-системы, транзакционные базы данных и аналитические приложения (бизнес- аналитика и т. п.). Более того, в связи с постепенным снижением цен на эти новые устройства сегодня вполне возможно построить целую систему хранения на базе одной флеш-памяти.

Системы хранения на базе флеш-памяти могут дополнять или полностью заменять традиционные массивы из жестких дисков для многих критически важных бизнес-приложений, включая ERP-системы, транзакционные базы данных и аналитические приложения (бизнес-аналитика и т. п.).

В широком смысле слова под SSD (solid state drive — твердотельный накопитель) понимается любое устройство ввода-вывода данных, лишенное механических компонентов. Однако в последнее время термин SSD используется в основном для обозначения твердотельных накопителей, имеющих традиционный форм-фактор жесткого диска и идущих ему на смену. SSD-накопители такого форм-фактора не следует путать с системами хранения на базе флеш-памяти. Интерфейсы и контроллеры таких SSD-накопителей основываются на традиционных для жестких дисков технологиях, которые создавались исходя из присущих HDD задержек доступа и ограничений пропускной способности. Системы же хранения на базе флеш-памяти изначально разрабатывают исходя из особенностей этой технологии и в расчете на быстрый контроллер FPGA, ставя цель минимизировать задержку и получить максимальную пропускную способность.

Системы хранения на базе флеш-памяти изначально разрабатывают исходя из особенностей этой технологии и в расчете на быстрый контроллер FPGA, ставя цель минимизировать задержку и получить максимальную пропускную способность.

У современных систем хранения на базе флеш-памяти время ожидания операций ввода-вывода сокращено за счет того, что скорость доступа в 250 раз быстрее, чем у жестких дисков (0,2 мс против 5 с). А увеличение скорости доступа в свою очередь позволяет флеш-памяти выдавать в 1333 раза больше операций ввода-вывода в секунду, чем у HDD (400 000 с лишним IOPS против 300). Такое улучшение может резко сократить задержки доступа к информации, обусловленные медлительностью системы хранения.

Семейство IBM FlashSystem™

IBM считает флеш-память стратегически важной технологией хранения данных и ставит своей целью быть в авангарде разработки систем хранения только на базе флеш-памяти. (Одним из следствий этой политики стала покупка в октябре 2012 года компании Texas Memory Systems (TMS) — высококлассного производителя мощных и надежных систем хранения на базе флеш-памяти.)

Целенаправленное использование IBM FlashSystem помогает предприятиям повысить свою гибкость и эффективнее задействовать аналитику — персонал в любой момент может оперативно получить информацию, которая всегда актуальна, поскольку поступает в режиме реального времени, а не с большими задержками. Кроме того, эта система способствует оптимизации центров обработки данных и консолидации ресурсов, в результате чего растет эффективность бизнес-процессов и работы критически важных приложений. Повышается и устойчивость систем, причем без потерь производительности и доступной емкости.

Системы хранения FlashSystem способны на 500 000 операций чтения в секунду с задержкой менее 100 микросекунд и при этом настолько компактны, что в одном отсеке 1U можно разместить устройства емкостью до 24 ТБ. Другим немаловажным преимуществом является высокий уровень доступности и надежности, обязательный для предприятий: отсутствие компонентов, отказ которых приводит к отказу всей системы, наличие нескольких уровней коррекции данных, резервных микросхем и компонентов с поддержкой «горячей замены».

Продукты IBM FlashSystem имеют наименьшую задержку и наивысший показатель IOPS среди конкурентов и при этом привлекательны с точки зрения совокупной стоимости владения. Они могут использоваться в качестве систем хранения т. н. уровня 0 (Tier 0, т. е. превосходящего по возможностям традиционный уровень Tier 1 — системы хранения данных, необходимых для первоочередных задач предприятия) в комбинации с SVC (IBM System Storage® SAN Volume Controller). Также IBM FlashSystem будут особенно полезны, когда работоспособность критически важных бизнес-приложений напрямую зависит от охлаждения, низкого энергопотребления и компактного размера.

Системы хранения только на базе флеш-памяти имеют не только технические преимущества, но и ряд экономических выгод по сравнению с традиционными системами на базе HDD. Например, стоимость лицензирования ПО для систем хранения IBM FlashSystem на 50 % ниже, чем у систем на базе HDD.

К тому же гораздо меньший размер и более высокая плотность хранения данных позволяют значительно сократить занимаемую площадь. (Как отмечалось выше, система хранения данных только на базе флеш-памяти с 24 терабайтами адресуемой памяти и высоким уровнем доступности имеет размер всего 1U. Таким образом, в одной стойке можно разместить систему емкостью 1 петабайт.)

Системы хранения данных только на базе флеш-памяти также гораздо более энергоэффективны, чем сопоставимые системы на базе HDD, — затраты на электроэнергию ниже на 75 %.

  • Стоимость лицензирования ПО для IBM FlashSystem на 50 % ниже, чем у систем на основе HDD.
  • IBM FlashSystem занимает значительно меньше места и экономит до 75 % электроэнергии по сравнению с HDD.
  • Стоимость эксплуатационной поддержки систем на базе флеш-памяти на 35 % ниже по сравнению с HDD.
  • Совокупная стоимость системы хранения данных только на базе флеш-памяти на 31 % меньше, чем у HDD.

Переход на флеш-память

Залогом максимальной отдачи и экономической эффективности флеш-памяти является стратегическое ее использование. Система хранения только на базе флеш-памяти полезна многим приложениям, но далеко не всем; в первую очередь она нужна основным приложениям предприятия. Ключ к высокой производительности приложений, удовлетворению пользователей и оптимальной совокупной стоимости владения лежит в умении идентифицировать те приложения, которые выиграют от перехода на системы хранения только на базе флеш-памяти, и те, которым хватит традиционных систем на базе HDD или же гибридных систем на основе комбинации этих технологий.

Система хранения только на базе флеш-памяти полезна многим приложениям, но далеко не всем; в первую очередь она нужна основным приложениям предприятия.

Низкая производительность приложений обычно связана с большим объемом одновременных и зачастую высокосложных запросов к базе данных. Если слабым звеном при этом является подсистема ввода-вывода, то необходимо выявить компоненты базы данных, которые работают под наибольшей загрузкой и таким образом вызывают задержку в операциях ввода-вывода.

В некоторых случаях на системы хранения на базе флеш-памяти переносят целые базы данных. Обычно это БД со стандартно высоким объемом одновременных запросов или регулярным случайным доступом ко всем таблицам БД, когда вычленить подмножество наиболее часто используемых файлов не представляется возможным.

Хорошо подходят для переноса на системы хранения на базе флеш- памяти также БД малого и среднего размера, потому что такие решения крайне привлекательны по цене, особенно по сравнению с RAID-системами. Аналогичное справедливо для крупных баз данных с большим количеством запросов на чтение.

Дополнительные сведения о том, как БД Oracle® работает в связке с IBM FlashSystem, см. в разделе «Дополнительные ресурсы», источник vi.

Другие доводы в пользу флеш-памяти — это такие недостатки больших дисковых массивов из HDD, как большая занимаемая площадь и высокое энергопотребление. Дополнительные сведения см. в примерах внедрения, перечисленных в следующем разделе.

Низкая производительность приложений обычно связана с большим объемом одновременных и зачастую высокосложных запросов к базе данных.

Технические сведения о флеш-памяти и IBM FlashSystem

Системы хранения только на базе флеш-памяти имеют емкость больше, чем у всех предыдущих технологий хранения данных. Это объясняется тем, что они не требуют дополнительных батарей для копирования DDR-кеша в случае отключения электроэнергии, равно как и обходятся без большого количества дорогих модулей DDR-памяти. Объем нужной им DDR-памяти минимален — она служит в качестве буфера записи для флеш-памяти и хранилища метаданных во время работы. Электропитание, необходимое, чтобы в моменты отключения электроэнергии скопировать небольшой кеш и метаданные на флеш-память, обеспечивается маленькими батареями. Система хранения данных только на базе флеш- памяти с 24 терабайтами адресуемой памяти и высоким уровнем доступности имеет размер всего 1U.

В продуктах IBM® FlashSystem™ применяется только самая качественная флеш-память: одноуровневая (SLC — single-level cell) и многоуровневая корпоративного класса (eMLC — enterprise multi-level cell). В большинстве твердотельных накопителей применяется ненадежная MLC-флеш-память начального уровня. У eMLC ресурс в 10 раз больше, чем у MLC, а у SLC — в 33 раза больше. MLC рассчитана на 3000 операций записи на ячейку флеш-памяти (т. н. циклов перезаписи), тогда как eMLC способна на 30 000 циклов, SLC — на 100 000.

Семейство FlashSystem имеет многоуровневую защиту данных (ECC, Variable Strip RAID и 2D Flash RAID), что исключает незапланированные простои и гарантирует надежность корпоративного класса. Чтобы ознакомиться с технической информацией о семействе FlashSystem, посетите страницу IBM FlashSystem 720 и IBM FlashSystem 820 (http://www.redbooks.ibm.com/abstracts/tips1003.html#specifications), а также IBM FlashSystem 710 и IBM FlashSystem 810 (http://www.redbooks.ibm.com/abstracts/tips1002.html)