RAID: концепция живет и развивается

11.09.2006

RAID: концепция живет и развивается

Возглас: «Raid!» — всем нам хорошо знаком по телерекламе средства для уничтожения насекомых. Те же возгласы можно услышать и в отделах информационных технологий, но связаны они совсем с другими вещами — с массивами независимых дисков с избыточностью (Redundant Arrays of Independent Disks — RAID).

Системы хранения данных в целом и RAID в частности пользуются большим спросом. Из-за появления огромного числа приложений с графическим интерфейсом, а также бурного развития баз данных и средств для работы в сети Интернет и интрасетях пользователи просто не успевают наращивать дисковое пространство своих информационных систем. По данным Dataquest, мировой рынок средств хранения данных для серверов и систем RAID за прошлый год вырос на 14% и составил 20 млрд долл., а к 2000 г., в связи с постоянным совершенствованием возможностей компьютеров и сетей, ожидается рост объема этого рынка до 27 млрд долл.

На пользователях развитие рынка систем RAID сказывается как нельзя более благоприятно: цены на них стремительно падают, что позволяет отделам информационных технологий использовать большее число таких систем и в некоторых случаях устанавливать их даже на обычных настольных компьютерах. Системы RAID оснащаются все более мощными средствами управления, которые позволяют организовывать централизованные хранилища информации. Как это ни покажется странным, но системы RAID настолько часто применяются, что стали товаром широкого пользования. Технология RAID активно развивается производителями систем RAID, и постепенно они перестают быть просто частями серверов.

Что такое RAID?

Для начала — краткий теоретический курс. Система RAID — это набор из двух или более дисков, сконфигурированный таким образом, что хост-машиной они воспринимаются, как один большой диск. Технология RAID повышает надежность хранения информации и увеличивает скорость ввода-вывода данных за счет возможности обращения к нескольким дискам одновременно.

Подсистема RAID может иметь встроенный SCSI-контроллер, который распознается хост-машиной как один большой диск с интерфейсом SCSI (архитектура SCSI-to-SCSI). Плата контроллера RAID может быть установлена и в самом хост-компьютере. Традиционно существуют семь уровней RAID — от 0 до 6. Каждый из них отличается от других организацией хранения данных, скоростью ввода-вывода и стоимостью реализации.

Система RAID уровня 0 всего лишь распределяет данные по своим дискам, никак не обеспечивая их защиты от сбоя диска. В RAID уровня 1 предусмотрено зеркальное отражение дисков, т. е. запись одних и тех же данных на два диска. Системы RAID уровней 2 и 3 называют дисковыми массивами с параллельным доступом: в выполнении каждой операции ввода-вывода участвуют все их диски, одновременно записывая или считывая данные. Такие системы используются для работы с приложениями, требующими высокой скорости передачи значительных объемов информации, — это обработка видеоданных или больших последовательных файлов. Системы RAID уровней 4, 5 и 6 представляют собой дисковые массивы с независимым доступом, диски в них могут работать независимо друг от друга, что позволяет системе выполнять несколько операций чтения или записи в одно и то же время (RAID уровня 4 обеспечивает одновременное выполнение только операций чтения). Три последних уровня предназначены для систем обработки транзакций и других приложений, требующих высокой скорости доступа к данным. Имеются также и «гибридные» уровни, в которых скомбинированы разные возможности основных уровней RAID, например 10 (см. «Не пора ли расстаться с уровнями RAID?»). Защита данных, хранящихся в системах RAID уровней 2—6, обеспечивается с помощью контроля четности.

Даешь RAID!

Пользователи приходят наконец к пониманию того, что данные имеют высокую цену, и начинают проявлять повышенный интерес к системам RAID. В ответ на это производители предлагают все более совершенные RAID-решения, такие, как использование интерфейсов Fibre Channel для соединения дискового массива с хост-компьютером, более быстрые диски и более производительные RAID-контроллеры.

Большинство систем RAID для ЛВС и компьютеров средней мощности предназначены для совместной работы с сервером или хост-машиной. Однако, согласно сведениям, полученным от консалтинговой фирмы DISK/TREND, все больше производителей RAID приступают к выпуску моделей с прямым подключением к сети. По прогнозам фирмы, объем продаж систем RAID для ЛВС и компьютеров средней мощности вырастет к 2000 г. до 14,3 млрд долл. (с 6,7 млрд долл. в 1996 г.). Доля этих систем от общего числа проданных в 1996 г. систем RAID составляет 93,5%.

Еще одна причина повышенного спроса на RAID — низкие цены на жесткие диски в связи с ростом объемов их производства и снижением стоимости хранения мегабайта информации.

Рынок массивов RAID может быть условно разделен на три сектора: сети устройств памяти (Storage Area Networks — SAN); системы хранения данных, взаимодействующие с сервером или хостом; системы хранения данных, напрямую подключаемые к сети.

Однако приведенная классификация не очень-то интересна конечным пользователям. Согласно опросу, проведенному компанией XIOTech, среди 100 топ-менеджеров по информационным технологиям только трое знали о существовании систем хранения данных, присоединяемых к сети напрямую. По-видимому, для них важны не столько технологические аспекты, сколько различия в цене и степени защиты данных.

Как выбирать RAID

Что должны знать менеджеры по информационным технологиям, чтобы принять разумное решение при закупке RAID? Прежде всего им необходимо иметь представление о том, как взаимодействуют их приложения с системами хранения данных. К сожалению, даже высокообразованные менеджеры не всегда владеют информацией по этому вопросу в полном объеме. Необходимо, чтобы возможности системы хранения соответствовали специфике работы приложения. Если она постоянно тормозится в связи с недостаточной скоростью обмена с системой хранения информации, то, возможно, вы нуждаетесь в системе с большей производительностью. Специалисты фирмы Clariion (в составе компании Data General), производящей дисковые массивы, считают, что основными критериями при выборе системы RAID должны быть ее производительность и надежность. Нужно знать и ответ на вопрос, останутся ли доступными хранящиеся в системе данные в случае выхода из строя ее диска или информационного канала (шины).

Джим Полтер, президент фирмы DISK/TREND, представил список вопросов, которые конечные пользователи должны задавать поставщикам систем RAID:

Сможет ли система работать с будущими моделями дисков повышенной емкости?

Сможет ли хост продолжать работу при замене компонентов системы?

Совместима ли система RAID со средами Windows NT и Unix?

Можно ли ее напрямую подключить к сети?

Итак, следует хорошенько разобраться в том, что вы покупаете.

Выбирая систему RAID, оцените положение ее производителя на рынке и его возможности в плане технической поддержки, которая необходима для ликвидации серьезных сбоев.

Согласно мнению специалистов компании Symbios, система хранения данных обычно служит дольше, чем сервер, поэтому нужно быть уверенным, что ее производитель не исчезнет, пока вы будете пользоваться этой системой: по данным DISK/TREND, число компаний, предлагающих дисковые массивы под своей маркой, сократилось со 179 в 1995 г. до 149 в 1997-м.

Производительность и надежность

Увеличение емкости систем RAID приводит к возникновению дефицита их производительности (с ростом объемов хранимых данных увеличивается и число запросов к системе). Имеется постоянно растущий разрыв между скоростью обработки данных и скоростью обмена ими с дисками.

Многие производители систем RAID используют модульный подход к их конструированию, позволяющий пользователям расширять систему и таким образом повышать ее производительность и/или надежность.

Что касается производительности, то фирма XIOtech, например, выпустила дисковую систему, выполняющую более 50 000 операций ввода-вывода в секунду, что примерно в 10 раз больше соответствующего показателя мощнейших систем конкурентов. XIOtech добилась этого благодаря суммированию работы 32—64 дисков (в большинстве систем RAID используется 5—12 накопителей) и разделению дискового пространства системы на большое число логических томов. Кроме того, система фирмы XIOtech может работать с несколькими серверами (до восьми) одновременно. С этой целью она оснащена восемью независимыми портами Fibre Channel. Система предназначена для использования в качестве централизованного хранилища данных.

Фирма Veritas Software и другие компании разработали мощное управляющее ПО для небольших систем RAID. В результате у последних появились новые возможности, ранее реализовавшиеся только в продуктах масштаба предприятия. Это, например, удаленное копирование и способность гибкого управления томами.

Сейчас за 10 000 долл. можно купить RAID-контроллер и по крайней мере, три-четыре высокоемких дисковых накопителя. Таким образом, использование систем RAID стало экономически эффективным и для небольших компаний.

В настоящее время некоторые производители реализуют поддержку RAID на материнских платах для серверов и рабочих станций.

Надо признать, что немало пользователей все еще заблуждаются, считая, будто установка системы RAID слишком дорогое удовольствие. Не все понимают, что убытки от потери данных часто превышают дополнительные затраты на установку системы RAID на сервере.

При выборе систем RAID многие конечные пользователи не уделяют должного внимания их надежности. Большинство производителей RAID способны создавать высоконадежные системы, резервируя процессоры (контроллеры) RAID и каналы хост—RAID. Однако не все клиенты пользуются этим. Чаще всего они устанавливают один хост-адаптер, один соединительный кабель хост—RAID и один контроллер. В результате хранящиеся в системе RAID данные оказываются защищенными только от сбоя ее диска, но не от повреждения кабеля, например.

Важным критерием выбора системы RAID является простота ее модернизации и технического обслуживания. Немалое значение имеет и наличие в системе компонентов, заменяемых в «горячем» режиме. Все это снижает время вынужденного простоя. Необходимо также иметь средства, информирующие администратора о состоянии компонентов системы и их отказах.

Новые возможности

Производители неутомимы в деле совершенствования возможностей систем RAID. Так, компания AIWA Raid Technology предложила технологию, позволяющую пользователям легко изменять текущие уровни RAID. Это окажется весьма кстати, когда, например, в массиве с конфигурацией RAID уровня 5 выйдет из строя один диск. Если в этот момент на предприятии не окажется запасного диска, то на время его поиска имеет смысл перейти к использованию конфигурации RAID уровня 0, что позволит поддерживать высокую скорость ввода-вывода информации. После же установки запасного диска можно будет вернуться к первоначальной конфигурации.

Лучшая управляемость

Самые мощные средства управления системами RAID позволяют конечному пользователю определять местоположение данных на дисках, конфигурировать системы RAID и обеспечивать резервное копирование данных.

Средства управления фирм Hewlett-Packard, IBM и Compaq дают возможность динамически наращивать емкость систем RAID, т. е. добавлять новые накопители без выгрузки данных из массива, переформатирования дисков и возврата информации на них.

Расширение функциональных возможностей RAID идет в рамках общего процесса превращения их в товар широкого пользования. Разработчики контроллеров RAID, как и производители дисков, интегрируют все больше функций управления в свои продукты, позволяя пользователям обходиться без добавочных средств. В настоящее время производители уделяют внимание поддержке контроллерами RAID не только дисков, но и ленточных накопителей. Новые интеллектуальные контроллеры способны сами осуществлять резервное копирование данных.

Фирма Symbios примерно половину своего бюджета на исследования и перспективные разработки тратит на создание и развитие ПО управления RAID. За последние годы оно значительно усовершенствовалось, пройдя путь от средств со сложными командными строками до утилит с графическим интерфейсом, которые в ближайшем будущем будут базироваться на технологии Web. Впрочем, уже сейчас в некоторых системах имеются Web-интерфейсы; много таких решений должны появиться к концу текущего года.

Для разработки графических интерфейсов большинство компаний используют Java-средства. На выставке NetWorld + Interop, проходившей в мае нынешнего года в Лас-Вегасе, фирма AIWA Raid Technology представила Java-версию своей системы управления RAID. Во время демонстрации работы системы при инсценированных отказах диска и вентилятора в массиве, который был установлен в штаб-квартире фирмы во Флориде, управляющая рабочая станция в Лас-Вегасе вывела предупреждающее сообщение об этом событии с соответствующей записью в системном журнале. По данным фирмы AIWA, компании все больше нуждаются в возможности управлять массивами RAID, расположенными в разных географических регионах, из единого центра.

По мнению аналитиков в ближайшее время при выборе систем RAID пользователи будут обращать очень большое внимание на наличие у них средств управления на базе Web. Следующим шагом в развитии таких средств станет возможность их совместной работы с оборудованием RAID различных производителей. Множество крупных компаний, имеющих разнообразные системы RAID, испытывают определенные неудобства от использования разных средств управления для работы с ними. Конечно, единое управляющее средство необходимо. Промышленность работает в этом направлении, однако данный процесс сдерживается отсутствием стандартов на управление внешними системами.

Централизованное хранение данных

Немало пользователей хотели бы иметь централизованные хранилища данных. Для их построения в основном используются внешние (по отношению к серверу) дисковые массивы.

В настоящее время растет популярность систем RAID, подключаемых к нескольким хост-машинам одновременно. Их применение позволяет быстрее окупить затраты на хранение информации.

Обычно цена систем хранения данных составляет 35—40% стоимости сервера. Однако при централизации данных эта величина может достигнуть 70%. Надо признать: централизованное хранение данных на начальном этапе обходится довольно дорого, но в долгосрочном плане оно выгодно. Централизация имеет много преимуществ, например облегчение планирования использования дискового пространства.

Безусловно, централизация хорошо осуществима на базе больших ЭВМ и хост-машин Unix. Что же касается серверов Windows NT, то некоторые пользователи опасаются, что они недостаточно надежны для этого. При всей привлекательности идеи централизации они боятся, что в случае интеграции серверов Windows NT сбой в работе одного из них может повлечь за собой сбой другого.

Следующая проблема с централизацией информации на базе серверов Windows NT заключается в том, что они редко поддерживают приложения в рамках всего предприятия.

В отличие от больших ЭВМ и хостов Unix серверы Windows NT чаще всего используются в отдельных подразделениях, и, хотя идея централизации в целом весьма привлекательна, объединение информационных систем разнородных по профилю деятельности подразделений не всегда целесообразно. Кроме того, если подразделения удалены друг от друга на большие расстояния, то централизация их информационных ресурсов может быть очень невыгодной из-за высоких затрат на оплату трафика дальней связи.

Потребность в централизации информации стимулирует развитие новых концепций управления ею и организации ее хранения, таких, например, как концепция сети SAN (см. «Сеть SAN»).

Технология Fibre Channel

Идеи, подобные SAN, базируются на новой технологии Fibre Channel, которая дает возможность увеличить длину соединительных кабелей (хост—RAID), а также обеспечивает большие производительность и расширяемость дисковой подсистемы.

Несмотря на то что эта технология еще не получила широкого распространения, ряд производителей — Hewlett-Packard, Silicon Graphics, Sun Microsystems, Compaq и Dell — уже выпускают совместимые с ней продукты. Пользователи, планирующие приобретение систем хранения данных высокого класса, теперь должны рассматривать возможности внедрения и использования на своем предприятии технологии Fibre Channel.

Концепция SAN предусматривает применение Fibre Channel для связи хост—RAID. Но при этом возникает вопрос, как быть с многочисленными дисковыми массивами на базе технологии SCSI, функционирующими на современных предприятиях. За последние три года их было продано на 18 млрд долл. Можно ли SCSI-системы задействовать в сетях SAN? В качестве ответа на заданный вопрос поставщики оборудования для сетей SAN предлагают два способа интеграции средств SCSI и Fibre Channel: применение конвертеров SCSI—Fibre Channel и использование новых коммутаторов, поддерживающих как Fibre Channel, так и SCSI.

Одним из расхожих заблуждений, по мнению аналитиков, является мнение, будто внедрение Fibre Channel всегда повышает производительность информационно-вычислительной системы. Узким местом в ее работе может оказаться вовсе не подсистема RAID, а, к примеру, хост-адаптер, приложение само по себе или что-то еще. В результате можно заплатить немалые деньги за средства Fibre Channel и не получить взамен ничего. Поэтому очень важно сначала протестировать их в условиях, максимально приближенных к тем, где они будут применяться.

В то же время специалисты фирмы Clariion утверждают, что в подавляющем большинстве случаев узким местом в информационных системах являются именно массивы RAID, а значит, переход на Fibre Channel заметно повысит скорость ввода-вывода данных по сравнению с соответствующими показателями систем на базе SCSI.

У специалистов нет согласованности в отношении того, как использовать технологию Fibre Channel. Одни из них утверждают, что ее следует применять для связи дисков в пределах системы RAID и для соединения последней с сервером. Другие считают, что достаточно задействовать ее только для соединений хост—RAID.

Несмотря на все достоинства технологии Fibre Channel, на рынке дисковых систем для серверов сейчас преобладают средства Ultra SCSI, возможности которых вполне устраивают большинство предприятий, и у них нет существенных причин для немедленного внедрения Fibre Channel. В то же время аналитики едины во мнении, что при выборе системы хранения данных следует предусмотреть ее возможную модернизацию в будущем с целью перехода на Fibre Channel.

Нет еще полной ясности и в вопросе о совместимости между собой различных моделей массивов RAID, контроллеров, концентраторов и коммутаторов Fibre Channel. Для конечного пользователя выбор совместимого оборудования Fibre Channel пока еще является довольно сложной проблемой.


Получайте новости с raidshop на почту

Системы хранения данных RaidShop.ru © 2024
Данная информация не является публичной офертой, определяемой положениями статей 435,437 Гражданского Кодекса РФ