Часто задаваемые вопросы по HDD и RAID

13.09.2006

Часто задаваемые вопросы

По долгу работы нашим сотрудникам приходится ежедневно отвечать на вопросы пользователей, поэтому имеет смысл привести наиболее популярные из них.

Какие операционные системы поддерживают RAID
Какого объема кэш необходимо иметь на контроллере
Как правильно выбрать режим работы кэша
Возможно ли улучшить производительность чтения длинных файлов
Как определить состояние контроллера при зависании сервера
Чем отличаются модели MYLEX DACPG и MYLEX DACPJ
чем отличаются модели DACPG/PJ и серия AcceleRAID
Какими средствами можно конфигурировать RAID
Подключение внешних устройств
Как предупредить выход HDD из строя
Как предпочтительнее производить замену диска
Что такое LUN (лун)
Что такое "bad stripes"
Общая последовательность действий при отказе винта в RAID
Что такое HBA

Какие операционные системы поддерживаются RAID

Внутренние RAID-контроллеры фирмы Mylex совместимы со стандартной ПК платформой, сертифицированы и имеют драйвера для работы со следующими ОС:

Novell NetWare 3.12, 4.xx, 5.xx
SCO Unix OSR 5.x
SCO UnixWare 2.1, 7.x
SUN Solaris 2.x, 7.x
Linux
MS Windows NT 3.51, 4.0
MS DOS, Windows 95/98/2000
IBM OS/2

Как правило, необходимые драйвера входят в комплект поставки как самой операционной системы, так и в комплект DAC Software kit, обязательно поставляемый вместе с описанием настройки и конфигурации RAID-контроллера. Если не сказано иное, выбирать нужно драйвер, имеющий более свежую дату создания. При этом полезно также посетить и сайт Mylex, почти наверняка там окажется еще более свежая версия. Учитывая появление драйверов под Linux, можно предположить и скорое появление драйверов для BSD.

Внешние RAID-контроллеры (SUI, SXI, SF, FL, FF ) опознаются ОС, как дисковые накопители и никаких дополнительных драйверов не требуют, что позволяет их использовать с любой операционной системой.
WIDTH="20" HEIGHT="40">

Какого объема кэш необходимо иметь на контроллере

2MB кэш-памяти всегда используется для работы процессора контроллера, а остальное отдается под кэширование данных, поэтому чем больше кэш, тем лучше — кэшем контроллер не испортишь. Но чтобы реально подойти к оптимальному выбору объема кэш-памяти, необходимо хотя бы приблизительно представлять себе, какой обьем оперативной информации постоянно работает с дисковой системой. Четких рекомендаций здесь быть не может, но из собственного опыта работы посоветуем, чтобы объем дискового пространства в GB и объем кэш-памяти в MB представляли величины хотя бы одного порядка.

Кэш-память контроллеров серий PG, PJ и AcceleRAID имеет 40-битовую организацию для коррекции ошибок и при начальной загрузке BIOS контроллера выдает сообщение вида "xxxMB ECC", что говорит о нормальной работе контроллера с возможностью коррекции ошибок. Другими словами, требуемая для работы контроллера память является нестандартной и не может быть заменена на обычные модули третьих производителей.

Как правильно выбрать режим работы кэша

У кэша RAID-матрицы есть два режима работы: сквозная запись (Write Through) и отложенная запись (Write Back). При первом режиме контроллер не дает подтверждения записи, пока данные не попали на диски, при втором достаточно того, чтобы данные попали в кэш. Второй режим помогает значительно увеличить производительность RAID-системы. Особенно это сказывается при наличии большого кэша и режима записи/чтения маленьких объемов информации. Существенный недостаток его в том, что при потере питания на контроллере или аппаратной перезагрузки информация безвозвратно теряется, так и не попав на диски. Здесь возможны три варианта: отказ от дополнительного быстродействия RAID-системы в пользу надежности; пренебрежение возможностью потерять данные из кэша в пользу производительности; приобретение дополнительного устройства BBU (cache Battery BackUp) для питания и регенерации содержимого кэш-памяти в случае аппаратного отказа более высокого уровня (контроллер, материнская плата, блок питания, UPS).

Возможно ли улучшить производительность чтения длинных файлов

Да. Жесткие диски показывают плохую производительность при чтении случайных секторов. Можно повысить этот показатель, если читать предполагаемый сектор заранее. Для этого в конфигурационной утилите контроллера существует опция "чтение вперед" (Read ahead). Если в данных имеются часто используемые длинные файлы необходимо установить параметр с состояние "активно".

Как определить состояние контроллера при зависании сервера

Какими бы ни были надежными сервера и операционные системы, нельзя быть уверенным, что система не зависнет. Самое неприятное в этой ситуации — необходимость делать аппаратную перезагрузку, не представляя себе, что происходит с дисковой системой. Предотвратить эту ситуацию можно при аппаратной установке RAID. На плате контроллера имеется разъем для трех индикаторов: активность SCSI-шины, активность шины PCI (EISA), "полный кэш" (данные в кэше еще не попали на диск). Желательно последний из них вывести на светодиод корпуса сервера. По состоянию этих индикаторов можно определить активность контроллера. При "чистом" кэше можно смело делать перезагрузку, не опасаясь потери данных. По рекомендации производителя необходимо выждать не менее 15 сек. после зависания или не менее 3 сек. после выключения индикатора "полный кэш", прежде чем делать перезагрузку. Разумеется, все это относится к случаю использования режима Write Back без установленного модуля BBU. При наличии BBU содержимое кэш-памяти сохраняется и после перезагрузки автоматически переносится на жесткие диски.

Чем отличаются модели MYLEX DACPG и MYLEX DACPJ

Это практически идентичные по функциональным возможностям серии контроллеров для шины PCI с каналами UltraWIDE SCSI. Принципиальное различие в типе RISС-процессора. На модели PG установлен более экономичный i960RP 33MHz, а на модели PJ — более производительный i960RD 66MHz. Кроме того, для дальнейшего повышения производительности управление кэш-памятью в модели PJ перенесено из firmware в отдельный кристалл контроллера памяти 86238. В соответствии с этим серия PG больше подходит для решений с упором на экономичность, в то время как серия PJ ориентирована на максимальное быстродействие.

Чем отличаются модели DACPG/PJ и серия AcceleRAID

Новая экономичная серия контроллеров AcceleRAID 150 и 250 создана на базе DAC960PG и PJ соответственно, т.е. использует одинаковые с ними процессоры, микросхемы поддержки и алгоритмическую реализацию. Серия AcceleRAID ориентирована на минимальный бюджет, поэтому собрана на плате половинной длины, для чего разработчикам пришлось ограничиться всего лишь одним SCSI каналом и отказаться от возможности установки BBU. Правда, взамен за это пользователь получает уже не UltraWIDE SCSI, а в два раза более производительный канал Ultra2. Кроме того, контроллер может использовать имеющиеся на материнской плате канальные SCSI процессоры Symbios для организации дополнительных RAID-каналов, превращаясь таким образом в 2-х или даже 3-канальный.

Какими средствами можно конфигурировать RAID

С любым RAID-контроллером должна поставляться утилита конфигурации под MS-DOS (daccf.exe). После физической установки RAID-контроллера можно загрузиться с дискеты или дополнительного винчестера и запустить утилиту. После создания матрицы и системных дисков всю конфигурацию можно сохранить на дискете прямо из программы. После окончания работы и перезагрузки получаются готовые для работы системные диски.

В контроллерах 5-го поколения (PG, PJ , AcceleRAID 170, AcceleRAID 170LP, AcceleRAID 352) и выше эта же конфигурационная утилита присутствует в BIOS самого контроллера и может вызываться по Alt-R при начальной загрузке.

Чтобы не перегружать работающий сервер для запуска конфигурационной утилиты, в стандартный комплект поставки входит также и клиент-серверное ПО GAM (Global Array Manager), с помощью которого администратор со своего рабочего места имеет возможность выполнения всех функций точной настройки и мониторирования дискового массива с ведением журнала ошибок, а также отправкой сообщений на факс, пейджер или по E-mail.

Подключение внешних устройств

Учитывая малый размер задней планки (bracket), производитель был вынужден отказаться от использования распространенных разъемов Micro DB-68 и применить сверхминиатюрные разъемы UHD (Ultra High Density). Таким образом, внешний соединительный кабель со стороны контроллера должен иметь разъем UHD, а с другой стороны — любой удобный пользователю, обычно Micro DB-68.

Как предупредить выход HDD из строя

Вылет нескольких дисков разом в 99% случаев бывает либо по причине внешнего воздействия, либо по причине несовместимости, либо по причине кабельной системы. Мониторинг SMART тут никак не поможет.

Еще одна плохая ситуация - это наличие логических или физических бэдов на одном или нескольких дисках. Если при этом вылетает другой винт, информацию на нем просто не из чего ребилдить. Но это легко предотвращается периодической верификацией массива, батарейкой на контроллере и выключением кэша на дисках.

Как предпочтительнее производить замену диска

Теоретически - надежнее с выключенным питанием. Практически - без разницы. RAID-массив не влияет на отказоустойчивость. Он влияет на доступность данных при выходе из строя одного или нескольких дисков в массиве. На отказоустойчивость влияет наличие бэкапов на внешних устройствах.

Что такое LUN (лун)

LUN - Logical Unit Number

В сказевых системах (а также FC, SAS и практически всех рэйд контроллерах, даже SATA) используется следующая схема адресации устройств - шина (Bus) - адрес (ID) - подадрес (LUN). Аналогия простая: улица - дом - квартира.

Понятие лунов введено в скази стандарт, т.к. существует много систем, где на одном адресе сидит много разных устройств. Например, внешние дисковые системы, которые цепляются к серверу одним кабелем - один порт имеет один адрес. Вот чтобы на этом одном адресе видеть кучу дисков и нужны луны.

Луном может быть не только логический диск. Это может быть например мониторинговый SES процессор или сам контроллер (для управления непосредственно через шину, без Ethernet хвоста).

Что такое "bad stripes"

Кратко - это значит, что на дисках имеются сбойные блоки, информацию из которых контроллер не способен восстановить.
Это может быть:

бэд блок на винте, если массив degraded (т.е. парити для этого блока просто нет).
бэд блоки на двух и более винтах с одинаковыми адресами (т.е. разрушен одновременно и блок данных, и соответствующий ему блок парити).
аналогично предыдущему, но повреждения не физические, а логические (например вследствие краха питания при включенном кэше дисков или контроллера, при отсутствии BBU).

Такое может случиться с любым рэйд контроллером, не только адаптек. Просто адаптек в таком случае не объявляет массив "dead", а помечает блоки как сбойные и сигнализирует админу, давая возможность успеть разобраться (т.е. сбэкапить то, что еще можно).

Диски и контроллер при этом могут быть исправны.

Вылечить это НЕВОЗМОЖНО. В принципе невозможно. Можно только предотвратить.
Во избежание подобных разрушений:

выключать кэш на дисках.
всегда использовать BBU при включенном write back кэше контроллера.
периодически (хотя бы раз в месяц) прогонять верификацию массива (при этом мелкие повреждения будут автоматически выявлены, перевычислены и перезаписаны, диск же отремапится).

Общая последовательность действий при отказе винта в RAID

Отключаем отказавший винт, вытаскиваем из сервера.
Подключаем отказавший винт к "просто" SCSI-контроллеру (HBA, не RAID) и проверяем утилитой вендора винта.
Если винт исправен - подключаем его обратно и делаем Rebuild, либо, если был hot-spare - помечаем как hot-spare именно этот винт.Если неисправен - меняем на заведомо исправный, потом делаем то, что описано выше в п.3 для исправного.
Очень желательно - выполняем Check Consistency/Verify/как оно еще называется у вендоров, смысл - проверка целостности массива.

Чего делать ни в коем случае нельзя:

вытаскивать и быстро вставлять обратно винт: помните, и у контроллера, и у SAF-TE процессора корзины есть время между опросом винтов, и если Вы умудритесь сделать описанное выше за меньшее, чем это, время - реакция контроллера может быть непредсказуемой: с большой вероятностью массив просто развалится. Просто подождите от 30 секунд до минуты, прежде чем вставлять винт обратно.
переставлять на Degraded или Failed массиве винты местами: Drive Roaming - фича, позволяющая контроллеру опознавать принадлежность винтов к конкретным массивам при смене SCSI ID - не работает, и если Вы забудете, где какой винт стоял (а это, поверьте, совсем не сложно) - убьете информацию на массиве.

Что такое HBA

HBA - Host Bus Adapter. Простой контроллер, который ставится в сервер и имеет наружу или внутрь интерфейс нужного типа (SCSI , SAS, FibreChannel ...). Примеры - Adaptec 29320А, Adaptec 29320АLP, Qlogic QLA2460 . Применяется обычно для подключения разного рода стримеров, внешних дисковых массивов.

Часто также подключаются диски, если не требуется функционал, надежность и производительность полноценных RAID контроллеров.

Иногда имеет примитивные рэйдовые функции (страйп, зеркало). Но работают такие "hostraid'ы" далеко не всегда стабильно.

Получайте новости с raidshop на почту


Получать спец. предложения компании о распродажах (1 раз в месяц в среднем)	Получать новости по мере выхода (1 раз в день в среднем) Получать еженедельный IT-дайджест новостей