Руководство по технологии хранения RAID

Секция 1

Обзор RAID

Что такое RAID?

Резервный массив независимых дисков (RAID) – это технология хранения, которая объединяет несколько физических жестких дисков для создания логического диска с лучшей производительностью и надежностью, чем отдельные устройства. Это увеличивает скорость хранения и доступа к данным, предотвращая потерю данных и простои.

Технология RAID, первоначально известная как избыточный массив недорогих дисков, была разработана Рэнди Кацем, Дэвидом Паттерсоном и Гартом Гибсоном в 1987 году. Три ученых из Калифорнийского университета в Беркли пытались решить проблемы, которые часто приводили к получению данных. потери. Сегодня их создание, которое было улучшено и улучшено, позволяет упорядочивать данные на нескольких дисках и восстанавливать недостающую информацию в случае аппаратного сбоя одного или нескольких дисков..

Хотя традиционно он предназначен для серверов, RAID также используется на рабочих станциях, компьютерах с интенсивным хранилищем и других приложениях, которым требуется защита данных, высокая скорость передачи и большие объемы хранилища. Типичные приложения, где важны операции быстрого чтения и записи для больших файлов, включают редактирование видео, САПР, графический дизайн и т. Д..

Конфигурация RAID обеспечивает одно или сочетание следующих преимуществ.

Повышение производительности чтения / записи данных, что обеспечивает более быструю передачу.

Репликация данных на двух или более дисках для увеличения избыточности и предотвращения потери данных в случае сбоя диска.

Объединение нескольких дисководов для обеспечения большей емкости.

Как работает RAID?

RAID – это технология для настройки и поддержки различных комбинаций физических жестких дисков с целью повышения надежности, производительности и емкости. Он состоит из нескольких физических дисков и контроллера для их настройки и управления..

Существуют разные схемы RAID для распределения или репликации данных на разных дисках. Каждая из конфигураций обеспечивает уникальный баланс между емкостью, производительностью и отказоустойчивостью. Как правило, тремя основными понятиями являются чередование, отражение и четность. Каждый из них имеет свои достоинства и ограничения, но может быть объединен для лучшей производительности.

Чередование распределяет данные равномерно по нескольким физическим дискам, зеркальное копирование реплицирует данные на два или более дисков, в то время как контроль четности использует необработанные данные для вычисления и сохранения информации четности для исправления ошибок. За счет одновременной записи или доступа к информации в чередовании RAID повышает производительность, а зеркалирование позволяет получить доступ к данным с оставшихся исправных дисков в случае сбоя диска.

Когда я должен использовать RAID

RAID идеально подходит для приложений с высокой надежностью, а также для приложений, требующих больших объемов памяти или высокой скорости передачи данных. Все веб-сайты и критически важные онлайн и автономные приложения должны использовать RAID для повышения производительности, предотвращения потери данных или простоев..

Большинство современных серверов используют быстрые SSD-накопители, поэтому может не потребовать дальнейшего повышения производительности. Однако необходимо добавить избыточность, чтобы обеспечить надежность и доступность веб-сайта в случае сбоя диска. Для серверов, использующих старые медленные диски, может потребоваться использование уровня RAID, который сочетает в себе повышение производительности и избыточность данных. Для получения дополнительной информации о жестких дисках и жестких дисках прочтите наше руководство по размещению жестких дисков и жестких дисков..

Почти все физические серверы на виртуальном хостинге, VPS или выделенных серверах имеют жесткие диски, которые работают в конфигурации RAID. Обычно, по крайней мере, один из дисков настроен на четность, и все скопированные здесь данные имеют дополнительный бит, который помогает в восстановлении данных в случае сбоя на одном из дисков..

RAID на выделенных, VPS или общих серверах повышает производительность сервера и избыточность данных. Тем не менее, это не устраняет необходимость резервного копирования данных за пределами сайта, на случай вирусной атаки или аварии.

Как правило, большинство провайдеров используют RAID как для серверов, так и для систем резервного копирования. Это повышает уровень защиты данных и скорость восстановления данных в случае проблем с дисками на сервере или в резервном хранилище..

Хотя RAID изначально был предназначен для серверов, отдельные пользователи и пользователи с интенсивным использованием данных, такие как видео и аудио редакторы, могут использовать его для улучшения операций чтения и записи..

Использование RAID с Raid-контроллером

RAID-контроллер – это аппаратное устройство или программный драйвер для настройки и управления жесткими дисками в массиве. Он предоставляет интерфейс для объединения физических дисков и представления их в ОС как единого логического устройства..

Аппаратный RAID-контроллер – это физическое устройство, которое либо интегрировано в материнскую плату, либо доступно как дополнительная плата расширения PCI или PCI Express. Для аппаратного RAID контроллер запускает все и имеет свой процессор и память. Контроллеры предназначены для поддержки определенных интерфейсов жесткого диска и уровней рейдов. Например, существуют уникальные контроллеры для дисков SCSI, SATA, SAS или SSD, которые не являются взаимозаменяемыми.

Некоторые контроллеры оборудования имеют дополнительный кэш, чтобы избежать потери данных в случае сбоя питания, а также увеличить операции чтения и записи. Преимущества аппаратного рейда – лучшая производительность, поддержка загрузки с массива и лучшая абстракция. Тем не менее, они стоят дороже, и есть риск блокировки поставщика, так как большинство из них используют проприетарные прошивки.

Программный RAID использует операционную систему и существующее оборудование, такое как процессор компьютера и стандартные контроллеры SAS, IDE или SATA. Это более гибкий, менее затратный и доступный в большинстве серверных и настольных операционных систем. Однако установка часто связана с конкретной операционной системой и может быть несовместима с другими типами. Поскольку он использует вычислительную мощность компьютера и память, это может ухудшить производительность сервера. Другие ограничения включают невозможность загрузки с RAID-массива и отсутствие поддержки горячей замены, если только не используется совместимый аппаратный контроллер..

Раздел 2

Рейдовые уровни

Что такое уровни RAID?

Уровень RAID относится к технике распределения, организации и управления данными на нескольких дисках в массиве. Каждый уровень имеет различную отказоустойчивость, избыточность данных и свойства производительности, и выбор зависит от требований или целей, а также от стоимости. Некоторые уровни обеспечивают большую защиту данных, в то время как другие предлагают лучшее улучшение производительности, чем другие методы..

Как правило, все RAID-массивы классифицируются как стандартные, нестандартные или вложенные уровни в зависимости от конфигурации, типа и уровня улучшений, которые он предлагает..

Стандартные уровни RAID зависят от базовой и простой конфигурации. К ним относятся исходные уровни, от одного до пяти, плюс два других (0 и 6), которые были добавлены позже. Другие уровни выше этих определены как нестандартные. Однако уровень 0 иногда не считается RAID, поскольку он не обеспечивает избыточность.

Вложенный или гибридный RAID сочетает в себе стандартный уровень RAID, который обеспечивает избыточность с RAID 0 для повышения производительности передачи данных. Этот уровень требует больше драйверов, более качественных аппаратных контроллеров и более мощных компьютеров. Некоторые недорогие контроллеры и программные драйверы не поддерживают вложенный RAID. Это делает его более дорогим для реализации и часто идеальным для крупных предприятий и предприятий..

Нестандартные уровни RAID – это те, которые не зависят от базовой архитектуры или методов, используемых в традиционных уровнях RAID. Некоторые из них являются собственностью и используются только для определенных приложений. Они обеспечивают более высокий уровень производительности и обычно подходят для конкретных приложений..

Стандартные уровни RAID

Стандартные уровни RAID основаны на простых и базовых конфигурациях оборудования и идеально подходят для широкого круга компаний и частных лиц. Типичным стандартным уровнем является RAID 0, 1, 2,3,4,5 и 6. Каждый из них обеспечивает уникальное сочетание избыточности и производительности..

В то время как уровни 1, 5 и 6 обеспечивают некоторую степень отказоустойчивости, уровень 0 – это не самая высокая производительность. RAID 1 является наиболее надежным средством защиты данных, а уровень 5 обеспечивает наилучший баланс между производительностью, отказоустойчивостью и надежностью..

RAID 0

Уровень RAID 0 использует чередование блоков для распределения данных между несколькими физическими дисками. Это обеспечивает самую высокую производительность ввода / вывода, поскольку она записывает или копирует небольшие части файла на несколько дисков одновременно или с них..

Для него требуется минимум два физических диска и максимальный объем дискового пространства, который представляет собой общую емкость отдельных устройств. Однако он не обеспечивает избыточности данных или отказоустойчивости и лучше всего подходит для организаций, которые ищут производительность. Сбой любого из дисков в массиве RAID 0 приводит к полной потере данных, включая данные, сохраненные на исправных дисках.

Уровень RAID 0 лучше всего подходит для приложений, обрабатывающих некритические данные, но требует высокой производительности.

Схема настройки RAID 0

RAID 1

RAID 1 отражает данные на двух или более дисках без проверки четности. Для уровня требуется как минимум два диска, а общая полезная площадь равна размеру одного диска..

Все диски имеют идентичные копии данных. В случае сбоя диска система продолжает использовать существующий диск или диски в хорошем рабочем состоянии..

Уровень RAID 1 обеспечивает лучшую избыточность данных и идеально подходит для приложений, где доступность данных имеет решающее значение. Это простая технология с базовой отказоустойчивостью, но без улучшения производительности, поскольку она должна записывать данные дважды.

Это идеально подходит для приложений, в которых важны доступность и избыточность данных.

Схема настройки RAID 1

RAID 2

В RAID 2 используется чередование на уровне битов с четностью по сравнению с чередованием блоков в RAID 0. Кроме того, он использует код Хемминга для обнаружения ошибок и, следовательно, требует наличия дисков без возможности проверки ошибок собственного диска. Поскольку большинство современных дисков имеют эту функцию, уровень используется редко. Кроме того, требуется дополнительный диск для хранения информации о четности в целях обнаружения ошибок. Эффективная емкость диска n-1, где n – количество дисков.

RAID 2 работает как RAID 0, но использует чередование на уровне битов вместе с механизмом защиты от ошибок для защиты потери данных из-за повреждения. Это обширный ресурс и не широко используется.

Схема настройки RAID 2

RAID 3

RAID 3 использует чередование на уровне байтов с четностью для восстановления данных. Требуется минимум три диска, один из которых хранит информацию о четности. Уровень имеет высокую скорость передачи данных для больших файлов, так как доступ к данным осуществляется параллельно, но для небольших файлов медленнее..

Этот уровень лучше работает для длинных последовательных передач данных, таких как видео, но не в приложениях, где есть много запросов, таких как база данных. В случае сбоя диска с четностью невозможно восстановить данные. Уровень используется мало и, как и RAID 2, его полезная емкость n-1.

Схема настройки RAID 3

RAID 4

RAID 4 почти аналогичен RAID 3, но использует чередование на уровне блоков. Он объединяет чередование на уровне блоков между несколькими дисками с выделенным диском четности. Для уровня требуется минимум три диска, один из которых зарезервирован для информации о четности. Доступ к данным с каждого диска осуществляется независимо по одному блоку за раз, следовательно, медленные операции. Кроме того, операции записи выполняются медленнее, поскольку система должна записывать информацию о четности.

Это идеально подходит для последовательного доступа к данным. Однако диск четности может замедлить запись приложений. Уровень редко используется.

Схема настройки RAID 4

RAID 5

RAID 5 имеет чередование на уровне блоков наряду с распределенной четностью. Это экономичная всесторонняя конфигурация, которая обеспечивает баланс между избыточностью, производительностью и емкостью хранения..

Чередование повышает производительность операций чтения-ввода-вывода, а четность важна для восстановления данных в случае сбоя диска. Однако он не может выжить после нескольких сбоев дисков и занимает больше времени для восстановления данных, так как этот процесс включает в себя вычисление четности для каждого из доступных дисков. Требуется минимум три диска, но есть свободное место на диске n-1.

Уровень RAID 5 подходит для приложений и файловых серверов с ограниченными устройствами хранения.

Схема настройки RAID 5

RAID 6

RAID 6 использует чередование блоков, как RAID 5, но с двойной распределенной четностью. Два блока информации о четности обеспечивают дополнительную избыточность и отказоустойчивость. Этот уровень может пережить два одновременных сбоя диска. Однако это дорого; требуется не менее четырех дисков, в то время как свободное пространство составляет n-2.

Он более надежен и распространен в средах и приложениях SATA, таких как резервное копирование на диск и архивы данных, где требуется длительное хранение данных. Он также подходит для сред, где доступность данных важнее производительности.

Недостатки уровня 6 включают в себя дополнительный диск для информации о двойной четности, а также сложность реализации по сравнению с уровнем 5. Из-за двойной четности скорость записи и восстановления ниже..

Схема настройки RAID 6

Вложенные (гибридные) уровни RAID

Вложенный RAID – это комбинация уровня, который обеспечивает избыточность, и RAID 0, который повышает производительность. Это может использовать RAID-массивы или отдельные диски. Как правило, лучшая комбинация – RAID 0 поверх избыточного массива, поскольку в случае сбоя диска потребуется регенерировать меньше дисков..

Вложенные уровни обеспечивают лучшую производительность и более высокий допуск. Однако они требуют сложных конфигураций и большего количества дисков, в то время как эффективная емкость уменьшается вдвое. Они также дороги и имеют ограниченную масштабируемость.

Общие уровни включают в себя 0 + 1, 1 + 0 (10), 0 + 3, 3 + 0 (30), 0 + 5, 5 + 0 (50) и 6 + 0 (60)

RAID 0 + 1

RAID 0 + 1 объединяет RAID 0 и 1 для обеспечения избыточности и повышения производительности. Процесс начинается с чередования данных на нескольких дисках, что повышает производительность, а затем выполняется зеркалирование для обеспечения избыточности данных..

RAID 0 + 1 требует как минимум четырех физических жестких дисков и представляет собой сложную конфигурацию, которая обеспечивает высокую производительность и отказоустойчивость. Он может выдержать более одного сбоя диска в одном и том же зеркальном наборе, если нет одновременного сбоя двух зеркальных дисков.

Для этого уровня требуется количество дисков, кратное двум, но общая полезная емкость обычно составляет половину общего дискового пространства. Кроме того, это дороже и не легко масштабируется.

Вложенная конфигурация RAID 01

Вложенная конфигурация RAID 01

Гибридная конфигурация RAID 01

Гибридная конфигурация RAID 01

RAID 1 + 0

RAID 1 + 0 или RAID 10 начинается с зеркального отображения данных перед их разделением по зеркальным массивам. Такой подход делает его более избыточным, надежным и эффективным, чем RAID 0 + 1, и может выдерживать многочисленные отказы дисков. Для него требуется минимум четыре диска, и он может выдержать несколько одновременных сбоев дисков, если ни одно из зеркал не потеряет все диски.

RAID 1 + 0 имеет лучшую отказоустойчивость, избыточность данных и восстановление по сравнению с RAID 0 + 1. Однако это очень дорого и, как и 0 + 1, имеет ограниченную масштабируемость. Уровень идеально подходит для организаций, которым нужна высокая производительность и безопасность данных. Полезная емкость составляет половину установленного дискового пространства..

Схема настройки RAID 1 + 0

RAID 0 + 3

Это также называется RAID 53 и состоит из массива Raid 0, объединенного в массив RAID 3. Кроме того, он имеет выделенный массив четности, который распределяется по дискам..

Уровень имеет высокие скорости передачи данных и отказоустойчивость, предлагаемые сегментами RAID 3. Этот уровень обеспечивает высокую устойчивость и отличную производительность при последовательном и случайном чтении и записи. Тем не менее, это более сложный и дорогой, так как требует больше дисков.

К сожалению, уровень дорогой и требует дисков со шпинделями, которые должны быть синхронизированы вместе. Это может ограничить выбор дисков для использования.

Схема настройки RAID 0 + 3

RAID 5 + 0

RAID 5 + 0 или RAID 50 объединяет распределенную четность RAID 5 с чередованием RAID 0. Он состоит из двух или более массивов RAID 5, в которых данные и информация о четности в массивах распределяются по дискам. Требуется минимум шесть физических дисков, что обеспечивает улучшенную защиту данных, производительность записи, а также более быстрое восстановление по сравнению с RAID 5. Поэтому оно идеально подходит для приложений, где важна высокая доступность.

Отказ одного диска повлияет только на этот массив и не приведет к снижению производительности, как это происходит в RAID 5. Кроме того, он может выдерживать до четырех отказов дисков, если каждый находится в отдельном массиве RAID 5. Тем не менее, это требует сложного контроллера RAID.

Схема настройки RAID 0 + 5

JBOD RAID N + N

JBOD (Just Bunch Of Disks) объединяет несколько дисков, которые он представляет в ОС, как один диск с большей емкостью, но без резервирования. В отличие от других уровней RAID, эта схема позволяет получить доступ к отдельным дискам отдельно. Это на самом деле не уровень RAID, а просто договоренность.

JBOD состоит из нескольких стандартных дисков, которые могут иметь разные размеры. Общая емкость – это сумма отдельных дисков, которую можно увеличить, просто добавив дополнительный диск. Как и RAID 0, он обеспечивает лучшую производительность, так как у него нет четности, что увеличит накладные расходы. Тем не менее, он не имеет защиты данных, и каждый диск является потенциальной точкой отказа. Поэтому он идеально подходит для приложений с интенсивным вводом-выводом и тех, которые требуют больше памяти.

Схема установки диска JBOD

Нестандартные уровни RAID

Нестандартные уровни RAID основаны на архитектурах или алгоритмах, отличных от стандартных RAID. Некоторые основаны на системах с открытым исходным кодом, в то время как другие полагаются на проприетарные технологии и предлагаются только определенными поставщиками для конкретных приложений..

Те, которые используют запатентованное аппаратное и программное обеспечение и могут быть несовместимы с другими системами разных производителей. Примеры включают RAID-3D Pure Storage и XtremIO Data Protection (XDP) Dell EMC..

Нестандартные уровни RAID обеспечивают лучшую производительность и отказоустойчивость, чем стандартные уровни. Они используются для специализированных приложений, которые требуют большей доступности и надежности, чем может предложить стандартный уровень.

RAID 3D

Это проприетарный RAID, разработанный Pure Storage и использующий флэш-диски вместо жестких дисков. Обычно это используется для предотвращения потери данных в случае сбоя компонента во флэш-памяти. Благодаря более высокой скорости передачи в твердотельных накопителях массив обладает высокой производительностью ввода-вывода. Если RAID 3d обнаруживает сбой устройства, который часто вызывает задержки ввода / вывода, он перестраивает данные с других устройств в той же группе четности.

Улучшенный RAID 1E

RAID 1 Enhanced (RAID 1E) объединяет зеркалирование и распределение данных между несколькими дисками. Он почти аналогичен RAID 1, но имеет чередование и требует нечетного количества дисков, из которых минимум 3 диска. Усовершенствованный RAID 1E отражает всю полосу данных на другую полосу в наборе дисков, и его иногда называют зеркальной полосой. Благодаря зеркалированию этот уровень имеет хорошую избыточность данных.

Схема настройки RAID 1E

Улучшенный RAID 5 E

RAID 5 E – это вариант RAID 5, но с дополнительным горячим резервным диском. Горячий резерв обычно активен в ожидании сбоя другого диска. Как только происходит сбой, горячий резерв становится доступным для восстановления данных. Для RAID 5E требуется не менее четырех дисков и производительность выше, чем у традиционного RAID 5. Однако невозможно разделить запасной диск между массивами. Кроме того, он страдает от медленного восстановления.

Схема настройки RAID 5E

Раздел 3

Плюсы и минусы RAID

Преимущества использования RAID

Преимущества системы RAID варьируются в зависимости от уровня. Массив может повысить производительность, отказоустойчивость или избыточность данных, но уровень улучшения зависит от типа конфигурации и количества дисков. Как правило, массив обеспечивает одно или несколько преимуществ, но не все максимумы одновременно.

  • Предотвращение потери данных в случае сбоя диска: RAID с избыточностью данных обеспечивает лучшую непрерывность бизнес-операций. В таких системах сбой диска не влияет на приложения или доступ к данным, поскольку сервер будет использовать оставшиеся исправные диски. Кроме того, замена неисправного диска в RAID-массивах с возможностью горячей замены не требует выключения или прерывания операций. Больше дисков обеспечивают лучший уровень отказоустойчивости.
  • Улучшение скорости чтения / записи следовательно, производительность серверов или компьютеров, таких как рабочие станции для редактирования видео и других приложений, интенсивно использующих данные. Однако это будет зависеть от уровня RAID и количества физических дисков..
  • Увеличение емкости с помощью простых и дешевых дисков: Это более выгодно, чем покупка большого одиночного диска.
  • Повышение отказоустойчивости благодаря использованию нескольких дисков.

Снижение затрат и повышение надежности: Используя несколько менее дорогих дисков меньшего размера, массив позволяет увеличить емкость при меньших затратах, чем приобретение одного жесткого диска большой емкости..

Недостатки использования RAID

Хотя существуют разные уровни RAID для удовлетворения различных потребностей в хранении данных, технология подвержена ряду сбоев, которые могут привести к потере или простою данных. К недостаткам можно отнести:

  • Поскольку диски RAID обычно находятся внутри сервера в одном и том же центре обработки данных, авария может повредить диски или весь массив, что может привести к уничтожению всех данных. Другие системы, такие как CDP, хранят данные на удаленных дисках, следовательно, добавляя дополнительный уровень защиты в случае аварии.
  • Хранилище RAID содержит текущую версию данных, что упрощает восстановление в случае сбоя. Однако восстановить более старую версию файла невозможно, особенно если произошла вирусная атака, ошибочные изменения файлов или вредоносные правки..
  • При большей емкости дисков RAID подвергается длительным перестроениям при сбое одного или нескольких дисков. Восстановление тома RAID занимает больше времени в случае сбоя, а в случае сбоя других дисков до завершения восстановления все данные будут невосстановимыми. Это также увеличит время простоя.
  • Реализация RAID-массива стоит дорого, поскольку требует нескольких дисков. Для RAID, обеспечивающего избыточность, невозможно использовать полную емкость. Полезное пространство часто меньше, чем общая установленная емкость.
  • Сложный и не подлежит передаче. Хотя аппаратные контроллеры или RAID-боксы можно передавать, программные RAID-массивы не.
  • Требуются навыки работы с ИТ и знание технологий. Поскольку таким организациям может потребоваться больше денег для обучения их персонала или найма сторонних поставщиков услуг, особенно для восстановления данных или устранения неисправностей.

Вывод

RAID продолжит предлагать преимущества производительности и защиты данных еще несколько лет. Однако требуются новые стратегии, чтобы сделать его более эффективным и совместимым с появляющимися технологиями и потребностями. В настоящее время существуют критические требования к хранилищу, выходящие за рамки существующих технологий RAID..

Некоторые производители уже используют новые подходы для удовлетворения растущих и меняющихся потребностей, а также для решения современных дисковых технологий и ограничений. Например, вместо использования RAID 0 для повышения производительности современные системы могут использовать DRAM, флэш-кэш, многоуровневое автоматическое хранение (AST) и другие технологии, такие как широкое чередование.

Современные диски, такие как SSD, больше и быстрее. Это устраняет необходимость чередования данных для повышения производительности. Однако для более крупных дисков требуется более длительное время восстановления, которое может составлять от 4 часов до нескольких дней для жесткого диска емкостью 2 ТБ..

Таким образом, организациям, обрабатывающим большие объемы данных, например, в масштабе петабайт, потребуются разные стратегии. Они должны быть направлены на повышение эффективности RAID, позволяя ему конкурировать с существующими и будущими альтернативами, такими как кодирование стирания и непрерывная защита данных (CDP)..

Кодирование стирания начинается с разбивки данных на фрагменты; затем он расширяет и кодирует их с избыточными частями данных. Затем они хранятся на разных носителях и в разных местах. Технология имеет небольшие накладные расходы по сравнению с традиционным RAID. Для восстановления данных требуется меньше времени и накладных расходов. Тем не менее, он интенсивно использует процессор и имеет большую задержку по сравнению с RAID.

В перспективе один из подходов – сохранить защиту данных, обеспечиваемую физическим хранилищем на основе RAID, а затем виртуализировать ее. Такое расположение создаст виртуальный том, который не зависит от конкретной конфигурации оборудования. Репликация таких томов в разных местах снижает потенциальный риск полного отказа в случае аварии или другого критического отказа.

Jeffrey Wilson Administrator
Sorry! The Author has not filled his profile.
follow me