Практичні поради щодо створення RAID-масивів на домашніх ПК. Що таке RAID та з чим його їдять.

Дисковий масив із нотками ретро.

На плечах RAID-контролерів лежить відповідальне завдання - керування дисковою підсистемою, тобто усією інформацією, що зберігається на сервері. Саме вони відповідають за роботу дискових масивів, дозволяючи підвищити продуктивність сервера або надійність зберігання даних. Тому давайте поговоримо про RAID-контролери, встановлені в сервери вендорів «великої трійки», про їх можливості та особливості.

Що таке RAID-контролер?

Найчастіше завдання, що виконуються серверами, вимагають високої швидкості читання/запису даних та/або необхідність зберегти дані при виході з експлуатації самих накопичувачів. Тому установка на сервер єдиного диска рідко має сенс. Цей варіант можна розглядати, якщо навантаження буде зовсім невеликим, а збереження даних не хвилює зовсім. Та й обсяги інформації, якими оперують сервери, часто вимагають значно більше місця для зберігання, ніж може дати один диск. А чим більше накопичувачів, тим вища ймовірність виходу з ладу, особливо при високому навантаженні.

Проблеми продуктивності та відмови стійкості дискової підсистеми вирішуються за допомогою створення масивів: логічних структур, в які за допомогою RAID-контролера об'єднується кілька накопичувачів. жорстких дисківта SSD. При цьому масив виглядає для системи єдиним простором для зберігання даних.

Існує багато видів масивів, що відрізняються продуктивністю, надійністю зберігання даних та мінімально необхідною кількістю дисків. Вибір конкретного виду залежить від ваших завдань і потреб, а також від можливостей RAID-контролера.

RAID-контролери діляться на:

Програмні. Все навантаження управління масивом лягає на центральний процесор. Найменш продуктивне та відмовостійке рішення.
Інтегровані. Вбудовані в материнську плату. Окремий чіп виконує частину завдань з управління, але все ж таки теж задіює центральний процесор. Інтегровані контролери можуть мати власну кеш-пам'ять. У порівнянні з програмними, підтримують більше видів масивів, працюють куди швидше та надійніше.
Апаратні. Виконані у вигляді плат розширення або окремих пристроїв, що розміщуються поза сервером (зовнішні або мостові контролери). Оснащені власним процесором, який виконує всі необхідні обчислення, і, як правило, кеш-пам'яттю. Модульні контролери можуть мати зовнішні та внутрішні порти:
- Внутрішні - призначені для підключення накопичувачів, встановлених у сервер.
- Зовнішні – використовуються для підключення зовнішніх дискових сховищ.

Навіть якщо ваш сервер оснащений інтегрованим RAID-контролером, то при необхідності можна буде встановити і модульний, якщо наявних можливостей, швидкості та надійності вам буде недостатньо.

Якщо на борту RAID-контролера є кеш-пам'ять, то вона може використовуватися для проміжного зберігання даних, що записуються або зчитуються. Це дозволяє ефективно управляти операціями введення/виводу.

Щоб при збої живлення не втратити дані, що знаходяться в кеші, використовується два різні підходи:

контролер оснащується власною батареєю (BBU - Battery Backup Unit), що дозволяє зберігати дані в пам'яті до 3 діб,
або додатковою флеш-пам'яттю, що живиться від ємного конденсатора. При збої живлення до неї вивантажує вміст кеша. А оскільки флеш-пам'ять споживає дуже мало енергії, то дані в ній зберігаються місяцями. Зверніть увагу, що флеш-пам'ять використовується лише при збої живлення.

І як тільки сервер запрацює, контролер насамперед скидає вміст кешу на диск. За наявності батарейки можна активувати режим WriteBack: при записі на диск контролер повідомить про успішне виконання операції вже в той момент, коли дані потраплять у кеш, а потім у фоновому режимі скине їх на диски. Тому інші процеси проведуть менше часу в очікуванні на підтвердження.

Деякі RAID-контролери дозволяють збільшити обсяг кеш-пам'яті та встановити батарейку, якщо вони її не мають. Чим більший розмір кеша контролера, тим вища продуктивність RAID-масивів.

RAID-контролери в серверах "великої трійки"

Щоб не перетворювати статтю на археологічне дослідження, обмежимося лише тими контролерами, що використовуються в поколіннях серверів, починаючи з 2009-2010:

HP: Gen7, Gen8, Gen9
Dell: Gen11, Gen12, Gen13
IBM: M3, M4, M5

Більшість RAID-контролерів HP та Dell спочатку підтримують усі основні види масивів. У IBM таких моделей - на пальцях перерахувати, майже в кожному випадку доведеться встановлювати на контролер 1-2 додаткових модулівапгрейду, що не надто зручно.

Інша цікава особливість RAID-контролери IBM - більшість з них застосовуються в серверах декількох поколінь. У HP і Dell інша схильність - з випуском нового покоління серверів зазвичай випускають і нове покоління контролерів.

Як вибрати відповідний контролер?

Якщо ви вирішили апгрейдити сервер і подбали про вибір RAID-контролера, то в першу чергу виходьте з ваших потреб.

Вам потрібна хороша продуктивність, але не хвилює збереження даних? Чи хочеться з невеликими зусиллями підвищити відмовостійкість, поступившись швидкістю? Знадобився простий веб-сервер для потреб розробки? Досить вибрати недорогий контролер та створити RAID 0 або 1. Можна навіть без кеш-пам'яті.

За бажання заощадити на накопичувачах або вичавити всю можливу ємність з наявних, розгляньте варіант з RAID 5 або 50. Це цілком придатне рішення для створення архівів. Для таких завдань достатньо взяти контролер із підтримкою потрібного вигляду RAID та кеш-пам'яттю середнього об'єму.

При створенні високошвидкісних та надійних масивів під бази даних, або великих сховищ під файлові сервери, потрібні продуктивні контролери з великим обсягом кеш-пам'яті та високою пропускною здатністю. Це той випадок, коли економія на одному пристрої може звести нанівець всі ваші зусилля.

Теги: Додати теги

Якщо Ви зацікавилися цією статтею, то Ви, мабуть, зіткнулися або припускаєте незабаром зіткнутися з однією з наведених нижче проблем на Вашому комп'ютері:

- явно не вистачає фізичного обсягу вінчестера як єдиного логічного диска. Найчастіше ця проблема виникає під час роботи з файлами великого обсягу (відео, графіка, бази даних);
- явно не вистачає продуктивність вінчестера. Найчастіше ця проблема виникає під час роботи з системами нелінійного відео монтажу або одночасному зверненні до файлів на вінчестері великої кількості користувачів;
- явно не вистачає надійності вінчестера. Найчастіше ця проблема виникає при необхідності працювати з даними, які в жодному разі не можна втратити або які повинні бути доступні для користувача. Сумний досвід показує, що навіть найнадійніша техніка іноді ламається і, як правило, в самий не підходящий момент.

Вирішити ці та деякі інші проблеми може створити на вашому комп'ютері RAID-системи.

Що таке "RAID"?

У 1987 році Паттерсон (Patterson), Гібсон (Gibson) і Катц (Katz) з Каліфорнійського університету Берклі опублікували статтю "Корпус для надлишкових масивів з дешевих дисководів (RAID)". У цій статті описувалися різні типидискових масивів, що позначаються скороченням RAID - Redundant Array of Independent (або Inexpensive) Disks (надлишковий масив незалежних (або недорогих) дисководів). В основу RAID покладено таку ідею: об'єднуючи в масив кілька невеликих та/або дешевих дисководів, можна отримати систему, що перевершує за обсягом, швидкості роботи та надійності найдорожчі дисководи. До того ж така система з погляду комп'ютера виглядає як єдиний дисковод.
Відомо, що середній час напрацювання на відмову масиву дисководів дорівнює середньому часу напрацювання на відмову одиночного дисководу, поділеного на кількість дисководів у масиві. Внаслідок цього середній час напрацювання на відмову масиву виявляється занадто малим для багатьох програм. Однак дисковий масив можна декількома способами зробити стійким до відмови одного дисководу.

У вищезгаданій статті було визначено п'ять типів (рівень) дискових масивів: RAID-1, RAID-2, ..., RAID-5. Кожен тип забезпечував стійкість на відмову, і навіть різні переваги проти одиночним дисководом. Поряд з цими п'ятьма типами популярність набув також дисковий масив RAID-0, що не має надмірності.

Які існують рівні RAID та який із них вибрати?

RAID-0. Зазвичай визначається як НЕ надлишкова група дисководів без контролю парності. RAID-0 за способом розміщення інформації з дисководів, що входять до масиву, іноді називається "Striping" ("смугастий" або "тільник"):

Оскільки RAID-0 не має надмірності, аварія одного дисководу призводить до аварії всього масиву. З іншого боку, RAID-0 забезпечує максимальну швидкість обміну та ефективність використання об'єму дисководів. Оскільки для RAID-0 не потрібні складні математичні чи логічні обчислення, витрати на його реалізацію є мінімальними.

Область застосування: аудіо- та відео програми, що вимагають високої швидкості безперервної передачі даних, яку не може забезпечити одиночний дисковод. Наприклад, дослідження, проведені фірмою Mylex, з метою визначити оптимальну конфігурацію дискової системидля станції нелінійного відео монтажу показують, що, порівняно з одним дисководом, масив RAID-0 із двох дисководів дає приріст швидкості запису/читання на 96%, із трьох дисководів – на 143% (за даними тесту Miro VIDEO EXPERT Benchmark).
Мінімальна кількість дисководів у масиві "RAID-0" – 2шт.

RAID-1. Більш відомий як "Mirroring" ("Дзеркалювання") - це пара дисководів, що містять однакову інформацію та складають один логічний диск:

Запис проводиться на обидва диски в кожній парі. Тим не менш, дисководи, що входять до пари, можуть здійснювати одночасні операції читання. Таким чином, «дзеркалювання» може подвоювати швидкість читання, але швидкість запису залишається незмінною. RAID-1 має 100% надмірність і аварія одного дисководу не призводить до аварії всього масиву - контролер просто перемикає операції читання/запису на дисковод, що залишився.
RAID-1 забезпечує найвищу швидкість роботи серед усіх типів надлишкових масивів (RAID-1 - RAID-5), особливо в розрахованому на багато користувачів оточенні, але найгірше використання дискового простору. Оскільки для RAID-1 не потрібні складні математичні чи логічні обчислення, витрати на його реалізацію є мінімальними.
Мінімальна кількість дисководів у масиві "RAID-1" – 2шт.
Для збільшення швидкості запису та забезпечення надійності зберігання даних кілька масивів RAID-1 можна об'єднати в RAID-0. Така конфігурація називається «двухрівневий» RAID або RAID-10 (RAID 0+1):

Мінімальна кількість дисководів у масиві "RAID 0+1" – 4шт.
Область застосування: дешеві масиви, у яких головне – надійність зберігання даних.

RAID-2. Розподіляє дані по страйпів розміром у сектор групи дисководів. Деякі дисків виділяються для зберігання ECC (код корекції помилок). Оскільки більшість дисководів за замовчуванням зберігають коди з ECC для кожного сектора, RAID-2 не дає особливих переваг у порівнянні з RAID-3 і тому практично не застосовується.

RAID-3. Як і у випадку з RAID-2, дані розподіляються по страйпах розміром в один сектор, а один з дисководів масиву відводиться для зберігання інформації про парність:

RAID-3 покладається на коди з ECC, що зберігаються у кожному секторі виявлення помилок. У разі відмови одного з дисководів відновлення інформації, що зберігалася на ньому, можливе за допомогою обчислення виключає АБО (XOR) за інформацією на дисководах, що залишилися. Кожен запис зазвичай розподілено по всіх дисководах і тому цей тип масиву хороший для роботи в додатках з інтенсивним обміном з дисковою підсистемою. Оскільки кожна операція введення-виводу звертається до всіх дисків масиву, RAID-3 не може одночасно виконувати кілька операцій. Тому RAID-3 хороший для однокористувацького однозадачного оточення з довгими записами. Для роботи з короткими записами потрібна синхронізація обертання дисководів, оскільки інакше неминуче зменшення швидкості обміну. Застосовується нечасто, т.к. програє RAID-5 з використанням дискового простору. Реалізація потребує значних витрат.
Мінімальна кількість дисководів у масиві "RAID-3" – 3шт.

RAID-4. RAID-4 ідентичний RAID-3 за винятком того, що розмір страйпів набагато більше одного сектора. І тут читання здійснюється з одного дисковода (крім дисковода, що зберігає інформацію про парності), тому можливе одночасне виконання кількох операцій читання. Тим не менш, оскільки кожна операція запису повинна оновити вміст парного дисковода, одночасне виконання декількох операцій запису неможливо. Цей тип масиву немає помітних переваг перед масивом типу RAID-5.
RAID-5. Цей тип масиву іноді називається «масив з парністю, що обертається». Даний тип масиву успішно долає властивий RAID-4 недолік - неможливість одночасного виконання кількох операцій запису. У цьому масиві, як і RAID-4, використовуються страйпивеликого розміру, але, на відміну від RAID-4, інформація про парність зберігається не на одному дисководі, а на всіх дисководах по черзі:

Операції запису звертаються до одного дисководу з даними та іншого дисководу з інформацією про парності. Оскільки інформація про парність для різних страйпів зберігається на різних дисководах виконання кількох одночасних операцій запису неможливе лише в тих поодиноких випадках, коли або страйпи з даними, або страйпи з інформацією про парність знаходяться на тому самому дисководі. Чим більше дисководів у масиві, тим рідше збігається розташування страйпів інформації та парності.
Область застосування: надійні масиви великого обсягу. Реалізація потребує значних витрат.
Мінімальна кількість дисководів у масиві "RAID-5" – 3шт.

RAID-1 чи RAID-5?
RAID-5 у порівнянні з RAID-1 більш економно використовує дисковий простір, Оскільки у ньому для надмірності зберігається не «копія» інформації, а контрольне число. У результаті RAID-5 можна об'єднати будь-яку кількість дисководів, з яких тільки один буде містити надмірну інформацію.
Але більш висока ефективність використання дискового простору досягається за рахунок нижчої швидкості обміну інформацією. Під час запису інформації в RAID-5 треба щоразу оновлювати інформацію про парність. Для цього треба визначити, які саме біти парності змінилися. Спочатку зчитується підлягає оновленню стара інформація. Потім ця інформація перемножується по XOR з новою інформацією. Результат цієї операції - бітова маска, в якій кожен біт = 1 означає, що в інформації про парність у відповідній позиції треба замінити значення. Потім оновлена інформація про парність записується на місце. Отже, на кожну вимогу програми записати інформацію, RAID-5 здійснює два читання, два записи та дві операції XOR.
За те, що більш ефективно використовується дисковий простір (замість копії даних зберігається блок парності) доводиться платити: на генерацію та запис інформації про парність йде додатковий час. Це означає, що швидкість запису на RAID-5 нижче, ніж RAID-1 у співвідношенні 3:5 або навіть 1:3 (тобто швидкість запису на RAID-5 становить від 3/5 до 1/3 від швидкості запису RAID-1). Через це RAID-5 безглуздо створювати у програмному варіанті. Їх також не можна рекомендувати в тих випадках, коли швидкість запису має вирішальне значення.

Який спосіб реалізації RAID - програмний чи апаратний?

Прочитавши опис різних рівнів RAID, можна помітити, що ніде не згадуються будь-які специфічні вимоги до апаратури, яка необхідна для реалізації RAID. З чого можна зробити висновок, що все, що потрібно для реалізації RAID - підключити необхідну кількість дисководів до контролера, що є в комп'ютері, і встановити на комп'ютер спеціальне програмне забезпечення. Це правильно, але не зовсім!
Справді, існує можливість програмної реалізації RAID. Прикладом може бути ОС Microsoft Windows NT 4.0 Server, у якій можлива програмна реалізація RAID-0, -1 і навіть RAID-5 (Microsoft Windows NT 4.0 Workstation забезпечує лише RAID-0 та RAID-1). Однак це рішення слід розглядати як вкрай спрощене, що не дозволяє повністю реалізувати можливості RAID-масиву. Досить зазначити, що з програмної реалізації RAID все навантаження з розміщення інформації на дисководах, обчислення контрольних кодів тощо. лягає на центральний процесор, що, природно, не збільшує продуктивності та надійності системи. З тих же причин, тут практично відсутні будь-які сервісні функції та всі операції із заміни несправного дисковода, додавання нового дисковода, зміни рівня RAID тощо проводяться з повною втратою даних і при повній забороні виконання будь-яких інших операцій. Єдина перевага програмної реалізації RAID - мінімальна вартість.

- спеціалізований контролер звільняє центральний процесор від основних операцій із RAID, причому ефективність контролера тим більше помітна, що вище рівень складності RAID;
- контролери, як правило, мають драйвери, що дозволяють створити RAID практично для будь-якої популярної ОС;
- вбудований BIOS контролера і програми управління, що додаються до нього, дозволяють адміністратору системи легко підключати, відключати або замінювати дисководи, що входять до RAID, створювати кілька RAID-масивів, причому навіть різних рівнів, контролювати стан дискового масиву і т.д. У «просунутих» контролерів ці операції можна робити «на лету», тобто. не виключаючи системний блок. Багато операцій може бути виконано у «фоновому режимі», тобто. не перериваючи поточну роботу і навіть дистанційно, тобто. з будь-якого (звісно за наявності доступу) робочого місця;
- Контролери можуть оснащуватися буферною пам'яттю («кеш»), в якій запам'ятовуються кілька останніх блоків даних, що, при частому зверненні до тих самих файлів, дозволяє значно збільшити швидкодію дискової системи.

Недоліком апаратної реалізації RAID є відносно висока вартість RAID-контролерів. Однак, з одного боку, за все (надійність, швидкодія, обслуговування) треба платити. З іншого боку, останнім часом, з розвитком мікропроцесорної техніки, вартість RAID-контолерів (особливо молодших моделей) почала різко падати і стала порівнянною з вартістю звичайних дискових контролерів, що дозволяє встановлювати RAID-системи не тільки в дорогі мейнфрейми, а й у сервери. початкового рівня та навіть у робочі станції.

Як вибрати модель RAID-контролера?

Можна виділити кілька типів RAID-контролерів залежно від їх функціональних можливостей, конструктивного виконання та вартості:
1. Контролери дисководу із функціями RAID.
По суті це звичайний дисковий контролер, який завдяки спеціальній прошивці BIOS дозволяє об'єднувати дисководи в RAID-масив, як правило, рівня 0, 1 або 0+1.

Ultra (Ultra Wide) SCSI контролер компанії Mylex KT930RF (KT950RF).
Зовні цей контролер нічим не відрізняється від звичайного SCSI-контролера. Вся "спеціалізація" знаходиться в BIOS, який ніби розділений на дві частини - "Конфігурація SCSI" / "Конфігурація RAID". Незважаючи на невисоку вартість (менше $200) даний контролер має непоганий набір функцій:

- об'єднання до 8 дисководів в RAID 0, 1або 0+1;
- Підтримка Hot Spareдля заміни "на льоту" дисковода, що вийшов з ладу;
- Можливість автоматичної (без втручання оператора) заміни несправного дисковода;
- автоматичний контроль цілісності та ідентичності (для RAID-1) даних;
- наявність пароля для доступу до BIOS;
- програма RAIDPlus, що представляє інформацію про стан дисководів у RAID;
- драйвери для DOS, Windows 95, NT 3.5x, 4.0

Жорсткі диски у нашому комп'ютері відіграють важливу роль. Там зберігається вся інформація. Не хочеться втрачати все відразу через відмову харда. А вони, як відомо, теж мають свій ліміт напрацювання на відмову. Напевно, багато хто з вас чув про якісь RAID-масиви. Роблять їх для прискорення роботи комп'ютера та безпеки даних. Давайте докладніше поговоримо про це.

Що таке RAID, і для чого він потрібний

RAID - дисковий масив із кількох жорстких дисків. Практично RAID-масив є системою, що налічує від двох жорстких дисків, підключених до материнської плати, що підтримує можливість створення масивів (або ж до raid-контролера). Що таке RAID-контролер? Пристрій, що управляє вашим масивом та супутніми роботами процесами. Зазвичай їх використовують на серверних машинах. Пересічним користувачам така іграшка малокорисна - недешево і малоефективно, враховуючи обсяги інформації, що обробляються рядовим комп'ютером. При створенні RAID-масиву апаратна начинка комп'ютера не зміниться. Програмно вся робота з рейдом проводиться в bios, тобто нічого трудомісткого.

SCSI RAID: на відміну від класичного масиву

SCSI – це інтерфейс, фізичний тип підключення пристрою. Він відрізняється від звичних нам інтерфейсів IDE або SATA, в першу чергу іншим алгоритмом роботи, що забезпечує більш високу швидкість, і завищеною, відносно останніх, ціною. Поширення отримав на масштабних серверних машинах, серед звичайних комп'ютерів встановлюється рідко.

Встановлення RAID-масиву

Знаходимо материнську плату із підтримкою рейд-масивів або SCSI RAID.
Беремо два абсолютно однакові диски, підключаємо.
Заходимо до bios (залежить від моделі мат. плати).
Параметр SATA Configuration виставляємо RAID.
У процесі завантаження комп'ютера натискаємо Ctrl+I.
Налаштовуємо рейд.

Готово! Важливо: під час створення RAID-масивів вся інформація з дисків видаляється!

Види масивів

RAID 0 – дисковий масив для підвищення продуктивності.
RAID 1 – "дзеркальний" дисковий масив.
RAID 2 – масиви, які використовують код Хеммінгу.
RAID 3 і 4 - масиви дисків із чергуванням та виділеним диском парності.
RAID 5 - диски з чергуванням та невиділеним диском парності.
RAID 6 - диски з чергуванням та двома незалежними парностями.
Існують ще рейди 10, 50, 60. Але це дуже складні конструкції.

Докладніше зупинимося на двох найпопулярніших версіях рейд-масивів. Це, відповідно, RAID 0 і RAID 1. Навіщо потрібен RAID 0? Все не так складно. Принцип роботи масиву полягає у паралельній роботі різних фізичних пристроїв, що видаються системі за одне. Тобто, це безпосередньо підвищує швидкість роботи системи, просто уявіть: у вашому raid 0 масиві беруть участь два диски. Ви записуєте дані об'ємом 10 гігабайт. Якби у вас не був створений масив, то довелося б записувати їх на конкретний диск, другий при цьому обов'язково простоював. У випадку з рейд 0 масивом ваші дані побайтово діляться на кілька потоків, а також записуються на носій рандомно. Тобто, один фільм може зберігатися на двох фізичних пристрояходночасно, причому на одному буде лише 30% від його "ваги". Мінус RAID 0 без відмовостійкості. Більше того, якщо з ладу виходить один диск, дані з другого вам теж не вдасться відновити.

Тепер поговоримо про RAID 1. У разі цього масиву вам доведеться використовувати кілька додаткових дисків для "дзеркального копіювання". Якщо у вас бере участь лише два диски в масиві, то це виглядає так: ви працюєте з диском номер 1, а комп'ютер дублює всі ваші дії для диска 2. У разі відмови пристрою всі ваші дані будуть в цілості і безпеці перебувати на дублюючому диску. Безпечно, безперечно. Мінусом рейд можна назвати втрату продуктивності.

Для чого потрібен RAID-масив, ви тепер знаєте, залишилося лише визначитися з тим, що вам найбільше підходить. Збереження даних чи приріст продуктивності? Особиста справа кожного!

Щоб об'єднати кілька жорстких дисків у RAID-масив, крім наявності самих дисків потрібно ще й контролер. RAID-контролер - це свого роду виконроб, керуючий бригадою HDD. Вони діляться на три тини: програмні, інтегровані та апаратні. Для побудови RAID-масивів високих рівнів із більш ніж 6-8 дисками краще використовувати апаратні контролери, тому що при високому навантаженні вони забезпечують мінімальну затримку в роботі. Крім того, громіздкі RAID-масиви, що керуються програмно, створюють серйозне навантаження на процесор комп'ютера.

Незважаючи на очевидні переваги RAID-масивів, потрібно пам'ятати і про недоліки: високий рівень шуму (чим більше дисків, тим більше шум) та труднощі у разі перенесення масиву на інший комп'ютер. Навіть при підключенні того ж самого контролера на іншому комп'ютері та дисків у тому ж порядку тими ж кабелями немає гарантії, що на іншому «залізі» RAID запрацює. Гарантовано він працюватиме на запис та читання тільки на тому обладнанні, на якому було створено, а у разі найменшої зміни комплектуючих можуть виникнути проблеми, що потребують додаткових налаштувань.

Програмні RAID контролери

Під програмними RAID-контролерами, як правило, маються на увазі рішення для організації RAID-масивів на рівні драйверів операційної системи. Mac OS X, багато Linux-дистрибутивів, а також деякі професійні редакції Windows мають вбудовані засоби для створення найпростіших дискових масивів стандарту RAID 0,1,0+1 і, рідше, RAID 5. Таким чином, маючи парочку HDD, можна легко організувати масив засобами операційної системи. Правда, в цьому випадку очікувати високої продуктивності не варто: такий спосіб організації RAID повністю залежить від «заліза вашого комп'ютера, оскільки для координації роботи дисків за діють ресурси центрального процесора і пам'яті, що може призвести до зниження продуктивності системи в цілому. Крім того, організовувати RAID-масиви для зберігання важливих даних на рівні операційних систем не рекомендується - такі масиви вкрай нестійкі до збоїв та помилок, тому ризик втрачений, інформація при збої операційної системи дуже велика.

Інтегровані RAID контролери

Якщо раніше RAID-масиви цікавили лише професіоналів, то сьогодні інтегровані RAID-контролери з підтримкою базових рівнів (достатніх задоволення потреб домашнього користувача) можна зустріти як на серверних материнських платах, а й у звичайних моделях, призначених для суто домашніх ПК. Як правило, це все ж таки «напівапаратні» рішення, тобто встановлені йшли на платі чіп координує роботу, але для обчислень все одно звертається до ЦПУ, оскільки не має на борту свого власного процесора. Проте, на відміну від повністю програмних контролерів, такі рішення працюють набагато стабільніше (RAID-масив «визначається* ще до завантаження ОС), оскільки апаратна «Підміна» відбувається на рівні прошивки материнської плати. З RAID-масивами в таких системах можна працювати не тільки в ОС, але і в оболонках завантажувальних та дискових менеджерів. Інтегровані контролери на сучасних материнських платах, як правило, підтримують базові рівні RAID 0,1.5 та 10 (зазвичай із розрахунку використання в системі не більше 6-8 дисків) та забезпечують дуже високу швидкість роботи в масивах із традиційних жорстких дисків. Таким чином, для організації домашнього RAID-масиву з невеликої кількості жорстких дисків можливостей інтегрованого в материнську плату контролера часто більш ніж достатньо.

Апаратні RAID контролери

Для створення високопродуктивних RAID масивів з великою кількістю жорстких дисків існують контролери, виконані у вигляді окремих плат з інтерфейсом PCI Express. Їхня вартість варіюється у великому діапазоні, і топові рішення можуть коштувати в десятки разів більше, ніж усе «залізо» сучасного десктопу разом узяте. Справа в тому. що такі плати, по суті, є мікрокомп'ютерами» в комп'ютері, тобто мають свій власний обчислювальний процесор і навіть пам'ять для координації масивів з більшої кількості жорстких дисків і роблять все це з мінімальними затримками і без зайвих звернень до центрального процесора. З огляду на високу вартість використовувати їх у домашніх системах навряд чи варто, тим більше що у найпростіших схемах RAID 0 або RAID 1 з двома жорсткими дисками приросту продуктивності порівняно з хорошим інтегрованим контролером, швидше за все, не буде.

Апаратні контролери можуть дати більший приріст продуктивності в порівнянні з інтегрованими рішеннями при створенні масивів із SSD-накопичувачів або при створенні RAID-масивів високих рівнів із більш ніж шести традиційних дисків. Крім того, дорогі апаратні RAID-контролери часто сумісні з професійними швидкісними жорсткими дисками з інтерфейсом SAS (він зазвичай використовується в серверах) і можуть мати додаткові засоби для підвищення стійкості до відмови: власну кеш-пам'ять на платі, можливість роботи від акумулятора для збереження вмісту кеш- пам'яті у разі збою електроживлення та засоби апаратної корекції помилок нальоту.

Зрозуміло, апаратні контролери, на відміну від програмних та інтегрованих, підтримують набагато більше схем RAID, деякі навіть дозволяють використовувати нестандартні рівні, а також дозволяють будувати складні гібридні масиви з різних рівнів RAID з одночасним задіянням жорстких і твердотільних дисків.

Взаємопов'язаних швидкісними каналами та сприймаються зовнішньою системоюяк єдине ціле. Залежно від типу використовуваного масиву може забезпечувати різні ступені відмовостійкості та швидкодії. Служить для підвищення надійності зберігання даних та/або підвищення швидкості читання/запису інформації (RAID 0).

Абревіатура RAID спочатку розшифровувалась як "redundant array of inexpensive disks" ("надлишковий (резервний) масив недорогих дисків", оскільки вони були набагато дешевшими за RAM). Саме так був представлений RAID його творцями Петтерсоном (David A. Patterson), Гібсоном (Garth A. Gibson) та Катцом (Randy H. Katz) у 1987 році. Згодом RAID стали розшифровувати як "redundant array of independent disks" ("надлишковий (резервний) масив незалежних дисків"), тому що для масивів доводилося використовувати і дороге обладнання(Під недорогими дисками малися на увазі диски для ПЕОМ).

(+) : Має високу надійність - працює доти, доки функціонує хоча б один диск у масиві Імовірність виходу з експлуатації відразу двох дисків дорівнює добутку ймовірностей відмови кожного диска. Насправді при виході з ладу однієї з дисків слід терміново вживати заходів - знову відновлювати надмірність. Для цього з будь-яким рівнем RAID (крім нульового) рекомендується використовувати диски гарячого резерву . Гідність такого підходу – підтримка постійної доступності.

(-) : Недолік полягає в тому, що доводиться виплачувати вартість двох жорстких дисків, отримуючи корисний обсяг лише одного. жорсткого диска.

RAID 1+0 та RAID 0+1

Дзеркало на багатьох дисках RAID 1+0або RAID 0+1. Під RAID 10 (RAID 1+0) мають на увазі варіант, коли два або більше RAID 1 об'єднуються в RAID 0. Під RAID 0+1 може бути два варіанти:

RAID 2

Масиви такого типу засновані на використанні коду Хеммінгу. Диски поділяються на дві групи: для даних і кодів корекції помилок, причому якщо дані зберігаються на дисках, то зберігання кодів корекції необхідно дисків. Дані розподіляються по дисках, призначених зберігання інформації, як і, як і RAID 0, тобто. вони розбиваються на невеликі блоки за кількістю дисків. Диски, що залишилися, зберігають коди корекції помилок, за якими у разі виходу будь-якого жорсткого диска з ладу можливе відновлення інформації. Метод Хеммінга давно застосовується у пам'яті типу ECC і дозволяє на льоту виправляти одноразові та виявляти дворазові помилки.

Перевагоюмасиву RAID 2 є підвищення швидкості дискових операцій, порівняно з продуктивністю одного диска.

Недолікоммасиву RAID 2 є те, що мінімальна кількість дисків, при якому має сенс його використовувати, - 7. При цьому потрібна структура майже з подвійної кількості дисків (для n=3 дані будуть зберігатися на 4 дисках), тому такий вид масиву не отримав поширення . Якщо дисків близько 30-60, то перевитрата виходить 11-19%.

RAID 3

У масиві RAID 3 з дисків дані розбиваються на шматки розміром менше сектора (розбиваються на байти) або блоки та розподіляються по дисках. Ще один диск використається для зберігання блоків парності. У RAID 2 для цієї мети застосовувався диск, але більша частина інформації на контрольних дисках використовувалася для корекції помилок на льоту, у той час як більшість користувачів задовольняє просте відновлення інформації у разі поломки диска, для чого вистачає інформації, що міститься на одному виділеному жорсткому диску.

Відмінності RAID 3 від RAID 2: неможливість корекції помилок на лету та менша надмірність.

Переваги:

висока швидкість читання та запису даних;
мінімальна кількість дисків для створення масиву дорівнює трьом.

Недоліки:

масив цього типу хороший тільки для однозадачної роботи з великими файлами, оскільки час доступу до окремого сектора, розбитого по дисках, дорівнює максимальному інтервалів доступу до секторів кожного з дисків. Для блоків малого розміру час доступу набагато більший за час читання.
велике навантаження на контрольний диск, і, як наслідок, його надійність падає в порівнянні з дисками, що зберігають дані.

RAID 4

RAID 4 схожий на RAID 3, але відрізняється від цього тим, що дані розбиваються на блоки, а чи не на байти. Таким чином, вдалося частково перемогти проблему низької швидкості передачі даних невеликого обсягу. Запис проводиться повільно через те, що парність для блоку генерується при записі і записується на єдиний диск. Із систем зберігання широкого поширення RAID-4 застосовується на пристроях зберігання компанії NetApp (NetApp FAS), де його недоліки успішно усунуті за рахунок роботи дисків у спеціальному режимі групового запису, що визначається використовуваним на пристроях внутрішнього файловою системою WAFL.

RAID 5

Основним недоліком рівнів RAID від 2-го до 4-го є неможливість робити паралельні операції запису, оскільки зберігання інформації про парності використовується окремий контрольний диск. RAID 5 не має цього недоліку. Блоки даних та контрольні суми циклічно записуються на всі диски масиву, немає асиметричності конфігурації дисків. Під контрольними сумами мається на увазі результат операції XOR (що виключає або). Xorмає особливість, яка застосовується в RAID 5, яка дає можливість замінити будь-який операнд результатом, і, застосувавши алгоритм xor, отримати в результаті бракує операнд. Наприклад: a xor b = c(де a, b, c- три диски рейд-масиву), якщо aвідмовить, ми можемо отримати його, поставивши його місце cі провівши xorміж cі b: c xor b = a.Це можна застосувати незалежно від кількості операндів: a xor b xor c xor d = e. Якщо відмовляє cтоді eвстає на його місце і провівши xorв результаті отримуємо c: a xor b xor e xor d = c. Цей метод по суті забезпечує стійкість до відмови 5 версії. Для зберігання результату xor потрібно всього 1 диск, розмір якого дорівнює розміру іншого диска в raid.

(+) : RAID5 набув широкого поширення, в першу чергу, завдяки своїй економічності Об'єм дискового масиву RAID5 розраховується за формулою (n-1) * hddsize, де n – число дисків у масиві, а hddsize – розмір найменшого диска. Наприклад, для масиву з 4 дисків по 80 гігабайт загальний обсяг буде (4 - 1) * 80 = 240 гігабайт. На запис інформації на тому RAID 5 витрачаються додаткові ресурси і падає продуктивність, тому що потрібні додаткові обчислення та операції запису, зате при читанні (проти окремого вінчестера) є виграш, тому що потоки даних з декількох дисків масиву можуть оброблятися паралельно.

(-) : Продуктивність RAID 5 помітно нижче, особливо на операціях типу Random Write (записи в довільному порядку), при яких продуктивність падає на 10-25% від продуктивності RAID 0 (або RAID 10), тому що вимагає більшої кількості операцій з дисками (кожна операція запису сервера замінюється на контролері RAID на три - одну операцію читання та дві операції запису). Недоліки RAID 5 виявляються при виході з ладу одного з дисків - весь том перетворюється на критичний режим (degrade), всі операції запису та читання супроводжуються додатковими маніпуляціями, різко падає продуктивність. При цьому рівень надійності знижується до надійності RAID-0 з відповідною кількістю дисків (тобто n разів нижче надійності одиночного диска). Якщо до повного відновленнямасиву відбудеться вихід з ладу, або виникне непоновна помилка читання хоча б ще на одному диску, то масив руйнується, і дані на ньому відновленню звичайними методами не підлягають. Слід також взяти до уваги, що процес RAID Reconstruction (відновлення даних RAID за рахунок надмірності) після виходу з ладу диска викликає інтенсивне навантаження читання з дисків протягом багатьох годин безперервно, що може спровокувати вихід будь-якого з дисків, що залишилися з ладу в цей найменше. захищений період роботи RAID, а також виявити раніше невиявлені збої читання в масивах cold data (даних, яких не звертаються при звичайній роботі масиву, архівні та малоактивні дані), що підвищує ризик збою при відновленні даних. Мінімальна кількість дисків, що використовуються, дорівнює трьом.

RAID 5EE

Примітка: підтримується не у всіх контролерів RAID level-5EE подібний до масиву RAID-5E, але з більш ефективним використанням резервного диска і більш коротким часом відновлення. Подібно до RAID level-5E, цей рівень RAID-масиву створює ряди даних та контрольних сум у всіх дисках масиву. Масив RAID-5EE має покращений захист і продуктивність. При застосуванні RAID level-5E, ємність логічного тому обмежується ємністю двох фізичних вінчестерівмасиву (один для контролю, один резервний). Резервний диск є частиною масиву RAID-level-5EE. Тим не менш, на відміну від RAID level-5E, що використовує нерозділене вільне місцедля резерву, RAID level-5EE в резервний диск вставлені блоки контрольних сум, як показано далі на прикладі. Це дозволяє швидше перебудовувати дані при поломці фізичного диска. При такій конфігурації ви не зможете використовувати його з іншими масивами. Якщо вам необхідний запасний диск для іншого масиву, вам слід мати ще один резервний вінчестер. RAID level-5E вимагає щонайменше чотирьох дисків і, залежно від рівня прошивки та їх ємності, підтримує від 8 до 16 дисків. RAID level-5E має певну прошивку. Примітка: для RAID level-5EЕ, ви можете використовувати лише один логічний том у масиві.

Переваги:

100% захист даних
Велика ємність фізичних дисків у порівнянні з RAID-1 або RAID-1E
Більша продуктивність у порівнянні з RAID-5
Більше швидке відновлення RAID у порівнянні з RAID-5Е

Недоліки:

Нижча продуктивність, ніж у RAID-1 або RAID-1E
Підтримка лише одного логічного тому на масив
Неможливість спільного використаннярезервного диска з іншими масивами
Підтримка не всіх контролерів

RAID 6

RAID 6 - схожий на RAID 5, але має більш високий рівень надійності - під контрольні суми виділяється ємність 2-х дисків, розраховуються 2 суми за різними алгоритмами. Потребує потужніший RAID-контролер. Забезпечує працездатність після одночасного виходу з експлуатації двох дисків - захист від кратної відмови. Для організації масиву потрібно мінімум 4 диски. Зазвичай використання RAID-6 викликає приблизно 10-15% падіння продуктивності дискової групи, порівняно з аналогічними показниками RAID-5, що викликано великим обсягом обробки для контролера (необхідність розраховувати другу контрольну суму, а також прочитувати та перезаписувати більше дискових блоків під час запису кожного блоку).

RAID 7

RAID 7 – зареєстрована торгова маркакомпанії Storage Computer Corporation, окремим рівнем RAID не є. Структура масиву така: диски зберігаються дані, один диск використовується для складування блоків парності. Запис на диски кешується з використанням оперативної пам'яті, сам масив вимагає обов'язкового ДБЖ; у разі перебоїв із харчуванням відбувається пошкодження даних.

RAID 10

Схема архітектури RAID 10

RAID 10 - дзеркальний масив, дані в якому записуються послідовно на кілька дисків, як RAID 0 . Ця архітектура є масивом типу RAID 0, сегментами якого замість окремих дисків є масиви RAID 1. Відповідно, масив цього рівня повинен містити щонайменше 4 диски. RAID 10 поєднує в собі високу відмовостійкість та продуктивність.

Нинішні контролери використовують цей режим за промовчанням для RAID 1+0. Тобто один диск основний, другий - дзеркало, зчитування даних проводиться з них по черзі. Зараз можна вважати, що RAID 10 та RAID 1+0 - це просто різна назва одного й того ж методу дзеркалювання дисків. Твердження, що RAID 10 є надійним варіантом для зберігання даних, помилково, тому що, незважаючи на те, що для даного рівня RAID можливе збереження цілісності даних при виході з ладу половини дисків, незворотне руйнування масиву відбувається при виході з ладу двох дисків, якщо вони знаходяться в одній дзеркальній парі.