Купити мережеве сховище даних за хорошу вартість? Вам сюди! SAS, NAS, SAN: крок до мереж зберігання даних

Якщо Сервери – це універсальні пристрої, що виконують у більшості випадків
- або функцію сервера програми (коли на сервері виконуються спеціальні програми, і йдуть інтенсивні обчислення),
- або функцію файл-сервера (тобто якогось місця для централізованого зберігання файлів даних)

СХД (Системи Зберігання Даних) - пристрої, спеціально спроектовані для виконання таких серверних функцій, як зберігання даних.

Необхідність придбання СГД
виникає зазвичай, у досить зрілих підприємств, тобто. тих, хто замислюється над тим, як
- зберігати та керувати інформацією, найціннішим активом компанії
- забезпечити безперервність бізнесу та захист від втрати даних
- Збільшити адаптованість ІТ-інфраструктури

СГД та віртуалізація
Конкуренція змушує компанії МСБ працювати ефективніше, без простоїв та з високим ККД. Зміна виробничих моделей, тарифних планів, видів послуг відбувається все частіше. Весь бізнес сучасних компаній "зав'язаний" на інформаційних технологій. Потреби бізнесу змінюються швидко, і миттєво відбиваються на ІТ - зростають вимоги до надійності та адаптованості ІТ-інфраструктури. Віртуалізація надає такі можливості, але для цього потрібні недорогі та прості в обслуговуванні системи зберігання даних.

Класифікація СГД за типом підключення

DAS. Перші дискові масиви з'єднувалися із серверами за інтерфейсом SCSI. При цьому один сервер міг працювати лише з одним дисковим масивом. Це – пряме з'єднання СХД (DAS – Direct Attached Storage).

NAS. Для більш гнучкої організації структури обчислювального центру – щоб кожен користувач міг використовувати будь-яку систему зберігання – необхідно підключити СГД у локальну мережу. Це - NAS - Network Attached Storage). Але обмін даними між сервером і СХД набагато інтенсивніший ніж між клієнтом і сервером, тому в такому варіанті варіанті з'явилися об'єктивні труднощі, пов'язані з пропускною здатністю мережі Ethernet. Та й з погляду безпеки не зовсім правильно показувати СГД у спільну мережу.

SAN. Але можна створити між серверами та СГД свою, окрему, високошвидкісну мережу. Таку мережу назвали SAN (Storage Area Network). Швидкодія забезпечується тим, що фізичним середовищем передачі є оптика. Спеціальні адаптери (HBA) та оптичні FC-комутатори забезпечують передачу даних на швидкості 4 та 8Gbit/s. Надійність такої мережі підвищувалась резервуванням (дуплікацією) каналів (адаптерів, комутаторів). Основним недоліком є ​​висока ціна.

iSCSI. З появою недорогих Ethernet-технологій 1Gbit/s та 10Gbit/s, оптика зі швидкістю передачі 4Gbit/s вже виглядає не так привабливо, особливо з урахуванням ціни. Тому все частіше як середовище SAN використовується протокол iSCSI (Internet Small Computer System Interface). Мережа iSCSI SAN може бути побудована на будь-якій досить швидкій фізичній основі, що підтримує протокол IP.

Класифікація Систем Зберігання Даних з області застосування:

клас опис
personal

Найчастіше являють собою звичайний 3.5" або 2.5" або 1.8" жорсткий диск, поміщений у спеціальний корпус та оснащений інтерфейсами USB та/або FireWire 1394 та/або Ethernet, та/або eSATA.
Таким чином ми маємо переносний пристрій, який може підключатися до комп'ютера/сервера та виконувати функції зовнішнього накопичувача. Іноді для зручності пристрою додають функції бездротового доступу, принтерних і USB портів.

male workgroup

Зазвичай це стаціонарний або переносний пристрій, в який можна встановлювати кілька (найчастіше від 2 до 5) жорстких дисків SATA, з можливістю гарячої або без заміни, що має інтерфейс Ethernet. Диски можна організовувати в масиви – RAID різного рівня для досягнення високої надійності зберігання та швидкості доступу. СХД має спеціалізовану ОС, зазвичай на основі Linux, і дозволяє розмежовувати рівень доступу по імені та паролю користувачів, організовувати квотування дискового просторуі т.п.
Такі СХД підходять для невеликих робочих груп як заміна файл-серверів.

workgroup

Пристрій, що зазвичай монтується в 19" стійку (rack-mount) в яке можна встановлювати 12-24 жорстких дисків SATA або SAS з можливістю гарячої заміни HotSwap. Має зовнішній інтерфейс Ethernet, та/або iSCSI. Диски організовані в масиви - RAID для досягнення високої надійності зберігання та швидкості доступу СХД поставляється зі спеціалізованим програмним забезпеченням, яке дозволяє розмежовувати рівень доступу, організовувати квотування дискового простору, організовувати BackUp (резервне копіювання інформації) тощо.
Такі СГД підходять для середніх та великих підприємств, і використовуються спільно з одним чи кількома серверами.
enterprise
Стаціонарний пристрій або пристрій, що монтується в 19" стійку (rack-mount), в який можна встановлювати до сотень жорстких дисків.
На додаток до попереднього класу СГД можуть мати можливість нарощування, модернізації та заміни компонентів без зупинки системи, системи моніторингу. Програмне забезпечення може підтримувати створення "моментальних знімків" та інші "просунуті" функції.
Такі СГД підходять для великих підприємств та забезпечують підвищену надійність, швидкість та захист критично важливих даних.

high-end enterprise

На додаток до попереднього класу СГД може підтримувати тисячі жорстких дисків.
Такі СГД займають кілька 19" кабінетів, загальна вага сягає кількох тонн.
СГД призначені для безперервної роботи з високим ступенем надійності, зберігання стратегічно важливих даних рівня держави/корпорацій.

Історія питання.

Перші сервери поєднували в одному корпусі всі функції (як комп'ютери) - обчислювальні (сервер додатків) і зберігання даних (файл-сервер). Але в міру зростання потреби додатків в обчислювальних потужностях з одного боку і в міру зростання кількості даних з іншого боку - стало просто незручно розміщувати все в одному корпусі. Ефективніше виносити дискові масиви в окремі корпуси. Але тут постало питання з'єднання дискового масиву із сервером. Перші дискові масиви з'єднувалися із серверами за інтерфейсом SCSI. Але в такому разі один сервер міг працювати лише з одним дисковим масивом. Народу захотілося гнучкішої організації структури обчислювального центру - щоб будь-який сервер міг використати будь-яку систему зберігання. Підключити всі пристрої безпосередньо в локальну мережу та організувати обмін даними по Ethernet – звичайно, просте та універсальне рішення. Але обмін даними між серверами і СХД набагато інтенсивніший ніж між клієнтами і серверами, тому в такому варіанті варіанті (NAS - див. нижче) з'явилися об'єктивні труднощі, пов'язані з пропускною здатністю мережі Ethernet. Виникла ідея створити між серверами та СГД свою, окрему високошвидкісну мережу. Таку мережу назвали SAN (див. нижче). Вона схожа на Ethernet, тільки фізичним середовищем передачі є оптика. Там теж є адаптери (HBA), які встановлюються в сервери та комутатори (оптичні). Стандарти на швидкість передачі даних по оптиці – 4Gbit/s. З появою технологій Ethernet 1Gbit/s і 10Gbit/s, а також протоколу iSCSI все частіше як середовище SAN використовується Ethernet.


Що таке системи зберігання даних (СГД) і для чого вони потрібні? У чому різниця між iSCSI та FibreChannel? Чому це словосполучення тільки в останні роки стало відоме широкому колу IT-фахівців і чому питання систем зберігання даних дедалі більше турбують вдумливі уми?

Думаю, багато хто помітив тенденції розвитку в навколишньому комп'ютерному світі – перехід від екстенсивної моделі розвитку до інтенсивної. Нарощування мегагерц процесорів не дає видимого результату, а розвиток накопичувачів не встигає за обсягом інформації. Якщо у випадку процесорів все більш-менш зрозуміло – достатньо збирати багатопроцесорні системи та/або використовувати кілька ядер в одному процесорі, то у разі питань зберігання та обробки інформації так просто проблем не позбутися. Існуюча зараз панацея від інформаційної епідемії – СХД. Назва розшифровується як Мережа Зберігання Даних (Storage Area Network) або Система Зберігання Даних. У будь-якому випадку – це спе

Основні проблеми, що вирішуються СГД

Отже, які завдання покликана вирішити СГД? Розглянемо типові проблеми, пов'язані з зростаючими обсягами інформації у будь-якій організації. Припустимо, що це хоча б кілька десятків комп'ютерів та кілька рознесених територіальних офісів.

1. Децентралізація інформації– якщо раніше всі дані могли зберігатися буквально на одному жорсткому диску, то зараз будь-яка функціональна система вимагає окремого сховища – наприклад, серверів електронної пошти, СУБД, домену і так далі. Ситуація ускладнюється у разі розподілених офісів (філій).

2. Лавиноподібне зростання інформації- Часто кількість жорстких дисків, які можна встановити в конкретний сервер, не може покрити необхідну системі ємність. Як наслідок:
Неможливість повноцінно захистити дані, що зберігаються - дійсно, адже досить важко зробити навіть backup даних, які знаходяться не тільки на різних серверах, але і рознесені територіально.
Недостатня швидкість обробки інформації – канали зв'язку між віддаленими майданчиками поки що залишають бажати кращого, але навіть за досить «товстого» каналу не завжди можливо повноцінне використанняіснуючих мереж, наприклад IP, для роботи.
Складність резервного копіювання– якщо дані читаються та записуються невеликими блоками, то зробити повне архівування інформації з віддаленого серверапо існуючих каналах може бути неможливо – необхідна передача всього обсягу даних. Архівування на місцях найчастіше недоцільне з фінансових міркувань – необхідні системи для резервного копіювання (стрічкові накопичувачі, наприклад), спеціальне ПЗ (яке може коштувати чималих грошей), навчений та кваліфікований персонал.

3. Складно чи неможливо передбачити потрібний обсягдискового простору під час розгортання комп'ютерної системи. Як наслідок:
Виникають проблеми розширення дискових ємностей – досить складно отримати на сервері ємності порядків терабайт, особливо якщо система вже працює на існуючих дисках невеликої ємності – як мінімум, потрібна зупинка системи та неефективні фінансові вкладення.
Неефективна утилізація ресурсів – часом не вгадати, у якому сервері дані зростатимуть швидше. У сервері електронної пошти може бути вільний критично малий обсяг дискового простору, тоді як інший підрозділ буде використовувати лише 20% обсягу недешевої дискової підсистеми (наприклад, SCSI).

4. Низький рівень конфіденційності розподілених даних– неможливо проконтролювати та обмежити доступ відповідно до політики безпеки підприємства. Це стосується як доступу до даних існуючими для цього каналами (локальна мережа), так і фізичного доступудо носіїв - наприклад, не виключені розкрадання жорстких дисків, їх руйнування (з метою утруднити бізнес організації). Некваліфіковані дії користувачів та обслуговуючого персоналу можуть завдати ще більшої шкоди. Коли компанія у кожному офісі змушена вирішувати дрібні локальні проблеми безпеки, це не дає бажаного результату.

5. Складність управління розподіленими потоками інформації– будь-які дії, спрямовані на зміни даних у кожній філії, що містить частину розподілених даних, створює певні проблеми, починаючи від складності синхронізації різних баз даних, версій файлів розробників та закінчуючи непотрібним дублюванням інформації.

6. Низький економічний ефект впровадження «класичних» рішень– у міру зростання інформаційної мережі, великих обсягів даних і дедалі більше розподіленої структури підприємства фінансові вкладення виявляються менш ефективні і найчастіше що неспроможні вирішити виникаючих проблем.

7. Високі витрати ресурсів для підтримки працездатності всієї інформаційної системипідприємства - починаючи від необхідності утримувати великий штат кваліфікованого персоналу і закінчуючи численними недешевими апаратними рішеннями, які покликані вирішити проблему обсягів і швидкостей доступу до інформації разом з надійністю зберігання та захистом від збоїв.

У світлі перелічених вище проблем, які рано чи пізно, повністю або частково наздоганяють будь-яку динамічно розвивається, спробуємо описати системи зберігання даних - такими, якими вони повинні бути. Розглянемо типові схемипідключення та види систем зберігання даних.

Мегабайти/транзакції?

Якщо раніше жорсткі диски знаходилися всередині комп'ютера (сервера), то тепер там стало тісно і не дуже надійно. Найпростіше рішення (розроблене досить давно і застосовується повсюдно) – технологія RAID.

images\RAID\01.jpg

При організації RAID у будь-яких системах зберігання даних додатково захисту інформації ми отримуємо кілька незаперечних переваг, одне з яких – швидкість доступу до інформації.

З погляду користувача чи ПО, швидкість визначається як пропускної спроможністю системи (Мбайт/с), а й числом транзакцій – тобто кількістю операцій вводу-вывода в одиницю часу (IOPS). Збільшенню IOPS сприяє, що цілком логічно, більше дисків і ті методики підвищення продуктивності, які надає контролер RAID(наприклад, кешування).

Якщо для перегляду потокового відео або організації файл-сервера важлива загальна пропускна здатність, то для СУБД, будь-яких OLTP (online transaction processing) додатків критично саме кількість транзакцій, які здатна обробляти система. А з цим параметром у сучасних жорстких дисків все не так райдужно, як з зростаючими об'ємами і, частково, швидкостями. Всі ці проблеми покликана вирішити сама система зберігання даних.

рівні захисту

Потрібно розуміти, що в основі всіх систем зберігання даних лежить практика захисту інформації на базі технології RAID – без цього будь-яка технічно просунута СГД буде марною, тому що жорсткі диски в цій системі є ненадійним компонентом. Організація дисків у RAID – це «нижня ланка», перший ешелон захисту інформації та підвищення швидкості обробки.

Однак, крім схем RAID, існує і більш низькорівневий захист даних, реалізований «поверх» технологій та рішень, впроваджених в сам жорсткий дискйого виробником. Наприклад, один із провідних виробників СХД – компанії EMC – існує методика додаткового аналізу цілісності даних лише на рівні секторів накопичувача.

Розібравшись із RAID, перейдемо до структури самих СГД. Насамперед, СХД поділяються на кшталт використовуваних інтерфейсів підключення хостів (серверів). Зовнішні інтерфейси підключення – це, в основному, SCSI або FibreChannel, а також досить молодий стандарт iSCSI. Також не варто скидати з рахунків невеликі інтелектуальні сховища, які можуть підключатися навіть USB або FireWire. Ми не розглядатимемо більш рідкісні (іноді просто невдалі в тому чи іншому плані) інтерфейси, як SSA від IBM або інтерфейси, розроблені для мейнфреймів – наприклад, FICON/ESCON. Окремо стоять сховища NAS, що підключаються до мережі Ethernet. Під словом «інтерфейс» в основному розуміється зовнішній роз'єм, але не слід забувати, що роз'єм не визначає протоколу зв'язку двох пристроїв. На цих особливостях ми зупинимося трохи нижче.

images\RAID\02.gif

Розшифровується як Small Computer System Interface (читається "скази") - напівдуплексний паралельний інтерфейс. У сучасних системах зберігання даних найчастіше представлений роз'ємом SCSI:

images\RAID\03.gif

images\RAID\04.gif

І групою протоколів SCSI, а конкретніше – SCSI-3 Parallel Interface. Відмінність SCSI від знайомого нам IDE – велика кількість пристроїв на канал, більша довжина кабелю, більша швидкість передачі даних, а також «ексклюзивні» особливості типу high voltage differential signaling, command quequing та деякі інші – заглиблюватися в це питання ми не станемо.
Якщо говорити про основних виробників компонентів SCSI, наприклад SCSI-адаптерів, RAID-контролерів з інтерфейсом SCSI, то будь-який фахівець відразу згадає дві назви - Аdaptec і LSI Logic. Думаю, цього достатньо, революцій на цьому ринку не було вже давно і, мабуть, не передбачається.

Інтерфейс FibreChannel

Повнодуплексний послідовний інтерфейс. Найчастіше у сучасному устаткуванні представлений зовнішніми оптичними роз'ємами типу LC або SC (LC – менше за розмірами):

images\RAID\05.jpg

images\RAID\06.jpg

…і протоколами FibreChannel Protocols (FCP). Існує кілька схем комутації пристроїв FibreChannel:

Point-to-Point- Точка-точка, пряме з'єднання пристроїв між собою:

images\RAID\07.gif

Crosspoint Switched– підключення пристроїв до комутатора FibreChannel (аналогічне реалізації мережі Ethernet на комутаторах):

images\RAID\08.gif

Arbitrated loop– FC-AL, петля з арбітражним доступом – всі пристрої пов'язані один з одним у кільце, схема чимось нагадує Token Ring. Також може використовуватися комутатор - тоді фізична топологія буде реалізована за схемою "зірка", а логічна - за схемою "петля" (або "кільце"):

images\RAID\09.gif

Підключення за схемою FibreChannel Switched є найпоширенішою схемою, у термінах FibreChannel таке підключення називається Fabric – російською є калька з нього – «фабрика». Слід врахувати, що комутатори FibreChannel - це досить просунуті пристрої, за складністю наповнення близькі до IP-комутатори рівня 3. Якщо комутатори з'єднані між собою, то вони функціонують в єдиній фабриці, маючи пул налаштувань, що діють для всієї фабрики одночасно. Зміна якихось опцій одному з комутаторів може призводити до перекомутації всієї фабрики, а про налаштування авторизації доступу, наприклад. З іншого боку, існують схеми SAN, які мають на увазі кілька фабрик усередині єдиної мережі SAN. Таким чином, фабрикою можна називати тільки групу об'єднаних між собою комутаторів - два або більше не об'єднаних між собою пристрої, введені в SAN для підвищення стійкості до відмови, утворюють дві або більше різні фабрики.

Компоненти, що дозволяють об'єднувати хости та системи зберігання даних у єдину мережу, прийнято позначати терміном "connectivity". Connectivity – це, звичайно ж, дуплексні з'єднувальні кабелі (зазвичай з інтерфейсом LC), комутатори (switches) та адаптери FibreChannel (HBA, Host Base Adapters) – тобто ті плати розширення, які, встановлені в хости, дозволяють підключити хост до мережі SAN. HBA зазвичай реалізовані як плат стандарту PCI-X або PCI-Express.

images\RAID\10.jpg

Не варто плутати fibre і fiber – середовище поширення сигналу може бути різним. FibreChannel може працювати з «міді». Наприклад, всі жорсткі диски FibreChannel мають металеві контакти, та й звичайна комутація пристроїв по «міді» – не рідкість, просто поступово всі переходять на оптичні канали як найперспективнішу технологію та функціональну заміну «міді».

Інтерфейс iSCSI

Зазвичай представлений зовнішнім роз'ємом RJ-45 для підключення до мережі Ethernet і самим протоколом iSCSI (Internet Small Computer System Interface). За визначенням SNIA: "iSCSI - це протокол, який базується на TCP/IP і розроблений для встановлення взаємодії та управління системами зберігання даних, серверами та клієнтами". На цьому інтерфейсі зупинимося трохи докладніше, хоча б через те, що кожен користувач здатний використовувати iSCSI навіть у звичайній «домашній» мережі.

Необхідно знати, що протокол iSCSI визначає, як мінімум, транспортний протокол для SCSI, який працює поверх TCP, та технологію інкапсуляції SCSI-команд у мережу на базі IP. Простіше кажучи, iSCSI - це протокол, що дозволяє отримати блоковий доступ до даних за допомогою команд SCSI, що пересилаються через мережу зі стеком TCP/IP. iSCSI з'явився як заміна FibreChannel і в сучасних СХД має перед ним кілька переваг – здатність об'єднувати пристрої на величезних відстанях (використовуючи наявні мережі IP), можливість забезпечувати заданий рівень QoS (Quality of Service, якість обслуговування), нижчу вартість connectivity. Однак основна проблема використання iSCSI як заміни FibreChannel – великий час затримок, що виникають у мережі через особливості реалізації стека TCP/IP, що зводить нанівець одну з важливих переваг використання СГД – швидкість доступу до інформації та низьку латентність. Це серйозний мінус.

Маленьке зауваження щодо хостів – вони можуть використати як звичайні мережеві карти(тоді обробка стека iSCSI та інкапсуляція команд буде здійснюватися програмними засобами), так і спеціалізовані картиза допомогою технологій аналогічних TOE (TCP/IP Offload Engines). Така технологія забезпечує апаратне оброблення відповідної частини стека протоколу iSCSI. Програмний методдешевше, проте більше завантажує центральний процесор сервера і теоретично може призводити до більших затримок, ніж апаратний обробник. При сучасній швидкості мереж Ethernet в 1 Гбіт/с можна припустити, що iSCSI працюватиме рівно вдвічі повільніше FibreChannel зі швидкістю 2 Гбіт, проте в реальному застосуванні різниця буде ще помітнішою.

Крім вже розглянутих, коротко згадаємо ще пару протоколів, які зустрічаються рідше і призначені для надання додаткових сервісів вже існуючим мережам зберігання даних (SAN):

FCIP (Fibre Channel over IP)– тунельний протокол, побудований на TCP/IP та призначений для з'єднання географічно рознесених мереж SAN через стандартне середовище IP. Наприклад, можна об'єднати дві мережі SAN в одну через Інтернет. Досягається це використанням FCIP-шлюзу, який є прозорим для всіх пристроїв у SAN.
iFCP (Internet Fibre Channel Protocol)– протокол, який дозволяє об'єднувати пристрої з інтерфейсами FC через IP-мережі. Важлива відмінність від FCIP в тому, що можливо об'єднувати саме FC-пристрої через IP-мережу, що дозволяє різної пари з'єднань мати різний рівень QoS, що неможливо при тунелюванні через FCIP.

Ми коротко розглянули фізичні інтерфейси, протоколи та типи комутації для систем зберігання даних, не зупиняючись на перерахунку всіх можливих варіантів. Тепер спробуємо уявити які параметри характеризують системи зберігання даних?

Основні апаратні параметри СГД

Деякі з них перераховані вище – це тип зовнішніх інтерфейсів підключення та типи внутрішніх накопичувачів(жорстких дисків). Наступний параметр, який є сенс розглядати після двох перерахованих вище при виборі дискової системизберігання – її надійність. Надійність можна оцінити не за банальним часом напрацювання на відмову якихось окремих компонент(Факт, що цей час приблизно дорівнює у всіх виробників), а по внутрішній архітектурі. «Звичайна» система зберігання часто «зовні» є дисковою полицею (для монтажу в 19-дюймову шафу) з жорсткими дисками, зовнішніми інтерфейсами для підключення хостів, кількома блоками живлення. Всередині зазвичай встановлено все те, що забезпечує роботу системи зберігання – процесорні блоки, контролери дисків, портів введення-виводу, кеш-пам'ять тощо. Зазвичай керування стійкою здійснюється з командного рядкаабо за web-інтерфейсом, початкова конфігурація часто потребує підключення за послідовним інтерфейсом. Користувач може «розбити» наявні в системі диски на групи і об'єднати їх в RAID (різних рівнів), дисковий простір, що вийшов, поділяється на один або кілька логічних блоків (LUN), до яких і мають доступ хости (сервери) і «бачать» їх як локальні жорсткі диски. Кількість RAID-груп, LUN-ів, логіка роботи кешу, доступність LUN-ів конкретним серверам і все інше налаштовується адміністратором системи. Зазвичай СГД призначені для підключення до них не одного, а кількох (аж до сотень, в теорії) серверів – тому така система повинна мати високу продуктивність, гнучку систему управління та моніторингу, продумані засоби захисту даних. Захист даних забезпечується багатьма способами, найпростіший з яких ви знаєте – об'єднання дисків в RAID. Однак дані мають бути ще й постійно доступними – адже зупинка однієї системи зберігання даних, центральної на підприємстві, здатна завдати відчутних збитків. Чим більше систем зберігає дані на СГД, тим більше надійний доступ до системи має бути забезпечений - тому що при аварії СГД зупиняється робота відразу всіх серверів, які там зберігають дані. Висока доступність стійки забезпечується повним внутрішнім дублюванням всіх компонентів системи – шляхів доступу до стійки (портів FibreChannel), процесорних модулів, кеш-пам'яті, блоків живлення тощо. Спробуємо принцип 100% резервування (дублювання) пояснити наступним малюнком:

images\RAID\11.gif

1. Контролер (процесорний модуль) СГД, що включає:
*Центральний процесор (або процесори) - зазвичай на системі працює спеціальне ПЗ, що виконує роль «операційної системи»;
*інтерфейси для комутації з жорсткими дисками – у разі це плати, які забезпечують підключення дисків FibreChannel за схемою петлі з арбітражним доступом (FC-AL);
*кеш-пам'ять;
*контролери зовнішніх портів FibreChannel
2. Зовнішній інтерфейс FC; як бачимо, тут їх по 2 штуки на кожен процесорний модуль;
3. Жорсткі диски- ємність розширюється додатковими дисковими полицями;
4. Кеш-пам'ять у такій схемі зазвичай дзеркається, щоб не втратити збережені там дані при виході будь-якого модуля з ладу.

Щодо апаратної частини – дискові стійки можуть мати різні інтерфейси для підключення хостів, різні інтерфейси жорстких дисків, різні схеми підключення додаткових полиць, що служать для збільшення числа дисків у системі, а також інші суто «залізні параметри».

Програмне забезпечення СГД

Звичайно, апаратна потужність систем зберігання повинна якось управлятися, а самі СГД просто повинні надавати рівень обслуговування і функціональність, недоступну в стандартних схемах «сервер-клієнт». Якщо розглянути малюнок « Структурна схемасистеми зберігання даних», стає зрозуміло, що при прямому підключенні сервера до стійки двома шляхами вони повинні бути підключені до FC-портів різних процесорних модулів, щоб сервер продовжував працювати при виході з ладу відразу всього процесорного модуля. Звичайно, для використання multipathing має бути забезпечена підтримка цієї функціональності апаратними та програмними засобами всіх рівнів, що беруть участь у передачі даних. Звичайно, повне резервування без засобів моніторингу та оповіщення не має сенсу – тому всі серйозні системи зберігання мають такі можливості. Наприклад, оповіщення про будь-які критичні події може відбуватися різними засобами - це сповіщення по e-mail, автоматичний модемний дзвінок до центру техпідтримки, повідомлення на пейджер (зараз актуальніше SMS), SNMP-механізми та інше.

Ну і як ми вже згадували, існують потужні засоби управління всією пишністю. Зазвичай це web-інтерфейс, консоль, можливість писати скрипти та вбудовувати керування у зовнішні програмні пакети. Про механізми, що забезпечують високу продуктивність СХД, згадаємо лише коротко - неблокируемая архітектура з кількома внутрішніми шинами і великою кількістю жорстких дисків, потужні центральні процесори, спеціалізована система управління (ОС), великий обсяг кеш-пам'яті, безліч зовнішніх інтерфейсів введення-виведення.

Сервіси, що надаються системами зберігання, зазвичай визначаються програмним забезпеченням, що функціонує на дисковій стійці. Практично завжди це складні програмні пакети, що купуються за окремими ліцензіями, що не входять у вартість самої СГД. Відразу згадаємо вже знайоме вам програмне забезпечення для забезпечення multipathing - ось воно функціонує на хостах, а не на самій стійці.

Наступне за популярністю рішення – програмне забезпечення для створення миттєвих та повних копій даних. Різні виробники по-різному називають свої програмні продуктита механізми створення цих копій. Ми для узагальнення можемо маніпулювати словами снапшот (snapshot) та клон (clone). Клон виробляється засобами дискової стійки всередині самої стійки - це повна внутрішня копія даних. Сфера застосування досить широка - від бекапу (backup) до створення "тестової версії" вихідних даних, наприклад, для ризикованих модернізацій, в яких немає впевненості і застосовувати які на актуальних даних небезпечно. Той, хто уважно стежив за всіма принадами СГД, які ми тут розбирали, запитає – навіщо ж потрібен бекап даних усередині стійки, якщо вона має таку високу надійність? Відповідь на це питання на поверхні - ніхто не застрахований від людських помилок. Дані збережені надійно, але якщо сам оператор зробив щось не так, наприклад, видалив необхідну таблицю в базі даних, від цього не врятують апаратні хитрощі. Клонування даних зазвичай виконується лише на рівні LUN. Цікавіша функціональність забезпечується механізмом снапшотів. Якоюсь мірою ми отримуємо всю красу повної внутрішньої копії даних (клону), при цьому не займаючи 100% обсягу копійованих даних усередині самої стійки, адже такий обсяг нам не завжди доступний. По суті снапшот – миттєвий «знімок» даних, який не займає часу та процесорних ресурсів СГД.

Звичайно не можна не згадати програмне забезпечення для реплікації (replication) даних, яке часто називають дзеркалюванням (mirroring). Це механізм синхронного або асинхронного реплікування (дублювання) інформації з однієї системи зберігання на одну або кілька віддалених систем зберігання. Реплікація можлива різними каналами – наприклад, стійки з інтерфейсами FibreChannel можуть асинхронно, через Інтернет і великі відстані, реплікуватися на іншу СХД. Таке рішення забезпечує надійність зберігання інформації та захист від катастроф.

Крім всіх перерахованих, існує велика кількість інших програмних механізмів маніпуляцій даними.

DAS & NAS & SAN

Після знайомства з самими системами зберігання даних, принципами їх побудови, що надаються ними можливостями і протоколами функціонування, саме час спробувати об'єднати отримані знання в діючу схему. Спробуємо розглянути типи систем зберігання та топології їх підключення до єдиної працюючої інфраструктури.

Пристрої DAS (Direct Attached Storage)– системи зберігання, що підключаються безпосередньо до сервера. Сюди відносяться як найпростіші SCSI-системи, що підключаються до SCSI/RAID-контролера сервера, так і пристрої FibreChannel, підключені прямо до сервера, хоч і призначені для мереж SAN. У цьому випадку топологія DAS є виродженою SAN (мережею зберігання даних):

images\RAID\12.gif

У цій схемі один із серверів має доступ до даних, що зберігаються на СГД. Клієнти отримують доступ до даних, звертаючись до цього сервера через мережу. Тобто сервер має блоковий доступ до даних на СГД, а вже клієнти користуються файловим доступом – ця концепція є дуже важливою для розуміння. Мінуси такої топології очевидні:
*Низька надійність – при проблемах мережі або аварії сервера дані стають недоступними всім одразу.
*Висока латентність, обумовлена ​​обробкою всіх запитів одним сервером і транспортом (найчастіше – IP).
*Високе завантаження мережі, що часто визначає межі масштабованості шляхом додавання клієнтів.
*Погана керованість – вся ємність доступна одному серверу, що знижує гнучкість розподілу даних.
* Низька утилізація ресурсів - важко передбачити необхідні обсяги даних, в одних пристроїв DAS в організації може бути надлишок ємності (дисків), в інших її може не вистачати - перерозподіл часто неможливий або трудомісткий.

Пристрої NAS (Network Attached Storage)– пристрої зберігання, підключені безпосередньо до мережі. На відміну від інших систем NASзабезпечує файловий доступ до даних і ніяк інакше. NAS-пристрою являють собою комбінацію системи зберігання даних і сервера, до якого вона підключена. У найпростішому варіанті звичайний мережевий сервер, що надає файлові ресурси, є пристроєм NAS:

images\RAID\13.gif

Усі мінуси такої схеми аналогічні DAS-топології, за деяким винятком. З мінусів, що додалися, відзначимо збільшену, і часто значно, вартість - правда, вартість пропорційна функціональності, а тут вже часто «є за що платити». NAS-пристрої можуть бути найпростішими «коробочками» з одним портом ethernet і двома жорсткими дисками в RAID1, що дозволяють доступ до файлів по одному протоколу CIFS (Common Internet File System) до величезних систем в яких можуть бути встановлені сотні жорстких дисків, а файловий доступ забезпечується десятком спеціалізованих серверів усередині NAS-системи. Число зовнішніх Ethernet-портів може досягати багатьох десятків, а ємність даних, що зберігаються, - кілька сотень терабайт (наприклад EMC Celerra CNS). Такі моделі з надійності та продуктивності можуть далеко обходити багато midrange-пристроїв SAN. Цікаво, що NAS-пристрої можуть бути частиною SAN-мережі і не мати власних накопичувачів, а лише надавати файловий доступ до даних, що знаходяться на блокових пристроях зберігання. У такому випадку NAS бере на себе функцію потужного спеціалізованого сервера, а SAN – пристрої зберігання даних, тобто ми отримуємо топологію DAS, скомпоновану з NAS- та SAN-компонентів.

NAS-пристрої дуже хороші в гетерогенному середовищі, де потрібний швидкий файловий доступ до даних для багатьох клієнтів одночасно. Також забезпечується відмінна надійність зберігання та гнучкість управління системою разом із простотою обслуговування. На надійності особливо зупинятись не будемо – цей аспект СГД розглянутий вище. Що стосується гетерогенного середовища, доступ до файлів в рамках єдиної NAS-системи може бути отриманий за протоколами TCP/IP, CIFS, NFS, FTP, TFTP та іншим, включаючи можливість роботи NAS, як iSCSI-target, що забезпечує функціонування з різним ОС, встановленими на хостах. Що стосується легкості обслуговування та гнучкості управління, то ці можливості забезпечуються спеціалізованою ОС, яку важко вивести з ладу та не потрібно обслуговувати, а також простотою розмежування прав доступу до файлів. Наприклад, можлива робота серед Windows Active Directoryз підтримкою необхідної функціональності - це може бути LDAP, Kerberos Authentication, Dynamic DNS, ACLs, призначення квот (quotas), Group Policy Objects та SID-історії. Оскільки доступ забезпечується до файлів, а їхні імена можуть містити символи різних мов, багато NAS забезпечують підтримку кодування UTF-8, Unicode. До вибору NAS варто підходити навіть ретельніше, ніж до DAS-пристроїв, адже таке обладнання може не підтримувати необхідні вам сервіси, наприклад, Encrypting File Systems (EFS) від Microsoft та IPSec. До речі можна помітити, що NAS поширені набагато менше, ніж пристрої SAN, але відсоток таких систем все ж таки постійно, хоча і повільно, зростає - в основному за рахунок витіснення DAS.

Пристрої для підключення до SAN (Storage Area Network)– пристрої для підключення до мережі зберігання даних. Мережа зберігання даних (SAN) не варто плутати з локальною мережею - це різні мережі. Найчастіше SAN ґрунтується на стеку протоколів FibreChannel і в найпростішому випадку складається із СГД, комутаторів та серверів, об'єднаних оптичними каналами зв'язку. На малюнку ми бачимо високонадійну інфраструктуру, в якій сервери включені одночасно в локальну мережу (ліворуч) та мережу зберігання даних (праворуч):

images\RAID\14.gif

Після досить детального розгляду пристроїв та принципів їхнього функціонування нам буде досить легко зрозуміти топологію SAN. На малюнку ми бачимо єдину для всієї інфраструктури СГД, до якої підключено два сервери. Сервери мають резервовані шляхи доступу – у кожному встановлено по два HBA (або один двопортовий, що знижує відмовостійкість). Пристрій зберігання має 4 порти, якими воно підключено до 2 комутаторів. Припускаючи, що всередині є два резервовані модулі, легко здогадатися, що найкраща схема підключення - коли кожен комутатор підключений і в перший, і в другий процесорний модуль. Така схема забезпечує доступ до будь-яких даних, що знаходяться на СХД, при виході з ладу будь-якого процесорного модуля, комутатора або шляхи доступу. Надійність СГД нами вже вивчена, два комутатори і дві фабрики ще більше збільшують доступність топології, тому якщо через збій або помилку адміністратора один з комутаційних блоків раптом відмовив, другий буде функціонувати нормально, адже ці два пристрої не пов'язані між собою.

Показане підключення серверів називається з'єднанням з високою доступністю (high availability), хоча в сервері при необхідності може бути встановлено ще більше HBA. Фізично кожен сервер має тільки два підключення до SAN, проте логічно система зберігання доступна через чотири шляхи – кожна HBA надає доступ до двох точок підключення на СХД, кожного процесорного модуля окремо (цю можливість забезпечує подвійне підключення комутатора до СХД). На цій схемі найнадійніший пристрій - це сервер. Два комутатори забезпечують надійність близько 99,99%, а от сервер може відмовити з різних причин. Якщо потрібна високонадійна робота всієї системи, сервери об'єднуються в кластер, наведена схема не вимагає апаратного доповнення для організації такої роботи і вважається еталонною схемою організації SAN. Найпростіший випадок – сервери, підключені єдиним шляхом через один світильник до системи зберігання. Однак система зберігання за наявності двох процесорних модулів повинна підключатися до комутатора як мінімум одним каналом на кожен модуль – інші порти можуть бути використані для прямого підключення серверів до СХД, що іноді необхідно. І не варто забувати, що SAN можна побудувати не тільки на базі FibreChannel, але й на базі протоколу iSCSI – при цьому можна використовувати тільки стандартні ethernet-пристрої для комутації, що здешевлює систему, але має ряд додаткових мінусів (обумовлених у розділі, що розглядає iSCSI ). Також цікавою є можливість завантаження серверів із системи зберігання – не обов'язково навіть наявність внутрішніх жорстких дисків у сервері. Таким чином, із серверів остаточно знімається завдання зберігання будь-яких даних. Теоретично спеціалізований сервер може бути перетворений на звичайну число дробилку без будь-яких накопичувачів, визначальними блоками якого є центральні процесори, пам'ять, а як інтерфейси взаємодії із зовнішнім світом, наприклад порти Ethernet і FibreChannel. Якась подоба таких пристроїв є сучасними blade-серверами.

Хочеться відзначити, що пристрої, які можна підключити в SAN, не обмежені тільки дисковими СГД - це можуть бути дискові бібліотеки, стрічкові бібліотеки (стримери), пристрої для зберігання даних на оптичних дисках(CD/DVD та інші) та багато інших.
З мінусів SAN відзначимо лише високу вартість її компонентів, проте плюси незаперечні:
* Висока надійність доступу до даних, що знаходяться на зовнішніх системахзберігання. Незалежність топології SAN від використовуваних СГД та серверів.
* Централізоване зберігання даних (надійність, безпека).
* Зручне централізоване управління комутацією та даними.
* Перенесення інтенсивного трафіку введення-виводу до окремої мережі, розвантажуючи LAN.
* Висока швидкодія та низька латентність.
* Масштабованість та гнучкість логічної структури SAN
* Географічно розміри SAN, на відміну класичних DAS, мало обмежені.
* Можливість оперативно розподіляти ресурси між серверами.
* Можливість будувати відмовостійкі кластерні рішення без додаткових витрат на базі наявної SAN.
* Проста схемарезервного копіювання – усі дані перебувають у одному місці.
* Наявність додаткових можливостей та сервісів (снапшоти, віддалена реплікація).
* Високий рівень безпеки SAN.

На закінчення
Думаю, ми досить повно висвітлили основне коло питань, пов'язаних з сучасними системамизберігання. Сподіватимемося, що такі пристрої будуть ще швидше розвиватися функціонально, а число механізмів управління даними буде тільки зростати.

На закінчення можна сказати, що NAS і SAN-рішення зараз переживають реальний бум. Число виробників та різноманітність рішень збільшується, технічна грамотність споживачів зростає. Сміливо можна припускати, що найближчим часом практично в кожному обчислювальному середовищі з'являться ті чи інші системи зберігання даних.

Будь-які дані постають перед нами як інформація. Сенс роботи будь-яких обчислювальних пристроїв – обробка інформації. Останнім часом обсяги її зростання часом лякають, тому системи зберігання даних та спеціалізоване програмне забезпечення, Безсумнівно, будуть найбільш затребуваними продуктами IT-рику найближчими роками.

SAS, NAS, SAN: крок до мереж зберігання даних

Вступ

З повсякденним ускладненням мережевих комп'ютерних систем та глобальних корпоративних рішень світ почав вимагати технологій, які дали б поштовх до відродження корпоративних системзбереження інформації (сторедж-систем). І ось одна єдина технологія приносить у світову скарбницю досягнень в області сторедж небачену раніше швидкодію, колосальні можливості масштабування та виняткові переваги загальної вартості володіння. Обставини, що сформувалися з появою стандарту FC-AL (Fibre Channel - Arbitrated Loop) та SAN (Storage Area Network), що розвивається на його основі, обіцяють революцію в дата-орієнтованих технологіях комп'ютера.

«The most significant development in storage we"ve seen in 15 years»

Data Communications International, March 21, 1998

Формальне визначення SAN у трактуванні Storage Network Industry Association (SNIA):

«Мережа, головним завданням якої є передача даних між комп'ютерними системами та пристроями зберігання даних, а також між самими сторедж-системами. SAN складається з комунікаційної інфраструктури, яка забезпечує фізичний зв'язок, а також відповідає за рівень управління (management layer), який поєднує зв'язки, сторедж та комп'ютерні системи, здійснюючи передачу даних безпечно та надійно».

SNIA Technical Dictionary, copyright Storage Network Industry Association, 2000

Варіанти організації доступу до сторедж-систем

Розрізняють три основні варіанти організації доступу до систем зберігання:

  • SAS (Server Attached Storage), сторедж, приєднаний до сервера;
  • NAS (Network Attached Storage), сторедж, підключений до мережі;
  • SAN (Storage Area Network), мережа зберігання даних.

Розглянемо топології відповідних сторедж-систем та їх особливості.

SAS

Сторедж-система, яка приєднана до сервера. Знайомий всім традиційний спосіб підключення системи зберігання даних до високошвидкісного інтерфейсу в сервері, як правило, до паралельного SCSI інтерфейсу.

Рисунок 1. Server Attached Storage

Використання окремого корпусу для сторедж-системи у рамках топології SAS не є обов'язковим.

Основна перевага сторедж, приєднаного до сервера, у порівнянні з іншими варіантами - низька ціна та висока швидкодія з розрахунку один сторедж для одного сервера. Така топологія є оптимальною у разі використання одного сервера, через який організується доступ до масиву даних. Але в неї залишається низка проблем, які спонукали проектувальників шукати інші варіанти організації доступу до систем зберігання даних.

До особливостей SAS можна віднести:

  • Доступ до даних залежить від ОС та файлової системи(у загальному випадку);
  • Складність організації систем із високим готовністю;
  • Низька вартість;
  • Висока швидкодія у межах однієї ноди;
  • Зменшення швидкості відгуку під час завантаження сервера, який обслуговує сторедж.

NAS

Сторедж-система, приєднана до мережі. Цей варіант організації доступу виник порівняно недавно. Основною його перевагою є зручність інтеграції додаткової системи зберігання даних у існуючі мережі, але сам по собі він не привносить скільки радикальних поліпшень в архітектуру сторедж. Фактично NAS є чистий файл-сервер, і сьогодні можна зустріти чимало нових реалізацій стереджів типу NAS на основі технології тонкого сервера (Thin Server).


Малюнок 2. Network Attached Storage.

Особливості NAS:

  • виділений файл-сервер;
  • Доступ до даних не залежить від ОС та платформи;
  • Зручність адміністрування;
  • Максимальна простота встановлення;
  • Низька масштабованість;
  • Конфлікт із трафіком LAN/WAN.

Сторедж, побудований за технологією NAS, є ідеальним варіантом для дешевих серверів із мінімальним набором функцій.

SAN

Мережі зберігання даних почали інтенсивно розвиватися та впроваджуватися лише з 1999 року. Основою SAN є окрема від LAN/WAN мережа, яка служить для організації доступу до даних серверів та робочих станцій, що займаються їхньою прямою обробкою. Така мережа створюється на основі стандарту Fibre Channel, що дає сторедж-системам переваги технологій LAN/WAN та можливості щодо організації стандартних платформ для систем з високою готовністю та високою інтенсивністю запитів. Майже єдиним недоліком SAN сьогодні залишається відносно висока ціна компонент, але при цьому загальна вартість володіння для корпоративних систем, побудованих з використанням технології мереж зберігання даних, є досить низькою.


3. Storage Area Network.

До основних переваг SAN можна віднести практично всі її особливості:

  • Незалежність топології SAN від сторедж-систем та серверів;
  • Зручне централізоване керування;
  • Відсутність конфлікту з трафіком LAN/WAN;
  • Зручне резервування даних без завантаження локальної мережіта серверів;
  • Висока швидкодія;
  • Висока масштабованість;
  • Висока гнучкість;
  • Висока готовність та відмовостійкість.

Слід також зауважити, що ця технологія ще досить молода і найближчим часом вона повинна пережити чимало удосконалень у галузі стандартизації управління та способів взаємодії SAN підмереж. Але можна сподіватися, що це загрожує піонерам лише додатковими перспективами першості.

FC як основа побудови SAN

Подібно до LAN, SAN може створюватися з використанням різних топологій та носіїв. При побудові SAN може використовуватися як паралельний SCSI інтерфейс, так і Fibre Channel або, скажімо, SCI (Scalable Coherent Interface), але своєю популярністю SAN, що все зростає, зобов'язана саме Fibre Channel. У проектуванні цього інтерфейсу брали участь фахівці зі значним досвідом у розробці як канальних, так і мережевих інтерфейсів, і їм вдалося поєднати всі важливі позитивні риси обох технологій для того, щоб отримати щось революційно нове. Що саме?

Основні ключові особливостіканальних:

  • Низькі затримки
  • Високі швидкості
  • Висока надійність
  • Топологія точка-точка
  • Невеликі відстані між нодами
  • Залежність від платформи
та мережевих інтерфейсів:
  • Багатоточкові топології
  • Великі відстані
  • Висока масштабованість
  • Низькі швидкості
  • Великі затримки
об'єдналися у Fibre Channel:
  • Високі швидкості
  • Незалежність від протоколу (0-3 рівні)
  • Великі відстані
  • Низькі затримки
  • Висока надійність
  • Висока масштабованість
  • Багатоточкові топології

Традиційно сторедж інтерфейси (те, що знаходиться між хостом та пристроями зберігання інформації) були перепоною на шляху до зростання швидкодії та збільшення обсягу систем зберігання даних. У той самий час прикладні завдання вимагають значного приросту апаратних потужностей, які, своєю чергою, тягнуть у себе потреба у збільшенні пропускну здатність інтерфейсів зв'язку з сторедж-системами. Саме проблеми побудови гнучкого високошвидкісного доступу до даних допомагають вирішити Fibre Channel.

Стандарт Fibre Channel був остаточно визначений за останні кілька років (з 1997-го по 1999-й), протягом яких була проведена колосальна робота з узгодження взаємодії виробників різних компонентів, і було зроблено все необхідне, щоб Fibre Channel перетворився з суто концептуальної технології на реальну, яка отримала підтримку у вигляді інсталяцій у лабораторіях та обчислювальних центрах. У 1997 були спроектовані перші комерційні зразки наріжних компонент для побудови SAN на базі FC, таких як адаптери, хаби, свічі та мости. Таким чином, вже починаючи з 1998 року FC використовується в комерційних цілях у діловій сфері, на виробництві та в масштабних проектах реалізації систем, критичних до відмов.

Fibre Channel – це відкритий промисловий стандарт високошвидкісного послідовного інтерфейсу. Він забезпечує підключення серверів та сторедж-систем на відстані до 10 км (при використанні стандартного обладнання) на швидкості 100 MB/s (на виставці Cebit"2000 були представлені зразки продукції, які використовують новий стандарт Fibre Channel зі швидкостями 200 MB/s на одне кільце, а в лабораторних умовах вже експлуатуються реалізації нового стандарту зі швидкостями 400 MB/s, що становить 800 MB/s при використанні подвійного кільця.(На момент публікації статті ряд виробників вже почав відвантажувати мережеві картки та свічки на FC 200 MB/s .) Fibre Channel одночасно підтримує цілу низку стандартних протоколів (серед яких TCP/IP і SCSI-3) при використанні одного фізичного носія, що потенційно спрощує побудову мережевої інфраструктури, до того ж це надає можливості зменшення вартості монтажу та обслуговування. Тим не менш, використання окремих підмереж для LAN/WAN і SAN має ряд переваг і є рекомендованим за замовчуванням.

Однією з найважливіших переваг Fibre Channel поряд зі швидкісними параметрами (які, до речі, не завжди є головними для користувачів SAN і можуть бути реалізовані за допомогою інших технологій) є можливість роботи на великих відстанях та гнучкість топології, яка прийшла до нового стандарту мережевих технологій. Таким чином, концепція побудови топології мережі зберігання даних базується на тих же принципах, що і традиційні мережі, як правило, на основі концентраторів та комутаторів, які допомагають запобігти падінню швидкості при зростанні кількості нід та створюють можливості зручної організації систем без жодної точки відмов.

Для кращого розуміння переваг та особливостей цього інтерфейсу наведемо порівняльну характеристику FC та Parallel SCSI у вигляді таблиці.

Таблиця 1. Порівняння технологій Fibre Channel та паралельного SCSI

У стандарті Fibre Channel передбачається використання різноманітних топологій, таких як точка-точка (Point-to-Point), кільце або концентратор FC-AL (Loop або Hub FC-AL), магістральний комутатор (Fabric/Switch).

Топологія point-to-point використовується для приєднання одиночної системи до сервера.

Loop або Hub FC-AL – для підключення множинних сторедж пристроїв до кількох хостів. При організації подвійного кільця збільшується швидкодія та відмовостійкість системи.

Комутатори використовуються для забезпечення максимальної швидкодії та відмовостійкості для складних, великих та розгалужених систем.

Завдяки гнучкості мережі в SAN закладена надзвичайно важлива особливість - зручна можливість побудови відмовостійких систем.

Пропонуючи альтернативні рішення для систем зберігання даних та можливості щодо об'єднання кількох стореджів для резервування апаратних засобів, SAN допомагає забезпечувати захист апаратно-програмних комплексів від апаратних збоїв. Для демонстрації наведемо приклад створення двонодової системи без точок відмов.


Рисунок 4. No Single Point of Failure.

Побудова трьох- і більше нодових систем здійснюється простим додаванням до мережі мережі додаткових серверів і підключенням їх до обох концентраторів/комутаторів).

При використанні FC побудова стійких до збоїв (disaster tolerant) систем стає прозорою. Мережеві канали і для сторедж, і для локальної мережі можна прокласти на основі оптоволокна (до 10 км і більше з використанням підсилювачів сигналу) як фізичного носія для FC, при цьому використовується стандартна апаратура, яка дозволяє значно зменшити вартість таких систем.

Завдяки можливості доступу до всіх компонентів SAN з будь-якої її точки, ми отримуємо надзвичайно гнучко керовану мережу даних. При цьому слід зазначити, що SAN забезпечується прозорість (можливість бачити) всіх компонентів аж до дисків в сторедж-системах. Ця особливість підштовхнула виробників компонентів до використання свого значного досвіду у побудові систем управління для LAN/WAN для того, щоб закласти широкі можливості моніторингу та управління у всі компоненти SAN. Ці можливості включають моніторинг і управління окремих нод, сторедж компонентів, корпусів, мережевих пристроїв і мережевих підструктур.

У системі управління та моніторингу SAN використовуються такі відкриті стандарти, як:

  • SCSI command set
  • SCSI Enclosure Services (SES)
  • SCSI Self Monitoring Analysis and Reporting Technology (S.M.A.R.T.)
  • SAF-TE (SCSI Accessed Fault-Tolerant Enclosures)
  • Simple Network Management Protocol (SNMP)
  • Web-Based Enterprise Management (WBEM)

Системи, побудовані з використанням технологій SAN, не тільки забезпечують адміністратору можливість стежити за розвитком та станом сторедж ресурсів, але й відкривають можливості моніторингу та контролю трафіку. Завдяки таким ресурсам програмні засоби управління SAN реалізують найбільш ефективні схеми планування обсягу сторедж та балансування навантаження на компоненти системи.

Мережі зберігання даних чудово інтегруються у існуючі інформаційні інфраструктури. Їх впровадження не вимагає будь-яких змін у вже існуючих мережах LAN і WAN, а лише розширює можливості існуючих систем, позбавляючи їх завдань, орієнтованих на передачу великих обсягів даних. Причому при інтеграції та адмініструванні SAN дуже важливим є те, що ключові елементи мережі підтримують гарячу заміну та встановлення з можливостями динамічного конфігурування. Отже додати той чи інший компонент або здійснити його заміну адміністратор може, не вимикаючи систему. І весь цей процес інтеграції може бути візуально відображений у графічній системіуправління SAN.

Розглянувши перераховані вище переваги, можна виділити ряд ключових моментів, які безпосередньо впливають на одну з основних переваг Storage Area Network - загальну вартість володіння (Total Cost Ownership).

Неймовірні можливості масштабування дозволяють підприємству, яке використовує SAN, вкладати гроші в сервери та сторедж у міру потреби. А також зберегти свої вкладення у вже інстальовану техніку за зміни технологічних поколінь. Кожен новий сервербуде мати можливість високошвидкісного доступу до стореджу і кожен додатковий гігабайт сторедж буде доступний усім серверам підмережі за командою адміністратора.

Прекрасні можливості щодо побудови відмовостійких систем можуть приносити пряму комерційну вигоду від мінімізації простоїв та рятувати систему у разі виникнення стихійного лиха або будь-яких інших катаклізмів.

Керованість компонентів і прозорість системи надають можливість здійснювати централізоване адміністрування всіх ресурсів, а це, у свою чергу, значно зменшує витрати на їх підтримку, вартість якої, як правило, становить понад 50% від вартості обладнання.

Вплив SAN на прикладні задачі

Для того щоб нашим читачам стало зрозуміліше, наскільки практично корисні технології, що розглядаються в цій статті, наведемо кілька прикладів прикладних завдань, які без використання мереж зберігання даних вирішувалися б неефективно, вимагали б колосальних фінансових вкладень або взагалі не вирішувалися б стандартними методами.

Резервування та відновлення даних (Data Backup and Recovery)

Використовуючи традиційний SCSI інтерфейс, користувач при побудові систем резервування та відновлення даних стикається з рядом складних проблем, які можна дуже просто вирішити, використовуючи технології SAN та FC.

Таким чином, використання мереж зберігання даних виводить рішення задачі резервування та відновлення на новий рівень і надає можливість здійснювати бекап у кілька разів швидше, ніж раніше, без завантаження локальної мережі та серверів роботою з резервування даних.

Кластеризація серверів (Server Clustering)

Однією з типових завдань, котрим ефективно використовується SAN, є кластеризація серверів. Оскільки один з ключових моментів в організації високошвидкісних кластерних систем, які працюють з даними - це доступ до сторедж, то з появою SAN побудова багатонодових кластерів на апаратному рівні вирішується простим додаванням сервера з підключенням до SAN (це можна зробити, навіть не виключаючи системи, оскільки свічі FC підтримують hot-plug). При використанні паралельного SCSI інтерфейсу, можливості по приєднанню та масштабованість якого значно гірше, ніж у FC, кластери, орієнтовані на обробку даних, було б важко зробити з кількістю нід більше двох. Комутатори паралельного SCSI - дуже складні та дорогі пристрої, а FC це стандартний компонент. Для створення кластера, який не матиме жодної точки відмов, достатньо інтегрувати в дзеркальну систему SAN ( технологія DUAL Path).

В рамках кластеризації одна з технологій RAIS (Redundant Array of Inexpensive Servers) здається особливо привабливою для побудови потужних систем інтернет-комерції, що масштабуються, та інших видів завдань з підвищеними вимогами до потужності. За словами Alistair A. Croll, співзасновника Networkshop Inc, використання RAIS виявляється досить ефективним: «Наприклад, за $12000-15000 ви можете купити близько шести недорогих одно-двопроцессорних (Pentium III) Linux/Apache серверів. Потужність, масштабованість та відмовостійкість такої системи буде значно вищою, ніж, наприклад, у одного чотирипроцесорного сервера на базі процесорів Xeon, а вартість однакова».

Одночасний доступ до відео та розподіл даних (Concurrent video streaming, data sharing)

Уявіть собі завдання, коли вам потрібно на кількох станціях редагувати відео або просто працювати над даними величезного обсягу. Передача файлу розміром 100GB через локальну мережу займе у вас кілька хвилин, а спільна роботанад ним буде дуже складним завданням. При використанні SAN кожна робоча станція та сервер мережі отримують доступ до файлу на швидкості, еквівалентній локальному високошвидкісному диску. Якщо вам потрібна ще одна станція/сервер для обробки даних, ви зможете її додати до SAN, не виключаючи мережі, простим під'єднанням станції до SAN комутатора і надання їй прав доступу до сторедж. Якщо ж вас перестане задовольняти швидкодію підсистеми даних, ви зможете просто додати ще один сторедж і з використанням технології розподілу даних (наприклад, RAID 0) отримати вдвічі більшу швидкодію.

Основні компоненти SAN

Середа

Для з'єднання компонентів у рамках стандарту Fibre Channel використовують мідні та оптичні кабелі. Обидва типи кабелів можуть використовуватись одночасно при побудові SAN. Конверсія інтерфейсів здійснюється за допомогою GBIC (Gigabit Interface Converter) та MIA (Media Interface Adapter). Обидва типи кабелю сьогодні забезпечують однакову швидкість передачі. Мідний кабель використовується для коротких відстаней (до 30 метрів), оптичний як для коротких, так і для відстаней до 10 км і більше. Використовують багатомодовий та одномодовий оптичні кабелі. Багатомодовий (Multimode) кабель використовується для коротких відстаней (до 2 км). Внутрішній діаметр оптоволокна мультимодового кабелю становить 62,5 або 50 мікронів. Для забезпечення швидкості передачі 100 МБ/с (200 МБ/с у дуплексі) при використанні багатомодового оптоволокна довжина кабелю має перевищувати 200 метрів. Одномодовий кабель використовується для великих відстаней. Довжина такого кабелю обмежена потужністю лазера, що використовується у передавачі сигналу. Внутрішній діаметр оптоволокна одномодового кабелю становить 7 або 9 мікронів, він забезпечує проходження одиночного променя.

Конектори, адаптери

Для підключення мідних кабелів використовуються конектори типу DB-9 або HSSD. HSSD вважається більш надійним, але DB-9 використовується так само часто, тому що він більш простий та дешевий. Стандартним (найпоширенішим) конектором для оптичних кабелів є SC конектор, він забезпечує якісне, чітке з'єднання. Для звичайного підключення використовуються багатомодові конектори SC, а для віддаленого - одномодові. У багатопортових адаптерах використовуються мікроконектори.

Найбільш поширені адаптери FC під шину PCI 64 bit. Також багато адаптеров FC виробляється під шину S-BUS, для спеціалізованого використання випускаються адаптери під MCA, EISA, GIO, HIO, PMC, Compact PCI. Найпопулярніші — однопортові, зустрічаються дво- та чотирипортові картки. На PCI адаптерах, як правило, використовують DB-9, HSSD, SC конектори. Також часто зустрічаються GBIC-based адаптери, які постачаються як із модулями GBIC, так і без них. Fibre Channel адаптери відрізняються класами, які вони підтримують, та різноманітними особливостями. Для розуміння відмінностей наведемо порівняльну таблицю адаптерів виробництва компанії QLogic.

Fibre Channel Host Bus Adapter Family Chart
SANblade64 BitFCAL Publ. Pvt LoopFL PortClass 3F PortClass 2Point to PointIP/SCSIFull DuplexFC TapePCI 1.0 Hot Plug SpecSolaris Dynamic ReconfigVIВ2Gb
2100 Series33 & 66MHz PCIXXX
2200 Series33 & 66MHz PCIXXXXXXXXX
33MHz PCIXXXXXXXXXX
25 MHZ SbusXXXXXXXXX X
2300 Series66 MHZ PCI/ 133MHZ PCI-XXXXXXXXXX XX

Концентратори

Fibre Channel HUBs (концентратори) використовуються для підключення нод до FC кільця (FC Loop) і мають структуру, схожу на концентратори Token Ring. Оскільки розрив кільця може призвести до припинення функціонування мережі, в сучасних концентраторах FC використовуються порти обходу кільця (PBC-port bypass circuit), які дозволяють автоматично відкривати/закривати кільце (підключати/відключати системи, приєднані до концентратора). Зазвичай FC HUBs підтримують до 10 підключень і можуть стекуватися до 127 портів на кільце. Усі пристрої, підключені до HUB, отримують загальну смугу пропускання, яку можуть розділяти між собою.

Комутатори

Fibre Channel Switches (комутатори) мають ті ж функції, що і звичні читачеві LAN комутатори. Вони забезпечують повношвидкісне неблоковане підключення між нодами. Будь-яка нода, підключена до комутатора FC, отримує повну (з можливостями масштабування) смугу пропускання. У разі збільшення кількості портів комутованої мережі її пропускна здатність збільшується. Комутатори можуть використовуватися разом з концентраторами (які використовують для ділянок, що не вимагають виділення смуги пропуску для кожної ноди) для досягнення оптимального співвідношення ціна/продуктивність. Завдяки каскадування свічки потенційно можуть використовуватися для створення FC мереж з кількістю адрес 2 24 (понад 16 мільйонів).

Мости

FC Bridges (мости або мультиплексори) використовуються для підключення пристроїв із паралельним SCSI до мережі на базі FC. Вони забезпечують трансляцію пакетів SCSI між Fibre Channel і Parallel SCSI пристроями, прикладами яких можуть служити Solid State Disk (SSD) або бібліотеки на магнітних стрічках. Слід зазначити, що останнім часом практично всі пристрої, які можуть бути утилізовані в рамках SAN, виробники починають випускати з вмонтованим інтерфейсом FC для прямого їх підключення до мереж зберігання даних.

Сервери та Сторедж

Незважаючи на те, що сервери і сторедж - далеко не останні за важливістю компоненти SAN, ми на їх описі зупинятися не будемо, оскільки впевнені, що з ними добре знайомі всі наші читачі.

Насамкінець хочеться додати, що ця стаття — лише перший крок до мереж зберігання даних. Для повного розуміння теми читачеві слід приділити чимало уваги особливостям реалізації компонентів виробниками SAN і програмним засобамуправління, оскільки без них Storage Area Network - це лише набір елементів для комутації сторедж-систем, які не принесуть вам повноти переваг від реалізації мережі зберігання даних.

Висновок

Сьогодні Storage Area Network є досить новою технологією, яка незабаром може стати масовою у колі корпоративних замовників. У Європі та США підприємства, які мають досить великий парк інстальованих сторедж-систем, вже починають переходити на мережі зберігання даних для організації сторедж із найкращим показником загальної вартості володіння.

За прогнозами аналітиків, у 2005 році значна кількість серверів середнього та верхнього рівня будуть поставлятися з попередньо встановленим інтерфейсом Fibre Channel (таку тенденцію можна помітити вже сьогодні), і лише для внутрішнього підключення дисків у серверах використовуватиметься паралельний SCSI інтерфейс. Вже сьогодні при побудові сторедж-систем та придбанні серверів середнього та верхнього рівня слід звернути увагу на цю перспективну технологію, тим більше, що вже сьогодні вона дає можливість реалізувати ряд завдань набагато дешевше, ніж за допомогою спеціалізованих рішень. Крім того, вкладаючи в технологію SAN сьогодні, ви не втратите своїх вкладень завтра, оскільки особливості Fibre Channel створюють чудові можливості для використання в майбутньому вкладених сьогодні інвестицій.

P.S.

Попередня версія статті була написана в червні 2000 року, але через відсутність масового інтересу до технології мереж зберігання даних публікацію було відкладено на майбутнє. Це майбутнє настало сьогодні, і я сподіваюся, що ця стаття спонукає читача усвідомити необхідність переходу на технологію мереж зберігання даних як передову технологію побудови сторедж-систем та організації доступу до даних.

Мережеві сховища даних NAS

Обсяги інформації та даних, з якими працюють сучасні компанії, значно перевищують рівень десятирічної та навіть п'ятирічної давності. Технічні рішення, що дозволяють сьогодні оперативно обробляти такі масштаби корпоративних даних, істотно відрізняються від схем, що працюють в умовах "побутового користування". Для життєдіяльності бізнесу необхідні вже кілька серверів, які одночасно виконують різні завдання: термінальні, поштові, DNS, проксі-сервери та інші, часто не об'єднані в кластерну систему. При такому розподілі виникає проблема оперативної обробки та резервування даних з різних пристроїв. Для вирішення цього завдання використовуються системи зберігання даних (СГД), вибрати та купити які пропонує наша компанія.

Переваги використання зовнішнього сховища даних

Подібна система зберігання даних (СГД) для роботи з даними є комплексним рішенням, що дозволяє централізовано зберігати будь-які обсяги інформації, забезпечуючи надійність її захисту, оперативність обробки та повне архівування. Мережеве сховище даних має ще кілька переваг перед класичними рішеннями розподілу інформації між кількома серверами. Відмовостійкість досягається можливістю як часткового, і повного резервування складових мережної СХД. Зовнішнє Мережеве сховищеданих відрізняється потужнішою продуктивністю і оперативністю передачі, легко адаптується під бізнес-потреби компанії, оскільки має можливість легко масштабуватися і підлаштовуватися під зміни обсягу інформаційних потоків даних у компанії. Сховище даних на відміну стандартних баз даних можна використовувати як обробки транзакцій, але й аналізу динаміки продажів протягом кількох років, формування звітів у різних форматах, інтегрування даних із різних реєструючих систем.

Існує чотири види зберігання даних:

  • NAS. Надійні, недорогі комплекси, що легко настроюються.
  • DAS. Схеми із зовнішньою магістраллю, що дає можливість підключення необмеженої кількості дисків.
  • SAN. Добре підходять для зберігання поштової бази даних та забезпечують оперативний доступ до інформації.
  • Відмовостійкі сховища даних. Об'єднуються в кластерну схему та забезпечують найбільшу надійність та швидкість передачі даних.

Зовнішні сховища даних застосовуються для економії внутрішнього дискового простору, запобігання втраті даних, забезпечення безпеки та доступності вмісту в будь-який час.

Купити мережеве сховище даних за хорошу вартість? Вам сюди!

Якщо ви вирішили купити мережеве сховище даних для своєї організації, компанія Трініті забезпечить Ваш бізнес надійними та потужними системами зберігання даних. У нашому асортименті є різні зміни СГД. Ми є офіційними представниками виробників IT-обладнання, що лідирують на світовому ринку, і маємо можливість оперативно укомплектувати сховище даних будь-якої конфігурації. Ми пропонуємо системи зберігання даних від таких виробників як Dell, HP, Lenovo, EMC та ін.

Для кожної конкретної компанії в залежності від її вимог та завдань, наші фахівці допоможуть вибрати або зібрати систему зберігання даних в індивідуальній комплектації, оптимальній для її масштабів, бюджету та вже працюючій мережній інфраструктурі. Ціна на обрану систему зберігання даних залежатиме від комплектації, вартість проектування сховища даних в залежності від поставлених завдань ви можете уточнити у наших фахівців.

Усі роботи з аналізу поточного стану технічної бази, підбору потрібної комплектації та встановлення обладнання наша компанія бере на себе. Вам потрібно просто залишити заявку нашим фахівцям.

Крім того, ми забезпечуємо технічну підтримкуобладнання, що поставляється. Наші співробітники – це висококваліфіковані інженери, монтажники, IT-фахівці нададуть Вам кваліфіковану допомогу у будь-який час. Від професійної консультації до модернізації та розробки обладнання.