Позволяет достичь многих преимуществ RAID – отказоустойчивости и возможности простой замены вышедшего из строя диска и его восстановления в фоновом режиме, прозрачности местонахождения файла (вне зависимости от того, на каком диске он находится).
Сегодня в рубрике «Технология» мы снова поговорим о RAID-массивах. Эта тема поднималась в журнале «Железо», и не раз. Но с того времени, когда производители материнских плат для настольного сегмента ввели моду на RAID в пользовательских ПК, сделав его очередной рекламной фишкой, прошло достаточно много времени, особенно по меркам ИТ-индустрии. Вспомним, что такое RAID, и посмотрим, что же нового произошло с технологией за последние годы.
RAID расшифровывается как redundant array of inexpensive/independent disks - избыточный массив недорогих/независимых дисков и впервые был представлен в 1987 году. Изначально подобные массивы строились в качестве резерва носителям на оперативной (RAM) памяти, которая в то время была дорогой. Со временем аббревиатура приобрела второе значение - RAID переназвали массивом независимых дисков, подразумевая использование нескольких дисков, а не разделов одного диска, а также дороговизну оборудования, необходимого для построения этого самого массива.
Концепция
Если брать исторический аспект, то данная технология родилась в результате решения проблемы, связанной с нарушением функционирования вычислительного комплекса в результате потери данных, находящихся в памяти, иными словами, решения проблемы отказоустойчивости. Исследованиями занимался Норман Кен Учи, а в 1978 году он защитил свои разработки патентом.
Затем, в 1987 году, Девид Паттерсон, Гарт Гибсон и Рэнди Кац опубликовали статью, где ввели термин «RAID». Данная статья говорила о высокой скорости роста производительности процессоров и грядущей проблеме с производительностью дисковой подсистемы. Более того, к настоящему моменту рост производительности значительно опередил предсказания, и проблема стала более актуальной.
RAID-массивы как раз и призваны повысить производительность дисковой подсистемы. Но еще одной задачей является снижение зависимости надежности подсистемы от надежности диска. То есть такая организация работы, при которой надежность выше, чем у одиночного диска. С ростом числа устройств, согласно теории вероятности, значительно падает надежность системы, но отказоустойчивость призвана бороться с этим. Все это делается с помощью специальным образом организованной работы массива из жестких дисков. Это и есть RAID.
Виды массивов
Рассмотрим, какие бывают RAID-массивы. Сперва рассмотрим уровни, которые были представлены учеными из Беркли, потом их комбинации и необычные режимы. Стоит заметить, что если используются диски разного размера (что не рекомендуется), то работать они будут по объему наименьшего. Лишний объем больших дисков будет просто недоступен.
RAID 0. Дисковый массив с чередованием без отказоустойчивости/четнос>ти (Stripe)
RAID 0 является массивом, где данные разбиваются на блоки (размер блока можно задавать при создании массива) и затем записываются на отдельные диски. В простейшем случае есть два диска, один блок пишется на первый диск, другой на второй, затем опять на первый и так далее. Также этот режим называется «чередование», поскольку при записи блоков данных чередуются диски, на которые осуществляется запись. Соответственно, читаются блоки тоже поочередно. Таким образом происходит параллельное выполнение операций ввода/вывода, что приводит к большей производительности. Если раньше за единицу времени мы могли считать один блок, то теперь можем сделать это сразу с нескольких дисков. Основным плюсом данного режима как раз и является высокая скорость передачи данных.
Однако чудес не бывает, а если бывают, то нечасто. Производительность растет все же не в N раз (N - число дисков), а меньше. В первую очередь увеличивается в N раз время доступа к диску, и без того высокое относительно других подсистем компьютера. Качество контроллера оказывает не меньшее влияние. Если он не самый лучший, то скорость может едва заметно отличаться от скорости одного диска. Ну и немалое влияние оказывает интерфейс, которым RAID-контроллер соединен с остальной системой. Все это может привести не только к меньшему, чем N, увеличению скорости линейного чтения, но и к пределу количества дисков, превышение которого прироста давать уже не будет вовсе. Или, наоборот, будет слегка снижать скорость. В реальных задачах, с большим числом запросов, шанс столкнуться с этим явлением минимален, ибо скорость весьма сильно упирается в сам жесткий диск и его возможности.
В этом режиме избыточности нет как таковой. Используется все дисковое пространство. Однако если один из дисков выходит из строя, то, очевидно, теряется вся информация.
RAID 1. Зеркалирование (Mirror)
Суть данного режима RAID сводится к созданию копии (зеркала) диска с целью повышения отказоустойчивости. Если один диск выходит из строя, то работа не прекращается, а продолжается, но уже с одним диском. Для этого режима требуется четное число дисков. Идея этого метода близка к резервному копированию, но все происходит «на лету», равно как и восстановление после сбоя (что порой весьма важно), и нет необходимости тратить время на это.
Минусы - высокая избыточность, так как нужно вдвое больше дисков для создания такого массива. Еще одним минусом является то, что отсутствует какой-либо прирост производительности - ведь на второй диск просто пишется копия данных первого.
RAID 2. Массив с использованием ошибкоустойчивого кода Хемминга
Данный код позволяет исправлять и обнаруживать двойные ошибки. Активно используется в памяти с коррекцией ошибок (ECC). В этом режиме диски разбиваются на две группы: одна часть используется для хранения данных и работает аналогично RAID 0, разбивая блоки данных по разным дискам; вторая часть используется для хранения ECC-кодов.
Из плюсов можно выделить исправление ошибок «на лету», высокую скорость потоковой передачи данных.
Главным минусом является высокая избыточность (при малом числе дисков она почти двойная, n-1). При увеличении числа дисков удельное число дисков хранения ECC-кодов становится меньше (снижается удельная избыточность). Вторым минусом является низкая скорость работы с мелкими файлами. Из-за громоздкости и высокой избыточности с малым числом дисков данный уровень RAID в данное время не используется, сдав позиции более высоким уровням.
RAID 3. Отказоустойчивый массив с битовым чередованием и четностью
Данный режим записывает данные по блокам на разные диски, как RAID 0, но использует еще один диск для хранения четности. Таким образом, избыточность намного ниже, чем в RAID 2 и составляет всего один диск. В случае сбоя одного диска скорость практически не меняется.
Из основных минусов надо отметить низкую скорость при работе с мелкими файлами и множеством запросов. Связано это с тем, что все контрольные коды хранятся на одном диске и при операциях ввода/вывода их необходимо переписывать. Скорость этого диска и ограничивает скорость работы всего массива. Биты четности пишутся только при записи данных. А при чтении - они проверяются. По причине этого наблюдается дисбаланс в скорости чтения/записи. Одиночное чтение небольших файлов также характеризуется невысокой скоростью, что связано с невозможностью параллельного доступа с независимых дисков, когда разные диски параллельно выполняют запросы.
RAID 4. Отказоустойчивый массив с блочным чередованием и четностью
Данные записываются блоками на разные диски, один диск используется для хранения битов четности. Отличие от RAID 3 заключается в том, что блоки разбиваются не по битам и байтам, а по секторам.
Преимущества заключаются в высокой скорости передачи при работе с большими файлами. Также высока скорость работы с большим числом запросов на чтение.
Из недостатков можно отметить доставшиеся от RAID 3 дисбаланс в скорости операций чтения/записи и существование условий, затрудняющих параллельный доступ к данным.
RAID 5. Дисковый массив с чередованием и распределенной четностью
Метод похож на предыдущий, но в нем для битов четности не выделяется отдельный диск, а эта информация распределяется между всеми дисками. То есть, если используется N дисков, то будет доступен объем N-1 дисков. Объем одного будет выделен под биты четности, как и в RAID 3 и 4. Но они хранятся не на отдельном диске, а разделены. На каждом диске есть (N-1)/N объема информации и 1/N объема заполнено битами четности. Если в массиве выходит из строя один диск, то RAID остается работоспособным (данные, хранившиеся на нем, вычисляются на основе четности и данных других дисков «на лету»). То есть сбой проходит прозрачно для пользователя и порой даже с минимальным падением производительности (зависит от вычислительной способности RAID-контроллера).
Из преимуществ отметим высокие скорости чтения и записи данных, как при больших объемах, так и при большом числе запросов.
Недостатки - сложное восстановление данных и более низкая, чем в RAID 4, скорость чтения.
RAID 6. Дисковый массив с чередованием и двойной распределенной четностью.
Все отличие сводится к тому, что используются две схемы четности. Система устойчива к отказам двух дисков. Основной сложностью является то, что для реализации этого приходится делать больше операций при выполнении записи. Из-за этого скорость записи является чрезвычайно низкой.
Комбинированные (nested) уровни RAID
Поскольку массивы RAID являются прозрачными для ОС, то вскоре пришло время и для создания массивов, элементами которых являются не диски, а массивы других уровней. Обычно они пишутся через плюс. Первая цифра означает то, массивы какого уровня входят в качестве элементов, а вторая цифра - то, какую организацию имеет верхний уровень, который объединяет элементы.
RAID 0+1
Комбинация, которая является массивом RAID 1, собранным на базе массивов RAID 0. Как и в массиве RAID 1, доступным будет только половина объема дисков. Но, как и в RAID 0, скорость будет выше, чем с одним диском. Для реализации такого решения необходимо минимум 4 диска.
RAID 1+0
Также известен, как RAID 10. Является страйпом зеркал, то есть, массивом RAID 0, построенным из массивов RAID 1. Практически аналогичен предыдущему решению.
RAID 0+3
Массив с выделенной четностью над чередованием. Является массивом третьего уровня, в котором данные блоками разбиваются и пишутся на массивы RAID 0. Комбинации помимо простейших 0+1 и 1+0 требуют специализированных контроллеров, зачастую достаточно дорогих. Надежность данного вида ниже, чем у следующего варианта.
RAID 3+0
Также известен, как RAID 30. Является страйпом (массивом RAID 0) из массивов RAID 3. Обладает весьма высокой скорость передачи данных вкупе с неплохой отказоустойчивостью. Данные сначала разделяются на блоки (как в RAID 0) и попадают на массивы-элементы. Там они опять делятся на блоки, считается их четность, блоки пишутся на все диски, кроме одного, на который пишутся биты четности. В данном случае из строя может выйти один из дисков каждого из входящих в состав массива RAID 3.
RAID 5+0 (50)
Создается путем объединения массивов RAID 5 в массив RAID 0. Обладает высокой скоростью передачи данных и обработки запросов. Обладает средней скоростью восстановления данных и хорошей стойкостью при отказе. Комбинация RAID 0+5 также существует, но больше теоретически, так как дает слишком мало преимуществ.
RAID 5+1 (51)
Сочетание зеркалирования и чередования с распределенной четностью. Также вариантом является RAID 15 (1+5). Обладает очень высокой отказоустойчивостью. Массив 1+5 способен работать при отказе трех дисков, а 5+1 - пяти из восьми дисков.
RAID 6+0 (60)
Чередование с двойной распределенной четностью. Иными словами - страйп из RAID 6. Как уже говорилось применительно к RAID 0+5, RAID 6 из страйпов не получил распространения (0+6). Подобные приемы (страйп из массивов с четностью) позволяют повысить скорость работы массива. Еще одним преимуществом является то, что так можно легко повысить объем, не усложняя ситуации с задержками, необходимыми на вычисление и запись большего числа битов четности.
RAID 100 (10+0)
RAID 100, также пишущийся как RAID 10+0, является страйпом из RAID 10. По своей сути он схож с более широким массивом RAID 10, где используется вдвое больше дисков. Но именно такой «трехэтажной» структуре есть свое объяснение. Чаще всего RAID 10 делают аппаратным, то есть силами контроллера, а уже страйп из них делают программно. К такой уловке прибегают, чтобы избежать проблемы, о которой говорилось в начале статьи, - контроллеры имеют свои ограничения по масштабируемости, и если воткнуть в один контроллер двойное число дисков, прироста можно при некоторых условиях вообще не увидеть. Программный же RAID 0 позволяет создать его на базе двух контроллеров, каждый из которых держит на борту RAID 10. Так мы избегаем «бутылочного горлышка» в лице контроллера. Еще одним полезным моментом является обход проблемы с максимальным числом разъемов на одном контроллере - удваивая их число, мы удваиваем и число доступных разъемов.
Нестандартные режимы RAID
Двойная четность
Распространенным дополнением к перечисленным уровням RAID является двойная четность, порой называемая «диагональной четностью». Двойная четность уже внедрена в RAID 6. Но, в отличие от нее, четность считается над другими блоками данных. Недавно спецификация RAID 6 была расширена, потому диагональная четность может считаться RAID 6. Если для RAID 6 четность считается как результат сложения по модулю двух битов, идущих в ряд (то есть сумма первого бита на первом диске, первого бита на втором и т.д.), то в диагональной четности идет смещение. Работа в режиме сбоя дисков не рекомендуется (ввиду сложности вычисления утраченных битов из контрольных сумм).
RAID-DP
Является разработкой NetApp RAID-массива с двойной четностью и подпадает под обновленное определение RAID 6. Использует отличную от классической RAID 6 реализации схему записи данных. Запись ведется сначала на кэш NVRAM, снабженный источником бесперебойного питания, чтобы предотвратить потерю данных при отключении электричества. Программное обеспечение контроллера, по возможности, пишет только цельные блоки на диски. Такая схема предоставляет большую защиту, чем RAID 1, и имеет более высокую скорость работы, нежели обычный RAID 6.
RAID 1,5
Был предложен компанией Highpoint, однако теперь применяется очень часто в контроллерах RAID 1 без каких-либо выделений данной особенности. Суть сводится к простой оптимизации - данные пишутся как на обычный массив RAID 1 (чем RAID 1,5 по сути и является), а читают данные с чередованием с двух дисков (как в RAID 0). В конкретной реализации от Highpoint, применявшейся на платах DFI серии LanParty на чипсете nForce 2, прирост был едва заметным, а порой и нулевым. Связано это, вероятно, с невысокой скоростью контроллеров данного производителя в целом в то время.
RAID 1E
Комбинирует в себе RAID 0 и RAID 1. Создается минимум на трех дисках. Данные пишутся с чередованием на три диска, а со сдвигом на 1 диск пишется их копия. Если пишется один блок на три диска, то копия первой части пишется на второй диск, второй части - на третий диск. При использовании четного числа дисков лучше, конечно, использовать RAID 10.
RAID 5E
Обычно при построении RAID 5 один диск оставляют свободным (spare), чтобы в случае сбоя система сразу стала перестраивать (rebuild) массив. При обычной работе этот диск работает вхолостую. Система RAID 5E подразумевает использование этого диска в качестве элемента массива. А объем этого свободного диска распределяется по всему массиву и находится в конце дисков. Минимальное число дисков - 4 штуки. Доступный объем равен n-2, объем одного диска используется (будучи распределенным между всеми) для четности, объем еще одного - свободный. При выходе из строя диска происходит сжатие массива до 3-х дисков (на примере минимального числа) заполнением свободного пространства. Получается обычный массив RAID 5, устойчивый к отказу еще одного диска. При подключении нового диска массив разжимается и занимает вновь все диски. Стоит отметить, что во время сжатия и распаковки массив не является устойчивым к выходу еще одного диска. Также он недоступен для чтения/записи в это время. Основное преимущество - большая скорость работы, поскольку чередование происходит на большем числе дисков. Минус - нельзя данный диск назначать сразу к нескольким массивам, что возможно в простом массиве RAID 5.
RAID 5EE
Отличается от предыдущего вида RAID только тем, что области свободного места на дисках не зарезервированы одним куском в конце диска, а чередуются блоками с битами четности. Такая технология значительно ускоряет восстановление после сбоя системы. Блоки можно записать прямо на свободное место, без необходимости перемещения по диску.
RAID 6E
Аналогично с RAID 5E использует дополнительный диск для повышения скорости работы и распределения нагрузки. Свободное место разделяется между другими дисками и находится в конце дисков.
RAID 7
Данная технология является зарегистрированной торговой маркой фирмы Storage Computer Corporation. Массив, основывающийся на RAID 3, 4, оптимизированный для повышения производительности. Основное преимущество заключается в использовании кэширования операций чтения/записи. Запросы на передачу данных осуществляются асинхронно. При построении используются диски SCSI. Скорость выше решений RAID 3, 4 приблизительно в 1.5-6 раз.
Intel Matrix RAID
Является технологией, представленной Intel в южных мостах, начиная с ICH6R. Суть сводится к возможности комбинации RAID-массивов разных уровней на разделах дисков, а не на отдельных дисках. Скажем, на двух дисках можно организовать по два раздела, два из них будут хранить на себе операционную систему на массиве RAID 0, а другие два - работая в режиме RAID 1 - хранить копии документов.
Linux MD RAID 10
Это RAID-драйвер ядра Linux, предоставляющий возможность создания более продвинутой версии RAID 10. Так, если для RAID 10 существовало ограничение в виде четного числа дисков, то этот драйвер может работать и с нечетным. Принцип для трех дисков будет тем же, что в RAID 1E, когда происходит чередование дисков по очереди для создания копии и чередования блоков, как в RAID 0. Для четырех дисков это будет эквивалентно обычному RAID 10. Помимо этого, можно задавать, на какой области диска будет храниться копия. Скажем, оригинал будет в первой половине первого диска, а его копия - во второй половине второго. Со второй половиной данных - наоборот. Данные можно дублировать несколько раз. Хранение копий на разных частях диска позволяет достичь большей скорости доступа в результате разнородности жесткого диска (скорость доступа меняется в зависимости от расположения данных на пластине, обычно разница - в два раза).
RAID-K
RAID-K - разработан компанией Kaleidescape для использования в своих медиаустройствах. Схож с RAID 4 с использованием двойной четности, но использует другой метод отказоустойчивости. Пользователь может легко расширять массив, просто добавляя диски, причем в случае, если HDD содержит данные, они будут просто добавлены в него вместо удаления, как это требуется обычно.
RAID-Z
RAID-Z - разработка компании Sun. Самой большой проблемой RAID 5 является потеря информации в результате отключения питания, когда информация из дискового кэша (который является энергозависимой памятью, то есть не хранит данные без электричества) не успела сохраниться на магнитные пластины. Такое несовпадение информации в кэше и на диске называют некогерентностью. Сама организация массива связана с файловой системой Sun Solaris - ZFS. Используется принудительная запись содержимого кэш-памяти дисков, восстанавливать можно не только весь диск, но и блок «на лету», когда контрольная сумма не совпала. Еще немаловажным аспектом является идеология ZFS - она не меняет данные при необходимости. Вместо этого она пишет обновленные данные и потом, убедившись, что операция прошла уже удачно, меняет указатель на них. Таким образом удается избежать потери данных при модификации. Мелкие файлы дублируются вместо создания контрольных сумм. Это тоже делается силами файловой системы, поскольку она знакома со структурой данных (массивом RAID) и может выделять место под эти цели. Существует также RAID-Z2, который, подобно RAID 6, способен выдержать отказ двух дисков с помощью использования двух контрольных сумм.
JBOD
JBOD не является RAID в принципе, но часто вместе с ним употребляется. Дословно переводится как «просто набор дисков» (just a bunch of disks) Технология объединяет все диски, установленные в системе, в один большой логический диск. То есть вместо трех дисков будет виден один крупный. Используется весь суммарный объем дисков. Улучшения надежности и производительности нет.
Drive Extender
Функция, заложенная в Window Home Server. Совмещает в себе JBOD и RAID 1. При необходимости создания копии она не дублирует сразу файл, а ставит на NTFS-разделе метку, указывающую на данные. При простое система копирует файл так, чтобы место на дисках было максимальным (использовать можно диски разного объема). Позволяет достичь многих преимуществ RAID - отказоустойчивости и возможности простой замены вышедшего из строя диска и его восстановления в фоновом режиме, прозрачности местонахождения файла (вне зависимости от того, на каком диске он находится). Также можно проводить параллельный доступ с разных дисков с помощью вышеуказанных меток, получая сходную с RAID 0 производительность.
UNRAID
Технология UNRAID разработана компанией Lime technology LLC. Эта схема отличается от обычных RAID-массивов тем, что позволяет смешивать диски SATA и PATA в одном массиве и диски разных объемов и скорости. Для контрольной суммы (четности) используется выделенный диск. Данные не чередуются между дисками. В случае отказа одного диска теряются только файлы, хранящиеся на нем. Однако с помощью четности они могут быть восстановлены. UNRAID внедрен как добавление к Linux MD (multidisk).
Большинство видов RAID-массивов не получило распространения, часть используется в узких сферах применения. Наиболее массовыми, от простых пользователей до серверов начального уровня, стали RAID 0, 1, 0+1/10, 5 и 6. Нужен ли тебе RAID для твоих задач - решать тебе.
Источник: Интернет магазин
А так же :
106
Город СоблаSнов (2010) » Скачать mp3 музыку бесплатно, скачать
РЕГИСТРАЦИЯ ПРОДАЖ И ПРОГНОЗИРОВАНИЕ
1. Ведение записей, связанных с продажей товаров В этой работе речь пойдет о ведении записей, связанных с продажей товаров. Это необходимо как для организации интенсивного сбыта, так и для контроля за эффективностью мероприятий в сфере маркетинга. С помощью этих записей Вы сможете контролировать свою деятельность по сбыту не только в данный момент, но и в будущем.