Нефть и песок О стали Компрессор - подбор и ошибки Из истории стандартизации резьб Соперник ксерокса - гектограф Новые технологии производства стали Экспорт проволоки из России Прогрессивная технологическая оснастка Цитадель сварки с полувековой историей Упрочнение пружин Способы обогрева Назначение, структура, характеристики анализаторов Промышленные пылесосы Штампованные гайки из пружинной стали Консервация САУ Стандарты и качество Технология производства Водород Выбор материала для крепежных деталей Токарный резец в миниатюре Производство проволоки Адгезия резины к металлокорду Электролитическое фосфатирование проволоки Восстановление корпусных деталей двигателей Новая бескислотная технология производства проката Синие кристаллы Автоклав Нормирование шумов связи Газосварочный аппарат для тугоплавких припоев
Главная страница / Архитектура отрасли

СИСТЕМЫ ХРАНЕНИЯ КОРПОРАТИВНОЙ ИНФОРМАЦИИ

В настоящее время практически для всех организаций характерно критическое нарастание объемов информации. Рост объема данных в информационной системе ставит перед IT-персоналом задачу построения современной системы хранения данных. По сведениям компании Meta Group (Стэмфорд, шт. Коннектикут), объем аккумулируемой в организации информации удваивается каждые 18 месяцев [1]. Конечно, такой показатель в большей степени характерен для зарубежных компаний, но и российские фирмы ненамного отстают по темпам увеличения объема хранимой информации. Анализируя требования к системам хранения данных, необходимо учитывать, что сейчас в России быстрыми темпами развиваются такие сферы деятельности, как электронная коммерция, планирование ресурсов предприятия (ERP) и управление взаимоотношениями с потребителями (Customer Relationship Management, CRM).

Исторически сложилось так, что подавляющее большинство предприятий имеет несколько автоматизированных систем различного функционального назначения, каждая из которых решает свою группу задач. Ни для кого не секрет, что обмениваться корпоративными данными эти системы могут с трудом, в некоторых случаях требуется новый ввод данных для каждой конкретной системы. Поэтому возникает необходимость в создании единого информационного пространства, при котором информация централизованна и доступна пользователям, работающим в различных автоматизированных системах. При этом совместное использование информации предполагает консолидацию корпоративного аппаратного обеспечения. Преобладающие в корпоративных информационных системах приложения баз данных только усиливают потребность в едином информационном пространстве.

Концепцию «большого мешка» успешно применяют многие компании. Проведенный Business Research Group опрос 300 IT-специалистов [2] показал, что две трети респондентов рассматривают возможность объединения устройств хранения данных в подсистему, допускающую совместное использование данных.

Как это ни удивительно, большинство компаний относятся к вопросу создания структуры хранения данных не слишком серьезно. «Пока компании действуют импульсивно. Осознавая рост объема информации, они просто увеличивают число серверов и расширяют объем дискового пространства. Лишь немногие подходят к проблеме конструктивно», – говорит Джефф Хайн, руководитель подразделения профессионального обслуживания компании Berkshire Computer Products (Хопкинтон, шт. Массачусетс). Причем такой подход характерен как для зарубежных, так и для российских компаний.

Цена потери доступа к

корпоративной информации

Можно долго обсуждать успехи технического прогресса, однако в словосочетании «информационные технологии» второе понятие всегда подчинено первому, а информация стоила и должна стоить дороже средств ее обработки, передачи и хранения [3]. По сведениям International Data Corp., плата за поддержку неизбежно возрастающих объемов данных составляет сегодня приблизительно половину всех расходов на IT-рещие способы обеспечения постоянного доступа к информации предпринимаются, для того чтобы избежать еще больших расходов, связанных с потерями доступа к хранилищам информации (до нескольких миллионов долларов в час в зависимости от приложения). Эти потери складываются из суммы ущерба от снижения эффективности труда сотрудников из-за простоя системы хранения данных, стоимости работы, которая не может быть выполнена в период простоя, а также стоимости ремонта вышедших из строя элементов системы. При реализации критически важных для предприятия приложений стоит учесть, что цена простоев из-за сбоев системы вполне оправдывает вложение немалых средств в установку отказоустойчивых архитектур. Десять лет назад, когда сервер локальной сети на базе процессора Intel выходил из строя, неприятности компании ограничивались возмущением пользователей по поводу отсутствия доступа к электронной почте. Теперь в случае выхода из строя системы хранения данных, обеспечивающей работу важных приложений, от которых зависит прибыль, а также при отсутствии доступа к ценной информации компания несет значительные убытки.

Что такое система хранения данных?

Концепция построения системы хранения данных была сформулирована в 1992 году «отцом-основателем» хранилищ данных Биллом Инмоном (Bill Inmon) в его книге «Building the Data Warehouse». Упрощенно смысл данной концепции можно объяснить следующим образом: система хранения физически отделяется от прикладных серверов и данные, созданные во всевозможных приложениях, помещаются на отдельное устройство либо группу устройств, специально предназначенных для хранения и обеспечения доступа к данным. Иными словами, администрирование и управление хранением данных на физическом уровне выделено в отдельную техническую и организационную задачу.

Сегодня существуют следующие подходы к построению систем хранения данных: прямое подключение (DAS – Direct Attached Storage); сеть хранения данных (SAN – Storage Area Network); подсистемы хранения данных, подсоединенные к сети (NAS – Network Attached Storage); NAS gateway – NAS устройство без интегрированной памяти (оно соединяется непосредственно с внешней памятью или SAN) и SANergy – программное обеспечение от IBM и Tivoli, предназначенное для разделения одного накопителя, файловой системы и файлов в ней между множеством серверов, подключенных к сети хранения данных (SAN).

Первые три из названных архитектур построения систем хранения данных наиболее распространенные.

Прямое подключение DAS предусматривает непосредственное соединение устройства хранения и серверов. Этот способ аналогичен подключению дисковых массивов (к примеру, RAID-массивов) и отличается только тем, что в данном случае к одному устройству хранения данных можно подключить сразу несколько серверов (рис. 1).

В качестве устройств хранения данных чаще всего используются дисковые подсистемы, например, HDS Freedom Storage, EMC Symmetrix, Comparex Tetragon, IBM 7133 Disk System, HP SureStore.

СтоFreedom Storage, Comparex Tetragon, HP SureStore выпускаются фирмой Hitachi и поставляются под различными марками по ОЕМ-соглашениям.

Вторым способом построения системы хранения данных является создание сетей хранения данных (SAN), которые в большинстве случаев используются в крупных вычислительных центрах. При этом способе подсистема хранения данных выделяется в отдельный сегмент сети, а прикладные серверы подключаются по набору высокоскоростных каналов, которые для удобства часто называют «SAN-облаком».

«SAN-облако» обычно строится на основе Fibre Channel технологии с применением специальных коммутаторов, которые обеспечивают высокоскоростное соединение как с подсистемой хранения данных, так и между прикладными серверами (рис. 2).

Основные преимущества SAN в следующем: возможность размещения дисковых подсистем на большом расстоянии от процессоров; практически неограниченные возможности масштабирования. Объясняется это тем, что программное обеспечение позволяет представить несколько подсистем хранения данных в качестве единой общей памяти, доступной для всех процессоров.

Поскольку для реализации SAN требуется специализированная сеть, первоначальные затраты будут выше, чем при внедрении DAS или NAS. SAN требует соответствующих аппаратных средств и программного обеспечения для управления и обеспечения ее потенциальных преимуществ. Дополнительно организация должна обучить персонал управлять этой сложной технологией. Однако благодаря более длительному сроку эксплуатации и низкой общей стоимости суммарные затраты могут оказаться ниже, чем при альтернативных подходах.

В качестве подсистем хранения данных в этом случае могут использоваться те же устройства, что и при прямом подключении.

Третий способ основан на применении устройств хранения данных, подсоединенных напрямую к локальным сетям, чаще всего к Ethernet LAN или любой другой, поддерживающей IP-протоколы, которые использует NAS.

Устройства хранения NAS инсталлируются и управляются проще, чем SAN, так как обычно устанавливаются на уже имеющуюся LAN/WAN сеть, обеспечивают гибкость размещения и возможность создания систем из большого количества таких устройств. Идеология NAS предусматривает, что подсистема хранения работает через сеть как обычный файловый сервер. Любой прикладной сервер, подключенный к сети, автоматически получает доступ к данным (с учетом разграничения доступа), а устройство хранения данных выглядит как обычный файл-сервер (рис. 3).

В качестве примера такой подсистемы хранения данных можно привести устройства HP Netstorage 6000, EMC CLARiON IP4700, NetApp Filer фирмы Network Appliance.

Устройства хранения могут представлять собой не только отдельные дисковые подсистемы, но и целую цепочку устройств иерархической памяти. Такая структура может быть реализована как в одном устройстве (например, в системе иерархического хранения данных INFINISTORE VirtualDisk фирмы GRAU Data Storage), так и в виде нескольких устройств (многоуровневая струквание накопителей на оптических носителях, магнитных лентах, дисках CDROM и DVD и т. д. В настоящее время в большинстве случаев используются все же дисковые подсистемы хранения данных. Рассмотрим их более подробно.

Общие требования

к дисковым подсистемам хранения данных

Одной из основных проблем построения дисковой подсистемы хранения данных по-прежнему остается задача обеспечения ее продолжительного функционирования с учетом трех критериев: надежность, доступность (готовность) и удобство обслуживания.

В состав дисковой подсистемы хранения данных входят накопители на жестких магнитных дисках. Как любой технически сложный продукт, они подвержены выходу из строя из-за внешних и внутренних причин. К внешним относятся плохие климатические условия и некачественное электропитание. Внутренние причины бывают двух типов. К первым, «фатальным»,

относятся выгорание микросхем управления, выход из строя контактов, внутреннее разрушение компонентов. Вторые проявляются в виде постепенного ухудшения функциональных показателей диска, выхода характеристик за пределы рабочего диапазона.

Повышение надежности системы основано на принципе предотвращения неисправностей путем снижения интенсивности отказов и сбоев за счет применения электронных схем и компонентов с высокой и сверхвысокой степенью интеграции; снижения уровня помех; обеспечения тепловых режимов работы системы; совершенствования методов сборки аппаратуры. Единицей измерения надежности является среднее время наработки на отказ (Mean Time Between Failure, MTBF).

В 1987 году трое специалистов [6] из университета Беркли опубликовали статью с описанием методов повышения надежности путем использования массивов небольших (3,5- и 5,25-дюймовых) жестких дисков, что позволяет достичь показателей производительности, характерных для одного большого дорогостоящего диска (Single Large Expensive Disk, SLED) в мэйнфреймах. Эта технология получила название RAID – Redundant Array of Inexpensive Disks (избыточный массив недорогих дисков). Позже аббревиатура RAID претерпела изменение и теперь она означает Redundant Array of Independent Disks (избыточный массив независимых дисков). Дисковый массив RAID – это консолидированная дисковая система для хранения данных большого объема. В массивах RAID значительное число дисков относительно малой емкости используется для хранения крупных объемов данных, а также для обеспечения более высокой надежности и избыточности. Платой за это является дополнительная избыточность, которая, в свою очередь,

требует дополнительных затрат. Подобный массив воспринимается компьютером как единое логическое устройство.

Повышение устойчивости дисковой подсистемы предполагает предотвращение влияния отказов и сбоев на работу с помощью средств контроля и коррекции ошибок, а также средств автоматического восстановления выполняемого процесса после проявления неисправности. Ключевой момент при этом – обеспечение защитной избыточности на базе как аппаратногозволяет сохранить текущее состояние данных или продолжить выполнение процесса до замены вышедших из строя компонентов.

Отказоустойчивая система хранения данных должна обеспечивать переключение на альтернативное устройство в случае сбоя, а также информировать администратора о любых изменениях конфигурации, чтобы он мог восстановить вышедшие из строя компоненты прежде, чем откажут их дубликаты. Для этого система должна посылать сообщения на консоль администратора, регистрировать на диске все ошибки для периодического просмотра, а также иметь возможность отправить внешнее сообщение в случае, если сбой произошел в отсутствие администратора на своем рабочем месте.

Повышение готовности – способ борьбы за сокращение времени простоя системы. Единицей измерения здесь служит коэффициент готовности, который определяет вероятность пребывания системы в работоспособном состоянии в любой произвольный момент времени. Статистически коэффициент готовности определяется как MTBF/(MTBF+MTTR), где MTTR (Mean Time To Repair) – среднее время восстановления (ремонта),

то есть период между моментом

обнаружения неисправности и моментом возврата системы к полноценному функционированию, отнесенный ко времени наблюдения.

Необходимо сказать несколько слов о пользе применения резервного копирования. Конечно, обеспечение резервного копирования данных увеличивает стоимость системы хранения, однако нужно помнить, что резервные копии – это своего рода «спасательный круг», который может пригодиться в самых разных ситуациях (например, в случае восстановления работоспособности информационной системы после пожара, наводнения,

террористического акта и т. п.). Поэтому возможен разумный компромисс между суммарной стоимостью систем резервного копирования и убытками, которые может понести фирма в случае потери данных.

Понятно, что чисто технические решения не способны полностью предотвратить возможные потери данных. Необходимы также профилактические организационные меры. Во-первых, следует обеспечить безопасность доступа к информации, во-вторых – разработать технологию резервного копирования и восстановления и в-третьих – определить место хранения резервных носителей.

При осуществлении всех этих мероприятий потери информации сводятся к минимуму, и даже если по каким-то причинам избежать их не удалось, обеспечивается быстрое восстановление данных с максимально возможной достоверностью.

Выбор дисковых систем

хранения данных

При выборе дисковых систем хранения данных необходимо ответить на ряд общих вопросов, актуальных для всех случаев. Ответы на них помогут выбрать оптимальное решение.

• Каковы особенности исполнения системы?

• Возможности системы к масштабируемости.

• Насколько надежны используемые носители?

• Как реализованы функции резервирования элементов, как происходит замена дисков, сколько времени занимают эти действия и можно ли их выполнить, не прерывая работы?

• Имеется ли возможность работся диагностирование системы и анализ результатов проверки?

• Поддерживается ли технология обеспечения резервного копирования?

Как уже отмечалось, на рынке представлено большое количество дисковых подсистем хранения данных различных производителей. В качестве примера (рис. 4) хотелось бы рассмотреть систему Comparex Tetragon (производитель – фирма Hitachi).

Дисковые системы Tetragon лидируют на мировом рынке по техническим характеристикам и надежности (по данным Gartner Group). Организация Raid Advisory Board (консультативный совет по системам RAID), исходя из своей классификации дисковых массивов (по защищенности данных), присвоила семейству COMPAREX TETRAGON максимальный класс DTDS+ (Disaster Tolerant Disk System, дисковая система, устойчивая к стихийным бедствиям). Выполнение дисковой подсистемой требований этого класса гарантирует пользователям сохранность данных даже при полном отказе или физическом разрушении одной из систем (используется вторая система и режим «зеркалирования»), а также доступ к данным при отказе любого единичного компонента и их сохранность при сбоях питания и других воздействиях окружающей среды.

Подсистема выполнена в виде отдельного устройства, состоящего в базовой комплектации из двух модулей – контроллера и дискового массива (с возможностью расширения количества дисковых массивов до четырех). Контроллер специально разработан для RAID-массивов. В нем может быть до 4 пар дисковых адаптеров, каждая из которых допускает до 8 одновременных операций обмена данных с дисками. Все элементы контроллера соединены двумя внутренними шинами данных с пропускной способностью 240 Mбайт/с каждая. Для управления в системе предназначена отдельная шина данных с пропускной способностью 135 Mбайт/с (для модели T2100). Объем энергонезависимой кэш-памяти может составлять до 8 Гбайт (модель Т2000) и 16 Гбайт (T2100). Для обмена данными между серверами и системой TETRAGON предназначены мощные канальные процессоры, построенные по RISС-архитектуре.

Система совместима с вычислительным оборудованием любых марок и производителей. Не требуется установки дополнительного программного обеспечения, достаточно средств операционной системы.

Архитектура подсистемы позволяет расширять ее емкость в зависимости от потребностей пользователя. Минимальная емкость обеспечивает 22,68 Гбайта памяти прямого доступа и может быть увеличена до 1600 Гбайт (модель Т2000) и 11 000 Гбайт (модель Т2100).

В дисковых массивах используются специально разработанные 3.5’ дисковые накопители (MTBF - 2 млн. часов) емкостью 9 Гбайт (модель Т2000) и 47 Гбайт (модель Т2100) или 2.5’ диски емкостью 6 и 15 Гбайт, скорость вращения которых составляет 12 тыс. об./с (только в модели Т2100). Диски различных объемов могут комбинироваться в одной системе, чтобы максимально удовлетворить потребности пользователя.

Система обеспечивает постоянный доступ к данным (24 часа

7 дней в неделю). Занесенные в систему данные не потребуют поддержки в режиме кие ошибки могут произойти и какие модификации или изменения конфигурации потребуются. Такая непрерывность функционирования достигается благодаря возможности выполнять все модификации оборудования, не прерывая работы пользователя («горячая замена»); использованию технологии RAID-5; наличию динамических запасных дисков, которые используются автоматически в случае отказов основных дисков; отсутствию в системе непродублированных элементов и модулей.

Дисковая подсистема TETRAGON предоставляет большие возможности диагностирования. Например, в режиме простоя система автоматически запускает программы проверки дискового массива, что позволяет, во-первых, заблаговременно выявить возможные ошибки, а во-вторых, рационально использовать время невостребованности системы. Есть возможность передачи информации об ошибках сразу на

рабочее место администратора дисковой подсистемы или прямо в сервис-центр.

Кроме интерфейса с серверами архитектуры S/390 по параллельным каналам (обеспечивающим скорость передачи данных до 9 МB/s) или ESCON-каналам ввода/вывода (до

17 МB/s), системы TETRAGON могут оснащаться интерфейсом SCSI (до 40 МB/s) для одновременного подключения к процессорам других платформ (UNIX, WindowsNT) и интерфейсом Fibre Channel (только в модели T2100), скорость до 100 МB/s.

Соответствующие программные средства обеспечивают с помощью системы TETRAGON эффективный обмен данными между различными платформами.

Система позволяет автоматически создавать удаленную резервную копию хранимых данных (функция Remote Copy) в синхронном (данные, заносимые в одну систему, одновременно сохраняются и на резервной) и асинхронном режиме (в этом случае резервная копия создается по определенным заданным критериям). Резервная подсистема может быть установлена в помещении, удаленном на расстояние до

43 км от основного вычислительного центра, при этом используется соединение между дисковыми подсистемами по ESCON-каналам.

Вместо заключения

В обозримом будущем рассмотренные системы хранения данных будут востребованы, возможно даже в пределах одного учреждения, поскольку ни один подход к построению сетей хранения не разрешает сразу всех проблем и не оптимизирует параметры, например такие, как стоимость, «легкость управления», производительность, удаленность банков данных друг от друга.

Тем не менее

необходимость построения современной корпоративной системы хранения данных очевидна. Ответ на вопрос, какая из альтернатив в наибольшей степени подходит для конкретного учреждения, может быть получен на основе сопоставления задач организации с возможностями каждого из предлагаемых вариантов. Правильный выбор программно-аппаратных средств системы хранения данных позволит избежать дополнительных расходов и в конечном счете обеспечит положительный экономический эффект.

Главная страница / Архитектура отрасли