Нефть и песок О стали Компрессор - подбор и ошибки Из истории стандартизации резьб Соперник ксерокса - гектограф Новые технологии производства стали Экспорт проволоки из России Прогрессивная технологическая оснастка Цитадель сварки с полувековой историей Упрочнение пружин Способы обогрева Назначение, структура, характеристики анализаторов Промышленные пылесосы Штампованные гайки из пружинной стали Консервация САУ Стандарты и качество Технология производства Водород Выбор материала для крепежных деталей Токарный резец в миниатюре Производство проволоки Адгезия резины к металлокорду Электролитическое фосфатирование проволоки Восстановление корпусных деталей двигателей Новая бескислотная технология производства проката Синие кристаллы Автоклав Нормирование шумов связи Газосварочный аппарат для тугоплавких припоев
Главная страница / Архитектура отрасли

ДЕЛО О СТОРИДЖЕ

Системы хранения данных (СХД) не предмет назойливой рекламы.

Для многих даже неочевидны различия между сервером и СХД. Подобное смешение типично, ведь основой корпоративной IT-инфраструктуры является именно сервер, а уж вопрос, где находятся данные, к которым обращаются те или

иные приложения, в повседневной работе мало кого занимает.

Для более подробного ознакомления с теорией этого вопроса можно обратиться к прошлым выпускам «Connect!»

(№ 9/2000, 1/2001).

Сразу оговоримся, что в данной публикации вы не найдете ни рассуждений о преимуществе тех или иных «сториджей», ни упоминаний марок каких-либо продуктов. Наша задача –определить возможные подходы к решению проблемы хранения данных.

Когда мы обратились к специалистам в области систем хранения данных с просьбой помочь в подготовке данного материала, то выслушали получасовую лекцию о том самом «железе», описание которого не входило в наши планы. Не удовлетворившись подобными сведениями, мы предложили своеобразную вводную, дабы приблизить наш разговор к возможному диалогу между клиентом и специалистом. Мы представились потенциальным заказчиком и попросили мотивировать целесообразность установки систем хранения данных для нашего воображаемого предприятия. Оказалось, что, как и любой полноценный проект, этот требует в первую очередь не «железок», а предпроектных работ и исследований. Оставим в стороне маркетинговую составляющую нашего диалога и попытаемся выяснить, каким образом можно оптимизировать хранение данных.

Что на сервере «живет»?

Созданная однажды компьютерная сеть начинает эволюционировать: повышаются требования к приложениям и вычислительной мощности, осуществляются обновления, увеличивается объем данных. Структура ведет себя, как живой организм, и недаром у нас появится такой термин, как «жизненный цикл данных».

В любой компании можно четко прописать законы и правила, по которым информация должна обрабатываться, «жить», архивироваться и утилизироваться. Это и есть цикл жизни данных в компании, реализуемый по определенным законам. Такой подход универсален.

Что нам дает знание о «жизненном цикле данных»? Оказывается, многое. Как уже было сказано, любой проект начинается с предпроектных исследований. В нашем случае – с классификации данных как необходимого этапа для последующей оптимизации их хранения. Специалисты решили эту задачу, обратившись именно к понятию «жизненный цикл».

Лет 5–7 тому назад существовала компания «Палиндром», которая занималась СХД: системами архивации, резервного копирования и миграции. В ней была разработана стратегия управления данными с помощью этих трех систем – Intelligent Storage Management («структурированная система хранения»)1. Задача подобной системы – упорядочить данные, существующие у пользователя. На ее основании одной российской компанией-интегратором для предпроектных исследований была создана утилита, которая сканирует данные на дисархивации и миграции, намечая таким образом их дальнейший «жизненный путь».

Классификация данных заключается в следующем: есть некий диск /группа дисков локальной сети (ЛС). Все данные, находящиеся в ЛС, можно разделить по трем категориям: дата создания файла, дата последнего доступа к файлу, дата его модификации.

Первый сегмент данных – это те файлы, где дата его создания или дата модификации менее 1 дня (то, что создано или изменилось сегодня).

Второй сегмент – данные, у которых дата модификации более 90 дней (это некая условная величина), т. е. они находятся в активной работе.

Третий сегмент – файлы с датой модификации более 90 дней, но менее 120 дней. Сюда относятся дистрибутивы, находящиеся в сети и относительно часто используемые на чтение (но немодифицируемые), а также системные файлы.

Четвертый сегмент – данные, у которых дата последнего доступа более 120 дней, т. е. они практически не используются, но должны храниться (допустим, некоторая банковская документация, подлежащая хранению в течение 20 лет).

Пятый, довольно большой сегмент данных – попросту «хлам», т. е. файлы, выложенные на сервер, которые по большому счету не нужны уже и неоправданно занимают дисковое пространство.

Если именно таким образом маркировать данные, то резервному копированию подлежат первые два сегмента, т. е. те критичные для компании данные, которые при возникновении форс-мажорной ситуации должны быть оперативно восстановлены. Данные других сегментов должны архивироваться. А историческая информация и «хлам» подлежат миграции – перенесению с жесткого диска на другие, менее дорогие носители либо уничтожению.

В некоторых случаях помогает даже эта простая процедура: данные сегментируются, «хлам» изничтожается, а архивная информация отправляется соответственно в архив. Но мы рассмотрим другие, более сложные варианты.

«Пять девяток», виртуальный офис и непрерывность бизнеса

Мы решили пойти еще дальше и усложнить задачу. У нас уже нет сомнения в том, потребуется ли нам СХД, однако нас интересует, существует ли надежная методика выбора оптимального решения. Для этого компании-интегратору необходимо изучить бизнес-процессы заказчика. Мы смоделировали следующую ситуацию.

В последнее время актуальными становятся решения для хранения данных в том случае, если у компании есть несколько разнесенных территориально филиалов (в качестве примера рассмотрим нефтяную компанию с несколькими площадками). Данные между этими площадками должны передаваться постоянно, причем по разным схемам. Поэтому сейчас актуальным становится такое понятие, как Business Continuity («непрерывность бизнеса»), т. е. при выходе из строя какой-либо из площадок бизнес не должен остановиться. Таким образом, мы предложили построить виртуальный офис, который не зависит от местоположения данных, используемых в компании.

Методика создания ти каждого из них и прогнозировании потерь, которые понесет компания в случае гибели какого-либо массива данных, с которым работает определенный бизнес-процесс.

С помощью этой методики можно построить график, основанный на соотношении «стоимость (оборудования)/время (восстановления данных в случае их потери)». Отметим, что чем дешевле решение, тем более длительный срок отводится на восстановление данных. Как же определить, что требуется заказчику? Производится декомпозиция бизнес-процессов, вычленяются разные действия (продажа нефтепродуктов, финансовый учет и т. д.), затем исходя из суммы годового дохода в привязке к каждому бизнес-процессу, который вносит определенную часть в формирование этого дохода, рассчитываются стоимость и соответственно убытки, прогнозируемые вследствие остановки процесса из-за гибели данных. Нужно учесть, что конкретный бизнес-процесс регламентирует определенное время восстановления данных. У каждого бизнес-процесса существует свой критичный период. Если данные не будут восстановлены в отведенный промежуток времени, то компания начинает терпеть убытки.

Соответственно можно вычислить сумму убытка и сделать выбор исходя из того, что оптимальное решение для хранения данных не может стоить дороже, чем убытки2.

Сейчас к компаниям уж предъявляются требования надежности хранения данных и скорости восстановления критически важных баз. Это относится в первую очередь к предприятиям ТЭК, банкам и телекоммуникационным компаниям. Но и любая другая компания, осознающая стратегическую важность данных, которые создаются в процессе ее деятельности, может задуматься над дилеммой: надо или не надо? Надеемся, что решение будет верным. Да и как усомниться в современных технологиях, когда уже существуют так называемые решения «пять девяток», надежность которых – 99,999 % при всех незапланированных отказах.

Главная страница / Архитектура отрасли