Нефть и песок О стали Компрессор - подбор и ошибки Из истории стандартизации резьб Соперник ксерокса - гектограф Новые технологии производства стали Экспорт проволоки из России Прогрессивная технологическая оснастка Цитадель сварки с полувековой историей Упрочнение пружин Способы обогрева Назначение, структура, характеристики анализаторов Промышленные пылесосы Штампованные гайки из пружинной стали Консервация САУ Стандарты и качество Технология производства Водород Выбор материала для крепежных деталей Токарный резец в миниатюре Производство проволоки Адгезия резины к металлокорду Электролитическое фосфатирование проволоки Восстановление корпусных деталей двигателей Новая бескислотная технология производства проката Синие кристаллы Автоклав Нормирование шумов связи Газосварочный аппарат для тугоплавких припоев
Главная страница / Архитектура отрасли

Построение операционных складов данных с использованием технологий Oracle

Хранилище данных – это очень большая предметно-ориентированная информационная корпоративная база данных, специально разработанная и предназначенная для подготовки отчетов и анализа информации с целью поддержки принятия решений в организации. Данные попадают в хранилище из транзакционных систем и после загрузки не изменяются. Как правило, процесс загрузки связан со значительными временными затратами, выполняется по определенному расписанию и состоит из следующих шагов:

извлечение данных – данные из транзакционных систем помещаются в промежуточную область хранилища (Staging Area);

преобразование и загрузка данных – данные из промежуточной области проверяются, преобразовываются к одному виду, после чего перемещаются из промежуточной области непосредственно в хранилище данных;

агрегация данных – происходит расчет итоговых значений с целью сократить время при формировании отчетов и анализе данных.

Однако кроме стратегического анализа информации многим компаниям необходимо получать оперативные отчеты по данным из нескольких транзакционных систем (оперативный анализ). Например, страховая компания ведет учет различных типов страховых полисов в нескольких транзакционных системах. Для ответа на вопрос клиента, «по каким полисам я застрахован?» сотрудники страховой компании должны иметь возможность видеть весь список полисов в едином унифицированном формате.

Для решения таких задач стандартные подходы по построению хранилищ данных неприемлемы, поскольку требуется более оперативная (с точностью до минут) и детальная информация. В традиционные хранилища информация попадает с существенной задержкой во времени и в агрегированном виде. Транзакционные системы также не способны выполнять подобные задачи, поскольку для оперативного анализа необходимо получение информации из нескольких систем.

Решение задач, связанных с оперативным анализом, обеспечивают операционные склады данных (Operational Data Store). Операционный склад данных – это предметноориентированный, интегрированный, изменяющийся набор данных, который содержит текущую (не историческую) детализированную информацию.

По некоторым характеристикам ODS и хранилище данных очень похожи, но ODS имеет ряд свойств, которые существенно отличают его от хранилища. Как ODS, так и хранилище данных, являются предметноориентированным интегрированным набором данных, в обоих случаях данные должны быть загружены из транзакционных систем. Этим их сходство исчерпывается. ODS содержит изменяющиеся данные, тогда как в хранилище после загрузки они не изменяются. Другое отличие состоит в том, что операционный склад содержит только данные, актуальные на текущий момент времени, а хранилище – как текущие, так и исторические. Причем актуальность данных в хранилище значительно ниже, чем в операционном складе. В хранилище обычно содержатся данные, загруженные в течение последних 24 часов, актуальность данных в ODS может измеряться секундами. Кроме того, в ODS содержатся только детальные данные, в хранилище – как детальные, так и агрегированные.

Главная страница / Архитектура отрасли