Тема2. Архитектура хранилищ данных
Аннотация. В настоящей лекции изучаются типовые архитектуры
хранилищ данных, рассматривается глобальное хранилище данных, централизованное хранилище данных,
распределенное хранилище данных, киоски данных, взаимосвязанные киоски данных, независимые киоски
данных, корпоративная информационная фабрика, хранилище данных с архитектурой шины данных, федеральное
хранилище данных. Обсуждаются основные типы хранилищ данных.
Ключевые слова: архитектура хранилища данных, глобальное хранилище данных,
централизованное хранилище данных, распределенное хранилище данных, киоски данных,
взаимосвязанные киоски данных, независимые киоски данных, корпоративная информационная фабрика,
хранилище данных с архитектурой шины данных, федеральное хранилище данных.
Цель лекции
Изучив материал настоящей лекции, обучающийся будет:
- типовую архитектуру хранилища данных и ее основные компоненты;
- что такое корпоративная информационная фабрика;
- что такое хранилище данных с архитектурой шины данных;
- иметь представление о представлении данных в хранилищах данных;
- что такое федеративное хранилище данных;
И научится:
- ориентироваться в подходах к выбору архитектуры хранилища данных;
- выбирать архитектуру хранилища данных для решения некоторых типовых задач с использованием хранилищ данных.
Литература: [15], [16], [17], [18], [19], [20], [21], [22], [23], [24], [25], [26], [27].
Компонентами типовой архитектуры ХД являются:
- программное обеспечение промежуточного слоя. Основное на значение этих компонент
состоит в обеспечении доступа к сети и доступа к данным;
- БД OLTP систем и данные внешних источников;
- предварительная обработка и загрузка данных;
- ХД, реализованное средствами СУБД;
- метаданные, которые играют роль справочника о данных;
- уровень доступа к данным — программное обеспечение, которое обеспечивает
взаимодействие конечных пользователей с данными ХД;
- уровень информационного доступа, который обеспечивает непосредственное общение пользователя с ХД;
- уровень администрирования. Отметим, что в последнее время возрастает практический интерес к использованию ХД
при формировании информационной инфраструктуры организаций.
Преимущества, которые получает организация от внедрения хранилищ данных, следующие:
- Взгляд на данные организации, как на единое целое. Это ответы на такие вопросы: сколько
продуктов реально производится? Что влияет на изменение спроса? Какие товары или услуги приносят
наибольший доход? А также возможность учитывать особенности и предпочтения клиентов.
- 400% возврат инвестиций, вложенный в создание хранилища данных (по результатам трехлетнего исследования
опыта 62-х корпораций, проведенного IDC). Сроки исполнения — от 6 месяцев до 2-х лет в зависимости от
объема хранилища данных, при следующем распределении затрат: для небольшого подразделения — $ 400000-600000,
для большого подразделения — $800000-1500000, для большой корпорации — $15000000.
- Возрастает надежность данных для принятия решений. Данные, загружаемые в хранилище данных,
подвергаются очистке — согласуются, проверяются, уточняются.
- Геопространственный анализ данных. Анализ такой информации имеет решающее значение в принятии решений
по всем вопросам, связанным с географией бизнеса. - Исследование трендов и колебаний в бизнес-данных.
Позволяет достаточно надежно прогнозировать развитие бизнес-процессов организации во времени.
Контрольные вопросы:
- Что такое корпоративная информационная фабрика?
- Что такое хранилище данных с архитектурой шины данных?
- Что такое федеративное хранилище данных?