Тема1. Хранилище данных.

Аннотация. В настоящей лекции рассматривается концепция систем складирования данных и хранилищ данных, основные причины ее возникновения и сферы применения, вводятся и обсуждаются основные понятия, при ведены примеры.

Ключевые слова: автоматизированные информационные системы, системы складирования данных, хранилища данных, системы операционной обработки данных, системы анализа данных.

Цель лекции

Изучив материал настоящей лекции, обучающийся будет:

И научится:

Литература: [1], [2], [3], [50, [7], [8], [9], [10], [11], [12], [13].

Концепция ХД была предложена в начале 90-х годов прошлого столетия как основа методологии организации данных в системах поддержки и принятия решений. Согласно классическому определению В. Инмона, хранилище данных есть предметно-ориентированная, интегрированная, неизменяемая и поддерживающая хронологию электронная коллекция данных для обеспечения процесса принятия решений. Данные поступают в ХД из внешних источников. Методика построения ХД предполагает выполнение ряда процедур преобразования и очистки данных внешних источников. Использование концепции ХД предполагает использование иных, чем в операционных системах обработки данных, методов построения модели данных.
Таким образом, в ХД хранятся:

Использование информационных технологий на основе ХД предполагает применение систематизированного позадачного подхода. ХД создается для решения конкретных, строго определенных задач анализа и воспроизводства данных. Таким образом, определяющим моментом в его построении являются задачи обработки данных. Именно это обстоятельство определяет и подходы к проектированию ХД. На практике для реализации ХД используются СУБД, поддерживающие определенную модель данных. Поэтому с точки зрения реализации ХД следует считать БД специальной структуры.

Контрольные вопросы:

  1. Что такое хранилище данных?
  2. Из каких частей состоит хранилище данных?
  3. Что такое таблица фактов? Что такое таблица измерений?