Тема10. Проектирование и разработка процесса ETL

Аннотация. В настоящей лекции рассматриваются общие принципы организации процесса извлечения, преобразования и загрузки данных (Extract, Transform, Load — ETL) для ХД, приводится классификация систем — источников данных, обсуждаются некоторые методы извлечения данных. Рассмотрена в общих чертах методика проектирования ETL-процессов с использованием CASE-инструментов.

Ключевые слова: извлечение, преобразование и загрузка данных, планирование ETL-процесса, элементы ETL-процесса, очистка данных, качество данных, диаграмма движения данных, диаграмма преобразования данных, диаграмма управления потоком преобразования данных.

Цель лекции

Изучив материал настоящей лекции, обучающийся будет знать:

И научится:

Литература: [3], [14], [33], [32], [51].

Разработка ETL-процесса включает в себя следующие основные стадии:

При проектировании процессов преобразования данных проектировщик ХД должен решить следующие задачи:

Контрольные вопросы:

  1. Что такое процесс ETL?
  2. Что такое реализация ETL-процесса с использованием промежуточной области?
  3. Что такое реализация ETL-процесса без использования промежуточной области?