Лабораторная работа №8. Построение
многомерных диаграмм.
Рассмотрим методику
проектирования кубов данных для OLAP хранилищ данных с использованием CASE PowerDesigner компании Sybase.
·
Многомерная
диаграмма (multidimensional diagram) представляет собой
модель хозяйственной деятельности организации в терминах кубов данных и
измерений.
·
Многомерные
диаграммы используются для проектирования OLAP ХД.
·
OLAP
ХД заполняются данными из ХД и киосков
данных. Эти данные преобразуются из
реляционного представления в многомерное.
·
Данные
о продажах (Sales) имеют измерения "Товар"
(product), "Регион" (region),
"Покупатель" (customer) и
"Магазин" (store). Факты, например итоговый объем продаж (sales
totals), рассматриваются с точки зрения этих
определенных пользователем измерений. Когда аналитик делает выборку об итоговых
объемах продаж (sales total)
по конкретному товару для конкретного региона, он изучает данные о продажах с
точки зрения измерений "Товар" и "Регион". Наиболее часто
используемым измерением является время, поскольку основной целью выполнения
аналитических запросов является нахождение трендов в данных.
·
Кубы
данных (cube),
содержат набор метрик, которые связаны с различными аспектами хозяйственной
деятельности организации и используются для информационной поддержки принятия
решений.
·
Измерения (Dimension), являются
своеобразными осями – аспектами исследования данных в кубе.
·
Атрибуты (Attribute), используются
для квалификации измерения.
·
Факты (Fact), группируют метрики,
используемые кубом данных.
·
Метрики (Measure), переменные, как
правило, числовые, связываемые с фактом.
·
Иерархии (Hierarchy), представляет
организационную структуру, которая описывает модель доступа к кубу
данных через измерение.
·
Ассоциации (Association), устанавливает
связь между кубом данных и измерением.
Только кубы данных, измерения и ассоциации
представлены на палитре инструментов CASE.
·
Выбратьвменю File->New Model. На
рабочем пространстве появится диалоговое окно "New
Model".
·
В этом
окне нужно выбрать тип модели "физическая
модель данных",
в качестве СУБД мы выберем MS SQL Server 2008 из
выпадающего списка СУБД, укажем многомерную
диаграмму, как класс
физической модели, присвоим имя многомерной модели (My_Model_4) и нажжем кнопку "ОК".
·
Таким
образом, многомерная модель создана, рабочее пространство и палитра инструментов
доступны.
·
Куб
данных является набором метрик, соответствующее значение которых сохраняется в
каждой его ячейки данных.
Метрики организованы в соответствие с измерениями для того, чтобы выполнять
быструю выборку данных или операции сверки-развертки (drill-down).
·
Кубы данных связаны с фактами, которые позволяют определить
метрики для куба. На многомерной диаграмме кубы данных представляют OLAP кубы.
·
Для
построения куба данных можно использовать палитру инструментов. Выбираем на
ней пиктограмму куба и щелчком левой кнопки мыши на рабочем пространстве
создаем куб данных.
·
Далее
двойным щелчком мыши на кубе данных откроем диалоговое окно для определения свойств куба
данных
·
Для куба
данных можно определить следующие
свойства:
o
Имя (Name) определяет имя куба данных, желательно в терминах понятных пользователям.
o
Код (Code) определяет техническое имя куба
данных, которое будет использовано при
генерировании скрипта.
o
Комментарий
(Comment) определяет дополнительное описание куба
данных.
o
Факт (Fact) определяет факт, используемый в кубе
данных.
·
Присвоим кубу
данных имя "Продажа" (Sale).
·
Измерения
являются осями для анализа данных в многомерной структуре данных.
·
Измерение
состоит из упорядоченного списка атрибутов, которые совместно определяют общий
семантический смысл (своими значениями) в моделируемой предметной области.
·
Каждый
атрибут определяет единственную позицию вдоль оси куба
данных.
·
Для
построения измерения можно использовать палитру инструментов. Выбираем на ней
пиктограмму измерения и щелчком левой кнопки мыши на рабочем пространстве
создаем измерение.
·
Далее
двойным щелчком мыши на измерении откроем диалоговое окно для определения
свойств измерения.
·
Атрибуты
являются квалификаторами измерений в запросах. Например, Измерения
"Время" (Time) может содержать атрибуты
"Год". "Квартал", "Месяц", "Неделя".
Атрибуты могут быть организованы в иерархии.
·
Для
создания атрибутов измерения можно использовать диалоговое окно свойств
измерения. Например, для измерения "Время" определим следующие
атрибуты "Год" (Year), "Квартал"
(Quarter), "Месяц" (Month)
и "Неделя" (Week).
·
Атрибуты
измерения имеют следующие свойства:
o
Имя (Name) определяет имя атрибута в терминах пользователя.
o
Код (Code) определяет техническое имя атрибута, используемое при
генерировании скрипта.
o
Комментарий
(Comment) определяет дополнительное описание атрибута
o
Измерение
(Dimension) определяет измерение для атрибута.
·
Самостоятельно
определите измерения и их атрибуты:
o "Покупатель" (Customer):
атрибуты "Имя покупателя" (Cust_Name) и
"Адрес покупателя" (Cust_Address) и
"Идентификатор покупателя" (Cust_ID).
o "Товар" (Product):
атрибуты "Тип товара" (Type) и
"Категория" (Category).
o "Регион" (Region):
атрибуты "Страна" (Country),
"Область" (State) и "Город" (Town).
o "Магазин" (Store): атрибуты
"Размер" (Size) и "Скидка" (Discount).
·
Атрибут
может участвовать в определении другого атрибута, чем самым дополняя
определение последнего. Уточняющие атрибуты находятся в списке атрибутов измерения
и могут быть использованы в определении другого атрибута.
·
В
измерении "Покупатель" (Customer) атрибуты
"Имя покупателя" (Cust_Name) и "Адрес
покупателя" (Cust_Address) могут быть
использованы для детализации атрибута "Идентификатор покупателя" (Cust_ID).
·
Для
этого, нужно в диалоговом окне свойств измерения выбрать список атрибутов, в
списке атрибутов выбрать атрибут Cust_ID, открыть для
него диалоговое окно свойств атрибута, на нем выбрать вкладку "Detail Attributes" и занести
на нее атрибуты Cust_Name и Cust_Address.
·
Иерархия
определяет один или несколько путей доступа к данным через измерение.
·
Различают
два основных типа иерархий:
o
Организационный
путь описывает шаблон обхода измерения, от самого общего к наиболее частному
атрибуту. Этот путь упорядочивает множество всех атрибутов измерения.
o
Консолидирующий
путь представляет консолидацию атрибутов измерения. Например, у измерения
"Время" с основной периодичностью в один день могла бы быть иерархия,
определяющая объединение дней в недели, недели в месяцы, месяцы в кварталы, и
кварталы в годы.
·
Иерархия
имеет следующие свойства:
o
Имя (Name) определяет имя иерархии в терминах пользователя.
o
Код (Code) определяет техническое имя, используемое пр генерировании скрипта.
o
Комментарий
(Comment) определяет описание иерархии.
o
Измерение
(Dimension) определяет родительское имя иерархии.
·
Добавить
иерархию в измерение можно открыв окно свойств измерения на вкладке
"Иерархии" (Hierarchies) с помощью кнопки
"Добавить строку".
·
Рассмотрим
измерение "Время" и создадим для нее иерархию.
·
Отрыв
диалоговое окно свойств иерархии добавим атрибуты в иерархию.
·
Факт
соответствует фокусу исследования данных для поддержки принятия решений руководство
организации. Факт – это набор метрик куба
данных.
·
Фактами
могут быть, как в нашем примере "Продажи" (Sale),
или доходы и бюджет. Одни и те же факты могут использовать в различных кубах
данных.
·
Факт
может быть добавлен в многомерную диаграмму следующим образом. Выберите пункт меню Model->Facts и
добавьте его в список в появившемся диалоговом окне "Список фактов" (List of Facts).
·
Факт
имеет следующие свойства:
o
Имя (Name) определяет имя факта в терминах пользователя.
o
Код (Code) определяет техническое имя факта, используемое при
генерировании скрипта.
o
Комментарий
(Comment) определяет описание факта.
·
Метрика
является переменной, которая соответствует фокусу исследования данных. Метрика
описывает значение ячейки куба данных.
·
Например,
метрикой часто бывает цена товара или итоговое значение. Метрики могут быть
результатом вычислений.
·
Метрика
имеет следующие свойства:
o
Имя (Name) определяет имя метрики в терминах пользователя.
o
Код (Code) определяет техническое имя, которое используется при
генерировании скрипта.
o
Комментарий
(Comment) определяет описание метрики.
o
Факт (Fact) определяет факт, которому принадлежит метрика.
o
Формула
(Formula) определяет выражение, посредством которого метрика
вычисляется.
·
Для
создания метрики можно из главного меню Model->Facts в
диалоговом окне "Список фактов" (List of Facts) выбрать факт (в нашем
случае Sale).
·
Вызвать
диалоговое окно "Свойства факта" (Fact Properties) , в котором на вкладке
"Метрика" (Measure) добавить необходимые
метрики.
·
В
нашем пример добавим следующие метрики "Итог" (Total).
"Промежуточный итог" (Sudtotal) и
"Еженедельный итог" (Weekly).
·
Ассоциация
связывает куб данных с измерением, которое его определяет. Ассоциация показывает аспект исследования куба
данных по указанному измерению.
·
Можно
связать куб данных "Продажи" (Sale) с
измерением "Покупатель" (Customer)
посредством ассоциации "Продажи"-"Покупатель" (Sale-Customer).
·
Допускается
только одна ассоциация между измерением и кубом данных.
·
Ассоциация
имеет следующие свойства:
o
Куб (Cube) определяет куб данных, который является источников ассоциации.
o
Измерение
(Dimension) определяет измерение, с которым связана
ассоциация.
o
Иерархия
(Hierarchy) определяет иерархию, используемую кубом
данных для консолидации вычислений.
·
Ассоциацию
можно создать при помощи палитры инструментов, выбрав пиктограмму ассоциации.
·
Для
нашего примера свяжем куб данных "Продажи" (Sale) с
измерением "Покупатель" (Customer).
·
Задание
– установить ассоциации между всеми элементами диаграммы.
Контрольные
вопросы
1.
Как
определяется куб данных?
2.
Как
определяются измерения?
3.
Как
определяются атрибуты?