|
В различных МСУБД используются два основных варианта организации данных: гиперкубическая модель и поликубическая модель. Различие состоит в том, что системы, поддерживающие поликубическую модель (например, Oracle Express Server), предполагают, что в МБД может быть определено несколько гиперкубов с различной размерностью и с различными измерениями в качестве их граней. Например, значение показателя Рабочее Время Менеджера, скорее всего, не зависит от измерения Модель компьютера и однозначно определяется двумя измерениями: День и Менеджер. В поликубической модели в этом случае может быть объявлено два различных гиперкуба.
2 гиперкуба:
· двухмерный - для показателя Рабочее Время Менеджера;
· трехмерный - для показателя Объем Продаж.
В случае же гиперкубической модели предполагается, что все показатели должны определяться одним и тем же набором измерений. То есть только из-за того, что Объем Продаж определяется тремя измерения-ми, при описании Показателя Рабочее Время Менеджера придется также использовать три измерения и вводить избыточное для этого показателя измерение Модель Компьютера.
Операции с измерениями |
|
Аббревиатура OLAP была впервые введена Коддом (E.F.Kodd), известным ученым в области реляционных БД, создателем широко распространенной реляционной модели. В своей работе, инициированной компанией Arbor Software (сегодня это Hyperion Solutions) "Providing OLAP to User Analysis: AN IT MAN-DATE"(Обеспечение OLAP (оперативной аналитической обработки) для пользователей – аналитиков) в 1993 г., он определил:
· основной недостаток реляционной модели как невозможность «объединять, просматривать и анализировать данные с точки зрения множественности измерений, то есть самым понятным для корпоративных аналитиков способом»
· общие требования к системам OLAP, расширяющим функциональность реляционных СУБД и включающим многомерный анализ как одну из своих характеристик.
Кодд сформулировал концепцию комплексного многомерного анализа данных, накопленных в хранилище, в виде 12 основных правил, которым должны удовлетворять OLAP-системы, как продукты, предоставляющие возможность выполнения оперативной аналитической обработки. В 1995 году к ним были добавлены еще шесть (которые известны в значительно меньшей степени). Все эти правила разделены на четыре группы и названы «характеристиками» (features, особенности). Ниже дано краткое описание этих особенностей, однако сегодня они редко цитируются и мало используются:
· Основные характеристики OLAP:
o многомерность модели данных (оригинальное правило 1). Эта особенность - сердцевина OLAP;
o прозрачность (оригинальное правило 2),
o доступность данных, пакетное извлечение данных (оригинальное правило 3),
o архитектура «клиент-сервер» (оригинальное правило 5),
o многопользовательская работа (оригинальное правило 8),
o интуитивные механизмы манипулирования данными (оригинальное правило 10),
o пакетное извлечение против интерпретации (новое). Это правило требует, чтобы продукт в равной степени эффективно обеспечивал доступ как к собственному хранилищу данных, так и к внешним данным. К большому сожалению лишь небольшая часть OLAP продуктов должным образом соответствует ей, и среди них редкие делают это легко или автоматически. Сегодня это соответствует определению гибридных OLAP, которые, в самом деле, становятся наиболее популярной архитектурой
o модели анализа OLAP (новое). OLAP-продукты должны поддерживать четыре модели анализа (Категориальный, Толковательный, Умозрительный и Стереотипный) которые можно определить как формирование параметрически настраиваемых отчетов, формирование разрезов и группировок с обращением, анализом в стиле "что, если" и моделями поиска целей, соответственно.
· Специальные характеристики:
o Обработка ненормализованных данных (новое)
Указывает на необходимость интеграции между OLAP-машиной и ненормализованными источниками данных. Не должны допускаться изменения данных, которые обычно расцениваются как расчетные ячейки в пределах БД OLAP.,
o Хранение результатов отдельно от исходных данных (новое)
В действительности это боле относится к реализации, чем к сущности продукта. OLAP приложения, работающие в режиме чтения/записи не должны воздействовать напрямую на обрабатываемые данные, и данные, модифицированные в OLAP, должны сохраняться отдельно от данных транзакций. Например, метод обратной записи данных, использованный в Microsoft OLAP Services, является лучшей реализацией этого, поскольку позволяет сохранять данные, измененные в среде OLAP, отдельно от основных данных.
o Выделение пропущенных данных (новое)
Пропущенные данные (Missing Data, Missing Value) – это особый элемент данных, который сигнализирует о том, что в данной ячейке данные отсутствуют и/или не определены. Это может быть как вследствие того, что рассматриваемая комбинация элементов не имеет смысла (например, снегоходы не могут продаваться в экваториальных странах), так и того, что данные не были введены. Термин "Пропущенные данные" по своему значению близок к термину "Пустое значение данных", однако, это не то же самое, что "Нулевое значение". В действительности это интересно только с точки зрения компактности хранения данных, некоторые OLAP инструменты игнорируют это правило без больших потерь в функциональности.
o Обработка отсутствующих значений (новое)
Все отсутствующие значения будут игнорироваться OLAP анализатором без учета их источника. Эта особенность связана с предыдущей и является почти неизбежным следствием того, как OLAP-машина обрабатывает все данные.
· Характеристики построения отчетов:
o стабильная производительность при построении отчетов (оригинальное правило 4),
o автоматическая настройка физического уровня(замена оригинального правила 7),
o гибкое построение отчетов (оригинальное правило 11).
· Управление размерностью:
o общая функциональность - универсальность измерений (оригинальное правило 6),
o неограниченные операции между данными различных измерений (оригинальное правило 9)
o неограниченное число измерений и уровней агрегирования (оригинальное правило 12).
Работа с OLAP-системами может быть построена на основе из двух схем:
Дата добавления: 2015-09-12; просмотров: 24 | Поможем написать вашу работу | Нарушение авторских прав |
<== предыдущая лекция | | | следующая лекция ==> |
Прогнозируемые данные | | | OLAP-средства, встроенные в настольные приложения |