Процесс моделирования Data Vault

Читайте также:

Для того чтобы сохранить дизайн простым и изящным, используется минимальное число компонентов, в частности: Хаб (Hub), Связь (Link) и традиционные навыки моделирования данных. Это было описано в 1-ой статье серии. Пожалуйста, обратитесь к первой статье для определения и настройки табличной структуры. В этой статье будет обсуждаться процесс преобразования вышеупомянутой модели данных в эффективное Data Vault. Шаги преобразования одной модели без интеграции следующие:

1. 1. Выявите бизнес ключи и суррогатные ключевые группировки, смоделируйте Хабы.

2. 2. Выявите отношения между таблицами, которые должны быть поддержаны, смоделируйте Связи.

3. 3. Определите описательную информацию, смоделируйте Спутники.

4. 4. Распределите (перегруппируйте) Спутники по темпам изменения или типам информации.

Для решения более чем одной модели, начинают с «мастер» системы, идентифицирующей бизнес. Постройте первую модель данных, и затем инкрементально отобразите другие модели и элементы данных в одно единое представление информации.

В архитектуре Data Vault применяются три стиля моделирования дат загрузки, и прежде чем начать моделировать, разумно будет выбрать стиль, соответствующий Вашим потребностям. Стили следующие:

1. 1. Стандартный стиль – поле Load Date. Описан в этой и в предыдущей статьях. Легко загружать, сложнее делать запросы. При наличии у хаба более чем двух спутниковых таблиц может потребоваться дополнительная "picture table" или point-in-time таблица для хранения дельт изменений для эквивалентного соединения (equi-joins, соединения по эквивалентному условию).

2. 2. Тип данных поля Load Date – целое число. Поле ссылается таблицу, содержащую даты загрузки. Целочисленная ссылка – автономный внешний ключ к таблице с датами загрузки и может использоваться, если использование даты не желательно. Будьте осторожны, это может вызвать трудности при перезагрузке и повторном упорядочивании ключей в хранилище. Это не рекомендуемая практика.

3. 3. Ко всем спутникам добавляется поле Load End Date. Строки в спутнике датируются датой окончания при вставке новых строк. Это может помочь с точки зрения создания запросов и в то же время может сделать загрузку сложнее. При использовании этого стиля отпадает необходимость в создании «picture» таблицы (таблица point-in-time).

Выберите стиль, который лучше всего отвечает потребностям бизнеса, и реализуйте его в модели. Часть успешного моделирования Data Vault – последовательность. Поддерживайте стиль, который выбрали, и модель будет твердой с точки зрения обслуживания.

Дата добавления: 2014-12-15; просмотров: 29 | Поможем написать вашу работу | Нарушение авторских прав

Предыдущая 1 2 3 456 7 8 Следующая

lektsii.net - Лекции.Нет - 2014-2024 год. (0.006 сек.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав