Читайте также:
|
|
Хранение и накопление являются одними из основных действий, осуществляемых над информацией и главным средством обеспечения ее доступности в течение некоторого промежутка времени.
База данных может быть определена как совокупность взаимосвязанных данных, используемых несколькими пользователями и хранящихся с регулируемой избыточностью.
Банк данных—система, представляющая определенные услуги по хранению и поиску данных определенной группе пользователей по определенной тематике.
Система баз данных — совокупность управляющей системы, прикладного программного обеспечения, базы данных, операционной системы и технических средств, обеспечивающих информационное обслуживание пользователей.
Хранилище данных (ХД — используют также термины Data Warehouse, «склад данных», «информационное хранилище») — это база, хранящая данные, агрегированные по многим измерениям.
Альтернативой хранилищу данных является концепция витрин данных (Data Mart). Витрины данных — множество тематических БД, содержащих информацию, относящуюся к отдельным информационным аспектам предметной области.
Еще одним важным направлением развития баз данных являются репозитарии. Репозитарий, в упрощенном виде, можно рассматривать просто как базу данных, предназначенную для хранения не пользовательских, а системных данных. Технология репозитариев проистекает из словарей данных, которые по мере обогащения новыми функциями и возможностями приобретали черты инструмента для управления метаданными.
По отношению к пользователям применяют трехуровневое представление для описания предметной области: концептуальное, логическое и внутреннее (физическое) (рис. 4.7).
Концептуальный уровень связан с частным представлением данных группы пользователей в виде внешней схемы, объединяемых общностью используемой информации. Каждый конкретный пользователь работает с частью БД и представляет ее в виде внешней модели.
Логический уровень является обобщенным представлением данных всех пользователей в абстрактной форме. Используются три вида моделей: иерархические, сетевые и реляционные.
· Сетевая модель является моделью объектов-связей, допускающей только бинарные связи «многие к одному» и использует для описания модель ориентированных графов.
· Иерархическая модель является разновидностью сетевой, являющейся совокупностью деревьев (лесом).
· Реляционная модель использует представление данных в виде таблиц (реляций), в ее основе лежит математическое понятие теоретико-множественного отношения, она базируется на реляционной алгебре и теории отношений.
Физический (внутренний) уровень связан со способом фактического хранения данных в физической памяти ЭВМ. Во многом определяется конкретным методом управления.
По наиболее характерным признакам БД можно классифицировать следующим образом:
по способу хранения информации:
• интегрированные;
• распределенные;
по типу пользователя:
• монопользовательские;
• многопользовательские;
по характеру использования данных:
• прикладные;
• предметные.
В настоящее время при проектировании БД используют два подхода. Первый из них основан на стабильности данных. Второй подход базируется на стабильности процедур запросов к БД.
Другим важным аспектом проектирования БД является проблема интеграции и распределения данных. Распределение данных по месту их использования может осуществляться различными способами:
1. Копируемые данные. Одинаковые копии данных хранятся в различных местах использования, так как это дешевле передачи данных. Модификация данных контролируется централизованно;
2. Подмножество данных. Группы данных, совместимые с исходной базой данных, хранятся отдельно для местной обработки;
3. Реорганизованные данные. Данные в системе интегрируются при передаче на более высокий уровень;
4. Секционированные данные. На различных объектах используются одинаковые структуры, но хранятся разные данные;
5. Данные с отдельной подсхемой. На различных объектах используются различные структуры данных, объединяемые в интегрированную систему;
6. Несовместимые данные. Независимые базы данных, спроектированные без координации, требующие объединения.
Оценочные критерии БД принято делить на количественные и качественные.
Количественные критерии: время, необходимое для ответа на запрос, стоимость модификации, стоимость памяти, время на создание, стоимость на реорганизацию.
Качественные критерии: гибкость, адаптивность, доступность ]ум новых пользователей, совместимость с другими системами, возможность конвертирования в другую вычислительную среду, возможность восстановления, возможность распределения и расширения.
Основные принципы организации хранилищ данных следующие [44,45].
1. Предметная ориентация. В оперативной базе данных обычно поддерживается несколько предметных областей, каждая из которых может послужить источником данных для ХД.
2. Средства интеграции. Приведение разных представлений ОХ^ них и тех же сущностей к некоторому общему типу.
3. Постоянство данных. В ХД поддерживается модель «массовых загрузок» данных, осуществляемых в заданные моменты времени по установленным правилам в отличиеот традиционной модели индивидуальных модификаций.
4. Хронология данных. Благодаря средствам интеграции реализуется определенный хронологический временной аспект, присущий содержимому ХД.
Основные функции репозитариев:
• парадигма включения/выключения и некоторые формальные процедуры для объектов;
• поддержка множественных версий объектов и процедуры управления конфигурациями для объектов;
• оповещение инструментальных и рабочих системоб интересующих их событиях;
• управление контекстом и разные способы обзора объектов репозитария;
• определение потоков работ.
Дата добавления: 2015-04-20; просмотров: 11 | Поможем написать вашу работу | Нарушение авторских прав |