Студопедия  
Главная страница | Контакты | Случайная страница

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатика
ИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханика
ОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторика
СоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансы
ХимияЧерчениеЭкологияЭкономикаЭлектроника

Сущности, их свойства. Связи между сущностями.

Читайте также:
  1. BreathMaker исправляет речь между губами и ушами.
  2. C. замыкание между фазами, замыкание фаз на землю в сетях с глухо и эффективно-заземленной нейтралью, а также витковые замыкания в эл. Машинах
  3. D. увеличение расстояния между ними
  4. LВзаимоотношения врачей между собой и с медицинскими работниками
  5. XVI. Международные отношения. Проблемы глобализации и секуляризма.
  6. А) международно-правовые акты и федеральные нормативно-правовые акты и документы
  7. А. Международные межправительственные организации.
  8. А.Понятие и виды международных договоров.
  9. А9. К политическим властным отношениям относятся отношения между
  10. Авторские и смежные права в международном частном праве

Широкое распространение реляционных СУБД и их использование в самых разнообразных приложениях показывает, что реляционная модель данных достаточ­на для моделирования предметных областей. При этом объект предметной области представляется информационным объектом.

Информационный объект — это описание некоторой сущности (реального объек­та, явления, процесса, события) в виде совокупности логически связанных реквизитов (информационных элементов). Такими сущностями для информационных объектов могут служить: цех, склад, материал, вуз, студент, сдача экзаменов и т.д.

Информационный объект определенного реквизитного состава и структуры образует класс (тип), которому присваивается уникальное имя (символьное обозначение), например Студент, Сессия, Стипендия.

Информационный объект имеет множество реализаций — экземпляров, каждый из ко­торых представлен совокупностью конкретных значений реквизитов и идентифицируется значением ключа (простого или составного). Ос­тальные реквизиты информационного объекта являются описательными. При этом одни и те же реквизиты в одних информационных объектах могут быть ключевыми, а в других — описательными. Информационный объект может иметь несколько ключей.

Однако проектирование реляцион­ной базы данных в терминах отношений на основе механизма нормализации часто пред­ставляет собой очень сложный и не всегда удобный для проектировщика процесс. Это обусловлено специфическими особенностями реляционной модели данных:

º реляционная модель не предоставляет достаточных средств для представления смысла данных. Проектировщик должен независимым от модели способом пред­ставлять семантику реальной предметной области. Примером данного ограни­чения может служить представление ограничений целостности;

º в ряде случаев предметную область трудно моделировать на основе плоских таблиц. Сложности могут возникнуть на начальной стадии проектирования при описании предметной области в виде одной (возможно, даже ненормализован­ной) таблицы;

º хотя весь процесс проектирования происходит на основе учета зависимостей, реляционная модель не содержит никаких средств для представления этих за­висимостей;

º несмотря на то, что процесс проектирования начинается с выделения некото­рых объектов (сущностей) предметной области, существенных для приложе­ния, и выявления связей между этими сущностями, реляционная модель дан­ных не предлагает какого-либо аппарата для разделения сущностей и связей.

Для преодоления ограничений реляционной модели и обеспечения потребности проектировщиков баз данных в более удобных и мощных средствах моделирова­ния предметной области проектирование баз данных обычно выполняется не в терминах реляционной модели, а с использованием концептуальных моделей пред­метной области.

Обычно различают концептуальные модели двух видов:

º объектно-ориентированные модели, в которых сущности реального мира пред­ставляются в виде объектов, а не записей реляционных таблиц;

º семантические модели, отражающие значения реальных сущностей и отношений.

Объектно-ориентированную модель можно рассматривать как результат объеди­нения семантической модели данных и объектно-ориентированного языка програм­мирования.

Несмотря на то, что в последнее время все большее распространение получают объектно-ориентированные модели, не снижается и значение семантических мо­делей. Кроме того, семантические модели более просты для понимания, особенно при проектировании сравнительно небольших баз данных.

Как и реляционная модель, любая развитая семантическая модель данных включает структурную, манипуляционную и целостную части.

Главным назначением семанти­ческих моделей является обеспечение возможности выражения семантики данных.

Цель семантического моделирования — обеспечение наиболее естественных для человека способов сбора и представления той информации, которую предполага­ется хранить в создаваемой базе данных.

Одной из наиболее популярных семантических моделей данных является модель «сущность-связь» (часто называемая также ER-моделью — по первым буквам ан­глийских слов Entity (сущность) и Relation (связь)).

На использовании разновидностей ER-модели основано большинство современ­ных подходов к проектированию баз данных (главным образом, реляционных). Модель была предложена Ченом в 1976 г. Моделирование предметной области базируется на использовании графических диаграмм, включающих небольшое число разнородных компонентов. В связи с наглядностью представления концеп­туальных схем баз данных ER-модели получили широкое распространение в CASE-средствах, предназначенных для автоматизированного проектирования реляцион­ных баз данных.

Для моделирования структуры данных используются ER-диаграммы (диаграммы «сущность-связь»), которые в наглядной форме представляют связи между сущ­ностями. В соответствии с этим ER-диаграммы получили распространение в CASE-системах, поддерживающих автоматизированное проектирование реляционных баз данных. Наиболее распространенными являются диаграммы, выполненные в со­ответствии со стандартом IDEF1X, который используют наиболее популярные CASE-системы (в частности, ERwin, Design/IDEF, Power Designer),

Цель инфологического моделирования – обеспечение наиболее естественных

для человека способов сбора и представления той информации, которую предполагается хранить в создаваемой базе данных. Поэтому инфологическую модель данных пытаются строить по аналогии с естественным языком (последний не может быть использован в чистом виде из-за сложности компьютерной обработки текстов и неоднозначности любого естественного языка). Основными конструктивными элементами инфологических моделей являются сущности, связи между ними и их свойства (атрибуты).

Основными понятиями ER-диаграммы являются:

· сущность,

· связь

· атрибут.

Сущность – любой различимый объект (объект, который мы можем отличить от другого), информацию о котором необходимо хранить в базе данных. Сущность — это реальный или виртуальный объект, имеющий существенное зна­чение для рассматриваемой предметной области, информация о котором подле­жит хранению.

Если не вдаваться в подробности, то можно считать, что сущности соответствуют таблицам реляционной модели.

Сущностями могут быть люди, места, самолеты, рейсы, вкус, цвет и т.д. Необходимо различать такие понятия, как тип сущности и экземпляр сущности. Понятие тип сущности относится к набору однородных личностей, предметов, событий или идей, выступающих как целое. Экземпляр сущности относится к конкретной вещи в наборе. Например, типом сущности может быть ГОРОД, а экземпляром – Москва, Киев и т.д.

Каждая сущность должна обладать следующими свойствами:

º иметь уникальный идентификатор;

º содержать один или несколько атрибутов, которые либо принадлежат сущнос­ти, либо наследуются через связь с другими сущностями;

º содержать совокупность атрибутов, однозначно идентифицирующих каждый экземпляр сущности.

Любая сущность может иметь произвольное количество связей с другими сущно­стями.

Атрибут является характеристикой сущности, значимой для рассматриваемой предметной области. Атрибут – поименованная характеристика сущности.

В реля­ционных базах данных аналогом атрибута является поле таблицы.

Его наименование должно быть уникальным для конкретного типа сущности, но может быть одинаковым для различного типа сущностей.

Например,

ЦВЕТ может быть определен для многих сущностей:

· СОБАКА,

· АВТОМОБИЛЬ,

· ДЫМ и т.д.

Атрибуты используются для определения того, какая информация должна быть собрана о сущности.

Примерами атрибутов для сущности АВТОМОБИЛЬ являются:

· ТИП,

· МАРКА,

· НОМЕРНОЙ ЗНАК,

· ЦВЕТ и т.д.

Здесь также существует различие между типом и экземпляром.

Тип атрибута ЦВЕТ имеет много экземпляров или значений:

· Красный,

· Синий,

· Банановый,

· Белая ночь и т.д.,

однако каждому экземпляру сущности присваивается только одно значение атрибута.

Абсолютное различие между типами сущностей и атрибутами отсутствует. Атрибут является таковым только в связи с типом сущности. В другом контексте атрибут может выступать как самостоятельная сущность. Например, для автомобильного завода цвет – это только атрибут продукта производства, а для лакокрасочной фабрики цвет – тип сущности.

Связь это соединение (ассоциирование) двух или более сущностей, при котором, каждый экземп­ляр одной сущности, называемой родительской сущностью, ассоциирован с про­извольным (в том числе нулевым) количеством экземпляров второй сущности, называемой сущностью-потомком, а каждый экземпляр сущности-потомка ассо­циирован в точности с одним экземпляром сущности-родителя.

Для каждой связи между сущностями указы­ваются правила, обеспечивающие ее поддержание.

Если бы назначением базы данных было только хранение отдельных, не связанных между собой данных, то ее структура могла бы быть очень простой.

Однако одно из основных требований к организации базы данных – это обеспечение возможности отыскания одних сущностей по значениям других, для чего необходимо установить между ними определенные связи.

А так как в реальных базах данных нередко содержатся сотни или даже тысячи сущностей, то теоретически между ними может быть установлено более миллиона связей.

Наличие такого множества связей и определяет сложность инфологических моделей.

11. Нормализация – основные понятия

Нормальная форма — свойство отношения в реляционной модели данных, характеризующее его с точки зрения избыточности, которая потенциально может привести к логически ошибочным результатам выборки или изменения данных. Нормальная форма определяется как совокупность требований, которым должно удовлетворять отношение.

Процесс преобразования отношений базы данных (БД) к виду, отвечающему нормальным формам, называется нормализацией. Нормализация предназначена для приведения структуры БД к виду, обеспечивающему минимальную логическую избыточность, и не имеет целью уменьшение или увеличение производительности работы или же уменьшение или увеличение физического объёма базы данных.[1] Конечной целью нормализации является уменьшение потенциальной противоречивости хранимой в базе данных информации. Как отмечает К. Дейт,[2] общее назначение процесса нормализации заключается в следующем:

§ исключение некоторых типов избыточности;

§ устранение некоторых аномалий обновления;

§ разработка проекта базы данных, который является достаточно «качественным» представлением реального мира, интуитивно понятен и может служить хорошей основой для последующего расширения;

§ упрощение процедуры применения необходимых ограничений целостности.

Устранение избыточности производится, как правило, за счёт декомпозиции отношений таким образом, чтобы в каждом отношении хранились только первичные факты (то есть факты, не выводимые из других хранимых фактов).

При том, что идеи нормализации весьма полезны для проектирования баз данных, они отнюдь не являются универсальным или исчерпывающим средством повышения качества проекта БД. Это связано с тем, что существует слишком большое разнообразие возможных ошибок и недостатков в структуре БД, которые нормализацией не устраняются. Несмотря на эти рассуждения, теория нормализации является очень ценным достижением реляционной теории и практики, поскольку она даёт научно строгие и обоснованные критерии качества проекта БД и формальные методы для усовершенствования этого качества. Этим теория нормализации резко выделяется на фоне чисто эмпирических подходов к проектированию,[3]которые предлагаются в других моделях данных. Более того, можно утверждать, что во всей сфере информационных технологий практически отсутствуют методы оценки и улучшения проектных решений, сопоставимые с теорией нормализации реляционных баз данных по уровню формальной строгости.

Нормализацию иногда упрекают на том основании, что «это просто здравый смысл», а любой компетентный профессионал и сам «естественным образом» спроектирует полностью нормализованную БД без необходимости применять теорию зависимостей.[4] Однако, как указывает К. Дейт, нормализация в точности и является теми принципами здравого смысла, которыми руководствуется в своём сознании зрелый проектировщик, то есть принципы нормализации — это формализованный здравый смысл. Между тем, идентифицировать и формализовать принципы здравого смысла — весьма трудная задача, и успех в её решении является существенным достижением.[4]

12. Нормализация – первая нормальная форма, алгоритм приведения, пример

Первая нормальная форма (1NF) — базовая нормальная форма отношения в реляционной модели данных.

Отношение находится в первой нормальной форме тогда и только тогда, когда в любом допустимом значении отношения каждый его кортеж содержит только одно значение для каждого из атрибутов.

В реляционной модели отношение всегда находится в первой нормальной форме по определению понятия отношение.

Что же касается различных таблиц, то они могут не быть правильными представлениями отношений и, соответственно, могут не находиться в 1NF. В соответствии с определением К. Дж. Дейта для такого случая, таблица нормализована (эквивалентно — находится в первой нормальной форме) тогда и только тогда, когда она является прямым и верным представлением некоторого отношения. Конкретнее, рассматриваемая таблица должна удовлетворять следующим пяти условиям:

1. Нет упорядочивания строк сверху-вниз (другими словами, порядок строк не несет в себе никакой информации).

2. Нет упорядочивания столбцов слева-направо (другими словами, порядок столбцов не несет в себе никакой информации).

3. Нет повторяющихся строк.

4. Каждое пересечение строки и столбца содержит ровно одно значение из соответствующего домена (и больше ничего).

5. Все столбцы являются обычными[1].

«Обычность» всех столбцов таблицы означает, что в таблице нет «скрытых» компонентов, которые могут быть доступны только в вызове некоторого специального оператора взамен ссылок на имена регулярных столбцов, или которые приводят к побочным эффектам для строк или таблиц при вызове стандартных операторов. Таким образом, например, строки не имеют идентификаторов кроме обычных значений потенциальных ключей (без скрытых «идентификаторов строк» или «идентификаторов объектов»). Они также не имеют скрытых временных меток[1].

Исходная ненормализованная (то есть не являющаяся правильным представлением некоторого отношения) таблица:

Сотрудник Номер телефона
Иванов И. И. 283-56-82 390-57-34
Петров П. П. 708-62-34

Таблица, приведённая к 1NF (являющаяся правильным представлением некоторого отношения):

Сотрудник Номер телефона
Иванов И. И. 283-56-82
Иванов И. И. 390-57-34
Петров П. П. 708-62-34

13. Нормализация – вторая нормальная форма, алгоритм приведения, пример

Переменная отношения находится во второй нормальной форме тогда и только тогда, когда она находится в первой нормальной форме и каждый неключевой атрибут неприводимо зависит от ее потенциального ключа.[1]

Неприводимость означает, что в составе потенциального ключа отсутствует меньшее подмножество атрибутов, от которого можно также вывести данную функциональную зависимость.[1] Для неприводимой функциональной зависимости часто используется эквивалентое понятие «полная функциональная зависимость».[1]

Если потенциальный ключ является простым, то есть состоит из единственного атрибута, то любая функциональная зависимость от него является неприводимой (полной). Если потенциальный ключ является составным, то согласно определению второй нормальной формы в отношении не должно быть неключевых атрибутов, зависящих от части составного потенциального ключа.

Вторая нормальная форма по определению запрещает наличие неключевых атрибутов, которые вообще не зависят от потенциального ключа. Таким образом, вторая нормальная форма запрещает создавать отношения как несвязанные (хаотические, случайные) наборы атрибутов.




Дата добавления: 2015-01-30; просмотров: 99 | Поможем написать вашу работу | Нарушение авторских прав

1 | 2 | 3 | 4 | 5 | 6 | <== 7 ==> | 8 | 9 |


lektsii.net - Лекции.Нет - 2014-2024 год. (0.012 сек.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав