Фундаментальные свойства отношений
Стр 1 из 3Следующая ⇒ История Реляционная модель данных (РМД) относится к теоретико-множественным моделям данных. Появление теоретико-множественных моделей в системах баз данных (БД) было предопределено настоятельной потребностью пользователей в переходе от работы с элементами данных, как это делается в теоретико-графовых моделях [1], к работе с некоторыми макрообъектами. Простота и наглядность для пользователей-непрограммистов и серьезное теоретическое обоснование эффективности практического применения в прикладных задачах определили большую популярность реляционной модели. Развитие формального аппарата представления и манипулирования данными в рамках реляционной модели привело к тому, что реляционная модель данных стала широко использоваться в системах представления знаний. Теоретической основной РМД стала теория отношений. Основу теории отношений заложили двое ученых – американец Чарльз Содерс Пирс (1839-1914) и немец Эрнст Шредер (1841-1902). В руководствах по теории отношений было показано, что множество отношений замкнуто относительно некоторых специальных операций, т.е. образует вместе с этими операциями абстрактную алгебру. Американский математик Э.Ф.Кодд заложил принципы РМД. В конце 1968 года он впервые осознал, что математические дисциплины можно использовать, чтобы привнести в область управления базами данных строгие принципы и точность. Именно таких принципов недоставало этой области в то время. Кодд впервые сформулировал понятия и ограничения реляционной модели, определив набор из Предложения Кодда для систем баз данных оказались чрезвычайно эффективными и оказали весьма существенное влияние на все аспекты технологии построения баз данных.
Основные понятия и определения Реляционная модель данных (РМД) – это способ рассмотрения данных, при котором данные воспринимаются пользователем как таблицы и в распоряжении пользователя имеются некоторые операторы, которые генерируют новые таблицы из старых. Под таблицами здесь понимается структура данных, состоящая из строк и столбцов. В этой структуре каждый столбец содержит данные только одного типа, каждая строка состоит из набора значений составляющих ее столбцов. Под операторами понимаются операции выборки, группировки, соединения и некоторые другие, результатом которых являются новые таблицы, полученные на основании старых. Основной структурой данных в РМД является отношение (от англ. relation – отношение). Отсюда возникло название модели, основанной на отношениях: такую модель стали называть реляционной моделью данных. Введем некоторые определения. N -арным отношением R называют подмножество декартова произведения множеств . Исходные множества называют доменами.
, (1)
где - полное декартово произведение множеств. Полное декартово произведение множеств – набор всевозможных сочетаний из n элементов, где каждый элемент берется из своего домена. Например, пусть имеются три домена (три некоторых множества): - содержит наименования складов торговой фирмы; - содержит наименования групп товаров; - содержит наименования товаров, которыми торгует фирма. Предположим, что содержимое доменов следующее: = {Склад №1, Склад №2}; = {Стройматериалы, Бытовая химия}; = {Кирпич, Шифер, Мыло, Порошок}.
Тогда полное декартово произведение содержит набор из 16 троек (2x2x4), где первый элемент – один из складов фирмы, второй – название группы товаров, третий – наименование товара:
Таким образом, получаем набор всевозможных сочетаний значений доменов в одном n -арном отношении. Учитывая, что отношение R только подмножество полного декартова произведения доменов, то в общем случае оно всегда меньше, чем полное декартово произведение множеств. Так отношение R может содержать только 5 строк. R = {<Склад №1, Стройматериалы, Кирпич>,
Отношение имеет простую графическую интерпретацию. Оно может быть представлено в виде таблицы R, столбцы которой соответствуют доменам, входящим в отношение, а строки – наборам из значений, взятых из исходных доменов.
R
Наборы из n значений называют n -ками. Представленная таблица (отношение в виде таблицы) обладает рядом свойств: 1. Таблица имеет столбцы, соответствующие доменам. 2. Каждый столбец имеет уникальное имя. 3. В таблице нет двух одинаковых строк. 4. Порядок строк и столбцов в таблице произвольный. Домен – множество всех допустимых значений какого-либо свойства или признака объекта (рис.1.1). При этом значения признака соответствуют определенному типу данных. Примерами элементарных доменов являются целые числа, дробные числа, строки и т.д. Одному домену может соответствовать несколько атрибутов, а одному атрибуту – несколько доменов. Например, домен «Текстовая строка» определяет множество допустимых значений для таких атрибутов как «Наименование склада», «Наименование товара», «Единица измерения» и пр. В то же время атрибут «Наименование склада» может быть определен доменом «Наименование объектов», как текстовой строки размером 50 знаков.
Атрибутом отношения называют признак или свойство объекта, множество значений которого определяется доменом. Если домен входит в отношение, то отношение имеет атрибут, возможными значениями которого могут быть только значения из данного домена. Если отношение представить в виде таблицы, то атрибутами будут являться столбцы. Кортеж – это конкретный набор значений доменов (n -ка), составляющих строку отношения. Степень отношения – это количество атрибутов в отношении. Первичный ключ отношения – это уникальный идентификатор кортежа в пределах отношения. Первичным ключом отношения может быть определенная совокупность атрибутов отношения, образующих уникальный в пределах отношения идентификатор. Первичный ключ может также создаваться искусственно путем добавления нового атрибута к отношению. При этом, значения добавленного атрибута также должны быть уникальны в пределах отношения. В этом случае степень отношения увеличивается на единицу, а такой атрибут называют суррогатным первичным ключом. Примером суррогатного ключа является атрибут «Номер строки» на рис.1.1. Следует отметить, что в отношении не может быть одинаковых кортежей, это следует из математической модели: отношение – подмножество декартова произведения множеств, а в декартовом произведении множеств все n -ки различны. Любое отношение является динамической моделью некоторого реального объекта внешнего мира. Для любой динамической модели необходимо знать ее состояние в какой-либо момент времени, необходимо также знать структуру отношения.
Рис.1.1. Пример отношения «Остатки товаров на складах»
Поэтому вводится понятие экземпляра отношения, которое отражает состояние данного объекта в текущий момент времени, и понятие схемы отношения, которое определяет структуру отношения.
Схемой отношения R называют перечень имен атрибутов данного отношения с указанием домена, к которому они относятся:
.
Если атрибуты принимают значения из одного и того же домена, то они называются q-сравнимыми, где q - множество допустимых операций сравнения, заданных для данного домена. Например, если домен содержит числовые данные, то для него допустимы все операции сравнения, тогда q = {=, <>, >=, <=, <, >}. Схемы отношения называют эквивалентными, если они имеют одинаковую степень (число атрибутов) и возможно такое упорядочивание имен атрибутов в схемах, что на одинаковых местах будут находиться сравнимые атрибуты, т.е. атрибуты принимающие значения из одного - схема отношения R1 - схема отношения R2 после упорядочивания имен атрибутов. Тогда, Фундаментальные свойства отношений Остановимся теперь на некоторых важных свойствах отношений, которые следуют из приведенных ранее определений.
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|