Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Базовые понятия реляционной модели данных.




История развития, назначение и роль БД.

Этапы развития информационных систем.

Изменения подхода к использованию информационных систем представлено в табл. 1.

Период времени Концепция использования информации Вид информационной системы Цель использования информационной системы
1950-1960 Бумажный поток расчётных документов ИТ обработки документов на электронных машинах Повышение скорости обработки документов Упрощение процедуры обработки и расчёта
1960-1970 Основная помощь в подготовке отчётов Управленческие ИТ для производственной информации Управление процессами подготовки отчётности
1970-1980 Управленческий контроль реализации Системы поддержки принятия решений (СППР). Выработка наиболее рационального решения
1980-наше время Информационно-стратегический ресурс, обеспечивающий конкурентное преимущество Стратегическая информационная система Повышение конкурентоспособности предприятия

 

В 50-е годы была осознана роль информации как важнейшего ресурса предприятия, организации, региона, общества в целом, начали разрабатывать автоматизированные информационные системы различного рода.

Первые информационные системы были предназначены исключительно для обработки счетов и расчёта з/п, а основывались на электромеханических бухгалтерских счётных машинах. Это приводило к некоторому сокращению времени на подготовку бумажных документов.

Когда появилась возможность обработки информации с помощью ВТ, появляется термин «система обработки данных» или СОД. Вместе с этим расширяется и область обработки информации, появляются системы сбора и обработки статистической информации о состоянии атмосферы, системы учётно-отчётной информации предприятия и т.п. Способ хранения информации – массив.

60-е годы характеризуются изменением отношения к информационным системам. Информация, полученная из них, стала применяться для периодической отчётности по многим параметрам. Для этого организациям требовалось компьютерное оборудование широкого назначения, способное обеспечивать множество функций, а не только обработку счёта и считать зарплаты.

Основные черты информационных систем этого поколения:

· Техническое обеспечение составляли маломощные ЭВМ.

· Информационное обеспечение представляло собой массивы (файлы данных), структура которых определялась той программой, в которой они использовались.

· Архитектура информационных систем была централизованной, как правило. Применялась пакетная обработка задач.

· Конкретный пользователь не имел непосредственного контакта с информационной системой, вся предварительная обработка и ввод осуществлялись персоналом ИС, программное обеспечение было специализированным.

Недостатки ИС данного поколения:

1. Сильная взаимосвязь между программами и данными, то есть изменения в предметной области приводили к изменению структуры данных, а это приводило к изменению в программах.

2. Трудоёмкость разработки и модернизации систем.

3. Сложность согласования частей системы, разработанных различными людьми в различное время.

В 70-80-е года ИС предприятий начинают использоваться в качестве средства управления производством, поддерживающего и ускоряющего процесс подготовки «принятия решений».

В своём большинстве ИС этого периода предназначались для решения установившихся задач, которые чётко определялись на этапе создания системы и затем практически не изменялись.

Появление персональных ЭВМ приводит к корректировке идеи АСУ (автоматизированных систем управления). С появлением персональных ЭВМ начинается процесс децентрализации процесса обработки информации и, как следствие, процесса управления. В результате уменьшается нагрузка на централизованные вычислительные ресурсы.

Все эти изменения приводят к появлению нового типа ИС поддержки и принятия решений. К концу 80-х годов концепция использования ИС снова изменяется. Они становятся стратегическим источником информации и используются на всех уровнях предприятия любого профиля.

ИС этого периода представляя вовремя нужную информацию, помогают организациям достичь успехов в своей деятельности, создавать новые товары и услуги, находить новые рынки сбыта, обеспечивать себе достойных партнёров и т. д.

Стремление повысить скорость обработки информации породило технологию создания и управления базами данных.

БД создаётся для групп взаимосвязанных задач для многих пользователей, что позволяло существенно повысить скорость обработки информации. Сначала СУБД разрабатывались для больших машин, чьё количество не превышало десятка. Благодаря появлению ПЭВМ технология БД стала массовой. Создано большое количество инструментальных средств для разработки ИС. Примером является Microsoft SQL. Основные черты ИС этого поколения:

1. Основу ИС, её информационного обеспечения составляет БД.

2. ПО состоит из прикладных программ и СУБД.

В качестве технических средств используются ПЭВМ и ЭВМ 3, 4 поколений.

Средства разработки ИС – процедурные ЯП 3,4 поколений, расширяемые языки.

Базовые понятия реляционной модели данных.

Принципы реляционной модели данных были изложены в 1970 году Э. Коддом (IBM). Согласно Дейту, РМД состоит из 3 частей:

1. Структурная часть.
Описывает объекты, рассматриваемые в РМД. Единственной структурой данных, используемой в РМД, является нормализованные n-арные отношения.

2. Целостная часть.
Описывает ограничения специального вида, которые должны выполняться для любых отношений в любой РМД. Это правило целостности сущности и ссылочной целостности.
Если данные ограничения выполняются, то обеспечивается целостность БД (свойство, означающее, что БД содержит полную и непротиворечивую информацию, необходимую и достаточную для корректной работы с данными).
Если ограничения, наложенные на БД, выполняются, то обеспечивается целостность БД.

3. Манипуляционная часть.
Описывает 2 эквивалентных способа манипулирования реляционными данными: реляционную алгебру и реляционное счисление.

Реляционная БД представляет собой множество взаимосвязанных таблиц (в теории БД - отношений), каждая из которых содержит информацию об объектах определённого типа. Почти все современные БД – реляционные.

Свойства объекта

   
Информация об объекте
Поля таблицы

   
     

 

При решении задач (например, создание БД для решения какой-либо задачи) обычно отвлекаются от деталей представления объектов, несущественных с точки зрения поставленной задачи. Такой приём, когда внимание фиксируется на выбранных свойствах объекта и игнорируются остальные, называется абстрагированием, а полученный новый объект называется абстракцией или моделью исходного объекта. Полученный объект описывается новыми данными. В зависимости от момента образования и периода их существования различают следующие виды данных:

1. Исходные.
Это сведения о предметной области, которые требуются в ходе решения задачи, но известны заранее. К ним относятся знания об исходных объектах.

2. Промежуточные.
Соответствуют представлениям об объектах, вводимым в рассмотрение в ходе решения задачи. Так же данные, обычно, заранее не известны и их получение не является конечной целью, однако без них невозможно получение решения.

3. Конечные (результаты).
Соответствуют моделям объектов предметной области, получаемым (синтезируемым) в результате решения задачи. По этим данным путём интерпретации приходят к объектам предметной области, являющимся результатом решения задачи.

Данные также делятся на константы и переменные. Константы – это данные, которые не изменяются во время решения задачи, а переменные – это данные, которые меняют своё значения в процессе решения задачи.

Для чёткости (единообразия) описания данных используется понятие типа данных, то есть каждому элементу данных приписывается некоторый тип. Тип данных определяет:

· Множество значений (состояний) данных.

· Множество допустимых операций над данными.

· Внутренне представление данных.

Для каждого элемента данных определяется его имя и тип. В общем случае данные по типу делятся на простые и составные. Простые типы отличаются тем, что одному имени соответствует строго одно значение. Имени же одного из составных типов соответствует набор (ряд) значений. Примерами составных типов являются матрицы (массивы), файлы (множества) и т.п.

В основе теории БД лежат понятия множества и реляционной алгебры.

Множество – это такой объект, который представляет собой коллекцию (набор) других объектов (элементов множества), порядок расположения и тип которых не играет никакой роли.

Характеристики множества:

1. Тип элементов: не ограничен ничем.

2. Обозначение {1,2,3,…} – множество целых чисел.

3. Порядок элементов не играет роли.

4. Число элементов: не ограничено ничем.

5. Ø – пустое множество.

В каждый момент времени их бесконечного числа возможных элементов в множестве присутствует конечный набор элементов. Этот конечный (конкретный) набор элементов и является значением множества.

Алгеброй называется множество объектов с заданной над этим множеством объектов совокупностью операций. В реляционной алгебре объектами операций является особый вид множеств – отношение.

Операции над множествами.

Над множеством возможны 4 операции:

1. Операция присваивания.
Пусть А – множество.
Тогда А:=значение, где значение может быть переменной или константой типа «множество».

Остальные операции – двухместные. Операндами в них могут быть как переменные, так и константы типа «множество».
А и В – множества.

 

2. Пересечение: АᴖВ

 

3. Объединение: АᴗВ

 

4. Разность: А|В

Последние 2 операции используются для выполнения следующих действий:

1. (А+В) используется для включения в множество отдельных элементов.

2. (А-В) используется для исключения отдельных элементов из множества.

А:= Ø

А:=А+{‘a’} – добавление символа ‘a’ в множество А.

В:=В-{‘b’} – удаление символа ‘b’ из множества В.

 

Сравнение множеств

Пусть А и В – множества, х- переменная. Тогда операции сравнения могут быть следующие:

Все операции возвращают логический результат (то есть может быть либо «истина» либо «ложь»).

1. «Истина» только тогда, когда оба множества имеют одинаковый набор элементов.

2. «Истина» тогда, когда набор элементов различный.

3. «Истина» тогда, когда все элементы множества В входят в множество А.

4. «Истина», если все элементы множества А входят в множество В.

5. «Истина», если элемент х входит в множество А.

Отношения в реляционной БД физически представляются в виде двухмерной таблицы, состоящей из строк и столбцов. Отношение имеет вид двухмерной таблицы, строки которой соответствуют отдельным записям, а столбцы – атрибутам.

Атрибут – это поименованный столбец данных.

Домен – это набор допустимых значений для одного или нескольких атрибутов.

Каждый атрибут реляционной БД определяется на некотором домене. Домены могут отличаться для каждого из атрибутов, но 2 и более атрибутов могут определяться на одном домене. Элементами отношений являются кортежи или строки таблицы.

Кортеж – это строка отношения, содержащая конкретные значения атрибутов.

Описание структуры отношения вместе со спецификациями доменов и любыми другими ограничениями возможных значений атрибутов называют его заголовком (содержанием).

Обычно заголовок является фиксированным до тех пор, пока смысл отношения не изменяется за счёт добавления в него дочерних атрибутов.

Кортеж называется расширением, телом или состоянием отношения, которое постоянно меняется. Степень отношения определяется количеством атрибутов, которое оно содержит.

Пусть отношение (таблица) содержит 5 атрибутов. Степень его равна 5. Это значит, что каждая строка таблицы является 5-арным кортежем. Отношение только с одним атрибутом является унарным, с двумя атрибутами – бинарным, с тремя атрибутами – тернарным.

Для отношения с большим количеством атрибутов используется термин n-арные.

Кардинальность – это количество кортежей, которое содержит отношение. Эта характеристика меняется при каждом добавлении или удалении картежей. Кардинальность является свойством тела отношения и определяется текущим состоянием отношения в произвольно взятый момент.

Реляционная БД – это набор нормализованных отношений, то есть реляционная БД состоит из отношений, структура которых определяется с помощью особых методов, называемых нормализацией.

 

Математические отношения

Декартовым произведением двух множеств, например, D1 и D2 (D1 x D2) называется набор из всех возможных пар, в которых первым идёт элемент множества D1, а вторым – элемент множества D2.

D1={2,4}, D2={1,3,5}

D1 x D2={(2,1), (2,3), (2,5), (4,1), (4,3), (4,5)}

Любое подмножество декартова произведения является отношением.

R={(2,1),(4,1)}

Пусть даны n множеств D1, D2,.., Dn. Тогда R – отношение, если R представляет собой множество n-арных кортежей вида {d1, d2,.., dn} где di у Di, i=1бтю

Множество допустимых значений di называется доменом. Тогда R – это подмножество декартова произведения доменов D1 x D2 x.. x Dn.

Каждый кортеж в отношении должен быть уникальным. Можно считать, что декартово произведение соответствует ситуации «всё, что возможно», а отношение моделирует реальную ситуацию.

D1={Иванов, Петров}

D2={История, Информатика, Физика}

D3={3, 4, 5}

D1 x D2 x D3 ={(Иванов, История, 3), (Иванов, История, 4), (Иванов, История, 5), (Иванов, Информатика,3), (Иванов, Информатика, 4), (Иванов, Информатика, 5), …}

Отношения в реляционной теории БД служат для отображения взаимосвязей между свойствами объектов (атрибутами). Отношение R, определённое на множестве доменов D1, D2,.., Dn содержит 2 части:

· Заголовок.

· Тело.

Заголовок отношения включает фиксированное количество атрибутов отношения: A1, A2, …, An. Каждый атрибут характеризуется именем, доменом и значением. Имя атрибута должно быть уникальным в пределах отношения. Заголовок отношения обычно записывается в следующем виде:

< имя отношения > (< список атрибутов >)

Имя отношения должно быть уникальным в пределах БД.

Список атрибутов представляет собой набор пар вида <Ai: Di>, где Ai – имя атрибута, Di – имя домена (Di можно не указывать).

Заголовок отношения «Стипендия»:

Стипендия (Фамилия, N группы. Размер стипендии)

Схема отношения – это перечень имён атрибутов отношения.

Sk=(A1, A2,.., An)

Схема отношения не меняется никогда в процессе функционирования БД. Тело отношения «Стипендия» содержит множество кортежей, состоящих из пар вида < Ai:Vali >, где Vali – значение составляющего атрибута. Кортеж записывается в круглых скобках:

(< A1:Val1>, < A2:Val2>,.., < Ai:Vali>), причём все значения Vali(Ai) e Di. Тогда тело отношения «Стипендия» можно представить в следующем виде:

(Иванов, 242, 0)

(Петров, 241, 1000)

(Сидоров, 240, 2000)

В теории БД отношение представляется в виде таблицы:

Фамилия № группы Размер стипендии
Иванов    
Петров    
Сидоров    

 

Заголовок «Стипендия» описывает декартово произведение доменов, на котором задано отношение. Заголовок статичен – он не меняется во время работы. Если в заголовке изменены, удалены или добавлены атрибуты, то получаем другое отношение, пусть даже с прежним именем.

Тело отношения «Стипендия» представляет собой подмножество декартова произведения доменов. Тело отношения может изменяться в процессе работы с БД.

 

 

Таблица соответствия реляционных терминов и табличных терминов

Реляционный термин Табличный термин
Отношение Таблица
Кортеж отношения Строка таблицы (запись)
Атрибут отношения Наименование столбца (поле)
Степень отношения Количество столбцов в таблице
Мощность отношения Количество строк в таблице
Схема БД Набор заголовков таблиц
БД Набор таблиц

 

Отношение с точки зрения реляционной алгебры должно обладать следующими свойствами:

1. Отношение должно иметь уникальное имя.

2. Каждый столбец должен иметь уникальное имя.

3. Отношения не должны иметь дубли кортежей.

4. Значение всех атрибутов должны быть взяты из определённого множества допустимых значений, которые может принимать атрибут (домен атрибута).

5. Отсутствие упорядоченных кортежей

Третье свойство следует из того, что все отношения – это подмножество декартова произведения множеств. А в таком подмножестве не может быть дублей кортежей по определению. Из пятого свойства следует, что в таблице в отличие от матрицы в математике, нельзя найти конкретную запись по номеру.

В БД записи находятся (идентифицируются) по значению так называемого ключа (первичного ключа, ключевого поля).

Из 3-го свойства следует, что в любом случае в любом отношении с помощью указания набора значений одного или нескольких атрибутов может быть однозначно выделена конкретная запись. Такое множество атрибутов называется ключом (первичным ключом) отношения.

Ключей у отношения может быть несколько. Размер ключа может меняться от одного атрибута до R. Ключом К отношения r является такой атрибут ил группа атрибутов, которые однозначно определяют любую конкретную запись в любом допустимом экземпляре отношения r со схемой R. При этом в любом отношении не может быть 2 кортежей t1 и t2 таких, что t1(K)=t2(K).

Задача выбора ключа является одной из наиболее важных задач при анализе данных. Рекомендуется при этом выбирать в качестве ключа атрибуты, которые в принципе не могут иметь дублей. Например, паспортные данные, номер студенческого билета и т. д.

Следующие свойства отношений:

1. В отношении не может быть одинаковых кортежей.

2. Кортежи не упорядочены.

3. Все значения атрибутов атомарны.

Они определяют первичную нормальную форму БД. То есть если БД соответствует перечисленным свойствам, то она находится в первичной нормальной форме.

 

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...