План:
1 О курсе Баз данных
2 Общая терминология курса
3 Типы моделей данных
4 Терминология таблиц
5 На примере Access
6 Типы первичных ключей
О курсе
Развитие вычислительной техники осуществлялось по двум основным направлениям:
применение вычислительной техники для выполнения численных расчетов;
использование средств вычислительной техники в информационных системах.
курс проектирования баз данных – это курс про построение информационных систем.
Например, тот же механизм прав доступа к информации –
уже требует определённой организации структуры данных:
списки модулей, ролей, статей, пользователей.
Общая терминология
Для начала построения теории нужно выбрать аксиоматическое понятие.
Что первичнее данные или информация?
Данные –
набор конкретных значений, параметров, характеризующих объект, условие,
ситуацию.
Данные не обладают определенной структурой, данные становятся информацией
тогда, когда пользователь задает им определенную интерпретацию,
то есть осознает их смысловое содержание.
Информация – сведения о каком-либо событии, процессе, объекте
содержащие не только данные, но и взаимосвязь между ними
Модель данных — некоторая абстракция (шаблон), которая, будучи приложима
к конкретным данным, позволяет пользователям и разработчикам
трактовать их уже как информацию.
предметная область –
область человеческой деятельности или область реального мира,
подлежащих изучению с целью создания базы данных
для автоматизации процесса управления этой областью
например: предприятие, вуз
База данных –
именованная совокупность моделей данных в рассматриваемой предметной области.
Система управления базами данных (СУБД) – совокупность языковых
и программных средств, предназначенных для создания, наполнения,
обновления и удаления баз данных.
пример ms Access, mySQL, postgreSQL
Автоматизированная информационная система (АИС или ИС) – система, которая
обеспечивают автоматизированный сбор, хранение, обработку и выдачу информации
для решения поставленных задач
Банк данных – разновидность ИС.
Система организации данных: баз данных, программных, технических,
языковых, организационно-методических средств,
предназначенных для обеспечения централизованного накопления и
коллективного многоцелевого использования данных
Типы моделей данных
основные модели данных –
списки (плоские таблицы),
иерархические
сетевые структуры
реляционные базы данных, relation (отношение)
Табличная БД содержит перечень объектов одного типа.
Такую БД удобно представлять в виде двумерной таблицы:
в каждой ее строке последовательно размещаются значения свойств одного из объектов;
каждое значение свойства – в своем столбце, озаглавленном именем свойства.
Иерархические БД графически могут быть представлены как перевернутое дерево,
состоящее из объектов различных уровней. Верхний уровень (корень дерева)
занимает один объект, второй – объекты второго уровня и т. д.
Между объектами существуют связи, каждый объект может включать
в себя несколько объектов более низкого уровня.
Такие объекты находятся в отношении предка (объект, более близкий к корню)
к потомку (объект более низкого уровня),
при этом объект-предок может не иметь потомков или иметь их несколько,
тогда как объект-потомок обязательно имеет только одного предка.
Сетевая БД является обобщением иерархической за счет допущения объектов,
имеющих более одного предка.
Вообще, на связи между объектами в сетевых моделях
не накладывается никаких ограничений.
Примером Сетевой базы данных является
Всемирная паутина глобальной компьютерной сети Интернет.
Гиперссылки связывают между собой сотни миллионов документов
в единую распределенную сетевую БД.
Реляционная модель основана на математическом понятии отношения,
физическим представлением которого является таблица.
Эдгар Франк Кодд – автор реляционной модели данных.
Дело в том, что Кодд, будучи опытным математиком,
широко использовал математическую терминологию,
особенно из теории множеств и логики предикатов.
Терминология таблиц в БД
Поле – это элементарная единица логической организации данных,
которая соответствует неделимой единице информации (реквизиту).
Запись (кортеж) – это совокупность логически связанных полей.
Таблица (отношение) – плоская таблица, состоящая из столбцов и строк.
совокупность записей одной структуры
Атрибут – это поименованный столбец отношения.
Ключ – это столбец (или несколько столбцов), добавляемый к таблице
и позволяющий установить связь с записями в другой таблице.
Существуют ключи двух типов: первичные и вторичные или внешние.
Первичный ключ – поле или набор полей, однозначно идентифицирующих запись.
Требования, предъявляемые к первичному ключу:
– уникальность – то есть в таблице не должно существовать двух
или более записей с одинаковым значением первичного ключа;
– первичный ключ не должен содержать пустых значений.
Первичные ключи
Существует три типа первичных ключей:
ключевые поля счетчика (счетчик), простой ключ и составной ключ.
Поле счетчика (Тип данных «Счетчик»). Тип данных поля в базе данных,
в котором для каждой добавляемой в таблицу записи в поле автоматически
заносится уникальное числовое значение.
Простой ключ. Если поле содержит уникальные значения, такие как коды
или инвентарные номера, то это поле можно определить как первичный ключ.
В качестве ключа можно определить любое поле, содержащее данные,
если это поле не содержит повторяющиеся значения или значения Null.
Составной ключ. В случаях, когда невозможно гарантировать уникальность
значений каждого поля, существует возможность создать ключ,
состоящий из нескольких полей. Чаще всего такая ситуация возникает
для таблицы, используемой для связывания двух таблиц многие – ко – многим.
Необходимо еще раз отметить, что в поле первичного ключа должны быть
только уникальные значения в каждой строке таблицы,
т.е. совпадение не допускается, а в поле вторичного или внешнего ключа
совпадение значений в строках таблицы допускается.
Если возникают затруднения с выбором подходящего типа первичного ключа,
то в качеcтве ключа целесообразно выбрать поле счетчика.