Система баз данных представляет собой компьютеризированную систему хранения информации. Пользователям этой системы предоставляются различные средства для ее извлечения и модификации.[1]
К информации может относиться все, что заслуживает внимания отдельного пользователя или организации, использующей систему, т.е. любое предприятие неизбежно должно хранить и обновлять большое количество данных, отражающих его деятельность. Это и есть «информация». Для иллюстрации этого понятия рассмотрим случай Holding-центра. Предположим в Holding-центре хранятся данные о всех товарах, реализуемых со складов фирм Holding-центра; о складах, где хранятся товары; о фирмах, которые занимаются оптовыми продажами товаров со складов и т.д. Все перечисленное представляет собой те основные объекты, данные о которых записаны в БД:
Продажи
Товары
Хранение
Склады
Фирмы
Между этими объектами существуют связи или отношения (эти связи представлены стрелками). Например, существует связь между Фирмами и Складами: каждая фирма имеет несколько складов, и каждый склад принадлежит конкретной фирме. Эти связи составляют такую же часть «информации», как и объединяемые ими объекты. Поэтому они также должны быть представлены в БД.
Чтобы понять процесс электронной обработки данных, необходимо знать ряд терминов, которые применяются при описании и представлении данных.
Предметная область– часть реального мира, подлежащая изучению с целью автоматизации процесса управления в этой сфере (например, банк, академия, больница).
Объект – элемент информационной системы, сведения о котором хранятся в базе данных. Объектом может быть человек, предмет, событие, место или явление (например, в банковском деле примерами объектов могут служить клиенты, банковские счета, ссуды по закладным и т.п.).
Атрибут (или элемент данных)–информационное отображение свойств объекта. Каждый объект характеризуется некоторым набором атрибутов (например, клиент банка имеет такие атрибуты как фамилия, адрес и, возможно, идентификационный номер).
Ключевой элемент данных. Некоторые элементы данных обладают интересным свойством. Зная значение, которое принимает такой элемент данных объекта, можно идентифицировать значения, которые принимают другие элементы данных этого же объекта. (Например, зная идентификационный номер клиента, можно узнать фамилию клиента, его адрес.) Элементы данных, по которым можно определить другие элементы данных, называются ключевыми.
Совокупность значений связанных элементов данных образует записьданных.
Система управления базой данных(СУБД) – программа, которая управляет всем доступом к базе данных.
Система управления базами данных основывается на использовании определенной модели данных. С помощью модели данных могут быть представлены объекты предметной области и взаимосвязи между ними. В начале 60-х годов прошлого века в СУБД стали применяться иерархическаяи сетевая модели данных. В начале 70-х г.г. была предложена реляционная модель данных. Главными достоинствами реляционного подхода являются его простота и теоретическое обоснование. Реляционная модель данных основана на хорошо проработанной теории отношений (Relation – отношение). При проектировании базы данных применяются строгие методы, построенные на нормализации отношений. Для других моделей таких методов проектирования в настоящее время нет.
Далее речь пойдет о реляционной модели данных.
Данные в реляционной модели представляются в виде таблицы. В терминологии реляционной модели таблицы называются отношениями. Каждый столбец в таблице является атрибутом. Значения в столбце выделяются из домена (домен суть множество значений, которые может принимать некоторый атрибут). Строки таблицы называются кортежами. В соответствии с традиционной терминологией можно сказать, что столбцы таблицы представляют элементы данных, а строки – записи.
Введем понятие нормализации. Единственными отношениями, допустимыми в реляционной модели, являются те, которые удовлетворяют следующему условию: каждое значение в отношении, т.е. значение каждого атрибута в каждом кортеже должно быть атомарным (неделимым). Другими словами, на пересечении любой строки и любого столбца в таблице должно быть точно одно значение, а не множество значений.
Отношение, удовлетворяющее приведенному условию, называется нормализованным.
Ненормализованное отношение
(атрибут «Количество товара» сам является отношением)
№Склада
Количество товара
КодТовара
Кол–во
Нормализованное отношение
№Склада
КодТовара
Кол–во
Атрибут является первичным ключом отношения, если его значения однозначно идентифицируют кортежи (строки) данного отношения.
Не каждое отношение будет иметь первичный ключ в виде единственного атрибута. Но каждое отношение будет иметь некоторую комбинацию атрибутов, которые взятые вместе, будут однозначно идентифицировать кортеж в отношении. Тогда первичный ключ называется составным первичным ключом(существование такой комбинации гарантируется тем, что отношение является множеством).
Атрибут отношения R1 является внешним ключом, если этот атрибут – не первичный ключ отношения R1, но его значения являются значениями первичного ключа некоторого отношения R2.
Ключи первичный и внешний представляют собой средства выражения связей между кортежами.