Uploaded by lemur-07

Лекция 1. Базы данных. Основные понятия

advertisement
Лекция 1. Базы данных. Основные понятия.
Основные понятия
Существуют различные определения понятия база данных (БД). Чаще
всего под БД понимается поименованная совокупность структурированных
данных, относящихся к некоторой предметной области. Однако в этом случае
БД весьма трудно отличить от обычной картотеки или архива документов.
База данных (БД) – совокупность взаимосвязанных, хранящихся вместе
данных при наличии такой минимальной избыточности, которая допускает их
использование оптимальным образом для одного или нескольких приложений.
Можно выделить три свойства, которые отличают БД от простой
совокупности данных:
1. БД хранится и обрабатывается в вычислительной системе.
2. Данные в БД хорошо структурированы, т.е. выделены основные
элементы, их типы и связи между элементами, а также ограничения на
допустимые операции.
3. Обеспечивается поиск и обработка данных.
Наиболее распространенным типом БД являются реляционные базы
данных. Рассмотрим основные структурные элементы реляционной БД:
1. Поле – элементарная единица организации данных. Для описания
поля используют характеристики: имя, тип, длина, точность и т.д.
Соответствует столбцу в таблице.
2. Запись – совокупность логически связанных полей. Соответствует
строке в таблице.
3. Собственно таблица (отношение).
Система баз данных
Система баз данных (СБД) – это компьютеризированная система
структурированных данных, основная цель которой хранение информации и
предоставление ее по требованию.
Различают однопользовательские и многопользовательские системы.
Однопользовательская система (Single-user system) – это система, в
которой в одно и то же время к БД может получить доступ только один
пользователь.
Многопользовательская система (Multi-user system) – это система, в
которой в каждый момент времени к БД могут получить доступ несколько
пользователей. Основная задача такой системы – позволить пользователю
работать с БД как с однопользовательской.
Обычно в СБД выделяют четыре основных элемента:
1. Данные.
2. Аппаратное обеспечение.
3. Программное обеспечение (ПО).
1
4. Пользователи.
Упрощенная схема СБД представлена на рис. 1.1.
База данных
Прикладные
программы
Конечные
пользователи
Рисунок 1.1 – Элементы системы баз данных
Данные
Данные в БД можно охарактеризовать как интегрированные и общие.
Интегрированные данные можно представить как объединение нескольких
отдельных файлов, полностью или частично неперекрывающихся. В случае
общих данных отдельные области данных можно использовать нескольким
различным пользователям.
Аппаратное обеспечение
К нему относятся:
 накопители для хранения информации вместе с устройствами
ввода/вывода;
 процессор вместе с основной памятью, которая используется для
поддержки работы ПО системы.
Программное обеспечение
Основная часть ПО – это система управления базами данных, СУБД
(DBMS – DataBase Management System – диспетчер БД).
Система управления базами данных (СУБД) – это комплекс
программных и языковых средств, необходимых для создания баз данных,
поддержания их в актуальном состоянии и организации поиска в них
необходимой информации.
Основная функция СУБД – предоставление пользователю возможности
работать с БД, не вникая в детали на уровне аппаратуры.
2
СУБД поддерживает пользовательские операции высокого уровня. К
таким операциям относятся и операции, выполняемые с помощью языка SQL
(Structured Query Language, структурированный язык запросов) –
специального языка БД. СУБД хотя и основной, но не единственный
программный компонент системы, среди других можно назвать утилиты,
средства разработки приложений, генераторы отчетов и другие.
Пользователи
Различают три группы пользователей СБД:
1. Прикладные программисты. Для целей разработки прикладных
программ, которые используют базы данных, применимы различные языки и
среды программирования: Visual Basic, C++, Java, C# и другие. Прикладные
программы получают доступ к базе данных посредством выдачи
соответствующего запроса к СУБД (обычно это операторы SQL).
2. Конечные (рядовые) пользователи. Конечный пользователь может
получать доступ к базе данных, применяя одно из интерактивных приложений.
Многие СУБД предоставляют не только средства для выполнения запросов
SQL, но и графические утилиты, позволяющие создавать запросы без знания
SQL.
3. Администраторы БД. Занимаются управлением работы сервера
БД.
Организация данных в БД
В базе данных выделяют следующие элементы:
 данные;
 объекты (сущности);
 связи;
 свойства (атрибуты);
 домен атрибута;
 ключ сущности;
 кортеж.
Данные
В БД данные обычно называют постоянными, хотя они, конечно, не
являются таковыми в общепринятом понимании. Так их назвали в сравнении
с изменчивыми данными – транзитными (промежуточные результаты,
входные, выходные данные).
Входные данные – это информация, передаваемая системе с терминала
или рабочей станции. Когда эта информация сохранена в таблицах, она
становится частью постоянных данных или влечет за собой изменения
постоянных данных.
Выходные данные – это сообщения и результаты, выдаваемые системой
на экран, печать и иное устройство вывода.
3
Объекты
Сущность (entity) – это реальный или представляемый тип объекта,
информация о котором должна сохраняться и быть доступна. В диаграммах
сущность представляется в виде прямоугольника, содержащего имя сущности.
При этом имя сущности – это имя типа, а не некоторого конкретного
экземпляра этого типа. Примеры сущностей: ФАКУЛЬТЕТ, ГРУППА,
СТУДЕНТ. Каждый экземпляр сущности (объект) должен быть отличим от
любого другого экземпляра той же сущности.
Пример экземпляров сущности ФАКУЛЬТЕТ: ПС, ФМ, АТ и т.п.,
сущности СТУДЕНТ: Иванов А.П., Петрова Н.Н. и т.п.
Кортеж
Кортеж – совокупность полей или запись.
Связи
Связь (relationship) – это графически изображаемая ассоциация,
устанавливаемая между двумя сущностями. Связь может существовать между
двумя разными сущностями или между сущностью и ей же самой
(рекурсивная связь). Возможны связи на основе отношений:

один-к-одному;

один-ко-многим;

многие-ко-многим.
Связь «содержит»: ГРУППА содержит много СТУДЕНТОВ. Каждый
СТУДЕНТ входит только в одну ГРУППУ.
Связь «укушен»: СОБАКА может укусить много ЧЕЛОВЕК, ЧЕЛОВЕК
может быть укушен многими СОБАКАМИ.
Связь «владеет»: ЧЕЛОВЕК может владеть многими СОБАКАМИ. У
СОБАКИ может быть только один хозяин.
Связь "один к одному" встречается редко. Например, у нас есть таблица
с информацией о всех сотрудниках и таблица с информацией о всех торговых
агентах, которые являются сотрудниками нашего предприятия. Записи в таких
таблицах могут быть связаны отношением "один к одному".
4
Свойства сущностей
Сущности
имеют
свойства,
которые
называются атрибутами (attribute).
Например, атрибуты:

сущности ФАКУЛЬТЕТ:
o
название;
o
год создания;

сущности ГРУППА:
o
номер;

сущности СТУДЕНТ:
o
фамилия;
o
имя;
o
отчество;
o
номер студенческого билета;
o
номер паспорта;
o
год рождения;
o
месяц рождения;
o
день рождения.
Домены атрибутов
Любой атрибут принимает значения из некоторого множества
допустимых значений, называемого доменом атрибута.
Например:

домен атрибута «год создания»: целые положительные числа;

домен атрибута «имя»: строка, не содержащая пробелов;

домен атрибута «год рождения»: целые положительные числа;

домен атрибута «месяц рождения»: январь, февраль, март …
декабрь;

домен атрибута «день рождения»: целые числа от 1 до 31.
Ключ сущности
Ключ сущности (entity key), первичный ключ – это атрибут (или
множество атрибутов) уникальным образом идентифицирующих экземпляр
сущности (объект).
Например: ключ сущности СТУДЕНТ – номер студенческого билета,
ключ ФАКУЛЬТЕТА – название. Если ключ состоит из одного атрибута, его
называют простым ключом. Если ключ сущности состоит из нескольких
атрибутов, его называют составным ключом.
Например, для сущности ДОМ с атрибутами «улица», «этажность», «год
постройки», «номер дома», первичным ключом будет «улица»+ «номер дома».
Технологии обработки данных БД
По технологии обработки данных БД делятся на централизованные
БД и распределённые БД.
Централизованная БД хранится в памяти одной вычислительной
системы (применяется в локальных сетях ПК).
5
Централизованные БД могут быть с сетевым доступом.
Архитектуры систем централизованных БД с сетевым
подразделяются на файл-сервер и клиент-сервер.
доступом
Рисунок 1.2 – БД с сетевым доступом (Файл-сервер)
Архитектура систем БД с сетевым доступом (Файл-сервер) как показано
на рис. 1.2 предполагает выделение одной из машин сети в качестве
центральной (сервер файлов). На ней хранится совместно используемая
централизованная БД. Все другие машины сети являются рабочими
станциями. Файлы БД в соответствии с пользовательскими запросами
передаются на рабочие станции, где и производится обработка. При большой
интенсивности
доступа
к
одним
и
тем
же
данным производительность системы падает.
Рисунок 1.3 – БД с сетевым доступом Клиент - сервер
6
В архитектуре Клиент-сервер (рис. 1.3) подразумевается, что помимо
хранения централизованной БД центральная машина (сервер базы данных)
должна обеспечивать выполнение основного объёма обработки
данных. Запрос на данные клиента, порождает поиск и извлечение данных на
сервере. Извлечённые данные (но не файлы) транспортируются по сети от
сервера к клиенту.
Пример БД - деловой ежедневник, в котором каждому календарному
дню выделено по странице. Даже в отсутствии там записей, он не перестаёт
быть ежедневником, т.к. имеет структуру, отличающую его от записных
книжек, рабочих тетрадей и т.п. Другие примеры БД: база данных больных в
поликлинике, БД по видеофильмам
(видеотека), БД по сотрудникам
организации (Ф.И.О., пол, дата рождения, место жительство, телефон, состав
семьи и т.д.).
Распределённая БД состоит из нескольких частей, хранимых в
различных ЭВМ вычислительной сети (работа с такой БД происходит с
помощью СУБД).
По способу доступа к данным БД разделяются на БД с локальным и
удаленным доступом.
БД с локальным доступом называется, если эта вычислительная
система является
компонентом
сети
ЭВМ,
возможен
распределённый доступ к такой базе. Такой способ использования БД часто
применяют в локальных сетях ПК.
БД с
удалённым
(сетевым)
доступом называется,
когда,
части БД могут пересекаться или даже дублироваться, но хранятся в
различных ЭВМ вычислительной сети.
Для работы с созданной БД пользователю или администратору
БД следует иметь перечень файлов-таблиц с описанием состава их данных
(структуры,
схемы).
Для
этого
создается
специальный файл,
называемый словарем данных
(депозитарием,
словарем-справочником,
энциклопедией). Описание БД относится к метаинформации.
В качестве технических средств могут выступать супер- или
персональные
компьютеры
с
соответствующими
периферийными
устройствами.
7
Download