Что такое база данных

advertisement
Базы данных
Что такое база данных
База данных (БД) — совокупность определенным образом организованной
информации на какую-то тему (в рамках некоторой предметной области). Например:

база данных книжного фонда библиотеки;

база данных кадрового состава учреждения;

база данных законодательных актов в области уголовного права;

база данных современной эстрадной песни.
Конечно, вся эта информация может храниться и на бумаге (например,
книжный каталог библиотеки). Но современным средством хранения и обработки баз
данных является, безусловно, компьютер. В дальнейшем мы будем иметь в виду
только компьютерные БД.
Базы данных бывают фактографическими и документальными.
В фактографических БД содержатся краткие сведения об описываемых объектах,
представленные в строго определенном формате. Из приведенных выше примеров две
первые БД скорее всего будут организованы как фактографические. В БД библиотеки о
каждой книге хранятся библиографические сведения: год издания, автор, название и
пр. Разумеется, текст книги в ней содержаться не будет. В БД отдела кадров
учреждения хранятся анкетные данные сотрудников: фамилия, имя, отчество; год и
место рождения.
Базы данных в третьем и четвертом примерах наверняка будут организованы как
документальные. Первая из них будет включать в себя тексты законов; вторая — тексты
и ноты песен; биографическую и творческую справочную информацию о композиторах,
поэтах, исполнителях; звуковые записи и видеоклипы. Следовательно, документальная
БД содержит обширную информацию самого разного типа: текстовую, графическую,
звуковую, мультимедийную.
Современные информационные технологии постепенно стирают границу между
фактографическими и документальными БД. Существуют средства, позволяющие легко подключать
любой документ (текстовый, графический, звуковой) к фактографической базе данных.
Сама по себе база данных не может обслужить запросы пользователя на поиск и обработку
информации. БД — это только «информационный склад». Обслуживание пользователя осуществляет
информационная система.
Информационная система — это совокупность базы данных и всего комплекса
аппаратно-программных средств для ее хранения, изменения и поиска информации, для
взаимодействия с пользователем.
Примерами информационных систем являются системы продажи билетов на пассажирские
поезда и самолеты. WWW — это тоже пример глобальной информационной системы.
Для хранения БД может использоваться как один компьютер, так и множество
взаимосвязанных компьютеров.
Если различные части одной базы данных хранятся на множестве компьютеров,
объединенных между собой сетью, то такая БД называется распределенной базой
данных.
Очевидно, информацию в Internet, объединенную паутиной WWW, можно рассматривать как
распределенную базу данных. Распределенные БД создаются также и в локаль ных сетях.
Реляционные (табличные) структуры данных
База данных (БД) — структурированная совокупность взаимосвязанных данных в
рамках некоторой предметной области, предназначенная для длительного хранения во
внешней памяти ЭВМ и постоянного применения.
Реляционные БД — базы данных с табличной формой организации информации.
Реляционная БД состоит из одной или нескольких взаимосвязанных двумерных таблиц.
Пример 1. Организация информации в однотабличной БД «Репертуар
кинотеатров на неделю».
Кинотеатр
Россия
Россия
Россия
Россия
Мир
Мир
фильм
Приключения Буратино
Титаник
Титаник
Звездный десант
Ну, погоди!
Титаник
время
11.00
13.00
17.00
21.00
11.00
13.00
стоимость
3.00
15.00
20.00
15.00
3.00
15.00
М/р
Вор
17.00
10.00
Запись — строка таблицы. Одна запись содержит информацию об отдельном объекте,
описываемом в БД. В примере 1 таким объектом является сеанс в кинотеатре.
Поле — столбец таблицы. Поле содержит определенное свойство (атрибут) объекта.
Каждое поле имеет имя. В примере 1 слова «Кинотеатр», «Фильм», «Время», «Стоимость»
— имена полей.
Первичный (главный) ключ БД — это поле или группа полей, с помощью которых
можно однозначно идентифицировать запись. Значение первичного ключа не должно
повторяться у разных записей. В рассмотренном выше примере в качестве первичного ключа
БД нужно взять группу полей кинотеатр + время.
С каждым полем связано еще одно очень важное свойство — тип поля. Тип определяет
множество значений, которые может принимать данное поле в различных записях. В
реляционных базах данных используется четыре основных типа полей: числовой,
символьный, дата, логический.
Числовой тип имеют поля, значения которых могут быть только числами. Числа могут
быть целыми и вещественными. Символьный тип имеют поля, в которых будут храниться
символьные последовательности (слова, тексты, коды и т.п.). Тип «дата» имеют поля,
содержащие календарные даты в различной форме. Логический тип соответствует полю,
которое может принимать всего два значения: «да» — «нет» или «истина» — «ложь».
Значения полей — это некоторые величины определенных типов. От типа величины
зависят те действия, которые можно с ней производить. Например, с числовыми
величинами можно выполнять арифметические операции, а с символьными и логическими
— нельзя.
Для полей символьного и числового типов требуется также определить их ширину. При
определении ширины поля нужно ориентироваться на максимально длинное значение,
которое может храниться в этом поле. В некоторых случаях для числовых полей нужно
задавать не ширину, а числовой формат (целое, длинное целое, с плавающей точкой и т. п.).
Поля типа «дата» и логического типа имеют стандартную ширину.
Пример 2. Описать структуру БД «Репертуар кинотеатров на неделю».
Описать структуру — это значит указать все поля таблицы и их характеристики:
название поля
тип
ширина
кинотеатр
фильм
время
символьный
символьный
числовой
стоимость
числовой
15
25
5
5
кол-во
десятичных
знаков
2
2
Пример 3. Дан фрагмент реляционной БД:
Номер
рейса
2156
Дата
вылета
Тип
самолета
Цена
билета
Наличие
билетов
23.10.98
ТУ-154
564.50
да
Указать главный ключ; описать характеристики полей.
Главный ключ: номер рейса + дата вылета.
Описания полей:
название поля
тип
ширина
кол-во
десятичных
знаков
Номер рейса
Дата вылета
Тип самолета
Цена билета
числовой
дата
символьный
числовой
4
0
10
5
2
Наличие билетов
логический
В некоторых СУБД внутри имени поля нельзя использовать пробелы. Для связки между
словами можно ставить знак подчеркивания.
Что такое система управления базами данных
СУБД (Система Управления Базами Данных) — программное обеспечение для работы с
базами данных. Большинство современных СУБД предназначены для работы с
реляционными базами данных (реляционные СУБД).
Создание базы данных состоит из трех этапов:
1) Проектирование БД. Это теоретический этап работы (без компьютера). На этом этапе
определяется:
— какие таблицы будут входить в состав БД,
— структура таблиц (из каких полей, какого типа и размера будет состоять каждая
таблица),
— какие поля будут выбраны в качестве первичных (главных) ключей каждой таблицы
и т. д.
2) Создание структуры. На этом этапе с помощью конкретной СУБД описывается
структура таблиц, входящих в состав БД.
3) Ввод записей. Заполнение таблиц базы данных конкретной информацией.
Что можно делать с готовой базой данных? Практически все, что угодно:
— добавлять новые записи;
— удалять записи, ставшие ненужными:
— изменять содержимое полей;
— изменять структуру таблицы: удалять или добавлять поля;
— сортировать строки по какому-нибудь принципу, например в алфавитном порядке
фамилий авторов;
—получать справки, то есть ответы на запросы.
Очевидно, последнее — получение справок — это основная цель, ради которой создается база
данных.
В большинстве случаев справка — это тоже таблица с интересующими пользователя
сведениями, извлеченными из базы данных.
Download