Технология хранения, поиска и сортировки информации

advertisement
Технология
хранения, поиска и
сортировки
информации
Н. Угринович. Информатика и информационные
технологии. 10-11 класс.
Глава 13.
Учитель информатики МОУ г. Кургана
«Гимназия № 47» Вольман Н.Н. >1
Понятие базы
данных
Веками человечество накапливало знания, навыки работы,
сведения об окружающем нас мире, другими словами - собирало
информацию. Вначале информация передавалась из поколения в
поколение в виде преданий и устных рассказов. Возникновение и
развитие книжного дела позволило передавать и хранить информацию в более надежном письменном виде. Открытия в области
электричества привели к появлению телеграфа, телефона, радио,
телевидения - средств, позволяющих оперативно передавать и
накапливать информацию.
Развитие прогресса обусловило резкий рост информации, в
связи с чем вопрос о ее сохранении и переработке становился год от
года острее. С появлением вычислительной техники значительно
упростились способы хранения, а главное, обработки информации.
Развитие вычислительной техники на базе микропроцессоров
приводит к совершенствованию компьютеров и программного
обеспечения.
Появляются программы, способные обработать большие
потоки информации. С помощью таких программ создаются
информационные системы.
Целью любой информационной системы является обработка
данных об объектах и явлениях реального мира и предоставление
нужной человеку информации о них.
Если мы рассмотрим совокупность некоторых объектов, то
сможем выделить объекты, обладающие одинаковыми свойствами.
Такие объекты выделяют в отдельные классы (рыбы, мебель, ученики
и т. д.). Внутри выделенного класса объекты можно упорядочивать
как по общим правилам классифицирования, например по алфавиту,
так и по некоторым конкретным общим признакам, например по цвету
или материалу.
Группировка объектов по определенным признакам значительно
облегчает поиск и отбор нужной информации.
Рассмотрев свойства объекта, можно продумать, какие
действия можно совершать над этим объектом.
База данных (БД) – это организованная совокупность данных, предназначенная для длительного
хранения во внешней памяти вычислительной
системы, постоянного обновления и использования.
Базы данных хранят информацию о группах объектов с одинаковым
набором свойств. Эта информация хранится в упорядоченном виде.
Для реализации возможностей компьютерной обработки требуется
специальное программное обеспечение. Такое обеспечение принято
называть Системами Управления Базой Данных или СУБД.
СУБД - универсальное программное обеспечение. Для адаптации
СУБД к конкретной предметной области необходима возможность
«подстройки» программного обеспечения. С этой точки зрения
большинство СУБД обладают собственным языком
программирования.
Информационная система – это БД + СУБД
Функции СУБД:
 Ввод информации в БД и обеспечение ее логического контроля









( проверка на допустимость вводимых значений).
Исправление информации.
Удаление устаревшей информации.
Контроль целостности непротиворечимости данных (данные
хранящиеся в разных частях БД не противоречат друг другу).
Защита данных от разрушений.
Поиск информации с необходимыми свойствами.
Автоматическое упорядочивание информации в соответствии с требованиями человека.
Обеспечение коллективного доступа к данным.
Защита от несанкционированного доступа.
Удобный и понятный интерфейс.
Классификация баз данных
1. Один из признаков, по которому можно
классифицировать базы данных - характер хранимой
информации.
 Фактографические БД содержат данные, представляемые в
краткой форме и строго фиксированных форматах. В фактографических БД регистрируются факты. БД являются аналогами бумажных карточек (н-р, библиотечный каталог или каталог видеотеки).
 Документальные БД содержат обширную информацию самого
разного типа: текстовую, графическую, звуковую, мультимедийную. Здесь аналогом являются архивы документов (н-р, БД
эстрадной песни или архив судебных дел, архив исторических
документов).
Классификация баз данных
2. По способу хранения данных:
 Централизованные БД Вся информация хранится на одном
компьютере. Это может быть автономный ПК или сервер сети, к
которому имеют доступ пользователи-клиенты.
 Распределенные БД используются в локальных и глобальных
компьютерных сетях. В этом случае разные части БД хранятся на
разных компьютерах.
Классификация баз данных
3. По структуре данных:
 Иерархические
 Сетевые
 Реляционные
Разновидности
структуры данных
Иерархическая модель БД
Иерархические БД графически могут быть представлены
как перевернутое дерево (граф), состоящее из объектов различных
уровней. Верхний уровень (корень дерева) занимает один объект,
второй – объекты второго уровня и т.д.
Между объектами существуют связи, каждый объект может
включать в себя несколько объектов более низкого уровня. Такие
объекты находятся в отношении предка (объект более близкий к
корню) к потомку (более низкого уровня). Объекты, имеющие
общего предка, называются близнецами.
Пример иерархической БД (набор данных в виде
многоуровневой структуры)
Прайс-лист:
Иванов И.
Продавец (уровень 1)
Автомобили
Товар (уровень 2)
Тойота
Марка (уровень 3)
Модель (уровень 4)
Цена (уровень 5)
Камри
$50000
Хонда
Королла
$70000
Мотоциклы
Лексус
Пример иерархической БД (набор данных в виде
многоуровневой структуры)
Иерархической БД является Каталог
папок Windows.
Верхний уровень занимает папка
Рабочий стол.
На втором уровне находятся папки:
Мои документы, Мой компьютер,
Сетевое окружение и Корзина. Эти
папки являются потомками папки
Рабочий стол, а между собой являются
близнецами.
В свою очередь папка Локальный диск
(С:) является предком по отношению к
папкам третьего уровня (Intel, TP7, и
т.д.)
Сетевая модель БД
Сетевая БД - это набор узлов, в которых каждый может быть связан
с каждым.
Сетевая модель данных позволяет отображать разнообразные
взаимосвязи элементов данных в виде произвольного графа, обобщая
тем самым иерархическую модель данных.
А
Связи между атрибутами могут быть
произвольными. Этот тип организации БД
наиболее соответствует реальным
данным от объекте (человек может быть и
работником, и клиентом банка, и больным,
и водителем и т.д.). Но, к сожалению, такую
БД очень сложно организовать в
компьютере.
Сетевой БД фактически является Всемирная паутина глобальной
сети Интернет. Гиперссылки связывают между собой сотни
миллионов документов в единую распределенную сетевую БД.
Г
В
Б
Реляционная модель БД
Это слово происходит от английского relation – отношение.
В реляционной БД используют табличную модель данных.
База данных может состоять из одной таблицы – однотабличная
БД, или из нескольких взаимосвязанных таблиц – многотабличная
БД.
Табличная база данных содержит перечень объектов одного типа,
т.е. объектов, имеющих одинаковый набор свойств. Такую БД
удобно представить в виде двумерной таблицы: в каждой ее
строке последовательно размещаются значения свойств одного
из объектов; каждое значение свойства – в своем столбце,
озаглавленным именем свойства.
Преимущество таких БД – наглядность и понятность организации
данных, быстрота поиска нужной информации.
Реляционная база данных
Каждый столбец в такой таблице называется – полем - это признак
объекта, выделенный в отдельный столбик и которому задано
имя
Каждая строка такой таблицы называется запись - совокупность
значений полей, которые относятся к конкретному объекту.
Каждая таблица должна содержать, по крайней мере, одно ключевое
поле, содержимое которого уникально для каждой записи в этой
таблице. Ключевое поле позволяет однозначно идентифицировать каждую запись в таблице.
Табличные БД
Моделью табличной БД может служить, например картотека в
библиотеке или записная книжка.
Иванова Света
г. Курган, ул Красина, д. 32, кв. 11
75-75-75
поля
записи
Фамилия
Имя
Адрес
Телефон
Иванова
Света
г. Курган, ул. Красина, д. 32, кв. 11
75-75-75
Петров
Костя
г. Москва, ул. Ленина, д.5, кв.12
76-76-76
Смирнов
Иван
г. Киров, ул. 1 Мая, д.12, кв 56
78-78-78
Домашнее задание:
Составить схему, показывающие
взаимоотношения основных понятий базы
данных, рассмотренных на этом уроке.
Данные смотри на следующем слайде.
Система основных понятий
БАЗЫ ДАННЫХ
Запись
По структуре данных:
Иерархические
Классификация
баз данных
Фактографические
Поле
Централизованные
Таблица – структура
данных БД
Сетевые
Реляционные
По характеру информации:
По способу хранения данных:
Ключевое поле
Документальные
Download