Ограничениями, присущими файловым системам, являются разделение и изоляция данных, дублирование данных, зависимость от данных, несовместимость файлов, фиксированные запросы и быстрое увеличение количества приложений В файловых системах описания данных и логика доступа к данным встроены в каждое приложение, поэтому программы становятся зависимыми от данных. Система управления файлами обеспечивает распределение внешней памяти, отображение имен файлов в соответствующие адреса во внешней памяти и обеспечение доступа к данным. База данных (БД) — это поименованная совокупность взаимосвязанных данных, управляемых специальной системой, называемой СУБД. СУБД представляет собой совокупность специальных языковых и программных средств, облегчающих пользователям выполнение всех операций, связанных с организацией хранения данных, их корректировкой и доступом к ним. СУБД служит, по существу, посредником между пользователем и БД. Банк данных (БнД) — это система, состоящая из баз данных, программных, технических, языковых, организационно-методических средств, предназначенных для обеспечения централизованного накопления и коллективного многоцелевого использования данных. Компоненты банка данных: информационный (базы данных и словарь данных), СУБД, технические средства, организационно-методические средства (инструкции, нормативные и правовые документы), программные средства, языковые средства, администраторы Словарь данных содержит метаинформацию, т.е. информацию об информации (описание предметной области, сведения о пользователях и т.д.). Использование СУБД для доступа к данным дает ряд преимуществ, к которым относятся: — контроль за избыточностью данных; — непротиворечивость данных; — больше полезной информации при том же объеме хранимых данных; — совместное использование данных; — поддержка целостности данных; — повышенная безопасность; — применение стандартов; — упрощение сопровождения системы за счет независимости от данных; — улучшенное управление параллельной работой; — развитые службы резервного копирования и восстановления. Целостность базы данных означает корректность и непротиворечивость хранимых в ней данных. Целостность обычно описывается с помощью ограничений, т.е. правил поддержки непротиворечивости, которые не должны нарушаться в базе данных. Однако использование СУБД дает не только преимущества, но сопряжено и с такими негативными последствиями, как: — сложность СУБД; — большой размер СУБД; — значительная стоимость некоторых СУБД; — дополнительные затраты на аппаратное обеспечение; — более серьезные последствия при выходе системы из строя. Три различных уровня описания элементов данных формируют трехуровневую архитектуру базы данных, включающую внешний, концептуальный и внутренний уровни Уровень, на котором данные воспринимаются пользователями, называется внешним уровнем (external level). СУБД и операционная система воспринимают данные на внутреннем уровне (internal level). На внутреннем уровне данные реально сохраняются с использованием структур данных и файловой организации. Концептуальный уровень (conceptual level) представления данных предназначен для отображения внешнего уровня на внутренний и обеспечения необходимой независимости друг от друга. Цель трехуровневой архитектуры заключается в отделении пользовательского представления базы данных от ее физического представления. Внешний уровень — это представление базы данных с точки зрения пользователей. Он описывает ту часть базы данных, которая относится к каждому пользователю. Концептуальный уровень соответствует обобщающему представлению базы данных. Этот уровень описывает то, какие данные хранятся в базе данных, а также связи, существующие между ними. Внутренний уровень отражает физическое представление базы данных в компьютере, описывая, как информация хранится в базе данных. Предметная область (ПО) - часть реального мира, представляющая интерес для данного исследования или использования. Описание предметной области, выполненное без ориентации на используемые в дальнейшем СУБД и технические средства, называется инфологической моделью предметной области. Этап создания инфологической модели называется инфологическим проектированием На основе ИЛМ строится даталогическая модель базы данных, которая представляет собой отображение логических связей между информационными элементами инфологической модели. Даталогическая модель строится в терминологии конкретной СУБД, в среде которой проектируется БД. Описание логической структуры БД на языке СУБД называется схемой. Для привязки ДЛМ к среде хранения используется модель данных физического уровня, или физическая модель. Эта модель базы данных определяет используемые запоминающие устройства, способы физической организации данных в среде хранения. Описание физической структуры БД называется схемой хранения. Соответствующий этап проектирования БД называется физическим проектированием. При создании моделей данных используются такие понятия, как «сущности», «атрибуты» и «связи». Сущность — это отдельный класс объектов предметной области (сотрудники или клиенты, понятия или события), который должен быть представлен в базе данных. Атрибут — это свойство, описывающее определенный аспект объекта, значение которого следует зафиксировать в описании предметной области. Связь является ассоциативным отношением между сущностями, при котором каждый экземпляр одной сущности соединен с некоторым количеством экземпляров другой сущности. Данные – это набор конкретных значений, параметров характеризующих объект, ситуацию, процесс т.д. Данные не обладают определенной структурой и становятся информацией тогда когда пользователь вкладывает в них смысловое содержание. Модель данных – это некоторая абстракция, которая применительно к данным, позволяет воспринимать их как информацию, т.е. сведения, содержащие не только данные, но и связь между ними. Структурирование – достижение соглашения о способах представления данных По типу хранимой информации БД делятся на фактографические и документальные Фактографические БД предназначены для хранения и обработки структурированных данных. Над такими данными можно выполнять различные операции — поиск, фильтрацию, сортировку, агрегирование и т.д. В документальных БД информация представлена в виде текстов на естественном языке общения документов, состоящих из рефератов, описаний и пр. Поиск по неструктурированным данным осуществляется с использованием семантических признаков. Отобранные документы предоставляются пользователю, а обработка данных в таких системах практически не производится. Основные структуры данных, используемые в фактографических БД: реляционная, иерархическая и сетевая. Наиболее распространенной структурой (моделью) БД является реляционная, в которой для хранения данных используются двумерные массивы (таблицы). Классическим методом, используемым для проектирования реляционных БД, является метод нормализации отношений (метод нормальных форм). Нормализации осуществляется декомпозицией (разбиением) исходной таблицы на несколько новых для устранения избыточности и потенциальной противоречивости хранимых данных. Нормализация отношений - формальный аппарат ограничений на формирование отношений (таблиц), позволяющий устранить дублирование, обеспечить целостность хранимых в базе данных. Метод нормализации основан на фундаментальном в теории БД понятии – зависимости между атрибутами отношений (полями таблицы). Атрибуты (поля) могут быть ключевыми и неключевыми. Значение ключевого поля позволяет однозначно идентифицировать любую запись в таблице, поэтому не повторяется. Ключ (первичный) в таблице может быть простым (состоять из значения одного поля) и составным (из нескольких) полей. Между атрибутами отношений существуют следующие виды зависимостей: – многозначные; – функциональные; – транзитивная. Многозначные: 1:М (один ко многим; М:М; М:1; 1:1) Функциональные: полная и частичная. Полная зависимость наблюдается в том случае, если все неключевые атрибуты зависят от ключа целиком, а не от отдельных частей ключа. Частичная функциональная зависимость наблюдается в том случае, если неключевой атрибут зависит от части составного ключа. Например, отношение Студент Ключ составной ДисциплинаПреподаватель – зависит от атрибута Дисциплина Оценка Транзитивная зависимость наблюдается в том случае, если первый неключевой атрибут зависит от ключа, в второй неключевой атрибут зависит от первого неключевого атрибута Например, отношение Студент- ключ Группа Староста – зависит от атрибута Группа Проектирование реляционной БД –процесс последовательного устранения частичной функциональной и транзитивной зависимостей при помощи нормализации. Существует несколько видов нормальных форм (1НФ, 2НФ, 3НФ и нормальные формы боле высокого порядка). Обычно логическое проектирование заканчивается, когда отношение приводится к третьей нормальной форме (3НФ) SQL (структурированный язык запросов) – язык программирования, который применяется для организации взаимодействия пользователя с базой данных .