История моих бедствий: некоторые выводы из двадцатилетия неудачного опыта работы с базами данных.

advertisement
История моих бедствий: некоторые выводы из двадцатилетия неудачного опыта работы с
базами данных.
В 1992 г. я приступил к исследованию, объектом которого была группа военного «служилого»
населения трех сибирских городов - Томска, Енисейска и Красноярска - в XVII в. Чтобы
получить какие-либо научные результаты в исследовании группы людей, требовалось создать
базу данных о них (далее — БД) и использовать какую-либо систему управления базой
данных (далее — СУБД) для ее обработки.
Первой такой БД и СУБД стала для меня обыкновенная бумажная картотека на карточках
размером три на пять дюймов. После написания и публикации первой в моей жизни научной
работы, выводы которой были основаны на ручной обработке этой БД, я оценил удобство
бумажной картотеки в качестве БД. В картотеке было очень удобно накапливать однородные
и разнородные данные, хранить их, просматривать, без использования дорогостоящего
оборудования и риска мгновенной потери всех накопленных данных.
Однако, в качестве СУБД картотека оказалась очень неудобной. Карточки трудно было
группировать и еще труднее было поддерживать их в определенном порядке, поскольку я
выбрал алфавитный способ расстановки, поскольку речь шла о людях с именами и
фамилиями. После первого же опыта обработки данных, стало ясно, что серьезная работа с
БД требует непросто автоматизации, а к переходу на электронные СУБД, тем более что в это
время началось победоносное шествие персональных компьютеров.
В 1997 г. мною была опубликована небольшая работа о восприятии времени жителями
Томска в XVII в. Выводы в этой работе были сделаны на основании обработки маленькой БД
средствами СУБД FoxPro 2.5. Этот опыт, однако, привел меня к убеждению, что
использования СУБД, которые требуют самостоятельного обучения программированию не
целесообразно. Поскольку выучится программировать по книгам я не могу. Поскольку
электронная БД показала свою эффективность как средство для проведения исследований и
эпистемологическую ценность, а также доказала свое превосходство над бумажной СУБД,
встал вопрос о поиске СУБД, ориентированной на начинающих.
Большая часть работы над диссертацией и книгой в 1999–2003 гг. была проведена с
использованием программы Excel и, в частности, встроенных в нее механизмов СУБД для
небольших баз данных. Однако параллельно с этой работой, на основании небольших
данных о реляционных БД, полученных в ходе работы с FoxPro 2.5, велась работа по
освоению СУБД MS Access.
Результаты работы с СУБД MS Access оказались неудовлетворительными. СУБД хранила все
данные в одном файле, который очень быстро переставал быть переносимым в тогдашних
условиях, что делало невозможным создания резервных копий на других машинах. В этой
ситуации стало ясным, что 1) в системе СУБД-БД именно БД является самым ценным
компонентом; 2) создание электронной БД является самым трудоемким элементом работы с
базами данных. Отсюда напрашивался вывод, что БД должна существовать в такой форме,
которая бы легко переносилась на другие материальные носители (чтобы обеспечить
резервное копирование) и что бы форма хранения данных не зависела от конкретных
производителей ПО СУБД. Кроме того, в ходе работы выяснилось, что некоторые версии
СУБД MS Access не имеют обратной совместимости, что вело к перспективе потери ранее
переведенных в электронный вид данных.
В начале текущего десятилетия нашего века, знакомство с объектно-ориентированным
программированием привело меня к мысли, что делопроизводственные источники XVII в.
являются не бесструктурными, а уже слабоструктурированными. Поэтому БД должны быть
отдельные тексты в электронном формате, а СУБД специально написанные скрипты на
Python или Ruby.
Download