Направления развития баз данных по математическим

реклама
Онтологический подход к
созданию словаря по
основным разделам
алгебры
Ефременкова В.М., Никольская И.Ю.,
Голод Е.С.
Всероссийский институт научной и
технической информации, Москва, Россия
«Словами мы познаем суть вещей», –
говорил мудрый царь Соломон.
• Системы
ключевых
слов
быстрее
отражают
те
изменения,
которые
возникают в процессе развития научных
направлений.
Одним
из
наиболее
эффективных способов упорядочения
накопленных
терминов
является
систематическая группировка их по
темам и рассматриваемым проблемам.
Онтология – это иерархически
структурированное
множество
терминов, описывающих предметную
область,
которое
может
быть
использовано как исходная структура
для базы знаний.
Неформально онтология представляет собой
некоторое
описание
взгляда
на
мир
применительно к конкретной области интересов.
Это описание состоит из терминов и правил
использования этих терминов, ограничивающих
их значения в рамках конкретной области.
C 1984 г. сводный том РЖ
“Математика” делится на четыре
выпуска:
13А
Общие
вопросы
математики.
Математическая
логика. Теория чисел. Алгебра.
Топология. Геометрия»
13Б - Математический анализ
13В - Теория вероятностей и
математическая статистика
13Г
Вычислительная
математика.
Математическая
кибернетика
Динамика распределения суммарного потока
публикаций отраженных в РЖ ВИНИТИ : 1 «Математика»,
2 - «Математика» и «Вычислительные науки»
50000
40000
2
35000
30000
1
25000
20000
15000
10000
5000
0
195
3
195
6
195
9
196
2
196
5
196
8
197
1
197
4
197
7
198
0
198
3
198
6
198
9
199
2
199
5
199
8
200
1
200
4
200
7
Количество публикаций
45000
Год генерации БД
Рост ретрофонда математической литературы
в специализированной БД MATH (Германия) и
политематических БД PASCAL (Франция) и
JICST-Eplus (Япония)
1600000
MATH
1400000
1200000
ВИНИТИ
1000000
800000
600000
JICST-Eplus
400000
PASCAL
200000
Год публикации
01
20
95
19
89
19
83
19
77
19
71
19
65
19
59
19
53
0
19
Количество публикаций
1800000
Виды предметных указателей к УДК
Предметный указатель
Алфавитнопредметный
указатель к
таблице
УДК
Предметный
указатель к
кодам УДК,
составленный
учеными в
определенной
области
знания
Предметный
указатель к
кодам УДК
Баз данных,
Библиотечных
каталогов
Предлагаемая концепция соответствия между
ключевыми словами и рубриками различных
областей знания включает:
установление соответствий между
иерархической системой классификации и
системой, построенной на ключевых словах, для
разных тематических областей;
установление (выделение) совокупности
признаков, образующих систему конечной
размерности подобную координатной для
подхода к построению тезауруса или словаря в
заданной тематической области.
Принципы функционирования блока
указателей как части системы,
действующей в редакции РЖ ВИНИТИ
“Математика”.
Указатели, вместе с классификацией,
используемой
для
отбора,
формирования и генерации РЖ и БД, а
также для организации поиска в базе
данных, представляют интерес сами по
себе. И именно они – классификация и
указатели во многом определяют
информационную
систему
РЖ/БД
“Математика” и в них содержатся
предпосылки развития создаваемой БД.
Основные указатели к БД
• Основными указателями к РЖ/БД
являются авторский и
предметный.
• Первый отвечает на вопрос “кто где”, а второй – “о чем - где”.
Основное назначение предметносистематического указателя – это роль
путеводителя по таблицам
классификации.
• В
предметно-систематическом
указателе
устанавливаются соответствия между ключевыми
словами,
используемыми
при
координатном
индексировании, рубриками УДК (Рубрикатора БД
«Математика»), в которые “попадает” индексируемая
работа. Он оказался наиболее удобным с точки зрения
информативности и достоверности. Его содержание
определяется и потоком литературы, который
приходит для дальнейшей обработки (разметки,
систематизации и реферирования) в ВИНИТИ, но не
менее важна роль специалиста, занимающегося
выбором, реферированием и редактированием
публикаций для последующего отражения в РЖ/БД.
Предметно-систематический
указатель
• Предметно-систематический указатель к
информационным массивам – это
указатель определенной тематической
области, в которой термины (ключевые
слова) определяют смысл и тематику
области знания или узко тематического
направления в ней и при этом
сгруппированы в алфавитном порядке по
выбранной системе классификации.
Систематизацию публикаций по линейной
алгебре можно увидеть в универсальной
десятичной классификации (УДК):
• 512.64 – Линейная алгебра
• с четырьмя подразделами:
• 512.642 – Векторные пространства. Теория
векторных пространств,
• 512.643 – Матрицы и линейные отображения.
Теория матриц,
• 512.644 – Системы линейных уравнений и
неравенств,
• 512.647 – Полилинейная алгебра. Формы.
• Раздел «Поля и многочлены» состоит из двух
взамосвязанных понятий: многочлены и поля и
является объектом «классической алгебры», где
рассматриваются понятия связанные с различными
видами многочленов, их свойствами и операциями над
ними.
• Многочлен (или полином) от n переменных — это
конечная формальная сумма вида
где есть набор из целых неотрицательных чисел, —
число (называемое «коэффициент многочлена»),
зависящее только от мультииндекса I. На языке
многочленов формулируются или решаются самые
различные задачи математики.
•
Поле - область пространства, в каждой точке
которой определено значение некоторой величины.
Поле алгебраическое представляет совокупность
элементов, для которых определены операции
сложения, вычитания, умножения.
Систематизацию публикаций раздела
«Поля и многочлены» в универсальной
десятичной классификации (УДК):
•
•
•
•
•
•
•
512.62 – Поля и многочлены
512.622 – Многочлены
512.623 – Общая теория полей
512.624 – Конечные поля
512.625 – Локальные поля
512.626 – Глобальные поля
512.627 – Теория полей классов, теория
Галуа, дзета и L-функции
512.628 – Поля с дополнительными
структурами
• В период 2006-2010 гг. на основе массива
ключевых слов (КС) к рубрикам раздела БД
«Математика» «Линейная алгебра», «Поля и
многочлены» и «Гомологическая алгебра» в
автоматизированном режиме было получено
частотное распределение ключевых слов с
относящимися к ним кодами УДК (рубриками
БД ВИНИТИ). Алфавитный список КС
каждого раздела, полученный из поисковых
образов документов после редактирования и
экспертного анализа, содержал около 2,5 тыс.
устойчивых терминов и словосочетаний
Алфавитный предметно-систематический указатель к разделу
РЖ/БД ВИНИТИ РАН "Математика" в период 2006-2010 гг.
Ключевые слова на
русском языке
Ключевые
слова на
английском
языке
УДК
Рубрика
рубрикатора БД/РЖ
"Математика"
Наименование
рубрики в
рубрикаторе БД/РЖ
"Математика"
(0,1)-матрица
(0,1)-matrix
512.643.845
271.17.29.19.33.40.50
Неотрицательные
матрицы; Булевы
матрицы
512.643.93
271.17.29.19.39.30
(1)-обратная
матрица
(1)-inverse
matrix
512.643.43
271.17.29.19.21.30
Специальные типы
систем линейных
уравнений
(min,max)эквивалентность
(min,max)equivalence
512.645.5
271.17.29.23.50
Линейные
отображения
матричных
пространств
(p, q)-норма
(p, q)-norm
512.643.35
271.17.29.19.19.50
Матричные нормы
(R,S)кососимметрическая
матрица
(R,S)-skewsymmetric
matrix
512.643.81
271.17.29.19.33.10
Симметрические,
кососимметрические,
эрмитовы и
косоэрмитовы
матрицы
(R,S)симметрическая
матрица
(R,S)symmetric
matrix
512.643.81
271.17.29.19.33.10
Симметрические,
кососимметрические,
эрмитовы и
косоэрмитовы
матрицы
Предметно-систематический указатель к разделу "Линейная
алгебра" БД ВИНИТИ "Математика" в период 2006-2010 гг.
512.644.8
271.17.29.21.80
Линейные
неравенства
лемма Фаркаша
Farkas lemma
линейная
дополнительная
задача
linear
complementary
problem
линейное неравенство
linear inequality
линейное
программирование
linear programming
обобщенная
рефлексивная
матрица
generalized reflexive
matrix
разделяющая
гиперплоскость
separating
hyperplane
система
линейных
неравенств
system of linear
inequalities
теорема Фаркаша
Farkas theorem
целочисленное
линейное
программирование
ineger linear
programming
• Гомологическая а́лгебра – изучает
алгебраические объекты, заимствованные из
алгебраической топологии, в которой она
играет важную роль. Гомологическая алгебра
применяется в теории групп, теории алгебр,
алгебраической геометрии. Одним из истоков
гомологической алгебры явилась теория
гомологии топологических пространств, в
которой каждому топологическому
пространству X сопоставляется
последовательность групп гомологии.
• 512.66 – Гомологическая алгебра с
подрубриками:
• 512.662 – Цепные комплексы;
• 512.664 – Производные функторы;
512.666 – Алгебраическая К-теория;
512.667 – Алгебраические аналоги
различных конструкций из
топологии и алгебраической
геометрии.
Принципы формирования словарей по
отдельным разделам математики
• На основе созданных двуязычных предметносистематических указателей к разделам «Линейная
алгебра», «Поля и многочлены» и «Гомологическая
алгебра» БД ВИНИТИ РАН "Математика" появилась
возможность составления англо-русских и русскоанглийских словарей по каждому из разделов
математики. Для составных терминов принята
алфавитно-гездовая система, по которой термины,
состоящие из определяемых слов и определений,
следует искать по определяемым словам, например,
элементарная матрица, косорефлексивная матрица,
кватернионная матрица следует искать в гнезде
матрица.
• Особенностями таких словарей является
расширение терминологической базы
рассматриваемых разделов за счет
включения новых терминов и
фразеологических сочетаний,
единообразного их толкования, более
широкое представление сложных слов;
предметное индексирование терминов с
помощью таблиц УДК, используя данные
из отражаемых в БД ВИНИТИ
первоисточников математической
литературы.
•
1.
2.
3.
ВЫВОДЫ
На основе массива ключевых слов к рубрикам
раздела «Линейная алгебра» », «Поля и многочлены»
и «Гомологическая алгебра» БД ВИНИТИ РАН
"Математика" в период 2006-2010 гг. В
автоматизированном режиме был получено частотное
распределение ключевых слов с относящимися к ним
кодами УДК (рубриками БД ВИНИТИ).
Проведен статистический анализ соотношения
ключевых слов и рубрик рубрикатора разделов
«Линейная алгебра».
Показано, что в разных тематических разделах от 4%
до 29% терминов имеют от 2 до 8 рубрик, т.е.
отражают принцип многоаспектности.
• Ефременкова Валентина
Макаровна
ВИНТИТИ РАН
• Тел. (495) 155-45-15
• e-mail: [email protected]
Скачать