Онтологический подход к созданию словаря по основным разделам алгебры Ефременкова В.М., Никольская И.Ю., Голод Е.С. Всероссийский институт научной и технической информации, Москва, Россия «Словами мы познаем суть вещей», – говорил мудрый царь Соломон. • Системы ключевых слов быстрее отражают те изменения, которые возникают в процессе развития научных направлений. Одним из наиболее эффективных способов упорядочения накопленных терминов является систематическая группировка их по темам и рассматриваемым проблемам. Онтология – это иерархически структурированное множество терминов, описывающих предметную область, которое может быть использовано как исходная структура для базы знаний. Неформально онтология представляет собой некоторое описание взгляда на мир применительно к конкретной области интересов. Это описание состоит из терминов и правил использования этих терминов, ограничивающих их значения в рамках конкретной области. C 1984 г. сводный том РЖ “Математика” делится на четыре выпуска: 13А Общие вопросы математики. Математическая логика. Теория чисел. Алгебра. Топология. Геометрия» 13Б - Математический анализ 13В - Теория вероятностей и математическая статистика 13Г Вычислительная математика. Математическая кибернетика Динамика распределения суммарного потока публикаций отраженных в РЖ ВИНИТИ : 1 «Математика», 2 - «Математика» и «Вычислительные науки» 50000 40000 2 35000 30000 1 25000 20000 15000 10000 5000 0 195 3 195 6 195 9 196 2 196 5 196 8 197 1 197 4 197 7 198 0 198 3 198 6 198 9 199 2 199 5 199 8 200 1 200 4 200 7 Количество публикаций 45000 Год генерации БД Рост ретрофонда математической литературы в специализированной БД MATH (Германия) и политематических БД PASCAL (Франция) и JICST-Eplus (Япония) 1600000 MATH 1400000 1200000 ВИНИТИ 1000000 800000 600000 JICST-Eplus 400000 PASCAL 200000 Год публикации 01 20 95 19 89 19 83 19 77 19 71 19 65 19 59 19 53 0 19 Количество публикаций 1800000 Виды предметных указателей к УДК Предметный указатель Алфавитнопредметный указатель к таблице УДК Предметный указатель к кодам УДК, составленный учеными в определенной области знания Предметный указатель к кодам УДК Баз данных, Библиотечных каталогов Предлагаемая концепция соответствия между ключевыми словами и рубриками различных областей знания включает: установление соответствий между иерархической системой классификации и системой, построенной на ключевых словах, для разных тематических областей; установление (выделение) совокупности признаков, образующих систему конечной размерности подобную координатной для подхода к построению тезауруса или словаря в заданной тематической области. Принципы функционирования блока указателей как части системы, действующей в редакции РЖ ВИНИТИ “Математика”. Указатели, вместе с классификацией, используемой для отбора, формирования и генерации РЖ и БД, а также для организации поиска в базе данных, представляют интерес сами по себе. И именно они – классификация и указатели во многом определяют информационную систему РЖ/БД “Математика” и в них содержатся предпосылки развития создаваемой БД. Основные указатели к БД • Основными указателями к РЖ/БД являются авторский и предметный. • Первый отвечает на вопрос “кто где”, а второй – “о чем - где”. Основное назначение предметносистематического указателя – это роль путеводителя по таблицам классификации. • В предметно-систематическом указателе устанавливаются соответствия между ключевыми словами, используемыми при координатном индексировании, рубриками УДК (Рубрикатора БД «Математика»), в которые “попадает” индексируемая работа. Он оказался наиболее удобным с точки зрения информативности и достоверности. Его содержание определяется и потоком литературы, который приходит для дальнейшей обработки (разметки, систематизации и реферирования) в ВИНИТИ, но не менее важна роль специалиста, занимающегося выбором, реферированием и редактированием публикаций для последующего отражения в РЖ/БД. Предметно-систематический указатель • Предметно-систематический указатель к информационным массивам – это указатель определенной тематической области, в которой термины (ключевые слова) определяют смысл и тематику области знания или узко тематического направления в ней и при этом сгруппированы в алфавитном порядке по выбранной системе классификации. Систематизацию публикаций по линейной алгебре можно увидеть в универсальной десятичной классификации (УДК): • 512.64 – Линейная алгебра • с четырьмя подразделами: • 512.642 – Векторные пространства. Теория векторных пространств, • 512.643 – Матрицы и линейные отображения. Теория матриц, • 512.644 – Системы линейных уравнений и неравенств, • 512.647 – Полилинейная алгебра. Формы. • Раздел «Поля и многочлены» состоит из двух взамосвязанных понятий: многочлены и поля и является объектом «классической алгебры», где рассматриваются понятия связанные с различными видами многочленов, их свойствами и операциями над ними. • Многочлен (или полином) от n переменных — это конечная формальная сумма вида где есть набор из целых неотрицательных чисел, — число (называемое «коэффициент многочлена»), зависящее только от мультииндекса I. На языке многочленов формулируются или решаются самые различные задачи математики. • Поле - область пространства, в каждой точке которой определено значение некоторой величины. Поле алгебраическое представляет совокупность элементов, для которых определены операции сложения, вычитания, умножения. Систематизацию публикаций раздела «Поля и многочлены» в универсальной десятичной классификации (УДК): • • • • • • • 512.62 – Поля и многочлены 512.622 – Многочлены 512.623 – Общая теория полей 512.624 – Конечные поля 512.625 – Локальные поля 512.626 – Глобальные поля 512.627 – Теория полей классов, теория Галуа, дзета и L-функции 512.628 – Поля с дополнительными структурами • В период 2006-2010 гг. на основе массива ключевых слов (КС) к рубрикам раздела БД «Математика» «Линейная алгебра», «Поля и многочлены» и «Гомологическая алгебра» в автоматизированном режиме было получено частотное распределение ключевых слов с относящимися к ним кодами УДК (рубриками БД ВИНИТИ). Алфавитный список КС каждого раздела, полученный из поисковых образов документов после редактирования и экспертного анализа, содержал около 2,5 тыс. устойчивых терминов и словосочетаний Алфавитный предметно-систематический указатель к разделу РЖ/БД ВИНИТИ РАН "Математика" в период 2006-2010 гг. Ключевые слова на русском языке Ключевые слова на английском языке УДК Рубрика рубрикатора БД/РЖ "Математика" Наименование рубрики в рубрикаторе БД/РЖ "Математика" (0,1)-матрица (0,1)-matrix 512.643.845 271.17.29.19.33.40.50 Неотрицательные матрицы; Булевы матрицы 512.643.93 271.17.29.19.39.30 (1)-обратная матрица (1)-inverse matrix 512.643.43 271.17.29.19.21.30 Специальные типы систем линейных уравнений (min,max)эквивалентность (min,max)equivalence 512.645.5 271.17.29.23.50 Линейные отображения матричных пространств (p, q)-норма (p, q)-norm 512.643.35 271.17.29.19.19.50 Матричные нормы (R,S)кососимметрическая матрица (R,S)-skewsymmetric matrix 512.643.81 271.17.29.19.33.10 Симметрические, кососимметрические, эрмитовы и косоэрмитовы матрицы (R,S)симметрическая матрица (R,S)symmetric matrix 512.643.81 271.17.29.19.33.10 Симметрические, кососимметрические, эрмитовы и косоэрмитовы матрицы Предметно-систематический указатель к разделу "Линейная алгебра" БД ВИНИТИ "Математика" в период 2006-2010 гг. 512.644.8 271.17.29.21.80 Линейные неравенства лемма Фаркаша Farkas lemma линейная дополнительная задача linear complementary problem линейное неравенство linear inequality линейное программирование linear programming обобщенная рефлексивная матрица generalized reflexive matrix разделяющая гиперплоскость separating hyperplane система линейных неравенств system of linear inequalities теорема Фаркаша Farkas theorem целочисленное линейное программирование ineger linear programming • Гомологическая а́лгебра – изучает алгебраические объекты, заимствованные из алгебраической топологии, в которой она играет важную роль. Гомологическая алгебра применяется в теории групп, теории алгебр, алгебраической геометрии. Одним из истоков гомологической алгебры явилась теория гомологии топологических пространств, в которой каждому топологическому пространству X сопоставляется последовательность групп гомологии. • 512.66 – Гомологическая алгебра с подрубриками: • 512.662 – Цепные комплексы; • 512.664 – Производные функторы; 512.666 – Алгебраическая К-теория; 512.667 – Алгебраические аналоги различных конструкций из топологии и алгебраической геометрии. Принципы формирования словарей по отдельным разделам математики • На основе созданных двуязычных предметносистематических указателей к разделам «Линейная алгебра», «Поля и многочлены» и «Гомологическая алгебра» БД ВИНИТИ РАН "Математика" появилась возможность составления англо-русских и русскоанглийских словарей по каждому из разделов математики. Для составных терминов принята алфавитно-гездовая система, по которой термины, состоящие из определяемых слов и определений, следует искать по определяемым словам, например, элементарная матрица, косорефлексивная матрица, кватернионная матрица следует искать в гнезде матрица. • Особенностями таких словарей является расширение терминологической базы рассматриваемых разделов за счет включения новых терминов и фразеологических сочетаний, единообразного их толкования, более широкое представление сложных слов; предметное индексирование терминов с помощью таблиц УДК, используя данные из отражаемых в БД ВИНИТИ первоисточников математической литературы. • 1. 2. 3. ВЫВОДЫ На основе массива ключевых слов к рубрикам раздела «Линейная алгебра» », «Поля и многочлены» и «Гомологическая алгебра» БД ВИНИТИ РАН "Математика" в период 2006-2010 гг. В автоматизированном режиме был получено частотное распределение ключевых слов с относящимися к ним кодами УДК (рубриками БД ВИНИТИ). Проведен статистический анализ соотношения ключевых слов и рубрик рубрикатора разделов «Линейная алгебра». Показано, что в разных тематических разделах от 4% до 29% терминов имеют от 2 до 8 рубрик, т.е. отражают принцип многоаспектности. • Ефременкова Валентина Макаровна ВИНТИТИ РАН • Тел. (495) 155-45-15 • e-mail: [email protected]