Государственная публичная библиотека Сибирского отделения Российской академии наук http://www.spsl.nsc.ru/ Индексирование документов с использованием вербальных информационно-поисковых языков Семинар - стажировка Предметизация документов для электронного каталога Тема: 1 день Вербальные ИПЯ •Информационнопоисковые языки, использующие для представления своих лексических единиц слова и выражения естественного языка в их орфографической форме Свойства ИПЯ • Контролируемые • Неконтролируемые Свойства ИПЯ • Предкоординатные • Посткоординатные (координатные) Язык предметных рубрик (ЯПР) Информационно-поисковый язык, предназначенный для индексирования документов (частей документов) и информационных запросов посредством предметных рубрик ПРЕДМЕТИЗАЦИЯ • Вид индексирования, при котором содержание документа выражается средствами языка предметных рубрик. • Определение предметной рубрики для произведения печати или другого документа в соответствии с его содержанием (ГОСТ 7.76-96). • Предметное индексирование средствами языка предметных рубрик (ГОСТ 7.74-96). Предметная рубрика (ПР) Унифицированное языковое выражение, представленное средствами естественного языка, отражающее предмет (тему) документа. Пример: Безопасность и защита населения в чрезвычайных ситуациях [Текст] : учеб.-метод. пособие для проведения занятий с населеним / Н.А. Крючек, В.Н. Латчук ; Под общ. ред. Кириллова Г.Н. М. : НЦ ЭНАС, 2001. - 147 с. Рубрика: Чрезвычайные ситуации -- защита населения -- Россия Предмет документа • - это основное содержание (основная тема) документа, как объекта индексирования. Что может являться предметом документа? • Предметом документа может служить все, что является объектом изучения: Что может являться предметом документа? - материальные вещи объективного мира в целом (человек, здание, машина) Что может являться предметом документа? - Любые части вещей и их отдельные свойства, стороны , отношения. (сердцебиение, бетонирование, размер) Что может являться предметом документа? - события, явления, факты, персоналии (Великая Отечественная война, снегопад, Толстой Л. Н.) Что может являться предметом документа? - Отражение этих вещей в нашем сознании ( ощущения, восприятия, представления, понятия) Что может являться предметом документа? - суждения, научные теории и школы и т.д.(теория относительности, теорема Ферма) Лексика языка предметных рубрик • Лексическая единица (ЛЕ) – обозначение отдельного понятия, принятого в данном информационно поисковом языке и неделимое в этой функции. Языковая форма выражения понятий в ЯПР: Имена существительные и словосочетания на их основе; Прилагательные и причастия, перешедшие в существительные и выполняющие их функции (млекопитающие, крестоцветные) Лексическая единица (ЛЕ) ЯПР Простая предметная рубрика Заголовок или подзаголовок сложной ПР Одно понятие в описательной ПР млекопитающие ЛЕ ЛЕ млекопитающие ЛЕ млекопитающие ЛЕ анатомия ЛЕ биологические процессы ЛЕ ритм Свойства ЯПР • Контролируемый • Предкоординатный Предметные рубрики различаются в зависимости от: Состава и структуры Содержания (семантики) Степени отражения предмета документа Состав и структура предметной рубрики Простая Многочленная Описательная Сложная Комбинированная Состав и структура предметной рубрики • В зависимости от количества ЛЕ Простая предметная рубрика – предметная рубрика, состоящая из одной лексической единицы. Здравоохранение Кемеровская область Сложная предметная рубрика – предметная рубрика, состоящая из нескольких лексических единиц Кемеровская область – здравоохранение Уголь – месторождения – Кемеровская область Здравоохранение – управление «Волга», легковые автомобили Состав сложной предметной рубрики • Многочленная предметная рубрика – сложная предметная рубрика, в которой ЛЕ отделены друг от друга разделительным знаком. • Состоит из подзаголовков заголовка и Состав сложной предметной рубрики Описательная предметная рубрика – сложная ПР, в которой комбинация лексических единиц, чаще всего отделенных друг от друга предлогами и союзами, представлена в виде единого словосочетания. Налог на наследство Сушка в кипящем слое Компьютеры для обработки данных Охрана материнства и детства Церковь и государство Состав сложной предметной рубрики Комбинированная предметная рубрика – многочленная ПР, в которой один из элементов построен как описательная ПР. Литье в кокиль – теплофизика Компьютеры – влияние на организм Наказание в уголовном праве – назначение – -- Российская Федерация Состав сложной предметной рубрики • Заголовок предметной рубрики – первый элемент многочленной ПР, отделяемый от последующих разделительным знаком. Кемеровская область – здравоохранение Уголь – месторождения – Кемеровская область Здравоохранение – управление «Волга», легковые автомобили – ремонт Подзаголовок предметной рубрики –второй и каждый последующий элемент многочленной ПР, отделяемый от других разделительным знаком Кемеровская область – здравоохранение Уголь – месторождения – Кемеровская область Здравоохранение – управление «Волга», легковые автомобили – ремонт Состав сложной предметной рубрики Заголовок млекопитающие ЛЕ млекопитающие млекопитающие Подзаголовок 1-го уровня анатомия ЛЕ + ЛЕ адаптация к низким температурам Подзаголовок 2-го уровня млекопитающие биологические процессы ритм ПРАКТИЧЕСКОЕ ЗАДАНИЕ ЖЕЛАЕМ УСПЕХА! Виды заголовков ПР В зависимости от содержания •Имя лица •Наименование организации •Географическое название •Родовое имя •Унифицированное заглавие • Имя/заглавие • Имя/обобщающее унифицированное заглавие • Наименование темы • Форма, жанр, физические характеристики документа Имя лица • Имена реально существующих (существовавших) лиц. Иван IV (царь русский; 1530 - 1584) Петр I (император; 1672 – 1725) Мадонна (1958 - ) Имя лица • Имена вымышленных образов и персонажей. Геракл (мифологический герой) Кот в сапогах (литературный образ) Наименование организации • Наименование постоянной организации. Российская федерация. Федеральная служба безопасности Аграрная партия России Соединенные штаты Америки. Корпус морской пехоты Наименование организации • Наименование временной организации (выставки, конференции и т.п.) «Хрустальная роза Виктора Розова», всероссийский литературно-театральный конкурс (1; 2001) Арктическая воздушная экспедиция Шмидта О.Ю., 1937 Географическое название (заголовок среды) • Географические объекты, имеющие собственные географические названия Южная Америка Балтийское море Урарту Сургут, город Географическое название (заголовок среды) • Географические объекты, названия которых являются производными от собственных географических названий Черноморское побережье Британские колонии Географическое название (заголовок среды) • Группы стран (государств), выделенных по любому признаку (языковому, этническому, социальному и т.п.) Арабские страны Постсоциалистические страны Развивающиеся страны Географическое название (заголовок среды) • Небесные тела, их части и иные астрономические объекты Марс, планета Галлея. комета Географическое название (заголовок среды) • Памятники, монументы, здания мосты, улицы, сады, парки и т.п. Лейтенанта Шмидта мост (Санкт Петербург, город) Александровский сад (Санкт -Петербург, город) Родовое имя • Имена родов, семей, династий Романовы (династия) Рерихи (род) Кутейниковы (династия корабелов) Лазаревы (семья актеров) Унифицированное заглавие • Анонимные классические произведения (мифы, своды древних законов религиозные произведения и пр.) Веды, памятники древнеиндийской литературы Рагнар сага Унифицированное заглавие • Названия произведений искусства (музыкальных произведений, фильмов, радиопередач и пр.) «Окопная правда", газета, 1917- 1918 «Броненосец Потемкин», кинофильм Имя / заглавие Состоит из двух элементов: - имя автора произведения; - заглавие произведения. Шекспир, Вильям (1564 – 1616). «Гамлет» Российская Федерация. Уголовный кодекс Имя / обобщающее унифицированное заглавие Состоит из двух элементов: - имя лица, наименование организации, родовое имя; - типовое заглавие, под которым собираются произведения автора, издавшего множество произведений. Шекспир. Вильям (1654 – 1616). Сонеты Бетховен, Людвиг ван (1770 – 1827). Квартеты Блок, Александр Александрович (1880 – 1921). Поэмы Наименование темы • Название предмета, понятия или явления Магия Палеонтологические исследования Якутская литература Легковые автомобили «Волга», легковые автомобили PEUGEOT 206, легковые автомобили MEDLINE, база данных Информационно-поисковые языки Авторитетные файлы предметных рубрик Форма, жанр, физические характеристики документа • Библиографическая форма документа Словари сокращений • Жанр документа Роман русский, 19 век Исландские саги • Физические характеристики документа (для отражения вида носителя каталогизируемого документа – CD, DVD и т.д.) Компакт-диски DVD, компакт-диски ВИДЫ ПОДЗАГОЛОВКОВ ПР Тематичес кие Общие Географические Хронологические Типовые Формальные Специальные Реляторы Релятор – символ или слово, используемое для различения значений многозначного термина. Реляторы - уточняющие термины. Указываются в скобках после рассматриваемого термина. В качестве самостоятельных ЛЕ не рассматриваются Гармония (иск.) Гармония (муз.) Гармония (филос.) Париж, город (Франция) Париж, город (Челябинская область) Виды ПР в зависимости от объема отражения темы документа Адекватная предметная рубрика – ПР, формулировка которой выражает объем понятия, наиболее точно соответствующий объему понятия о предмете документа. Обобщающая предметная рубрика – ПР, выражающая объем понятия, существенно более широкий, чем объем понятия о предмете документа. • Гагин, В. В. • Самолеты Воронежского авиазавода [Текст] = Voronezh's aircrafts : монография / В.В. Гагин. - Воронеж : Траст, 1996. - 88 с. : ил. - (Сер. "Россия, проснись!"; Вып. 2). - ISBN 5-87930-037-4 : Б. ц. • Рубрики: Авиация – история Пассажирские самолеты Самолеты военные • Климов, Валентин Тихонович. • Авиационная персоносфера : 60-90-е г. ХХ в.:истории попыток и ошибок / В. Климов. - М. : Моск. рабочий, 2004. - 208 с. • Рубрики: Военно-воздушные силы -- персоналии -- Россия Авиация -- персоналии -- Россия Основные предметизационные системы • LCSH – Library of Congress Subject Headings • RSWK – Regeln für den Schlagwortkatalog • RANEAU – Répertoire ďAutoritéMatière Encyclopédique et Alphaabétique Unifié Library of Congress Subject Headings Ссылочно-справочный аппарат ССА - совокупность указаний, фиксирующих связи и размежевания между предметными рубриками. Зачем нужен: фиксировать логические отношения между ПР ( парадигматические отношения). ССЫЛКИ Ссылка – запись, связывающая между собой предметные рубрики. Виды ссылок: «СМ.» - смотри «СМ. ТАКЖЕ» - смотри также ССЫЛКИ «СМ.» • Отсылают от непринятых терминов и формулировок к принятым в данной предметизационной системе. Зачем нужны: Организуют формулирование поисковых предписаний в нужном направлении. Типовые модели ссылок «СМ.» От отвергнутой формы синонима к принятой: Бизнес СМ. Предпринимательство Кардиохирургия СМ. Сердечно-сосудистая хирургия От возможных вариантов транслитерации терминов: Фрэнчайзинг СМ. Франчайзинг От прямой формулировки ПР к инверсированной, и наоборот (в зависимости от того, какая из них принята в данной системе) Рисковый капитал СМ. Капитал рисковый Комрессоры автомобильные СМ. Автомобильные компрессоры От сокращенной формы (или аббревиатуры) к полной и наоборот: ЕЭС СМ. Европейское Экономическое сообщество Автоматизированные системы управления СМ. АСУ От (или к) формулировок с союзом «И»: Мир и война, проблема СМ. Война и мир, проблема Посадки СМ. Допуски и посадки Для ПР, различных по структуре: Природа – Охрана СМ. Охрана природы Теория литературы СМ. Литература – Теория Горы – Образование СМ. Горообразование От отвергнутой формы написания имени (в т.ч. родового) к принятой, от псевдонимов к подлинным именам и наоборот: Авиценна (980 – 1037) СМ. Ибн Сина (980 – 1037) Гурко (род) СМ. Гурко – Ромейко (род) Бейль, Анри Мари ( 1783 – 1842) СМ. Стендаль (1783 – 1842) От отвергнутой формы географического названия или унифицированного заглавия к принятой: Новосибирск. Театр оперы и балета СМ. Новосибирский театр оперы и балета Для отражения хронологический отношений между заголовками: Санкт-Петербург, город с 1924 по 1991 СМ. Ленинград, город ССЫЛКИ «СМ. ТАКЖЕ» • Указывают на тематические связи между отдельными ПР, принятыми в данной предметизационной системе. Зачем нужны: Позволяют повысить полноту поиска. Типовые модели ссылок «СМ. ТАКЖЕ» • Иерархические отношения Основаны на подчиненности терминов • Род-вид Искусство СМ. ТАКЖЕ БОЛЕЕ УЗКОЕ ПОНЯТИЕ Архитектура Живопись Скульптура • Целое – часть Артиллерийские орудия СМ. ТАКЖЕ Лафеты • Ассоциативные отношения Все типы отношений, не входящие в иерархические отношения или отношения эквивалентности (антонимы, причинноследственные, хронологические и т.п.) Адсорбция СМ. ТАКЖЕ Десорбция Литье СМ. ТАКЖЕ Отливки НОРМАТИВНЫЕ СЛОВАРИ ЯПР • Карточные; • Алфавитно-предметные указатели; • Авторитетные / нормативные файлы ПРОЦЕСС ПРЕДМЕТИЗАЦИИ ДОКУМЕНТА Анализ и определение содержания документа как объекта предметизации ДА НЕТ Предварительное определение основных предметов документа и аспектов их рассмотрения ДА НЕТ Обращение к нормативносправочной базе Создание ПР Поиск ПР в нормативных словарях ЯПР ДА НЕТ Присвоение ПР документу Внесение ПР в нормативные словари Предварительное определение основных предметов документа и аспектов их рассмотрения • Потемкин, Виктор Яковлевич. Автоматизация составления оперативной части планов ликвидации аварий на шахтах и рудниках [Текст] : монография / В.Я. Потемкин, Е.А. Козлов, И.Е. Кокоулин ; СПО "Металлургбезопасность". - Киев : Тэхника, 1991. - 125 с. : ил., табл. - ISBN 5-335-00974-8 : Б. ц. • Рубрики: Аварии на рудниках -ликвидация -- планирование Процесс предметизации Основные этапы: Формулировка ПР (морфология) – формулирование лексических единиц; Построение ПР (синтаксис) – определение порядка следования заголовка и подзаголовков, простановка разделительных знаков; Присвоение ПР – выбор и простановка адекватных содержанию документа ПР Созд ание ПР Основные правила формулировки ПР (морфология) ПРИНЦИП УНИФИЦИРОВАННОГО ЗАГОЛОВКА Для контроля синонимов и создания комплексов ПР каждое понятие, тема, объект должны быть представлены в ЯПР одним, и только одним принятым заголовком. Как это делается: • Прежде чем создать новую ПР, необходимо убедиться, что данный термин еще не представлен в списке в виде ПР, и что предлагаемая ПР не установлена в другой форме. От вариантных форм делаются ссылки «см.» к принятой форме, ссылки «см. также» к связанным принятым заголовкам. Для чего это нужно: - для избежания синонимии; - для избежания образования двойных рядов; - для обеспечения полноты выдачи по одной теме ПРИНЦИП ЛИТЕРАТУРНОЙ ИСПОЛЬЗУЕМОСТИ Словарь ЯПР должен постоянно развиваться на основе терминов, используемых в документах, и встраиваться в существующую систему ПР (ЯПР). Как это делается: • новая ПР, как правило, устанавливается только при наличии документов по данному предмету; • новый термин проверяется по авторитетным источникам; • при отсутствии термина в авторитетных источниках используется формулировка термина из индексируемого документа. Для чего это нужно: • Для обеспечения полноты отражения содержания документов; • Для обеспечения адекватности отражения содержания документов принцип омонимии В ЯПР должен быть реализован контроль омонимии (многозначности терминов). Как это делается: • Термин, выбираемый в качестве авторитетного для обозначения нового понятия, должен пониматься однозначно. • Если термин имеет более чем одно значение или может применяться в различных дисциплинах, необходимо дифференцировать значения термина. Для этого используются: • • прилагательное релятор Реляторы используются для терминов категорий: «Наименование темы» и «Географическое название». В категориях «Имя лица» и «Наименование организации» к заголовку может быть добавлена любая дополнительная информация: для имен, как правило, указываются даты жизни, а также другие идентифицирующие признаки — титулы, эпитеты, звания и т. д.; для наименований организации — географические названия, даты и / или номера временных организаций. Для чего это нужно: • Для увеличения точности информационного поиска • Для исключения из выдачи нерелевантных документов (т. е. документов, не отвечающих запросу пользователя) Категория числа имен существительных (единственное, множественное число) • Имена существительные, используемые в формулировке предметной рубрики, применяются во множественном числе, например: Агропромышленные комплексы Древесные плиты Компьютеры Исключения: • Если термин не имеет множественного числа: Аудит Виноград Патриотизм Аналитическая геометрия Луна • ! Имена существительные могут употребляться как в единственном, так и во множественном числе в соответствии с терминосистемой отрасли знания, с точки зрения которой рассматривается предмет : Вода Атомное ядро но Легкие атомные ядра Питьевая вода но Подземные воды Сточные воды Ведущее слово предметной рубрики - это первое слово предметной рубрики, объединяющие предметные рубрики в комплекс и определяющее местоположение ПР в списке рубрик (например, при выводе списка на экран). • Для выбора ведущего слова ПР обязательно использование авторитетных источников — справочных изданий и ГОСТов. • Несмотря на то, что в заголовке предметной рубрики, как правило, присутствует существительное, оно может не быть ведущим словом. Кроме того, ведущее слово предметной рубрики может быть не в именительном падеже. • Для того, чтобы в позиции ведущего слова предметной рубрики находилось слово, несущее максимальную смысловую нагрузку, широко используется прием инверсии. Инверсия в предметной рубрике изменение прямого порядка слов для выведения слова, несущего максимальную смысловую нагрузку, в позицию ведущего слова предметной рубрики или первого слова в подзаголовке многочленной предметной рубрики Инверсия применяется : В отношении таких понятий, как теория, теорема, метод, задача, закон, реакция, эффект, явление и т.д. Вероятностей теория Ферма теорема В отношении «нехарактерных» прилагательных. Исключения - те случаи, когда нехарактерное само по себе прилагательное , является частью общепринятого термина. Внешняя торговля Черные дыры • В случае, если имя собственное входит в географическое название. Лаптевых море • В формулировках ПР, содержащих названия кораблей, автомобилей, компьютерных программ и т. д., например: «Аврора», крейсер-музей (Санкт-Петербург, город) «Ока», легковые автомобили Комплексы предметных рубрик Комплекс предметных рубрик – совокупность предметных рубрик, объединенных тематикой. Узкий комплекс предметных рубрик -- комплекс предметных рубрик, в котором ПР об одном предмете собраны в одном месте каталога, словаря, указателя. Узкий комплекс предметных рубрик Широкий комплекс предметных рубрик – комплекс предметных рубрик, в котором собраны ПР о многих тематически взаимосвязанных предметах, расположенных в различных местах каталога и объединенных с помощью ссылочносправочного аппарата. Широкий комплекс предметных рубрик • Компьютерные вирусы см. также более узкое понятие Вычислительные сети – защита от компьютерных вирусов Компьютеры – защита от компьютерных вирусов Электронная почта – защита от компьютерных вирусов Основные подходы к построению ПР • Эмпирический • Теоретический Логиколингвистический метод Категориальный метод Основные правила построения ПР (синтаксис) • Модели предметных рубрик, Предмет Аспект/ы Атмосфера– динамика – исследования – математические методы Русский язык – изучение – история Предмет Указатель связи Россия – культурные связи – Франция – 18 – 20 вв. Русский язык – заимствования – Тюркские языки Французский язык – словари – русский язык Предмет синтаксический принцип • это соблюдение правил сочетаемости элементов в сложной предметной рубрике. Порядок элементов ПР определяется содержанием документа. ПР строится по принципу ограничения объема понятия, выраженного заголовком предметной рубрики: каждый из подзаголовков ограничивает объем предшествующего, а все вместе подзаголовки ограничивают объем понятия, выраженного заголовком. В одной сложной ПР не могут находиться ЛЕ, связанные логическими отношениями: ▬ подчинения, ▬ перекрещивания, ▬ соподчинения, ▬ противоположности, ▬ ассоциативными отношениями. Правило риверсной проверки Элементы сложной ПР должны располагаться так, чтобы при переводе ПР на ЕЯ не искажался смысл исходного понятия документа. Правило риверсной проверки: как это делается Предметная рубрика читается справа налево, начиная с последнего подзаголовка; каждая предшествующая ЛЕ присоединяется в родительном или предложном падеже. Наука — Методология Методология (чего?) науки Щитовидная железа — Болезни — Профилактика Профилактика (чего?) болезней (чего?) щитовидной железы Риверсной проверке не подлежат: • ПР типа <Предмет> — <Указатель связи> — <Предмет> и некоторые комбинированные ПР— например, ПР, в которых подзаголовок начинается с «Влияние...». • Географические и хронологические подзаголовки Порядок следования географических подзаголовков • Географическое понятие должно входить или в заголовок рубрики, или располагаться в конце рубрики в виде географического подзаголовка. Порядок следования хронологических подзаголовков Хронологический подзаголовок должен стоять: • непосредственно после той лексической единицы, которую он характеризует: «Великая Отечественная война, 1941—1945 — Помощь тыла фронту — Узбекская ССР», • в конце рубрики: Франция — История, 12—15 вв. Принцип устойчивости индексирования Каждая вновь создаваемая ПР должна соответствовать по форме и структуре ПР, уже существующим в ЯПР Как это делается: • Выделяются основные категории ПР • Определяются правила сочетаемости ПР отдельных категорий с подзаголовками того или иного типа • Разрабатываются списки типовых тематических подзаголовков Для чего это нужно: Для обеспечения устойчивости (единообразия) индексирования. Таким образом достигается высокая полнота индексирования и поиска на ЯПР. Основные правила присвоения ПР ПРИНЦИП АДЕКВАТНОСТИ ИНДЕКСИРОВАНИЯ Объем понятия, выраженный ПР или набором ПР, должен соответствовать объему понятия о предмете документа. Зачем это нужно: •Для повышения точности поиска Однако необходимая степень адекватности индексирования должна определяться с учетом количества и характера документов в каталоге. Как это делается: • Предметные рубрики должны отражать содержание документа с максимальной полнотой и точностью. • Как правило, документу приписываются адекватные ПР. • Обобщающие ПР используются только в том случае, если применение адекватной ПР не представляется возможным. В случае, если в документе рассматривается более трех лиц (или организаций), документу приписывается ПР, в обобщенном виде называющая категорию лиц или организаций. ЧАСТНЫЕ СЛУЧАИ ИНДЕКСИРОВАНИЯ Имя лица как ПР 1. Заголовок формируется по правилам каталогизации. 2. Если лицо известно под различными именами, то выбирается та форма, под которой лицо наиболее известно. 3. Иностранные имена рассматриваются в русской транслитерации. Наименование организации как ПР 1. Используется только в качестве заголовка ПР. 2. Формулируется по правилам каталогизации. 3. Если начинается со слова «Республика», то применяется инверсия. Географическое название в ПР ПРАВИЛА ФОРМУЛИРОВКИ: 1. Используются без сокращений. 2. Формулировка начинается с имени собственного. 3. Инверсия применяется, если: 3.1. Обозначена часть территории. 3.2. ЛЕ начинается с нехарактерного существительного. Древняя Греция Тихий океан Черное море Урал Северный Урал Средний Урал Южный Лейтенанта Шмидта мост Лаптевых море Мордовия, республика Географическое название в ПР 4. Должны иметь уточнения категории (город, река, село и т.п.) 5. Если отражают название одного объекта в разные исторические периоды, связываются ссылками см. также. Сургут, город Москва, река Кунашир, остров (Курильские острова) Географическое название в ПР 6. Если отражается территориальная единица, начиная от города и менее, то используются географические реляторы Константиново, село (Рязанская область) Брест, город (Беларусь, Республика) Брест, город (Франция) Географическое название в ПР • ПР, отражающие географические названия одного объекта в разные периоды существования, связываются ссылками. Географическая ПР присваивается: Географическое название Подзаголовок справочным изданиям; географическим или картографическим материалам; общим работам о географическом объекте в целом (всесторонние или по совокупности многих аспектов). ПР типа <Предмет> — <Указатель связи> — <Предмет> • Обязательно даются прямая и обратная ПР: Франция – взаимоотношения – Российская Федерация Российская Федерация – взаимоотношения – Франция Сборники. Материалы конференций • Материалы предметизируются по основной теме сборника, конференции, совещания и т.п. Многоуровневые описания • Если в многотомном документе каждая из частей представляет собой законченное целое, то каждый из выпусков обрабатывается как самостоятельный документ. • В записи первого уровня (общей части) записываются ПР, присвоенные всему документу в целом. • В запись каждой из частей вносятся только ПР, отражающие содержание конкретной части. Из истории предметизации W. E. Stadwell конец XIX в. - 70-х гг. XX в. – период следования традиционным правилам каталогизации, разработанным Ч. Кеттером 1970 – 80-е гг. (с началом эпохи электронных каталогов) создание полного универсального свода правил по формулированию ПР 1990-е гг. - стремление к максимальному учету интересов пользователей к настоящему моменту – адаптация ЯПР к различным видам информационной среды, в том числе электронной Предпосылки «компьютерной революции» в предметизации Компактность электронного каталога Любой элемент библиографической или авторитетной записи может стать «точкой доступа» Язык общения с ЭК может отличаться от языка поиска Особенности предметизации для электронного каталога Изменение принципа адекватности Изменение принципов применения инверсии Изменение подходов к порядку следования заголовка и подзаголовков Стандартизация и унификация подзаголовков Филиппов, Михаил Михайлович(1858-1903). Леонардо да Винчи / [М.М. Филиппов]. Рафаэль / [С.М. Брилиант]. Рембрандт : [Биогр. очерки / А. Калинина]. - М. : Республика, 1993. - 320 с. : ил., цв. ил.+ 22 см. - (Жизнь замечательных людей : Биогр. б-ка Ф. Павленкова). Живопись – история Рафаэль Санти (1483 – 1520) Микеланджело Буонартти (1475 – 1564) Рембрандт, Харменс ван Рейн (1606 – 1669) Леонардо да Винчи (1452 – 1519) Категориальный метод построения ПР основан на том, что в любой области знания выделяются основные категории предметов, а для каждой типовой категории — типовые аспекты этих предметов; при построении ПР необходимо учитывать правила сочетаемости подзаголовков в зависимости от их категорий. Поиск в электронном каталоге Ф.С. Воройский: Информационный поиск «процесс нахождения, отбора и выдачи определенной информации в соответствии с заранее заданными признаками (в том числе документов, их частей и/или данных) из массивов и записей любого вида на любых носителях» Поиск в электронном каталоге Возможности доступа к ПР, где названное пользователем слово является ведущим (способ поиска в карточных ПК); ко всем ПР словаря, содержащим любое из слов запроса; к ПР, максимально близким к полному тексту запроса. Поиск в электронном каталоге Усечение Полных ПР Отдельных слов из ПР Классификационных индексов Поиск в электронном каталоге Булева логика Система логического мышления, разработанная английским математиком Джорджем Булем. Используется, когда поисковый запрос содержит более, чем одно понятие. Поиск в электронном каталоге Операция Процесс OR (или) Требует наличия в документе хотя бы одного из двух или обоих терминов AND (и) Требует наличия обоих терминов NOT (не) Требует отсутствия термина Сим вол Результат + Увеличивает число выданных документов * Уменьшает число выданных документов ^ Уменьшает число выданных документов ОПРЕАТОР «ИЛИ» Пневмония Антибиотики Антибиотики + Пневмония ОПЕРАТОР «И» ОПЕРАТОР «И» Антибиоткики Пневмония Антибиотики * *пневмония Антибиотики * пневмония^ животные Антибиотики Пневмония Животные ОПРЕРАТОР «НЕ» Современные проблемы предметизации • Поисковые термины пользователей соответствуют Списку предметных рубрик Библиотеки Конгресса только в пределах от 18% до 40% случаев. • Пользователи правильно указали значения менее чем для 50% предложенных им рубрик. Современные проблемы предметизации в России • недоиспользование поисковых возможностей ЯПР ; • отсутствие авторитетных файлов, имеющих статус национальных; • недостаточное осознание специфики и отсутствие единых принципов комплексного использования ИПЯ в ЭК; • недостаточность средств помощи конечным пользователям ЭК; • недостаточная адаптация методик индексирования документов для ЭК. Предметные рубрики в структурах метаданных • Проект Dublin Core • Системы фасетного предкоординатного индексирования (DSIS, FAST). • Предметизация электронных полнотекстовых документов. ГОСТы: ГОСТ 7.59-2003. ИНДЕКСИРОВАНИЕ ДОКУМЕНТОВ. ОБЩИЕ ТРЕБОВАНИЯ К СИСТЕМАТИЗАЦИИ И ПРЕДМЕТИЗАЦИИИ ГОСТ 7.74-96. ИНФОРМАЦИОННОПОИСКОВЫЕ ЯЗЫКИ. ТЕРМИНЫ И ОПРЕДЕЛЕНИЯ ГОСТ 7.73-96. СИБИД. ПОИСК И РАСПРОСТРАНЕНИЕ ИНФОРМАЦИИ. ТЕРМИНЫ И ОПРЕДЕЛЕНИЯ Основная литература: • Гендина, Н. И. Лингвистическое обеспечение автоматизированных библиотечных систем / Н. И. Гендина. – Алма-Ата, 1991. – 221 с. • Гринина, Р. Ф. Теоретические основы предметизации и предметного каталога , Р. Ф. Гринина. – Л., 1989. – 73 с. • Предметный поиск в традиционных и нетрадиционных информационно-поисковых системах. – СПб. – Вып. 15. – 2001. • Руководство по методике предметизации. Опыт Российской национальной библиотеки. – М., 2005. 407 с. БЛАГОДАРИМ ЗА ВНИМАНИЕ! Благодарим за внимание! На Ваши вопросы готовы ответить: Людмила Анатольевна Жарикова, старший научный сотрудник ГПНТБ СО РАН, отдел научной обработки документов [email protected] Галина Анатольевна Скарук, кандидат педагогических наук, старший научный сотрудник ГПНТБ СО РАН, отдел научной обработки документов [email protected]