Типовая технологическая инструкция по индексированию

advertisement
ТИПОВАЯ ТЕХНОЛОГИЧЕСКАЯ ИНСТРУКЦИЯ ПО ИНДЕКСИРОВАНИЮ
ДОКУМЕНТОВ в узлах КСМБ
1.1.
1.2.
1.3.
1.4.
1. Общие положения
Данная инструкция вводит порядок индексирования всех документов ключевыми терминами
(КТ), вносимыми в поле 610 формата UNIMARC, а также поле 600 — "Персоналии".
Данная инструкция не отменяет, а дополняет методы предкоординатного индексирования
документов (см. «систематизация» и «предметизация»), проводимых по рубрикаторам при
заполнении полей 606, 675, 676, 679 и 686 формата UNIMARC.
Количество КТ в ПОДе должно быть достаточным для полного отображения основных
аспектов
и
объектов
содержания
индексируемого
документа,
потенциально
представляющего интерес для пользователей.
Специфичность ПОДа определяется тем, в какой мере понятия документа нашли точное
отражение терминами индексирования, и также является одним из параметров качества
индексирования. Замена понятия термином, отражающим более широкое понятие, приводит
к потере специфичности. Более широкие термины допускается использовать в качестве
дополнения к детализированным (избыточное индексирование) в случаях:
 если излишне специфичный термин непонятен пользователям, особенно когда
соответствующее понятие применяется только в пограничных областях деятельности;
 если в документе понятие раскрыто недостаточно полно или является вспомогательным
для изложения содержания документа1.
2. Анализ содержания документов
2.1. Начальным этапом индексирования является анализ содержания обрабатываемого
документа. Предметом анализа являются все важные для потенциальных пользователей
аспекты содержания книги, статьи или других видов документов. Последнее означает, что
список ключевых терминов должен в первую очередь наиболее полно отражать те части
содержания документа, которые представляют наибольший читательский спрос. Список КТ
может быть не упорядочен и не зависит от их роли и характера отношений между ними в
содержании каждого конкретного документа.
2.2. В зависимости от вида индексируемого документа анализу подлежат: основное заглавие
(название), продолжение заглавия, аннотация или реферат (к книге или статье), оглавление
(содержание), а в наиболее ответственных случаях — также выборочные участки текста
(например, введение, выводы и т.п.).
3. Правила составления ключевых терминов
3.1. На данном этапе внедрения инструкции список КТ может быть не упорядочен и не зависеть от
их роли, веса и характера отношений между КТ в содержании каждого конкретного
документа: используется т.н. «мешочная грамматика».
3.2. В качестве КТ, используемых в ПОДе, могут выступать одиночные слова (существительные,
субстантивированные прилагательные — напр. мастерские, прекрасное), именные
словосочетания, аббревиатуры, сокращения слов и словосочетаний.
3.3. Каждый КТ вносится в отдельный повтор поля 610.
3.4. Опорное существительное в КТ приводится в именительном падеже. Не опорное
существительное в именном словосочетании может стоять в любом падеже (другими
словами, оно стоит в том падеже, которого требует опорное существительное).
Исчисляемые существительные употребляются в форме множественного числа, а
неисчисляемые – в форме единственного числа. Прилагательное, выступающее в качестве
определения, согласуется в роде, числе и падеже с существительным. Следует избегать
использования при существительном более двух определений.
Например: диоды, лазерные принтеры, менеджмент, буровое оборудование, Великая
Отечественная война, теория графов, разведка боем, двигатели внутреннего сгорания.
В устойчивых словосочетаниях возможно использование предлогов, например: игра в
кости, бурение на нефть.
1
См. ГОСТ 7.66-92 (ИСО 5963-85). Индексирование документов. Общие требования к координатному
индексированию.
3.5. КТ даются без инверсии, например: теория вероятностей, теорема Пифагора.
3.6. Словосочетания должны включать не более 2-3 слов и могут входить в ПОД, если в качестве
опорного слова содержат существительное (или субстантивированное прилагательное), и
выполнено одно из следующих условий2:
 значение словосочетания не выводится из значений его компонентов, например:
ЧЕРНЫЙ ЯЩИК, АБСОЛЮТНО ЧЕРНОЕ ТЕЛО, ЦАРСКАЯ ВОДКА;
 хотя бы один из компонентов словосочетания не употребляется в составе других сочетаний
или употребляется всегда в другой смысле, например:
ТОРГОВЛЯ НА ВЫНОС, ЛЕГКАЯ ПРОМЫШЛЕННОСТЬ;
 данное словосочетание является устойчивым словосочетанием с именем собственным,
например:
ТАБЛИЦА МЕНДЕЛЕЕВА, ЗАКОН БОИЛЯ -МАРИОТТА;
 отдельные слова словосочетания имеют слишком широкое значение, например, слово
МАШИНЫ в словосочетаниях:
СТРОИТЕЛЬНЫЕ МАШИНЫ, ЭЛЕКТРИЧЕСКИЕ МАШИНЫ;
 для данного словосочетания существует общепринятая аббревиатура, например:
АВТОМАТИЗИРОВАННЫЕ СИСТЕМЫ УПРАВЛЕНИЯ, ЭЛЕКТРОННО-ВЫЧИСЛИТЕЛЬНЫЕ МАШИНЫ;
 разбиение словосочетаний на отдельные компоненты приводит к потере важных для поиска
парадигматических связей, например:
АЛГОРИТМИЧЕСКИЕ ЯЗЫКИ, АЛГОЛ, КОБОЛ, ФОРТРАН;

словосочетание является нерасторжимым словосочетанием или принятым в данной
области термином, например:
УНИВЕРСАЛЬНАЯ ДЕСЯТИЧНАЯ КЛАССИФИКАЦИЯ, ОБЫКНОВЕННЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ,
ЭЛЕМЕНТАРНАЯ ТЕОРИЯ ЧИСЕЛ, СРЕДСТВА ХИМИЧЕСКОЙ ЗАЩИТЫ.
Общеупотребительные термины (метод, принцип, теория, проблема, закон, теорема,
критерий, свойство и т. п.) приводятся только в сочетании с другими словами, сужающими
их значение, например:
ОЦЕНКА РИСКА; ПРИНЦИП ВЗАИМОЗАМЕНЯЕМОСТИ; МЕТОД КООРДИНАТ;
УРАВНЕНИЕ ТУРБУЛЕНТНОЙ ДИФФУЗИИ.
Словосочетания, не удовлетворяющие указанным выше требованиям, следует разбивать
на компоненты.
3.7. Биологические вид, род, семейство, отряд, класс, тип и т.п. приводятся в том виде, в котором
они отражены в отраслевых справочных изданиях.
3.8. Географические названия используются в том виде, как и в географических справочниках или
картах и вносятся в поле 610 в случае, если они не внесены в поле 607 «Географическое
наименование как предметная рубрика».
3.9. Термины, обозначающие класс химических соединений, материалов, смесей и т.п.
приводятся обычно во множественном числе, например: газы, кислоты, глины, масла.
Форма записи термина может быть обусловлена областью знания или отраслью, в которой
он применяется, например: вода, но сточные воды.
3.10. Имена собственные, присвоенные неодушевленным предметам, событиям, партиям и т.п.,
записываются в комбинации с последними, при этом имена собственные в кавычки не
заключаются, например:
ВОЕННАЯ ОПЕРАЦИЯ БАГРАТИОН;
ТЕПЛОХОД АДМИРАЛ НАХИМОВ;
ПОЛИТИЧЕСКАЯ ПАРТИЯ ЯБЛОКО;
ХОЛОДИЛЬНИК ЗИЛ; САМОЛЕТ BOEING.
3.11. Названия организаций, фирм и торговых марок записываются без кавычек, на языке
оригинала либо по-русски, если в издании фигурирует только русская форма, например:
МВД; IBM; PANASONIC; КОНИКА.
Другие специальные составные термины включаются в ПОД в соответствии с формой,
используемой автором в индексируемом документе.
2
См. ГОСТ 7.25-2001. Тезаурус информационно-поисковый одноязычный. Правила разработки,
структура, состав и форма представления и ГОСТ 7.66-92 (ИСО 5963-85). Индексирование
документов. Общие требования к координатному индексированию.
2
3.12. Ключевыми терминами могут быть ГОСТированные и общепринятые сокращения и
аббревиатуры. Использование других сокращений и аббревиатур допускается, если только
они сопровождаются в ПОДе полной формой термина.
3.13. Словосочетание, включающее в себя цифры и цифровые комбинации, следует заключать в
угловые скобки, например:
<1941-1945 ГГ.>; <WINDOWS 2000>
3.14. Для описания дат и временных интервалов следует пользоваться следующими правилами:
 при описании века используют арабские цифры и "В." (<19 В.>, <20 В.>). Устоявшиеся
названия веков записываются как одна лексическая единица, например:
СЕРЕБРЯНЫЙ ВЕК; БРОНЗОВЫЙ ВЕК;
 годы записываются арабскими цифрами и буквой "Г." для одного года или "ГГ." для
интервала лет, например:
<1954 Г.>; <1941-1945 ГГ.>;
 десятилетия записываются: арабскими цифрами, дефис, "е" и "ГГ.", например:
<20-е ГГ.>;

интервалы в несколько веков или десятилетий записываются следующим образом:
<20-50-е ГГ.>; <20-21-е ВВ.>.
3.15. Обозначения формул можно приводить в ПОДе в символическом виде, но обязательно
также давать их словесную форму. При этом подстрочные индексы отображаются в
квадратных скобках, а надстрочные — в фигурных скобках. Например:
H2O — вода <H[2]O>; хлорид натрия NaCl;
X2Y3 — <x{2}y{3}>.
3.16. Для обеспечения полноты поиска по усмотрению индексатора в ПОДы допускается включать
КТ для «избыточного индексирования», представляющие дополнительные понятия:
 более высокого семантического (родового) уровня, нежели объекты описания в
индексируемом документе;
 реляторы, уточняющие область применения термина, например: стабилизаторы
(электротехника), стабилизаторы (авиация);
 наиболее часто используемые синонимы наименований объектов описания в
индексируемом документе.
3.17. В поля 600 «Персоналии» вносится перечень лиц, которым посвящен обрабатываемый
документ (Фамилия, Имя и Отчество или инициалы), за исключением тех случаев, когда
лицо лишь упоминается. При этом каждая запись вносится в отдельный повтор поля. Если в
книгу определенного автора включена статья об авторе или биографическая справка о нем,
то автор также записывается в данное поле.
3
Download