Uploaded by mniazov24

Частотный словарь семантических множителей русского языка

advertisement
Частотный словарь
семантических
множителей
русского языка
Когда и кем составлен
словарь?
В начальный период работы в
установлении набора
семантических множителей
приняли участие студентыпрактиканты в 1976-1977гг. с
кафедры структурной и
прикладной лингвистики
филологического факультета
Московского университета.
Идею опубликовать словарь
автору предложил Е. Л. Гинзбург,
который согласился быть и
рецензентом рукописи. Вторым
рецензентом стал Б. В. Якушин
Назначение словаря
• Словарь должен давать представление о
статистической структуре лексики, то есть
материальное выражение тех элементов
стабильности, посредством которых язык
создаёт возможности для его познания. Зная
структуры, мы можем решать как
прикладные задачи, так и фундаментальные
проблемы, выявление грамматических
параметров.
Количество слов в словаре
Кодирование всех слов словника (около 10 000) и
1 500 дескрипторов сформированы три
массива данных, с их семантическими
множителями, каталог дескрипторов со своими
семантическими множителями и каталог самих
множителей (квазиоснов). Частный словарь
семантических множителей составлен по двум
каталогам – отдельно по каталогу дескрипторов
и отдельно по словнику.
Количественный состав множителей: в
частном списке их 5526, а в алфавитном – на
две с лишним тысячи больше.
Принцип расположения слов
• Материал частотного словаря
расположен на странице в
два столбца, каждый из
которых содержит четыре
колонки: после порядкового
номера (ранга) указана
частота данного множителя
на массиве словника
(«частота сл»), затем его
частота на массиве
дескрипторов («частота дес»)
и буквенный состав (текст)
самого множителя
(«семантический
множитель»).
Общий вывод о словаре
• Частотный словарь служит источником
информации о том, какие слова более
употребительны в языке, а какие менее частотны.
Он содержит списки слов, при которых
указывается, с какой частотой они встречаются в
текстах. Для того, чтобы этот показатель был более
достоверным, частота слова подсчитывается на
основе большого корпуса текстов.
Спасибо за
внимание!
Download