[ОПУБЛИКОВАНО В СБОРНИКЕ «Известия Смоленского государственного университета», 2009,

реклама
[ОПУБЛИКОВАНО В СБОРНИКЕ
«Известия Смоленского государственного университета», 2009,
№ 4 (8). – Смоленск: Издательство Смоленского
государственного университета, 2009. – Стр. 133-152.]
Системно-квантитативный анализ
многозначности лексики китайского языка в её
взаимосвязи со структурными и стилистическими
характеристикамиi
Поликарпов А.А.
(Лаборатория общей и компьютерной лексикологии и лексикографии
филологического факультета МГУ им. М.В.Ломоносова)
[email protected]
Ключевые слова:
китайский язык, универсалии, типология языков, лексическая система, многозначность, функциональные
стили, устная и письменная сфера языка, структурные типы лексических единиц
Аннотация:
Для проверки ряда выдвигаемых в модели жизненного цикла знака теоретических положений анализируется
семантический объём, структурные и функционально-стилистические характеристики лексики «Словаря
современного китайского языка» (Сяндай ханьюй цыдянь, 1979). Выявляется специфика распределения
китайских лексических единиц по многозначности на фоне языков относительно более синтетических, а
также специфика данного типа распределений для китайских одно- и многосложных единиц в их
письменно-иероглифическом и устно-фонетическом вариантах.
0.
Проблема.
Сколько-нибудь полному системному анализу лексика китайского языка ещё не подвергалась. Под
полным анализом подразумевается анализ представительных и хорошо охарактеризованных по ряду
аспектов собраний лексики, которые обнаруживаются, прежде всего, в относительно больших толковых
словарях языков развитой лексикографической традиции.
Под системным анализом подразумевается комплексный анализ ведущих характеристик объекта в
их связях и опосредованиях. Мы опираемся на тот вариант системного подхода в лингвистике, который
представлен серией работ Г.П.Мельникова [Мельников, 1978; 2000; 2003; Mel’nikov, 1988]. Этот подход
реализуется нами с использованием квантитативных данных. Функционирование (а поэтому и устройство)
языка сопряжено с проявлением различных свойств его единиц и связей между ними в различной степени.
Градации выделенных свойств объекта и могут быть точно оценены только на основе их измерений,
получения о них количественных данных и последующего их анализа [Поликарпов, 2007].
Многозначность китайской лексики в её взаимосвязи с её структурными и стилистическими
характеристиками (причём, с различением единиц устного и письменного языка) – один из самых важных
узлов системных отношений в языке. Это и определило выбор этих характеристик для исследования в
данной работе. (Аналогичный анализ для русского языка ранее был нами предпринят в работах
[Поликарпов, 1987; Поликарпов, Курлов, 1994]). По возможности, в настоящей работе данные китайского
языка будут сравниваться с данными других языков (русского, английского, вьетнамского и нек. др.) для
контрастно-типологического оттенения его специфики.
Материал таких языков, как китайский, до сих пор считается экзотическим и остаётся
малоисследованным. Оценки его строя и свойств до сих могут встречаться строго взаимноисключающие –
от уверенности, что это самый сложный язык, до определения его в качестве самого простого. Этот
разнобой, в частности, связан с тем, какая – форма языка - устная или письменно-иероглифическая - имеется
в виду в каждом данном случае. Учитывая это, мы постараемся провести анализ некоторых его свойств
дифференцированно для каждой из этих двух форм китайского языка.
Кроме того, отмеченное нерадостное положение с изученностью китайского языка связано с тем,
что реальному системному обследованию сколько-нибудь представительный его материал до сих пор не
подвергался.
Под анализом «представительного материала» подразумевается анализ данных, берущихся, по
крайней мере, из основных, авторитетных словарей данного языка, т.е. заведомо отображающих
неслучайный и достаточно полный его материал. Специфика отображений толковыми словарями
лексической системы того или иного языка ни в одной лексикографической традиции практически не
изучалась; попытки такого рода немногочисленны (Обухова, 1986; Поликарпов, 1987; Малов, 1988;
Поликарпов, Курлов, 1994; Поликарпов, Крюкова, 1988). Однако даже на основе имеющегося опыта можно
утверждать, что толковый словарь является, хоть и не идеальным, но специфическим системным
отображением реально существующей языковой действительности. Языковая система представлена в
словаре в виде извлеченного из речи лексического инвентаря с соответствующими типизированными
лингвистическими характеристиками его единиц. Исследования показывают, что, при имеющей место
известной субъективности в работе лексикографов, отбор слов, значений и их характеристик (в том числе и
стилистических) в словари разного типа происходит не случайным образом, а на основе определенных
задаваемых, "навязываемых" объектом принципов, что приводит к системной, закономерной
соотнесенности состава толкового словаря с общим составом лексической системы языка. Эти принципы
задаются объективным устройством языковой действительности, и лексикографы эти принципы не
придумывают, а лишь в той или иной мере учитывают, отображают.
Наконец, можно отметить, что сама концепция «слова» ( в противопоставлении морфеме и
фразеологизму) для китайского языка в достаточной мере не выработана до сих пор. И, наверное, в
принципе, не может с такой же степенью ясности быть выработана для этого языка, как это возможно для
более «морфологических» языков. (Но и для последних эта проблема, хотя в целом и менее актуальна, но
всё равно существует – ср. относительную ясность выделения «слова» в русском языке и меньшую ясность
этой процедуры для английского). В связи с этим, например, А.М.Карапетьянцем высказывалось суждение,
что реальными лексемами в китайском языке являются только односложные единицы. Всё прочее многосложные номинации - с его точки зрения, относятся к области фразеологии и синтаксиса
[Карапетьянц, 1982 ]. Совершенно очевидно, что такая точка зрения расходится не только с практикой
выделения устойчивых единиц номинации в китайской и русской китаистической традицией, но и с
некоторыми важными теоретическими подходами в лингвистике. В частности, можно указать на
определение «лексемы» в концепции В.М.Павлова [] как любого устойчивого сочетания морфем, имеющих
лексическое значение в противопоставлении «слову» как морфологической единицы (сочетанию морфем,
имеющему кроме отдельного лексического значение ещё и обязательную оформленность теми или иными
специализированными аффиксами). По указанной концепции, устойчивые единицы номинации («лексемы»,
по Павлову) при возможности стремятся «оформиться», т.е. стать и морфологическими единицами
лексической номинации («словами»). Т.е. в любом языке обязательно есть лексемы, но не в каждом есть
слова. Точнее, в разных языках «слова» представлены в разной степени, в зависимости от общей степени его
морфологизации, оформленности единиц его «лексемного» инвентаря.
Выход из этого теоретически и практически до конца не прояснённого положения заключается в
том, что для анализа из избранного нами китайского словаря словаря как основного источника информации
(«Словаря современного китайского языка» - Сяндай ханьюй цыдянь, 1979) мы берём только односложные
и многосложные «цы» (устойчивые, в большинстве случаев лексикализованные, готовые к употреблению
одноморфемные и многоморфемные комплексы). Как правило, в словаре они возглавляли статью и при
отображении фонетического облика составляющих их слогоморфем они писались слитно. Однако в
некоторой части заглавных единиц каждая из входящих в них слогоморфем писалась отдельно. Что,
видимо, свидетельствовало о фразеологическом (а не о лексическом) статусе данной входной единицы. При
создании картотеки по словарю эти входные единицы помечались особо и могли анализироваться как
вместе с полноправными «цы», так и отдельно.
1.
Задачи исследования.
Настоящее исследование является очередным в серии работ [Поликарпов, 1994-1995; 1998; 2001; 2007;
Поликарпов и др., 2008; Поликарпов и Селезнева-Елецкая, 2004; Поликарпов и ТАНЯ, 2005] по проверке
ряда выдвигаемых в Модели жизненного цикла знака теоретических положений, объясняющих
закономерности жизни и эволюции языка [Поликарпов, 1988; 1990; 1994-1995; 1998; 2001; 2007; Polikarpov,
1993; 2005; 2006 ]. Здесь анализируются в их взаимосвязи семантический объём, структурные и
функционально-стилистические характеристики лексики «Словаря современного китайского языка»
(Сяндай ханьюй цыдянь, 1979). Выявляется специфика распределения китайских лексических единиц по
многозначности на фоне языков относительно более синтетических, а также специфика данного типа
распределений для китайских одно- и многосложных единиц в их письменно-иероглифическом и устнофонетическом вариантах. Исследование начинаем с изложения некоторых основных положений Модели
жизненного цикла знака, наиболее релевантных для тех задач, которые мы здесь перед собой ставим.
2.
Теоретические основания анализа.
С нашей точки зрения в механизме осуществления коммуникативного акта заключена возможность
осуществления микроскопических сдвигов в характеристиках знаковых единицах языка и в их
соотношениях, которые, накапливаясь и отображаясь в других свойствах знаков, ведут и к видимым,
макроскопическим изменениям в системе языка, к ее эволюции. Это определяет необходимость для
лингвистической теории строить своё здание с прочного фундамента – анализа принципов и механизмов
осуществления элементарного коммуникативного акта.
Для этого, прежде всего, отметим, что главную функцию в языковом механизме выполняют
коммуникативные абстракции, называемые значениями. Любое значение любого знака это некоторый образ,
соотносимый в каждом данном акте коммуникации с некоторым целевым (обозначаемым) образом-смыслом по
принципу намекания, т.е. ассоциативно-вероятностного возбуждения смысла в голове получателя на основе
предшествующего ему возбуждения некоторого значения, подобранного отправителем на основе
вероятностного совпадения определенной части компонентов в этих двух типах образов.
Знаков меньше, чем значений, так что любой знак, хотя бы в потенции, многозначен, обладает в акте
коммуникаций той или иной степенью полисемической (а также, но в меньшей степени – омонимической)
неопределенности, трудности для получателя осуществления выбора ситуативно наиболее подходящего
значения из числа тех, которые свойственны полученному знаку.
Значений меньше, чем смыслов. Так что каждое значение многосмысленно, обладает определенной
степенью смысловой неопределенности, трудности для получателя осуществления выбора правильного
смысла из числа тех, которые потенциально возможны как итоговая интерпретация выбранного
значения полученного (распознанного) знака.
Разрешение получателем полисемической и смысловой неопределенности знака-намека
производится на основе учета им всей совокупной избыточности речевого контекста общения, что включает
в себя (1) общность видо-генетической базы членов одного коммуникативного коллектива, (2) общность их
прижизненно формируемого опыта, а также (3) возможная общность базы текущей ситуативной апперцепции
общающихся.
При прочих равных глобальных и ситуативно-апперцепционных обстоятельствах объем контекстуальнотекстовой информации, необходимый и достаточный для снятия получателем полисемической и смысловой
неопределенности каждого очередного знака, зависит, в среднем, именно от величины полисемической
неопределенности используемого знака и смысловой неопределенности (широты покрываемой смысловой
области) того из его значений, которое имелось в виду отправителем и было выбрано получателем. В частности,
при прочих равных контекстуальных условиях, чем данная знаковая единица более нагружена значениями,
тем она более семантически неопределенна, более трудна для определения получателем того значения,
которое в данном случае имелось в виду. В свою очередь, средний уровень полисемической нагруженности, а
значит, и общей относительной трудности (при прочих равных условиях) правильного истолкования каждого из
знаков в данном языке зависит от того, насколько, в зависимости от типологических причин, относительно богат
словарь знаковых единиц данного уровня данного языка. Каждый носитель относительно более аналитического
языка, обладая более ограниченным лексемным словарем, чем носитель относительно более синтетического
языка (к примеру, носитель современного английского в сравнении с носителем современного русского), в
котором каждая лексическая единица является, в среднем, более полисемической (и более омонимической),
более неопределенной как намек, вынужден при выражении одного и того же смыслового содержания
пропорционально этому тратить большее количество лексических знаков, чем носитель относительно более
синтетического языка [Поликарпов, 1976; 1979], чтобы в равной (достаточной) степени понятно намекнуть на
один и тот же смысл. Что, впрочем, не говорит о том, что носители аналитических языков более неэкономны в
своих параллельных по содержанию речевых произведениях, чем их коллеги, носители относительно более
синтетических языков, так как средняя длина лексических единиц в результате действия оптимизирующих
тенденций в более ограниченном лексическом наборе более аналитического языка становится меньше (причем,
пропорционально меньше - подробнее об этих соотношениях см. в [Поликарпов, 1976; 1979]). Это сокращение
относительно уравнивает длину текстов типологически отличающихся языков на уровне различительных
единиц текста, фонем.
Если, как мы считаем, вскрыт некоторый основной, ведущий принцип коммуникативной деятельности принцип знакового намекания-догадки, - то из него вытекает многое другое, на нем, как на фундаменте,
базируются, из него “вырастают” многие другие существенные свойства языка.
Дело в том, что ни один акт в использовании языка как ассоциативной кодовой сети не оставляет эту сеть в
неизменном виде: одни образы и связи в ней усиливаются, другие затухают. Наблюдается совершенно
определённая направленность этих микропроцессов, которые, суммируясь и определяют общую направленность
макро-развития языка - развития на уровне языковой системы в целом.
Самой общей тенденцией, на которой базируется ряд других, более частных тенденций оказалась тенденция
к расширению смысловой области, покрываемой каждым знаком. Это проявляется как в тенденции
расширения смысловой области каждого из значений, а поэтому и их абстрактивизации, так и тенденции
появления у знака новых, все более абстрактных значений и т.п.
Если допустить, что компоненты, составляющие любой образ, различаются степенью своей
специфичности, то это о позволяет сделать вывод и о том, что в ходе процесса абстрактивизации должны
теряться в первую очередь наиболее специфические компоненты значений.
Из уже сделанных допущений вытекает ряд важных следствий, которые более проверяемы, чем исходные
допущения. В числе этих следствий – такие тенденции, как возрастание с возрастом слов, морфем и фразем
степени грамматичности и субъективности их значений, падение со временем степени функциональностилистической маркированности значений слов и других знаковых единиц, тенденция к субъективизации
значений. Новые компоненты, “впитываемые” в таких условиях значением из контекстов его употребления, в
большей степени субъективны, эмоциональны, антропоцентричны, чем те, что в целом ему были
свойственны на более ранних этапах его развития.
Расширение смыслового объема значений, а также приобретение новых значений является для любого
знака не только неизбежным результатом его употребления, но и полезным, т.к. увеличивает
функциональную нагруженность знака в системе языка и, значит, повышает его стабильность,
устойчивость к любым внутренним и внешним изменениям, изменениям в языке и мире смыслов. Чем
больше значений у слова, тем его существование становится менее уязвимым от посягательств других
слов-конкурентов на обозначение тех же самых смыслов, а также от факта исчезновения каких-то из
смыслов, покрывавшихся какими-то его значениями ранее. (Факт исчезновения некоторых смыслов,
очевидно, производен от исчезновения в объективной реальности некоторых объектов, представленных в
сознании коммуникантов этими смыслами).
При этом наблюдается тенденция истощения порождающей способности значения в его жизни. Так
как в ходе жизни значения степень его абстрактности растет, а оставшиеся компоненты значения постепенно
становятся заняты ассоциативными связями с уже порожденными значениями от данного, порождающая
способность каждого значения в его истории постоянно падает и в конечном итоге истощается полностью.
Тем самым, репродуктивный период каждого из значений вполне конечен. Можно предположить, что чем более
конкретным, т.е. чем более наполненным компонентами является значение, тем, в среднем, оно будет
более плодовитым в плане порождения от него других значений.
В русле естественного стремления любого знака к большей стабильности лежит и такое важное
свойство процесса наращивания словом новых значений, как более высокая, в среднем, степень
абстрактности каждого последующего значения в сравнении с “материнским” (т.е. с тем, которое его
вовлекло в круг значений языка из круга внеязыковых смыслов). При этом наблюдается тенденция к
понижению порождающей способности значений каждой очередной ступени деривации значений в
знаке. Так что процесс порождения новых значений с каждым новым шагом семантической деривации
постепенно слабеет и на каком-то шаге вовсе останавливается.
Процесс вымирания значений знака также имеет свои закономерности. В той
последовательности, в какой значения появлялись, в такой же примерно они и выпадают, т.к. на
каждой следующей, относительно более отдалённой ступени порождения значения являются
относительно более абстрактными и поэтому относительно более устойчивыми, более живучими, чем
значения начальных ступеней семантической деривации знака.
Объединение в единой картине процесса замедляющегося наращивания знаком своих новых
значений с начинающимся относительно позже, но тоже постоянно тормозящимся процессом
выпадения значений, появившихся ранее, позволяет прогнозировать закономерности хода развития
полисемии знака. А на этой основе – прогнозировать типовые особенности исторической динамики
совокупного смыслового объёма знаков, частоты его употребления и длины, развития
синонимической способности значений, их фразеологизации, омонимизации и т.п.
Один из наиболее значимых прогнозов касается системной детерминации процесса
метаболизма знаков языка. Тип языка здесь выступает как основной фактор варьирования общей
степени интенсивности знакового метаболизма в нем. Некоторый установившийся в определенных
коммуникативных условиях тип языка, например, относительно аналитический (или, наоборот,
относительно синтетический) определяет и относительно более быстрый (или, наоборот, более медленный)
темп знакового метаболизма в языке, т.е. темп развития характеристик лексических (морфемных,
фразеологических и т.п.) единиц в этих поколениях, убыстренный (или, наоборот, замедленный) темп
сменяемости в нем поколений знаков, понижение (повышение) среднего возраста этих знаков, достижение
ими более высоких (более низких) пиковых значений полисемии знаков, их частоты, относительно более
быстрое и более сильное (или более медленное и более слабое), в среднем, укорочение знаков в
относительно более аналитическом (относительно более синтетическом) языке и т.п. [Поликарпов, 1979;
2001].
В итоге, мы можем прогнозировать для относительно более аналитического языка следующие,
экспериментально проверяемые вещи:
- (а) более юный, в среднем, возраст знаковых единиц в этом языке;
- (б) относительную бедность морфемного и лексемного инвентарей единиц в нём;
- (в) более высокие в нём средние и пиковые величины полисемии лексем и морфем;
- (г) распределение лексем и морфем по величине их полисемии должно оказываться в нём более сдвинутым
в области высокой полисемии;
- (д) относительно более активное развитие и употребление фразеологических единиц (как в смысле
относительной частоты их употребления, так и в смысле объёма их инвентаря) как относительное
восполнение дефицита лексических единиц в системе такого языка;
- (е) относительно более частое в текстах относительно такого языка употребление лексем и морфем (как
производное от (д));
- (ж) относительно более короткие морфемные и лексические единицы в нём;
- (з) относительно более высокий уровень омонимизации лексики в таком языке;
- (и) относительно меньшая развитость лексической синонимии как следствие большей бедности
лексического запаса.
- (к) относительно менее выраженные стилистические характеристики значений слов.
Пункт (а) требует проведения большой подготовительной работы и пока на этот счёт ни для какой
пары языков сколько-нибудь представительных данных не собрано. Однако при проведении
глоттохронологических исследований было замечено, что темп сменяемости лексики относительно
аналитических языков оказывается выше в сравнении с другими, менее аналитическими [Поликарпов,
Селезнёва-Елецкая, 2004]. Естественно, поэтому, что и средний возраст лексических единиц должен быть в
нём относительно более молодым.
Пункты (б) – (и) прошли доказательную проверку на материале сопоставления данных русского и
английского языков [Поликарпов, 1979; 2001], а также частично – на материале романских языков. Но эти
пункты ещё ожидают своего широкого исследования на материале других языков. В т.ч. на материале
китайского языка.
Пункт (к) оказывается наименее определённым по своему содержании т.к. массовая проверка
содержащейся в нём гипотезы наименее возможна, в силу практических расхождений различных
национальных лексикографических школ в стилистической маркировке значений слов. Однако
сопоставительно-типологические исследования в этой области всё равно необходимы, т.к. возможный
отрицательный результат таких экспериментов надо ещё показать.
Приведённая программа сопоставительно-типологических исследований полностью приложима и к
материалу китайского языка. Более того, в силу своей крайней типологической специфики этот язык должен
демонстрировать крайнюю контрастность по отношению к другим языкам по всем указанным параметрам.
В настоящем исследовании затрагивается только вопрос о специфике распределения многозначности
китайских лексических единиц различного рода – односложных, многосложных, фонетических
слогоморфем и графических (иероглифов). Несистематически проводится сопоставление этих
характеристик китайского языка с подобными же характеристиками других языков.
3.
Результаты анализа:
Словарь современного китайского языка “Сяньдай ханьюй цыдянь” (1979) как источник
лексико-типологической информации
3.1.
Общая характеристика словаря.
Источником материала о полисемических, омонимических, структурных (односложность,
двусложность и т.п.), функционально-стилистических и иных характеристиках китайских лексических
единиц для нас стал «Словарь современного китайского языка» (Сяндай ханьюй цыдянь, 1979). Несмотря
на то что уже прошло 30 лет со дня его выхода, до сих пор он сохраняет значение как практический
справочник, а также как лингвистический источник данных о различных характеристиках этого языка.
В нём представлены как односложные лексические единицы, так и многосложные лексические
сочетания «цы», а также синтаксические сочетания «цыцзу», готовые выражения «шуюй», выражения-
идиомы «ченъюй» и нек. др., которые нами различались. Основным материалом для нашего анализа стали
односложные лексические единицы и многосложные лексические сочетания «цы».
Судя по объёму словаря, характеристикам многозначности и характеру представленной в нём
функционально-стилистической информации, это – словарь краткого типа, согласно типологии толковых
словарей, разработанной С.И.Ожеговым. В словаре общим объемом около 56 тыс. единиц (примерно
столько же, сколько в «Словаре русского языка» С.И. Ожегова 9-ого изд., 1972 г.) содержится 9281
иероглифический однослог и 43 625 их сочетаний различного типа; 1480 однослогов не способны к
свободному функционированию в языке, имеется 405 односложных имен собственных. Таким образом, в
этом словаре односложные единицы (за исключением несвободных однослогов) составляют 14,3%,
многосложные — 85,7% (из них двусложные — 67,46%, трехсложные — 9,36%, четырехсложные — 7,6%,
пяти- и более сложные — 1,28%).
Явное преобладание в словаре многослогов еще не свидетельствует о том, что лексический состав
текстов китайского языка содержит единицы разной длины в таких же пропорциях. Во-первых, данный
словарь отражает еще не всё богатство лексических ресурсов современного китайского языка, ибо должен
быть отнесен к числу кратких, т.е. содержащих, по типологии С.И.Ожегова, наиболее активное “ядро
современного словоупотребления” (т.е. наиболее активную лексику, преимущественно общеупотребляемую
[Поликарпов, Курлов, 1994]). Об этом свидетельствует, в частности, то, что в области односложных и
двусложных единиц доля лексики с функционально-стилистическими пометами, характеризующими выход
за это “ядро”, весьма незначительна (8,9% и 15,5%).
Во-вторых, многосложные единицы китайского языка во многих случаях могут быть признаны как
сложным словом, так и словосочетанием.
В-третьих, в реальном языковом употреблении многосложные единицы (преимущественно
двусложные) могут быть представлены и своими односложными вариантами.
Критерием для отделения лексических сочетаний слогоморфем от синтаксических может служить
приведение в рассматриваемом словаре некоторых единиц со слитным, а других — с раздельным
написанием в транскрипции. Как показывает анализ (см. таблицу 2), число заглавных сочетаний
слогоморфем, записанных раздельно, последовательно растет, начиная с трехчленных. Для четырехчленных
оно уже становится преобладающим; слитные написания вовсе отсутствуют среди семи-, восьми- и
девятичленных сочетаний.
3.2.
Представленность в «Словаре современного китайского языка» групп лексики
разной величины многозначности и разной структуры.
Для выявления этой картины была создана серия таблиц. Рассмотрим содержание таблиц 1 и 2,
представляющих лексические единицы, разные по многозначности (общее число значений у слова или
группы омонимичных слов), по структуре (по количеству составляющих их слогоморфем), отдельно для
устной и письменной формы китайского языка.
ТАБЛИЦА 1. Распределение односложных фонетических (Ф) и иероглифических (И)
лексических единиц по их многозначности
Кол-во
знач.
Ф
кол-во
лекс.
ед.
И колво лекс.
ед.
Кол-во
знач.
Ф колво лекс.
ед.
И колво лекс.
ед.
Кол-во
знач.
Ф колво лекс.
ед.
И колво лекс.
ед.
120
1
-
39
6
-
18
30
103
1
-
38
3
-
17
27
90
1
-
37
4
-
16
35
4
85
1
-
36
5
-
15
33
10
74
1
-
35
3
-
14
40
7
72
1
-
34
3
-
13
35
5
71
2
-
33
7
-
12
34
9
68
1
-
32
3
-
11
44
17
66
1
-
31
11
-
10
50
34
63
1
-
30
8
-
9
54
38
59
1
-
29
8
-
8
54
57
53
1
-
28
15
-
7
69
86
51
1
-
27
9
-
6
71
165
50
2
-
26
5
1
5
60
206
48
1
-
25
14
1
4
87
394
47
3
-
24
12
-
3
90
649
46
2
-
23
22
1
2
95
1492
44
3
-
22
18
-
1
91
3808
42
1
-
21
18
-
0
23
1228
41
2
-
20
15
1
40
5
-
19
25
2
Всего
1273
8320
1
Таблица 2. Распределение многосложных фонетических лексических единиц китайского языка по
величине их многозначности.
Кол- во
Количество слогов в многосложных фонетических единицах словаря
знач.
2
1
2849
3
366
4014 /
333
36
30
2
4909
57
336 /
27
3
635
3 / 12
638 /12
4
98
0/3
98 /3
5
31
31
6
6
6
7
2
2
Всего
3417
4
2 +
”эр”
423
3
4353 /
375
3+
”эр”
4
5
6
7
8
9
/
198 /
3594
6 /
201
36220
0 /15
0/3
0/3
3987
5
32021
39
/33
207 /
3691
Всего
33116
4278
/
5314 /
117
6
/201
36220
0/
15
0/3
0/3
39205 /
4410
Примечания к таблице 2:
1. Начиная с трехсложных единиц, подсчет производился на основе выборки в 1/3 объема словаря.
2. 2 + “эр” и 3 + “эр” означает, что у двуслогов (трехслогов) имеет место так называемое явление эризации.
3. 4353 /375 — Написание через дробную черту указывает, что слитных слогов в транскрипционной записи
трехслогов зафиксировано 4353, раздельных написаний (число выделено курсивом) — 375.
Аналогичные данные для анализа распределения лексических комбинаций иероглифов по
многозначности, к сожалению, ещё не собраны. Однако в нашем распоряжении имеются средние величины
по этому материалу. А именно, если для иероглифических однослогов максимальный семантический объем
доходит до 26 значений (а средний равен 1,79 значений), то для двуслогов — 7 (в среднем 1,19), трехслогов
(транскрибированных слитно) — 3 (в среднем 1,08), четырехслогов (тоже слитно транскрибированных) — 2
(в среднем 1,05), пятислогов и далее — 1. Как видно, сочетание иероглифов эффективно снижает
потенциальную неоднозначность каждого из них в его изолированном употреблении.
Кстати, высказанное нами в работе [Поликарпов, 1981, с.114] суждение о том, что величина,
обратная логарифму числа значений, является аддитивной мерой специфичности знака, может быть
проверено на китайском материале. Это означает, что суммирование величин семантической специфичности
составных частей знака (например, лексических компонентов сложного слова) очень хорошо соответствует
общей величине его семантической специфичности. Получив эту величину путем прямых измерений
исходной величины многозначности и семантической специфичности каждого из компонентов, можно
рассчитать многозначность всего такого знака (не измеряя её напрямую). Исходя из известной средней
величины семантической специфичности для элементарных единиц данного языка (например, однослогов
китайского языка), можно рассчитать среднюю величину семантической специфичности и, соответственно,
среднюю величину многозначности комплексных единиц разной сложности (двуслогов, трёхслогов и т.п.)
китайского языка путём умножения средней величины специфичности китайских однослогов на число
входящих в слово слогоморфем, а потом путём обратного перехода от полученной специфичности сложной
единицы к её многозначности. А именно, определённая эмпирически средняя величина многозначности для
однослогов китайского языка равна 1,79 значения. Расчётная величина многозначности для двусложных
слов получается 1,3 значения (при эмпирических 1,19 значения), для трёхсложных 1,2 значения (при
эмпирических - 1,1) и т.п.
Для китайского языка характерны существенные структурные различия единиц его письменной и
устной форм. В показанных в таблице 1 распределениях фонетических и иероглифических однослогов по
семантическому объему наблюдаются между ними разительные отличия.
Фонетические однослоги могут иметь до 120 значений, а максимум для иероглифических – 26
значений. Среднее число значений на фонетический однослог — 12,6, а на иероглифический, как было
указано выше, — 1,79.
Согласно нашим подсчетам, за счет графического разграничения групп значений, связанных с тем
или иным фонетическим слогом, снимается до 80% присущей фонетическим слогам омонимии.
В наиболее общем виде различия письменно-иероглифического и фонетического отображения
словаря, а также различия между односложными и неодносложными китайскими единицами представлено
Таблице 3.
В таблице также представлен для контраста материал русского, английского и вьетнамского языков,
полученный в результате анализа толковых словарей этих языков в Лаборатории общей и компьютерной
лексикологи и лексикографии МГУ.
В таблице 3 для более компактного представления данных как по величине многозначности, так и
по количеству единиц для каждой полисемической зоны была применена логарифмическая мера этих
характеристик.
Таблица 3. Соотношение объёмов групп лексических единиц разного типа и разных языков по
зонам многозначности
Зоны величин многозначности лексических единиц
Наборы единиц
3…4
5…8
9…16
17…32
33..64
65...128
1,9777
2,2504
2,6345
2,5119
2,3802
1,7324
1
3,5807
3,1738
3,0183
2,711
2,0934
0,8451
Вьетн. фон. однослоги
3,5184
3,077
3,0183
2,6803
1,8129
0,699
Вьетн. фон.многосложн.
4,3887
3,3393
2,4014
0,7782
1
2
1,959
Кит.иероглиф. однослоги
Кит.фонет. однослоги
Рус.однослоги
2,716
2,4533
2,2529
1,8751
1,3424
0,6021
Рус.многосложн.слова
4,6399
3,9088
3,5221
2,8692
1,9912
0,6021
Англ. слова (Хорнби)
4,5588
3,671
3,4098
2,8698
2,2041
1,1139
Как видно, на основе данных этой таблицы можно:
- (1) Контрастно соотнести китайские фонетические односложные лексемы с китайскими же
иероглифическими односложными лексемами.
- (2) Контрастно соотнести китайские фонетические односложные с вьетнамскими (фонетическими)
односложными и русскими односложными словами.
- (3) Вьетнамские односложные - с вьетнамскими же многосложными (данные получены в Лаборатории
общей и компьютерной лексикологии и лексикографии филол. ф-та МГУ на основе анализа «Словаря
вьетнамского языка» под ред. Нгуен Ван Тана; Ханой, 1977).
- (4) Русские односложные - с русскими же многосложными словами (наши данные по «Словарю русского
языка» С.И.Ожегова).
- (5) Русские - с вьетнамскими обоих типов.
- (6) Английский – с китайским и прочими представленными языками (данные по английскому языку
получены в Лаборатории общей и компьютерной лексикологии и лексикографии филол. ф-та МГУ на
основе анализа словаря A.S.Hornby “Oxford Advanced Learner’ Dictionary of Current English” - 1982).
Рис.2. Соотношение объёмов групп лексических единиц разного типа и разных языков по
зонам многозначности
5
4.5
4
3.5
3
2.5
2
1.5
1
0.5
0
Кит.фонет. однослоги
Кит.иероглиф. однослоги
Вьетн. фон. однослоги
Вьетн. фон.многосложн.
Рус.однослоги
Рус.многосложн.слова
Хорнби англ. Слова
Как можно видеть из приведённой таблицы 3 и Рис. 2, китайские фонетические односложные слова
представляют словарь, наиболее ограниченный по составу единиц (всего – 1293 единицы), но наиболее
нагруженный значениями, причём, причём, наиболее равномерно нагруженный в сравнении с другими
словарями. В отличие от других распределение китайских фонетических односложных слов не является
строго асимметричным. Сколько слов имеет 1-2 значения, столько же в этом словаре и слов с 33-64
значениями.
Максимум многозначности тоже принадлежит этому словарю.
Наиболее близки по этому параметру к китайским однослогам (но всё же существенно от них
отличаются) вьетнамские фонетические односложные слова. Но т.к. их относительно больше во
вьетнамском языке (ок. 6 тыс. однослогов в сравнении с 1293 в китайском), то каждое из них относительно
меньше нагружено. А характер распределения вьетнамских односложных слов демонстрирует, вследствие
этого, свой относительно более синтетический характер, с большей его соредоточенностью в зоне
относительно малополисемичных единиц.
Иероглифические китайские однослоги демонстрируют очевидно менее аналитический характер в
сравнении с распределением фонетических однослогов. Поэтому они оказались очень близки по своему
распределению вьетнамским фонетическим однослогам.
Ещё менее аналитичны единицы английского языка и, особенно, русского. Здесь данные по
русскому и английскому языку оказались ближе всего друг к другу. Хотя, если присмотреться, то можно
обнаружить, что, в полном соответствии с теоретическим ожиданием, угол наклона графика лексики
английского языка всё-таки является заметно более крутым, что символизирует больший удельный вес в
английском распределении высокополисемичных слов и, наоборот, относительно более низкий удельный
вес в нём малозначной лексики.
Существенные отличия характеристик многозначности единиц письменной и устной форм
китайского языка должны приводить к существенным различиям в способах их употребления. В частности,
если в самостоятельном употреблении каждый из фонетических однослогов обладает столь широкой
потенциальной сферой отнесенности, то в устной речи для однозначного выражения данного содержания
они должны чаще, чем в письменной, входить в сочетания с другими однослогами. Т.е. удельный вес
неодносложных номинаций в различных жанрах устной речи должен быть более высоким, чем в жанрах
письменной.
Предварительные
результаты
сопоставления
структуры
устойчивых
письменно-
иероглифических и устно-фонетических номинаций, имеющиеся в нашем распоряжении на основе анализа
данных «Частотного словаря современного китайского языка» [1985] (где сфера устной речи выделена и
может быть сопоставлена со сферой письменной речи) позволяют считать этот общий вывод верным.
3.3.
Закономерности
функционально-стилистической
маркированности
значений
иероглифических однослогов китайского языка.
Рассмотрение данных, представленных в Таблице 4 и Рис. 2 позволяет прийти к следующим
совершенно определённым выводам.
Таблица 4.
Данные о функционально-стилистической помеченности
значений иероглифических
однослогов в “Словаре современного китайского языка” (Пекин, 1979)
Обозначения в таблице:
I – общее число лексических единиц с данной величиной многозначности
I - всего помеченных значений
III — общее количество значений у однослогов с данной полисемией
IV — процент помеченных значений
V — всего помеченных значений у данной группы однослогов
VI — общее количество значений у всех однослогов укрупненных
полисемических зон
VII — процент помеченных значений в укрупненных полисемических зонах
многозначность
I
II
III
IV
V
VI
VII
0
1228
1
3808
1210
3808
31,77%
1210
3808
31,77%
2
1492
674
2984
22,58%
674
2984
22,58%
3
649
201
1947
10,36%
269
3523
7,63%
4
394
68
1576
4,31%
5
206
36
1030
3,50%
118
3078
3,08%
6
165
42
990
3,23%
7
86
28
602
4,31%
8
57
12
456
2,63%
9
38
7
342
1,75%
27
1354
2,00%
10
34
11
340
3,50%
11
17
3
187
1,60%
12
9
-
108
0%
13
5
-
65
0%
14
7
3
98
3%
15
10
1
150
0,06%
16
4
2
64
3,10%
17
1
-
17
0%
19
2
-
38
0%
20
1
-
20
0%
23
1
-
23
0%
25
1
-
25
0%
26
1
-
26
0%
Всего
8216
2301
14 896
15,50%
0%
2308
14886
15,50%
Рис. 1. Процент стилистически помеченных
значений в разных зонах многозначности
китайских лексических единиц
35.00%
30.00%
25.00%
20.00%
% стил.помеч.зн.
15.00%
10.00%
5.00%
0.00%
1
2
3…4
5…8
9…16
17…32
Табличные данные и, в особенности, график зависимости степени помеченности
значений разных групп односложных слов (сформированных по логарифмическим
интервалам многозначности) позволяют сделать очень важный вывод о непреложном
факте последовательного падения степени стилистической маркированности при
движении от групп низкой многозначности к группам высокой многозначности. Это
уже было показано на русском материале [Поликарпов, Курлов, 1994; Поликарпов,
Крюкова, 1988]. Этот факт – одно из важнейших подтверждений одного из ведущих
положений Модели жизненного цикла знака о том, что параллельно росту полисемии
слова должна расти средняя степень абстрактности его значений.
Заключение.
На основе системно-квантитативного подхода был сформулирован ряд гипотез о
свойствах лексики китайского языка, а также о соотношении ряда характеристик
китайского языка с характеристиками типологически близких и далёких языков. Все
высказанные предположения оправдались.
Литература
БКРС 1984.
BREITER M.A., POLIKARPOV A.A. [1997]. Polysemy and Frequency of aWord in Chinese: Experimental Study
of System Dependences // IV International Conference on Languages of the Far East, South-East Asia, and Western
Africa, September 17-20 1997, Institute of Asian and African Countries, Moscow Lomonosov State University. M.,
1997.
ZIPF G.K. [1949]. Human Behavior and the Principle of the Least Effort. - Boston (Mass.): Addison-Wesly, 1949.
Polikarpov A.A. A Model of the Word Life Cycle // Contributions to Quantitative Linguistics. Eds. R.
Koehler and B.B. Rieger. - Dordrecht; Boston; London: Kluver, 1993.
Polikarpov A.A. System Tendencies in Word-Formational Process of Indo-European Languages // Abstracts
from the International Conference on System-Functional Linguistics. - Toronto, 1997.
Xiandai hanyu cidian (Частотный словарь современного китайского языка). - Пекин, 1985.
Polikarpov A.A. A model of the word life cycle / Ed. by Koehler, R., Rieger, B. // Contributions to quantitative
linguistics. Dordrecht; London; Boston, 1993.
Поликарпов А.А. К теории жизненного цикла лексических единиц // Прикладная лингвистика и
автоматический анализ текста. Тез. докл. научн. конф. 28 - 30 янв. 1988. Тарту, 1988.
Поликарпов А.А. Лексическая полисемия в эволюционном аспекте // Linguistica. Тарту, 1990 (Учен. зап.
Тартуского гос. ун-та. - Вып. 911).
Ожегов С.И. О трех типах толковых словарей современного русского языка // ВЯ, 1952, N 2.
Ожегов С.И. Словарь русского языка / 9-е изд. испр. и доп. / Под ред. Шведовой Н.Ю. М., 1972.
Поликарпов А.А. Полисемия: системно-квантитативные аспекты // Квантитативная лингвистика и
автоматический анализ текстов. Тарту, 1987 (Уч. зап. Тартуского гос. ун-та. Вып. 774).
Поликарпов А.А., Крюкова О.С. О системном соотношении краткого и среднего толковых словарей
русского языка // Квантитативная лингвистика и автоматический анализ текстов. Тарту, 1989 (Уч. зап.
Тартуского ун-та. Вып. 872).
Поликарпов А. А. Циклические процессы в становлении лексической системы языка: моделирование и
эксперимент. Автореф. докт. дисс. - М., 1998.
Polikarpov A.A. On the Model of Word Life Cycle // Koehler, R., Rieger, B. (eds.) Contributions to Quantitative
Linguistics.- Dordrecht: Kluwer, 1993. - Pp. 53-66.
Арапов М. В., Херц М. М. Математические методы в исторической лингвистике. - М.: Наука, 1974. - 166 с.
Белоозеров В. Н.. Моделирование фонологической системы языкового механизма. Диссертация на соискание
учёной степени кандидата филологических наук. Москва, 1974.
Богородицкий В.А. Лекции по общему языкознанию. 2-е изд., доп. - Казань: Типо-лит. Имп. ун-та, 1915 - 332 с.
Богородицкий В.А.. О морфологической абсорбции, РФВ, 1888, т.3, с.55.
Бодуэн де Куртенэ И.А. Избранные труды по русскому языкознанию. - М.: Изд-во АН СССР, 1963. Т.1, 1963. 384 с., Т.2, 1963. - 391 с.
Будагов Р. А. Проблема промежуточного звена в лексике // Р. А. Будагов. Человек и его язык. - М., 1974.
Земская Е. А. Словообразование как деятельность. - М., 1992.
Котелова Н.З. (ред.) Новые слова и значения. Словарь-справочник на материале прессы и литературы 70-х
годов. - М., 1984.
Крушевский. Н.В. Лингвистические заметки, РФВ, 1880, т.3, с.55.
Кустова Г.И., Поликарпов А.А. От предметности - к абстрактности // Эвристические возможности
квантитативных методов исследования языка. Тез. докл. Всес. семинара в г. Смоленске 11-13 сент. 1991г. Смоленск, 1991.
Мельников Г.П. Системная лингвистика и ее отношение к структурной // Проблемы языкознания. Доклады и
сообщения советских ученых на X Международном конгрессе лингвистов. – Бухарест, 28.08 – 2.09.1967. – С. 98102.
Мельников Г.П. Язык как система и языковые универсалии // Языковые универсалии и лингвистическая
типология. – М., 1969. – С.34-45.
Мельников Г.П. Языковая стратификация и классификация языков // Единицы разных уровней грамматического
строя языка и их взаимодействие. – М., 1969. – С. 45-73.
Мельников Г.П. О типах дуализмов языкового знака // Филологические науки, 1971, №5. – С. 54-69.
Мельников Г.П. Системный подход к лингвистике // Системные исследования. Ежегодник 1972. – М., 1971. –
С.184-196.
Мельников Г.П. Типы означаемых языкового знака и детермината языка // Проблемы семантики. – М., 1974. – С.
25-34.
Мельников Г.П. Системология и языковые аспекты кибернетики. - М.: Cов. радио, 1978. – 368 с.
Поликарпов А.А. Элементы теоретической социолингвистики. - М.: Изд. МГУ, 1979. - 163 стр.
Поликарпов А.А. Аналитическое развитие - адаптивная реакция языка на условия его интенсивного
распространения // Количественные методы в гуманитарных науках. -М.: Изд. МГУ, 1981. - С.172-178.
Поликарпов А.А. Квантитативная универсалия удельной семантической специфичноcти: Логика теоретического
выведения, измерения и соположения с другими языковыми параметрами // Количественные методы в
гуманитаных науках. - М.: Изд. МГУ, 1981. - С.166-171.
Поликарпов А.А. О понятии "коммуникативная ситуация" // Методологические
лингвистики. - М.: Изд. МГУ, 1986. - С.108-129.
проблемы социальной
Поликарпов А.А. Полисемия: системно-квантитативные аспекты // Квантитативная лингвистика
автоматический анализ текстов. (Уч. зап. Тартуского гос. ун-та. Вып. 774). - Тарту, 1987 - С.135-154.
и
Поликарпов А.А. К теории жизненного цикла лексических единиц // Прикладная лингвистика и автоматический
анализ текстов. Тез. докл. науч. конф. 28.01.- 30.01.1988, Тарту. - Тарту: Изд-во Тартуского университета, 1988. С.66.
Поликарпов А.А. Лексическая полисемия в эволюционном аспекте // Linguistica. (Учен. зап. Тартусского гос. унта. - Вып. 911). Тарту, 1990. - С.76-86.
Поликарпов А.А., Курлов В.Я.) Стилистика, семантика, грамматика: опыт анализа системных взаимосвязей //
Вопросы языкознания, N 1, 1994. - С.62-75.
Поликарпов А.А. Циклические процессы в становлении лексической системы языка: моделирование и
эксперимент. Автореферат докторской диссертации. - М., 1998;
Поликарпов А.А. Закономерности образования новых слов: моделирование процесса и его экспериментальное
исследование // Язык. Глагол. Предложение. К 70-летию Георгия Георгиевича Сильницкого. - Смоленск, 2000, с.
213-214;
Поликарпов А.А. Когнитивное моделирование циклических процессов в становлении лексической системы
языка // Труды Казанской школы по компьютерной и когнитивной лингвистике. - Казань, 2001. С. 57-99.
Поликарпов А.А. Историческая лингвистика. Системные закономерности развития языков. М. 2007 (в печати).
Поликарпов А.А., Филимонова Т.А. О системной зависимости негативных денотативных и субъективнооценочных признаков фразеологических единиц от их возраста // Cognitive Мodeling in Linguistics. CLM-2005. –
Москва, 2005;
Barnhart, C. A Dictionary of New English. 1963-1972. - London, Longman, 1973.- 512p.
Beloozerov, V.N., Polikarpov, A.A. 1980. On the Mechanizm of the Analyticity Development in a Language. Elements
of the Theory and the Computer Experiment. // Mathematical and Computational Linguistics. Proceedings of the
International Conference, Pisa. - Firenze, 1980. - Pp. 76-83.
Langacker, Ronald. 1990. Subjectification. // Cognitive Linguistics,1, pp. 5-38.
Melnikov G.P. Systemology and Linguistic Aspects of Cybernetics. - N.Y.; L.: Gordon and Breach, 1988.
Polikarpov A.A. On the Model of Word Life Cycle // Koehler, R., Rieger, B. (eds.) Contributions to Quantitative
Linguistics.- Dordrecht: Kluwer, London, Boston, 1993. - Pp. 53-66.
Polikarpov A.A. Evolutionary Aspects of a Language as a Natural Classification System // А.А. Поликарпов (ред.).
Qualico-94. 2-ая Международная конференция по квантитативной лингвистике, 20-24 сент. 1994 г., Москва,
МГУ, филологический факультет. - Москва, 1994. - С.196-198.
Polikarpov A. Cognitive Mechanisms for Emergence of Some Regularities of Human Language Evolution // VII
Международная конференция «Когнитивное моделирование в лингвистике» (September 4-11, 2004 Varna). Труды
(Обработка текста и когнитивные технологии №9). - М., МИСИС, 2004. - С. 10-20;
Polikarpov A.A. Towards the Foundations of Menzerath’s Law (On the Functional Dependence of Affix Length on their
Positional Number within Words) // Peter Grzybek (ed.). Contributions to the Science of Text and Language. Word
Length Studies and Related Issues. - Dordrecht: Springer, 2006. – Pp. 215-240.
Zipf G.K. Psycho-Biology of Language. - Boston (Mass.), 1935.
Abstract:
For testing the number of predictions put forward in the Sign’s life
cycle model sign’s semantic volume, structural and functionalstylistic featurs of the lexicon from the Dictionary of Modern Chinese
Language (Syanday Hanyu tsydyan, 1979). There was revealed specific
characteristics of the polysemic distribution of Chinese lexical
items. Also this specificity was stressed by the comparison with the
corresponding data of some more synthetic languages. At last, the
specificity consists in this type of distributions for the Chinese
one-syllabic and polysyllabic units in their hieroglyphic as well as
phonetic variants.
i
В сборе и, частично, обработке материала для данного исследования совместно с автором статьи
принимала участие Н.В.Обухова.
Скачать