Электронный вариант - Институт языкознания РАН

реклама
1
Е.И.ЯРОСЛАВЦЕВА, А.К.ЗОТОВА
ЛИНГВОТИПОЛОГИЧЕСКАЯ БАЗА ДАННЫХ «ЯЗЫКИ МИРА»:
РЕЗУЛЬТАТЫ ИССЛЕДОВАНИЙ ПО ТЕМЕ «ФОРМАЛЬНО СОВПАДАЮЩИЕ
КЛАССЫ
ЯЗЫКОВЫХ
ЯВЛЕНИЙ
–
УНИВЕРСАЛИИ,
ФРЕКВЕНТАЛИИ,
РАРИТАРИИ И УНИКАЛИИ (НА МАТЕРИАЛЕ РОМАНСКИХ ЯЗЫКОВ)»
История создания лингвотипологической базы данных «Языки мира»
В Институте языкознания РАН с начала 1980-х гг. разрабатывается и создается
лингвотипологическая
формализованные и
база
данных
«Языки
мира»,
Образец модели реферата (фрагмент)
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
включает
в
себя
структурированные описания языков мира в виде специально
разработанных универсальных моделей (т.н. рефератов).
1
2
3
4
5
которая
2.1.1.ФОНЕМНЫЙ СОСТАВ
.О
.гласные
.О
..подъем
...верхн./верх.пониж./верх.ср./нижн.ср/ср./нижний
...верхний/нижний
...верхний/средний/нижний
...верхний/верхнесредний/средний/нижний
...верхний/верхне-средний/нижнесредний/нижний
...верхний/верхний
пониженный/средний/нижний
...верхний/средний откр./средний
закр./нижний
...верхний/средний/нижний откр./нижний
закр.
...средний закрытый/нижний
..ряд
...отсутствует
...передний/задний
...средний/задний
...передний/средний/задний
...передний/средне-передний/среднезадний/задний
...перед./ср.-пер./средний/средн.задн./задний
..долгие/краткие
..долгие/краткие/сверхдолгие
..долгие/краткие/сверхкраткие
2
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
..долгие/полудолгие/краткие
..лабиализованные/нелабиализованные
..назализованные/неназализованные
..напряженные/ненапряженные
..напряженные/ненапряженные/ретрофлекс
ные
..открытые/закрытые
..открытые/полуоткрытые/закытые
..открытые/полуоткрытые/полузакрытые/за
крытые
..редуцированные/нередуцированные
..сильные/слабые
..смещенные/несмещенные
..твердые/мягкие
..умлаутированные/неумлаутированные
..фарингализованные/нефарингализованны
е
..долгие/краткие/сверхкраткие/беглые
..долгие/среднедолгие/краткие/сверхкратки
е
..общая схема монофтонгов
...различия по ряду
....в нижнем подъеме
.....отсутствуют
.....передний/средний
.....передний/задний
.....средний/задний
.....передний/средний/задний
....в верхнем подъеме
.....отсутствуют
.....передний/средний
.....передний/задний
.....средний/задний
.....передний/средний/задний
.....передний/средне-передний/среднезадний/задний
...различия по лабиализации
....отсутствуют
....в переднем ряду
....в среднем ряду
....в заднем ряду
....в переднем и среднем ряду
....в переднем и заднем ряду
....в среднем и заднем ряду
....во всех рядах
...различия по напряженности
....в переднем и заднем ряду
...различия по назализации
....во всех рядах
....в переднем и заднем ряду
3
70 ....в среднем и заднем ряду
71 ...различия по фарингализации
72 ....во всех рядах
3. Список романских языков в Базе данных «Языки мира»:
1. Арагонский 2. Галисийский 3. Гасконский 4. Еврейско-испанский 5. Итальянский 6.
Испанский 7. Латинский 8. Португальский 9. Провансальский 10. Ретороманский 11.
Румынский 12. Старофранцузский 13. Франкопровансальский 14. Французский
Первые попытки “intelligent data mining”: пилотные квантитативные эксперименты
Первые попытки использовать БД для решения квантитативных задач были сделаны
самими создателями БД в Институте языкознания РАН, в частности, сотрудниками Сектора
прикладной лингвистики под руководством
созданы программы, разработаны
д.ф.н. А.И.Новикова.
Так, например,
были
методики и проведены эксперименты по установлению
близости языков по некоторым признакам в пределах нескольких групп и семей, в том числе
германских и романских (2003-2005гг).
ЭКСПЕРИМЕНТ 1. Определение близости языков в пределах семьи относительно одного
из заданных языков. Результаты приводятся выборочно для того, чтобы показать их
неоднородность:
Латинский (исходный язык, относительно которого по убыванию располагаются языки в
соответствии с количественными показателями близости)
Экспертный список № 1.
Румынский
Ретороманский
Португальский
Провансальский
Итальянский
Французский
Старофранцузский
Еврейско-испанский
Испанский
Галисийский
Франкопровансальский
Гасконский
Арагонский
4
Латинский (исходный язык, относительно которого по убыванию располагаются языки в
соответствии с количественными показателями близости)
Экспертный список № 2.
Итальянский
Испанский
Еврейско-испанский
Галисийский
Арагонский
Португальский
Румынский
Гасконский
Провансальский
Франкопровансальский
Ретороманский
Французский
Испанский (исходный язык, относительно которого по убыванию располагаются языки в
соответствии с количественными показателями близости)
Экспертный список № 1.
Еврейско-испанский
Галисийский
Итальянский
Старофранцузский
Португальский
Провансальский
Ретороманский
Румынский
Латинский
Французский
Арагонский
Гасконский
Франкопровансальский
Испанский (исходный язык, относительно которого по убыванию располагаются языки в
5
соответствии с количественными показателями близости)
Экспертный список № 2.
Арагонский
Галисийский
Португальский
Гасконский
Итальянский
Провансальский
Ретороманский
Румынский
Франкопровансальский
Старофранцузский
Французский
Латинский
Испанский (исходный язык, относительно которого по убыванию располагаются языки в
соответствии с количественными показателями близости)
Экспертный список № 3.
Еврейско-испанский
Галисийский
Португальский
Арагонский
Гасконский
Провансальский
Франкопровансальский
Итальянский
Старофранцузский
Французский
Ретороманский
Румынский
Французский (исходный язык, относительно которого по убыванию располагаются языки
в соответствии с количественными показателями близости)
Экспертный список № 1.
Португальский
Ретороманский
6
Еврейско-испанский
Провансальский
Латинский (мертвый)
Старофранцузский
Франкопровансальский
Арагонский
Итальянский
Румынский
Испанский
Гасконский
Галисийский
Французский (исходный язык, относительно которого по убыванию располагаются языки
в соответствии с количественными показателями близости)
Экспертный список № 2.
Франкопровансальский
Старофранцузский
Провансальский
Итальянский
Гасконский
Ретороманский
Арагонский
Португальский
Галисийский
Испанский
Еврейско-испанский
Румынский
Французский (исходный язык, относительно которого по убыванию располагаются языки
в соответствии с количественными показателями близости)
Экспертный список № 3.
Португальский
Ретороманский
Еврейско-испанский
Провансальский
7
Латинский (мертвый)
Старофранцузский
Франкопровансальский
Арагонский
Итальянский
Румынский
Испанский
Гасконский
Галисийский
Полученные результаты отражают начальный уровень интереса к возможностям
компьютерной обработки значительных массивов лингвистической информации, а также
ограниченные в то время самостоятельные возможности лингвистов (д.ф.н. А.И.Новиков
и к.т.н. Ю.П.Скокан) в области
проводившихся
экспериментов,
программного и информационного
При
этом
полученные
обеспечения
результаты
оказались
неожиданными с точки зрения лингвистов – специалистов по этим языкам.
Тем не менее, с точки зрения оценки прикладных возможностей системы эти
результаты оказались чрезвычайно полезны. Они позволили выявить ряд ограничений и
ошибок,
связанных как с методикой проведения эксперимента, так и с форматом
представления информации.
Степень изученности и глубина описания отдельных языков в виде статей
энциклопедии вызвала необходимость создания нескольких типов моделей реферата (I –
IV) на основе минимальных и максимальных парадигм признаков и характеристик –
разделов в модели, уровней иерархии в позициях и количестве строк в позициях.
В своё время в рамках отдельно взятых естественных языков сложились различные
традиции их описания. С одной стороны, эти традиции в той или иной мере
способствовали формированию структурного подхода к описанию языков разного типа. С
другой стороны, экстраполяция
грамматических традиций и использование их для
описания языков, не имеющих морфологии (например, китайского, собственные
грамматические традиции которого могли бы эффективно использоваться при описании
морфологических языков), может приводить к «информационным конфликтам». Так, в
частности,
парадигматический
принцип,
положенный
в
основу
формализации
оригинальных текстов энциклопедии «Языки мира», стал причиной того, что уровень
полноты описания языков в БД начал претерпевать изменения как в сторону потери
информации (в случае неполной формальной парадигмы), так и в сторону ее «прироста»,
т.е. переописания (образования артефактов в силу избыточной формальной парадигмы).
8
Сказанное можно проиллюстрировать с помощью компьютерного эксперимента по
сопоставлению арагонского и португальского языков.
Компьютерный эксперимент попарного сопоставления языков португальский –
арагонский (фрагмент)
Анализ
результатов
возможности
первых
использовать
дальнейших
экспериментов подвел создателей БД к идее о
накапливаемый массив описаний языков мира
теоретических
и
экспериментальных
исследований
в
для
области
компаративных, типологических и др. лингвистических исследований. Так, в частности, с
помощью демонстрационной версии программы сопоставления языков (МИСИС)
Секторе
прикладного
языкознания
были
проведены
и
эксперименты по возможностям парного сопоставления языков.
Выделение – наличие в обоих языках
Выделение – наличие только в португальском
25
20
25
21
25
22
25
23
25
24
25
25
25
26
25
27
25
28
25
29
25
30
25
31
25
32
25
33
25
34
25
2.3.6.ДЕЙКТИЧЕСКИЕ КАТЕГОРИИ
.О
.местоимения и местоименные слова
..разряды местоимений
...адвербиальные
...анафорические
...атрибутивно-указательные
...безличные
...взаимные
...взаимно-возвратные
...взаимно-личные
...взаимно-притяжательные
...возвратные
....инклюзмвность/эксклюзивность
....субъектно/объектные
...возвратно-выделительные
оценены
в
компьютерные
9
35
25
36
25
37
25
38
25
39
25
40
25
41
25
42
25
43
25
44
25
45
25
46
25
47
25
48
25
49
25
50
25
51
25
52
25
53
25
54
25
55
25
56
25
57
25
58
25
59
25
60
...возвратно-определительные
...возвратно-относительно-неопределенные
...возвратно-отрицательные
...возвратно-притяжательные
...возвратно-указательные
...возвратно-усилительные
...вопросительные
...вопросительно-относительные
...выделительные
...глагольные
...качественные
...кванторные
...количественные
...косвенно-объектные
...личные
....инклюзивность/эксклюзивность
....различия по полу во всех лицах
....субъектные/объектные
...лично-возвратные
...личные единичности
...лично-определенные
...лично-определительные
...лично-притяжательные
...личные косвенного объекта
...личные прямого объекта
10
25
61
25
62
25
63
25
64
25
65
25
66
25
67
25
68
25
69
25
70
25
71
25
72
25
73
25
74
25
75
25
76
25
77
25
78
25
79
25
80
25
81
25
82
25
83
25
84
25
85
25
...личные субъектные
...лично-указательные
...неопределенные
...неопределенно-личные
...неопределенно-отрицательные
...неопределенно-обобщающие
...обобщительные
...обобщительно-определительные
...обобщительно-отрицательные
...ограничительные
...определенные
...определительные
....инклюзивность/эксклюзивность
...определительно-притяжательные
...определительно-разделительные
...определительно-указательные
...относительные
...относительно-вопросительные
...отрицательные
...послеложные
...послеложно-личные
...предложные
...притяжательные
....инклюзивность/эксклюзивность
...притяжательно-атрибутивные
...притяжательно-предикативные
11
86
25
87
25
88
25
89
25
90
25
91
25
92
25
93
25
94
25
95
25
96
25
97
25
98
25
99
26
00
26
01
26
02
26
03
26
04
26
05
26
06
26
07
26
08
26
09
26
10
26
11
...притяжательно-субстантивные
...проклитические
...разделительные
...собирательные
...соотносительные
...сравнительно-указательные
...счетно-личные
...уважительные
...указательные
...указательно-качественные
...указательно-количественные
...указательно-локативные
...указательно-определительные
...указательно-относительные
...указательно-репрезентативные
...уподобительные
...усилительно-личные
...эмфатические
...энклитические
...местоимения тождества
..квазиместоимения
..местоименные наречия
..местоименные предлоги
..местоименные прилагательные
..местоименные существительные
12
26
12
26
13
26
14
26
15
26
16
26
17
26
18
26
19
26
20
26
21
26
22
26
23
26
24
26
25
26
26
26
27
26
28
26
29
26
30
26
31
26
32
26
33
26
34
26
35
26
36
26
..местоименные энклитики
.дейктический статус
..указательные местоимения
...ближний план/дальний план
...верхний план/нижний план
...верхний план/средний план/нижний план
...горизонтальность/вертикальность
...ближний план/средний план/дальний
план
...ближний/средн.ближний/средн.дальний/
дальн.план
...видимый план/невидимый план
...движущийся/неподвижный объект
...непоср.близ./ближн.план/дальн.план/знач
.дальн.
...открытость/закрытость пространства
...пологость/отвесность
...полож.перед говорящим/полож.сбоку от
говорящ.
...протяженность/непротяженность
...сфера говорящего/собеседника
...сфера слушающего/говорящего/3-его
лица
..личные местоимения 3 лица
...верхний план/нижний план
..глагольные превербы
...вертик.план/накл.план/пологий
план/гориз.план
...к говорящ./от говорящ./вверх/вниз
...сфера гов.собесед./нейтр./ближ.план/дальн.пл.
..именные аффиксы
...ближний план/дальний план
13
37
26
38
26
39
26
40
26
41
26
42
26
43
26
44
26
45
26
46
26
47
26
48
26
49
26
50
26
51
26
52
26
53
26
54
26
55
26
56
26
57
26
58
26
59
26
60
26
61
26
62
...ближний план/средний план/дальний
план
...вверх по течению/вниз по течению
...вверх/вниз/наклонно/полого/поперек/вдо
ль
...вертикальная/горизонтальная ориентация
...внизу/впереди/сверху/вблизи
...внутренний план/внешний план
...внутри/в среде/на/вблизи/около
...верхний план/боковой план/внутренний
план
...наравне/выше/ниже
...сфера говорящего/собеседника
..местоименные наречия
...ближний/средний/дальний
...здесь/по эту сторону/там/туда/где 3-е л./
см.F4
...здесь/там/всюду
...здесь/там/где
...здесь/там/где/туда/сюда/куда/на/за/подле
cм.F4
...покой/удаление/приближение
...почему/который/где/когда
...сверху/снизу/вверх/вниз/наверху/внизу
...сверху/снизу/внутри/снаружи/вдалеке
...статич.план/направительн.план/переходн
ый план
..послелоги
...рядом/сзади
...верх/бок
...вместе/при/в
промеж./опоср./через/сквозь/ см.F4
14
26
63
26
64
26
65
26
66
26
67
26
68
26
69
26
70
26
71
26
72
26
73
26
74
26
75
26
76
26
77
26
78
26
79
26
80
26
81
26
82
26
83
26
84
26
85
26
86
26
87
26
...внутри/сбоку/около
...внутри/снаружи/верх/низ
...ради
...ради/вдоль/на
...раньше/в течение
...выше/ниже/слой/у/под/сбоку/вне/внутри
..пространственные наречия
...видимый план/невидимый план
...верх/низ/внутри/около/перед
...внутри/снаружи
..темпоральные наречия
...вчера/ночью/сейчас/до сих пор/сначала/
см. F4
...сегодня/вчера/теперь/тогда
...сейчас/тогда/сегодня/завтра/на след.день/
см.F4
..наречия образа действия и прочие
...снова/полностью/друг за другом/по
одному/зачем
...так/сразу/вдруг/зачем/очень
..предлоги
...без/вместо/посредством/после/следом
...вниз/к
лицу/исход/цель/вместе/причина/переход
...возле/сзади
...голова/на верх чего-либо/с чего-либо
...из/до/через/по/для/от
...место/направление/предел/совместность/
отсутстви
...сквозь/внутри/вместе/по ту сторону/
см.F4
...основные/изафетные
15
88
26
89
26
90
26
91
26
92
26
93
26
94
26
95
26
96
26
97
26
98
26
99
27
00
27
01
27
02
27
03
27
04
27
05
27
06
27
07
27
08
27
09
27
10
27
11
27
12
27
13
...совместности
..частица
...сфера говорящего/собеседника/3-го лица
.грамматическая категория лица
..отсутствует
..в имени
...предикативные аффиксы
...предназначительные аффиксы
...притяжательные аффиксы
...согласование в лице объекта и субъекта
..в глаголе
...более чем двухличное спряжение
...отсутствует
...одноличное спряжение
....только в императиве
...двухличное спряжение
...более чем двухличное спряжение
...личное/лично-классное
...местоименные аффиксы
.эмфаза
..в имени
...морфологическое выражение
...синтаксическое выражение
..в глаголе
..в указательных местоимениях
16
27
14
27
15
27
16
27
17
27
18
27
19
27
20
27
21
27
22
27
23
27
24
27
25
27
26
27
27
27
28
27
29
27
30
27
31
27
32
27
33
27
34
27
35
27
36
27
37
27
38
27
...морфологическое выражение
...синтаксическое выражение
.пространственная ориентация действия
..выражение
...адвербы
...адъективы
...глагольные превербы
....по течению/против течения
....через препятствие/сквозь препятствие
....наружу/изнутри
....вверх/вниз
...глагольные суффиксы
...дирекционалы
...локализация
...местные деепричастия
...местоименные наречия
...наречия
...наречия-послелоги
...порядок слов
...послелоги
...поствербы
...предлоги
...пространственные падежи
...служебные имена
...указательные местоимения
...частицы
17
39
27
40
27
41
27
42
27
43
27
44
27
45
27
46
27
47
27
48
27
49
27
50
27
51
27
52
27
53
27
54
27
55
27
56
27
57
27
58
27
59
27
60
27
61
27
62
27
63
27
64
.определенность/неопределенность имени
..актантно-предикатное согласование
..артикли
...присоединяемые
...свободные
..именные аффиксы
..местоимение с ущербной парадигмой
..определенная/неопределенная форма
существит.
..определенное/неопределенное спряжение
глагола
..особая глагольная форма
..особая падежная форма
..особая форма классного показателя
..порядок слов
..послелоги
..предлоги
..реализация в сентенциальном синтаксисе
..синтаксическое выражение
...безличными местоимениями
...личными местоимениями
...направительным послелогом
...наречием
...неопределенным местоимением
...определительными местоимениями
...относительными местоимениями
...прилагательным
18
27
65
27
66
27
67
27
68
27
69
27
70
27
71
27
72
27
73
27
74
27
75
27
76
27
77
27
78
27
79
27
80
27
81
27
82
27
83
27
84
27
85
27
86
27
87
27
88
27
89
27
...притяжательными местоимениями
...причастием
...указательными местоимениями
...числительным
..реализация в сентенциальном синтаксисе
..частицы
..числительное с ущербной парадигмой
.формы вежливости
..в именной группе
...гонорифические показатели
множественности
...классный показатель
...показатели вежливости
...препозитивн.пок.для
обозн.высокопост.лиц см.F4
...служебные слова
..в глагольной группе
...адрессив
....нейтральный/вежливый
....нейтральный/вежливый/фамильярный
...гоноратив
....субъектный/объектный
....субъектный/объектный/императорский
...показатели вежливости
..в квазиместоимениях
..в местоимениях
..в сентенциальном синтаксисе
...гонорифические конструкции
19
90
27
91
27
92
27
93
27
94
27
95
27
96
27
97
27
98
27
99
28
00
28
01
28
02
28
03
28
04
28
05
28
06
28
07
28
08
28
09
28
10
28
11
28
12
28
13
28
14
28
15
...модально-экспрессивные частицы
.фокус
..сфера применения
...в глаголе
...в имени
..способ выражения
...показатели контрастивности
...служебные слова
....ограничители
...тематическо-рематические показатели
.отрицание
..именное = глагольному
..именное >< глагольному
..выражение в прилагательных
..лексическое
...нейтральное/категорическое
..морфологическое
...запретительные аффиксы
...отрицательные аффиксы
..синтаксическое
..позиция отрицательного показателя
...инкорпорация
...обрамление
...постпозиция
...препозиция
20
28
16
28
17
28
18
28
19
28
20
28
21
28
22
28
23
28
24
28
25
28
26
28
27
.единичность/множественность
..морфологическое выражение
.единичность/общность
..морфологическое выражение
.контрастивность
..в имени
...морфологическое выражение
..в глаголе
...морфологическое выражение
.референтность/нереферентность имени
..артиклевые формы
..именные аффиксы
Интерпретация результатов (общая):
1. Количество присутствующих признаков в португальском языке - 362
2. Количество присутствующих признаков в арагонском языке - 244
3. Количество совпадений – 3211
4. Количество несовпадений - 216
5. Близость рассчитывалась попарно, единообразно по всем позициям и строкам модели,
без учета типа информации – фактографическая или классифицирующая.
6. Близость рассчитывалась без учета глубины информации, т.е. на основании
разнотипного описания языков (см. типы статей I-IV), тогда как португальский описан
по модели наиболее полного типа I, а арагонский – по минимальному типу
IV,
поскольку в традиционном энциклопедическом описании этот язык определяется как
Арагонский язык/диалект.
УНИВЕРСАЛИИ, ФРЕКВЕНТАЛИИ, РАРИТАРИИ И УНИКАЛИИ
В лингвистике в последнее время стала бурно развиваться типология так
называемых абсолютных универсалий, т.е. явлений и свойств, характерных для всех
естественных языков. В современной лингвистической типологии преобладает концепция
21
универсальности синтаксиса и семантики, без которых не может существовать ни один
естественный язык, хотя подобное возможно для морфологии и фонетики.
Так, была высказана идея о возможности выделения формально совпадающих
классов языковых явлений любого уровня языка в виде универсалий, фреквенталий,
раритарий и уникалий.
Эксперимент проводился в двух основных направлениях – по материалам на основе
традиционного описания в энциклопедии «Языки мира. Романские языки» (А.К.Зотова) и
в виде
компьютерного эксперимента по определению количественных показателей
отнесенности явлений к определенному формальному классу (Е.И.Ярославцева).
Многомерность описания, характер и объем информации вызвали необходимость
выработать основные принципы выделения формально совпадающих языковых явлений, в
частности:
- проводить анализ последовательно по всем позициям реферата для всего ряда
выбранных языков
- учитывать качественную неоднородность информации, содержащейся в модели –
фактографическая/классифицирующая информация
Список романских языков в энциклопедии «Языки мира. Романские языки».
1. Арагонский язык/диалект 2. Арумынский язык/диалект 3. Астурийский язык 4.
Галисийский язык 5. Гасконский язык/диалект 6. Диалекты Италии 7. Еврейско-испанский
(Сефардский)
язык
8.
Испанский
язык
9.
Истророманский
язык/диалект
10.
Истрорумынский язык/диалект 11. Итальянский язык 12. Каталанский язык 13.
Корсиканский язык/диалект 14. Ладинский язык 15. Меглено-румынский язык/диалект 16.
Окситанский язык 17. Португальский язык 18. Ретороманский язык
19. Румынский язык
20. Сардинский язык 21. Старофранцузский язык 22. Франкопровансальский язык 23.
Французский язык
24. Фриульский язык
ФАКТОРЫ, ОПРЕДЕЛЯЮЩИЕ НАЛИЧИЕ И ВОЗМОЖНОСТЬ
КЛАССИФИКАЦИИ УНИВЕРСАЛИЙ, ФРЕКВЕНТАЛИЙ, РАРИТАРИЙ И
УНИКАЛИЙ:
1. Романские языки генетически восходят к латинскому языку.
1.1. Непосредственный источник – народная латынь (устная речь романизованного
населения на территориях в составе Римской империи).
1.2. Функциональная нагрузка: разговорная речь sermo vulgaris/ sermo plebeus,
повседневная речь sermo cotidianus, деревенская речь sermo rusticus противопоставляется
22
литературному латинскому языку классического периода.
2. Редкий случай формирования языковой группы в исторически обозримый и вполне
определенный период.
3. Основой является относительно хорошо документированный
язык-источник.
4. Территориальная дифференциация латыни: местные особенности живой речи в
провинциях за пределами Апеннинского п-ва.
5. Типологическая природа: романские языки - языки номинативного строя,
соответствующие общему представлению о развитых европейских языках.
6. Давняя и авторитетная исследовательская традиция, в том числе в области
сравнительно-исторического
и
типологического языкознания.
7. Структурные совпадения и расхождения, обусловленные социолингвистическими
факторами:
7.1. время завоевания данной области Римом в связи с этапами развития латыни
7.2. время изоляции романизованных областей от Центральной Италии в период
распада Римской империи
7.3. степень интенсивности политических, экономических и культурных контактов
области с Центральной Италией и соседними романскими ареалами
7.4. Способ романизации: «городской» - школа, администрация, приобщение местной
знати к римской культуре; «сельский» - колонии латинских и италийских поселенцев, в
основном бывших воинов-легионеров
7.5. Характер
субстрата
и
степень
его воздействия (сильная/слабая)
7.6. Характер суперстрата (германский/не германский) и степень его воздействия
7.7. Характер адстратов и степень их воздействия
8. Внутриязыковые тенденции и специфика их проявления в каждой
романизованной, области.
Принципы отбора языков для сравнения в эксперименте с учетом ошибок
предыдущих экспериментов:
1. По типу схем описания в энциклопедии (параметры схем I-IV) с целью
нивелировать расхождения, снизить уровень фактических ошибок, вызванных
формальными причинами.
2. По структурным показателям (позиции 2.1.1., 2.3.0. и др.)
3. На основании функциональной близости:
3.1. Сферы коммуникации
3.2. Диалекты ↔ литературный язык в Италии
23
3.3. диалекты и группы языков по ареалам:
3.3.1. северо-итальянские диалекты с галло-романскими языками
3.3.2. южно-итальянские диалекты с сардинским
3.3.3. южно-итальянские диалекты с румынским (по некоторым
позициям)
Вывод 1.
Главным положительным аспектом формальных классификаций является то, что
они позволяют сочетать, а в некоторых случаях нивелировать различия иных способов
классификации.
Вывод 2.
Классификации на основании структурных признаков оказываются не
одномерными, поскольку противопоставляемые по одним признакам языки оказываются
объединенными по другим.
Вывод 3.
Наиболее распространенная и приемлемая классификация сочетает типологические
основания с критериями географической и культурной близости ареалов. При этом в
выделяемых подгруппах есть языки, образующие ядро подгруппы, и т.н. «языки-мосты»,
сочетающие в себе характеристики нескольких групп.
Отсюда:
Возможен относительный характер некоторых формально совпадающих классов
явлений в языках, сопоставляемых по разным векторам и/или их закономерные взаимные
переходы по мере смены вектора описания. Универсалии, фреквенталии, раритарии и/или
уникалии могут меняться местами?
ВЕКТОР 1. Западная и Восточная Романия - классификация, сочетающая
типологические основания с критериями географической и культурной близости
ареалов.
ВОСТОЧНО-РОМАНСКИЙ (БАЛКАНО-РОМАНСКИЙ) АРЕАЛ
Румынский язык
Малые балканские (южно-дунайские ) языки:
Арумынский
Мегленорумынский
Истро-румынский
ЗАПАДНО-РОМАНСКИЙ АРЕАЛ
Иберо-романская подгруппа:
24
Испанский
Португальский
Галисийский
Еврейско-испанский
Арагонский
Астурийский
Каталанский - мост, близкий к галлороманским языкам (особенно к
Окситанскому).
Галло-романская подгруппа:
Французский
Окситанский
Франкопровансальский
Гасконский - мост, рассматриваемый иногда как диалект окситанского и имеющий
совпадения с иберо-романскими языками (арагонским, каталанским, частично испанским)
Пиренейская подгруппа (иногда выделяемая как самостоятельная):
Окситанский
Гасконский
Каталанский
_
Арагонский
Итало-романская подгруппа (достаточно разнообразные идиомы):
Литературный итальянский язык
Северные диалекты Италии
Центральные диалекты Италии
Южные диалекты Италии
Сардинский
Корсиканский
Фриульский
Ладинский
Истро-романский
Периферийная архаичная южная зона (особо оговаривается):
Сардинский
Корсиканский
Диалекты Крайнего Юга Италии
25
Далматинский (мертвый) - мост между итало-романской и балкано-романской
подгруппами
Ретороманская подгруппа
(ранее выделявшаяся как структурное единство и
считавшаяся переходной между галло-романской и итало- романской и шире как
переходная между восточными и западными языками Романии, теперь
- диалекты
Руманшской Швейцариии)
Ретороманский Швейцарии
Фриульский (ранее)
Ладинский (ранее)
Балкано-романская подгруппа:
Румынский
Малые балканские языки (южно-дунайские):
Арумынский
Мегленорумынский
Истрорумынский
ВЕКТОР 2 . Классификация, основанная на диахронических переходах, но не
учитывающая современного состояния РЯ. (Противопоставление: Romania continua Романия непрерывная или центральная и Romania discontinua - Романия обособленная,
периферийная, маргинальная).
Степень структурной близости соседствующих языков менялась на протяжении
истории: старо-каталанский и старо-окситанский были структурно ближе друг к другу,
чем современные каталанский а окситанский.
Старофранцузский был по многим параметрам ближе к западно-романским языкам,
чем современный французский.
Попарное сопоставление языков на основании нескольких различительных
признаков позволило выделить наиболее «центральные» (итальянский) и наиболее
«периферийные» (сардинский и румынский языки).
ВЕКТОР 3.
Структурно-типологические
основания
для выделения
формально совпадающих классов явлений.
Романские языки относятся к флективно-аналитическим языкам. Тенденции к
аналитизму наиболее выражены в системе имени устной форме французского языка.
Роль флексий значительнее в балкано-романских языках.
26
Генетическое родство РЯ обусловило достаточную близость в универсалиях
(для удобства весь иллюстративный материал приводится с указанием позиций как в
тексте энциклопедии, так и в модели реферата):
1.4.0. письмо: строчные и прописные буквы (отсутствуют в модели реферата)
2.3.5. сходны категориальные значения глагольных наклонений
2.3.6. дейктические категории (наилучший раздел отражающий генетическое родство
языков)
Можно предположить, что положительный результат в данном случае связан с
наибольшей универсальностью типологических категорий (в отличие от фонетики и
фонологии, где различия наиболее контрастны).
2.3.7. ЧАСТИ РЕЧИ
Знаменательные
Существительное
Прилагательное
Глагол (личные и неличные формы)
Наречие
Числительное
Местоимение
Служебные
Артикль
Предлог
Союз
Междометие
2.5.3. в качестве нейтрального преобладает порядок слов SVO; утвердительные,
вопросительные и восклицательные предложения
2.5.4. типы придаточных более или менее совпадают; возможность сочетания
сочинительной и подчинительной связи в сложном предложении
Универсалии, выделяемые только на основе традиционного описания (по тексту
энциклопедии «Языки мира») и отсутствующие в базе данных «Языки мира»
ДИАХРОННЫЙ универсализм
вокализм: четыре основных типа перехода от классической латыни к
поздней народной латыни)
западно-романский
«румынский»
«сардинский»
«сицилийский»
27
изменения, восходящие к народной латыни:
- дефонологизация признака долгота/краткость
- закрепление долготы за ударным гласным
- перераспределение и
закрепление тембровых и количественных признаков (
краткость + открытость; долгота + закрытость)
- совпадение смежных по ряду фонем
- стяжение дифтонгов
консонантизм: изменения от латыни к РЯ (обще-романские):
палатализация и как следствие:
- образование аффрикат С и G перед гласными переднего ряда Е и I
(кроме сардинского и далматинского)
- группы СJ, GJ, DJ, Т перед гласными:
- упрощение аффрикат и образование спирантов
- образование мягких согласных
- лениция (фрикативизация) интервокальных согласных с:
выпадением согласных
замолканием конечных согласных
- появление новых (вторичных) конечных согласных в связи с замолканием
конечных гласных (непроизносимых, но сохранившихся в написании)
французский
каталанский
северо-итальянские диалекты
2.3.0. МОРФОЛОГИЧЕСКИЙ ТИП ЯЗЫКА
В целом, формирование морфологического типа Р.Я. двигалось от синтетизма к
аналитизму. Лидером движения стал французский, в котором произошло расхождение
норм устной
грамматических
и письменной структур языка.
форм
В устной
речи
большинство
выражается не морфологически, а с помощью служебных
частей речи. Произносимых флексий мало, и они грамматически полисемантичны. В
письменном французском часть флексий сохраняется (число и род существительных,
личные флексии глаголов).
Остальные Р.Я. можно отнести к флективно-аналитическому типу. Степень
флективности выше в балкано-романских
морфемы чаще объединяют
языках и в итальянском, где грамматические
несколько категориальных значений (число и род имени в
28
итальянском,
число, род и падеж в румынском) и где также велика роль внутренних
флексий.
2. 3. 1. КРИТЕРИИ ВЫДЕЛЕНИЯ ЧАСТЕЙ РЕЧИ
Категориальные способы выражения универсальных значений (инновации народной
латыни относительно классической, составляющие основу всех романских языков):
2.3.2. СУЩЕСТВИТЕЛЬНОЕ И МЕСТОИМЕНИЕ:
А) сокращение типов склонений с пяти до трех;
В) сокращение падежной парадигмы
С) исчезновение среднего рода
Б) рост частотности употребления указательных местоимений в
указательной функции
Е) возрастание частотности употребления предложных конструкций
вместо падежных форм
2.3.5. ГЛАГОЛЬНЫЕ КАТЕГОРИИ: (инновации народной латыни относительно
классической, составляющие основу всех романских языков):
- использование перфективно-результативных перифраз с глаголами
«иметь» и «быть» вместо простого перфекта
- исчезновение формы будущего времени и замена ее перифраз модального характера
- утрата синтетического пассива
- смещение временного или модального значения
форм плюсквамперфекта
индикатива или конъюнктива
- исчезновение всех форм инфинитива, кроме активного инфинитива настоящего времени,
а также супина, герундия и герундива, кроме аблативной формы
последнего.
СИНХРОННЫЕ универсалии, фреквенталии, раритарии и уникалии
2.1.1. в современных РЯ вокализм весьма сходен:
гласные противопоставлены
признакам:
ряд
подъем
тембр (открытые/закрытые)
не фонологизированы:
румынский
испанский
по
следующим
29
арагонский
астурийский
логудорский диалект сардинского
южнокорсиканские диалекты
фонологизированы частично:
только среди гласных среднего подъема
исчезающие оппозиции
французский
долгота
не фонологизирована:
определяется характером слога
итальянский
обусловлена позиционной сочетаемостью
французский
закреплена за отдельными фонемами
французский
фонологизирована на фонемном уровне:
только во фриульском
некоторые диалекты Северной Италии
реликт во французских диалектах
Бельгийский французский
Канадский французский
назальность
наличие подсистем носовых гласных
французский
португальский
тенденция к назализации прослеживается
галло-итальянские диалекты
отдельные зоны
окситанский
франкопровансальсикй
корсиканский
сардинский
дифтонги
бифонемные сочетания гласного с полугласным/полусогласным
французский и др.
«истинные» монофонемные
30
восходящие
только в румынском
носовые
старофранцузский
португальский (обусловлены позиционно)
трифтонги
носовые
старофранцузский
португальский (обусловлены позиционно)
- система безударного вокализма:
число фонем в безударной
позиции меньше, чем в ударной во всех языках, кроме
испанского
румынского
- в конечной позиции количество возможных фонем сокращается
еще больше
- замолкание конечных гласных (см. согласные)
- противопоставление открытость/закрытость исчезает
итальянский
- слияние в архифонему
окситанский
- появление неясных редуцированных гласных
португальский
каталанский
южноитальянские диалекты
- полная редукция
португальский
- беглая «немая» фонема
французский
- переход в нейтральный гласный всех/почти всех гласных
некоторые ареалы Южной Италии
- ограниченное число безударных фонем в конечной позиции:
итальянский
каталанский
31
галисийский
португальский
окситанский
расхождения в системе консонантизма:
состав серий:
аффрикаты
фрикативные
палатальные
носовые
боковые
ПРИЧИНЫ, ОБЪЕМ И УРОВЕНЬ РАСХОЖДЕНИЙ, ПРИВОДЯЩИХ К ПОГРЕШНОСТЯМ
В ФОРМАЛЬНЫХ ОЦЕНКАХ:
2.1. Полнота описания (типы статей см. выше)
2.2. Традиции описания:
2.2.1. использование общих наименований и терминов, принятых в
описаниях
конкретных языков (названия парадигмы глагольных времен)
2.2.2. предпочтение
терминов, принятых в описании романских языков («метафония» как
изменение тембра корневого гласного в зависимости от качества последующего гласного вместо
«умлаут»). Метафония вообще шире, чем умлаут («палатальная перегласовка» в германских языках):
не только подъем, но любое качество, не только корневого, но любого (аффиксальных) гласного.
ДИСКУССИОННЫЕ ВОПРОСЫ:
1. Классификация романских языков
2. Соотношение язык/диалект
3. Влияние субстратов и адстратов
ПЕРСЕКТИВЫ
1. Масштабы и перспективы квантитативных исследований с использованием БД
впервые были оценены специалистами
смежных с ними
в области информационных технологий и
специальностей, в первую очередь статистиками и математиками. В
частности, были разработаны и предложены методы и специальные программы по целому
ряду направлений:
- Создание мер парной близости языков;
- Кластеризация языков на основе мер парной близости;
- Расчет квантитативных портретов по языковым семьям и ветвям;
32
- Выявление статистических закономерностей в динамике грамматических
признаков, построение моделей языкового разнообразия;
- Разработка новых методов верификации генетических гипотез.
2.
Накопленный материал позволяет
использовать БД
для решения
самостоятельных задач в различных направлениях компаративных, типологических др.
исследований. В частности, перспективным оказывается
направление, связанное с
возможностями компьютерной обработки значительного объема информации, получившее
название корпусной лингвистики.
Соответствие информационного массива БД «Языки мира» понятию «корпус» по
основным параметрам:
1. корпус располагается на машинном носителе
2. корпус
имеет
стандартизованное
представление
материала,
позволяющее
использовать стандартные программы его обработки
3. корпус имеет компьютерную поддержку, а именно программы для обработки
данных
4. корпус имеет конечный характер
5. корпус репрезентативен
6. корпус обладает достаточной полнотой представления объектов
Скачать