Математические модели в лингвистике

advertisement
Родство языков
Глоттохронология
Математические модели
в лингвистике
12. Сравнительно-историческое языкознание
Мати Пентус, Александр Пиперски,
Алексей Сорокин
МГУ им. М. В. Ломоносова,
межфакультетский курс,
осенний семестр 2015–2016 учебного года
1 / 37
Родство языков
Глоттохронология
Зачёт
I
I
I
16 декабря, с 12:00 до 19:00
hp://lpcs.math.msu.su/~pentus/mfk2015/
A VYBOR STATJI K ZACHETU.html
hp://goo.gl/forms/PBY6kgiE7T
2 / 37
Родство языков
Глоттохронология
Родственные языки
I
I
Что такое родственные языки?
Ср. понятие родства в биологии
3 / 37
Родство языков
Глоттохронология
Понятие родства
I
I
I
Родство на синхронном уровне
выражается в виде сходства
Человек и горилла похожи, потому что
у них был общий предок
Украинский и русский язык похожи,
потому что у них был общий предок
5 / 37
Родство языков
Глоттохронология
Классификация: биология
Царство
Тип
Класс
Отряд
Семейство
Род
Вид
Животные
Хордовые
Млекопитающие
Приматы
Гоминиды
Люди
Гориллы
Человек Горилла
разумный западная
6 / 37
Родство языков
Глоттохронология
Классификация: лингвистика
(Макросемья)
(Ностратическая)
Семья
Индоевропейская
Ветвь
Балто-славянская
Группа
Славянская
Подгруппа
Восточнославянская
Язык
Украинский Русский
7 / 37
Родство языков
Глоттохронология
Классификация языков
Ethnologue.com: 152 семьи
I Afro-Asiatic (375)
I East New Britain (7) [Папуа — Новая
Гвинея]
I Mascoyan (6) [Парагвай]
I Siouan-Catawban (14) [США, Канада]
I Algic (42) [Канада, США]
I …
8 / 37
Родство языков
Глоттохронология
Количество языков
~7000 языков
Проблемы:
I язык vs. диалект и появление новых
языков
I вымирание языков
I история описания и названия языков
(галла / оромо, кпелле / герзе,
черемисский / марийский, вотяцкий /
удмуртский)
9 / 37
Родство языков
Глоттохронология
Язык vs. диалект
I
I
I
Диалект — территориальная
разновидность языка
архангельский диалект, вологодский
диалект, рязанский диалект русского
языка
баварский диалект, саксонский диалект
немецкого языка
Как отличить язык от диалекта?
— Никак
10 / 37
Родство языков
Глоттохронология
Язык vs. диалект
I
I
I
I
Взаимопонятность
Самоидентификация
Стандартизация
Политика
11 / 37
Родство языков
Глоттохронология
Взаимопонятность?
Беларусь падала заяўку на правядзенне
чатырох матчаў футбольнага чэмпіянату
Еўропы-2020
12 верасня, Мінск. Асацыяцыя «Беларуская
федэрацыя футбола» падала ў УЕФА
афіцыйную заяўку на ўдзел у правядзенні
фінальнага этапу чэмпіянату Еўропы-2020
у Мінску, паведамілі карэспандэнту
БЕЛТА ў прэс-службе АБФФ.
12 / 37
Родство языков
Глоттохронология
Политика
I
I
Макс Вайнрайх (1894–1969):
Язык — это диалект, у которого есть
армия и флот
Ср. новейшую историю Югославии
13 / 37
Родство языков
Глоттохронология
Классификация языков
I
I
Предположим, что мы умеем выделять
языки
Как узнать классификацию языков,
если мы не имеем документированной
истории?
14 / 37
Родство языков
Глоттохронология
Классификация языков
I
I
I
Надо понять законы развития языков
Надо понять, могли ли изучаемые
языки иметь единого предка
Надо построить модель, которая
позволит по законам развития языков
перейти от единого предка к
наблюдаемому состоянию
15 / 37
Родство языков
Глоттохронология
1786: Jones, The Philologer Passage I
The Sanscrit language, whatever be its
antiquity, is of a wonderful structure; more
perfect than the Greek, more copious than
the Latin, and more exquisitely refined
than either; yet bearing to both of them a
stronger affinity, both in the roots of verbs
and in the forms of grammar, than could
possibly have been produced by accident;
16 / 37
Родство языков
Глоттохронология
1786: Jones, The Philologer Passage II
so strong indeed, that no philologer could
examine them all three without believing
them to have sprung from some common
source, which, perhaps, no longer exists.
There is a similar reason, though not quite
so forcible, for supposing that both the
Gothic and Celtick, though blended with a
very different idiom, had the same origin
with the Sanscrit; and the old Persian
17 / 37
Родство языков
Глоттохронология
1786: Jones, The Philologer Passage III
might be added to the same family, if this
were the place for discussing any question
concerning the antiquities of Persia.
[Jones 1798 (1786), 422–423]
18 / 37
Родство языков
Глоттохронология
Классические модели развития
языков
I
I
Август Шлейхер: древесная модель
[Schleicher 1863]
Иоганнес Шмидт: волновая модель
[Schmidt 1872]
19 / 37
Родство языков
Глоттохронология
Классические модели развития
языков
I
I
I
Дерево: языки делятся и затем
развиваются независимо
Волны: из эпицентров
распространяются инновации
Волны реалистичнее, но дерево
удобнее как модель
20 / 37
Родство языков
Глоттохронология
Изменения в языке
I
Поскольку язык избыточен, он может
передаваться из поколения в поколение
с искажениями ⇒ изменения в языке
Примеры изменений:
I
I
ж': > ж: в русском языке
утрата падежей в английском языке
21 / 37
Родство языков
Глоттохронология
Регулярные фонетические
соответствия
Русский Украинский
белый
білий
хлеб
хліб
дед
дід
вера
віра
22 / 37
Родство языков
Глоттохронология
Фонетические законы
I
I
I
Звук X переходит в Y в контексте C в
языке L в период времени T
ě > e в любом контексте в русском языке
~в 3-й четверти II тысячелетия н. э.
æ > ɔ после w в английском языке
около 1600 года (was, watch)
23 / 37
Родство языков
Глоттохронология
Реконструкция и классификация
I
Традиционная компаративистика: если
знать фонетические законы и
понимать историю морфологических
явлений, можно построить
реконструкцию и классификацию
24 / 37
Родство языков
Глоттохронология
Возможные двоичные деревья
I
I
Пусть языки делятся только надвое ⇒
двоичные деревья
Сколько двоичных деревьев
теоретически можно построить для
классификации 1, 2, 3, 4, … языков?
25 / 37
Родство языков
Глоттохронология
Задача
Язык A Язык B Язык C
милмайл
майлмин
майн
майн
мус
маус
маус
телтел
целтун
таун
цаун
хус
хаус
хаус
26 / 37
Родство языков
Глоттохронология
Сходства между родственными
языками
I
I
Гомология: черта, имевшаяся в
языке-предке
Гомопла́зия: черта, отсутствовавшая в
языке-предке и развившаяся
независимо в нескольких потомках
27 / 37
Родство языков
Глоттохронология
Построение дерева
I
I
I
Если мы равно допускаем гомологию и
гомоплазию, все деревья хороши
⇒ надо максимизировать гомологию и
минимизировать гомоплазию!
NB: всё это — в предположении, что у
нас есть реконструкция, а не только
сходства
28 / 37
Родство языков
Глоттохронология
Проблемы
I
I
Традиционный подход плохо
применим к малоизученным языкам
Нужны методы, требующие менее
глубокого анализа
29 / 37
Родство языков
Глоттохронология
Сходства в лексике
I
I
I
Моррис Сводеш (1909–1967):
100-словный список
Если в списках для двух языков
достаточно много похожих слов, эти
языки родственные
Чем больше похожих слов, тем ближе
родство
30 / 37
Родство языков
Глоттохронология
белый, большой, видеть, вода, все, глаз, говорить,
голова, гора, грудь, давать, два, дерево, длинный,
добрый, дождь, дорога, дым, есть, желтый, женщина,
жечь, жир, звезда, зеленый, земля, знать, зола, зуб,
идти, имя, камень, коготь, кожа, колено, кора, корень,
кость, красный, кровь, кто, кусать, лежать, летать, лист,
луна, маленький, много, мужчина, мы, мясо, нет,
новый, нога, нос, ночь, огонь, один, перо, песок,
печень, пить, плавать, полный, приходить,
птица, рог, рот, рука, рыба, семя, сердце, сидеть,
слово, слышать, собака, солнце, спать, стоять,
сухой, теплый, тот, ты, убивать, умирать, ухо,
хвост, холодный, хороший, человек, черный, что,
шея, этот, я, язык
31 / 37
Родство языков
Глоттохронология
Глоттохронология
I
I
Скорость выпадения слов из
100-словного списка: 14 слов за 1000 лет
(по Сводешу)
Сколько общих слов останется в двух
языках, разошедшихся 1000 лет назад?
2000 лет назад? …
32 / 37
Родство языков
Глоттохронология
Совпадения в 100-словном списке для
двух языков
n — время в годах c(n) — совпадения
r = 0, 86 — константа, показывающая
сохранность списка
n c(n)
n c(n)
1000 0.74
4000 0.30
2000 0.55
5000 0.22
3000 0.40
6000 0.16
c(n) = r2×n / 1000
33 / 37
Родство языков
Глоттохронология
Похожие слова
I
I
I
I
англ. much ~ исп. mucho 'много'
нем. Feuer ~ фр. feu 'огонь'
др.-греч. theós ~ лат. deus 'бог'
венг. fiú 'мальчик' ~ рум. fiu 'сын'
(фин.-уг. *poji ~ лат. filius 'сын')
34 / 37
Родство языков
Глоттохронология
Непохожие слова
I
I
I
англ. wheel ~ хинди cakkā 'колесо'
англ. horn ~ хинди sī̃g 'рог'
англ. sister ~ хинди bahan 'сестра'
35 / 37
Родство языков
Глоттохронология
Сходство слов
I
I
Регулярные соответствия улучшают
качество оценки сходства слов, но не
всегда известны
Иногда приходится ориентироваться
только на внешнее сходство
36 / 37
Родство языков
Глоттохронология
Вопросы
I
I
До какой глубины применим метод
глоттохронологии?
Как построить на его основании
дерево?
37 / 37
Родство языков
Глоттохронология
Jones, Sir W. 1798 [1786]. The third
anniversary discourse, delivered 2d
February, 1786: on the Hindus. Asiatick
Researches 1, 415–31.
Schleicher, August. 1863. Die Darwinsche
Theorie und die Sprachwissenscha –
offenes Sendschreiben an Herrn Dr. Ernst
Haeckel. Weimar: H. Böhlau.
Schmidt, Johannes. 1872. Die
Verwandtschasverhältnisse der
37 / 37
Родство языков
Глоттохронология
indogermanischen Sprachen. Weimar: H.
Böhlau.
37 / 37
Download