sem4Volkov-Rara

advertisement
Олег Волков (volkovolek@gmail.com), ВШЭ, 01.12.2014
 Не так давно, как изучение универсалий (на редкости иногда
предпочитали закрывать глаза)
 http://typo.uni-konstanz.de/rara/intro/index.php
 Несколько конференций и сборников 2000х годов (Rethinking
Universals: How Rarities affect Linguistic Theory [ed. Wohlgemuth,
Cysouw 2010]; Типологически редкие и уникальные явления на
языковой карте России (ИЛИ, 2010) и т. д.)
 Как изучать языковые редкости?
Как найти редкости? Что считать редкостями? Как с ними работать? и
т. д.
 Зачем изучать языковые редкости?
Редкости – как экспонаты кунсткамеры – интересно, но не полезно
для науки. Правда ли это?
 Как примириться с существованием языковых редкостей?
Редкости испортили нам всю картину. Как они вообще появляются?
Почему они возможны? Почему они редки?
 С точки зрения универсалий, редкость может быть
контрпримером к универсалии
 С точки зрения вариативности, редкость может быть
наименее вероятным вариантом параметра,
встречающимся в минимальном числе языков
 Редкость должна проявляться не во всех языках одной генетической
группы / одного ареала, а лишь в меньшинстве таких языков [Plank
2000]
Зачем нужна эта идея?
Она позволяет отсечь историю и социолингвистику (наши любимые
кликсы) и сконцентрироваться на типологии
Но появляются проблемы
 Индивидуальная редкость (individual, [Plank 2000]) – не
зависимая ни от чего единичная черта
 Нетривиальная комбинация тривиальных (независимых)
признаков – по сути, не является редкостью
Терминология:
 Rara (редкость) – rarissima (большая редкость)
 Absolute rara (независимая) – relative rara (внутри группы или
ареала) [Bickel, Nichols 2003]
 Singulare / nonesuch (крайняя степень редкости) [Plank 2000]
 Unicale / unique (крайняя степень редкости) [Wohlgemuth, Cysouw
2010]
 Количество редкостей может быть статистически значимым
(особенно если речь идёт об сумме всех редких вариантов одного
параметра)
 Rara ≤ 5% от всех языков, rarissima ≤ 1%; 1% – около 70 языков.
Если принять, что в мире около 350 языковых групп (по оценке
Драера), то в каждой пятой группе должно быть по языку с
одинаковой редкой чертой [Wohlgemuth, Cysouw 2010]
 Как найти языковые редкости?
 Увеличивать выборку
 Искать упоминания о редкостях в грамматических описаниях
 Если нашли редкость в языке, поищем в других языках ареала
 Используем больше данных экзотических языков
 Используем метод исчисления, чтобы примерно знать, что искать
(подходит не для всех параметров)
 Два случая ложных редкостей:
 После того как редкость нашли в одном языке, оказалось,
что она есть во многих языках
 Редкость оказывается нераспознанным или неправильно
описанным тривиальным грамматическим явлением
 Изучая редкости, мы больше понимаем о возможностях и
разнообразии человеческого языка, так как наблюдаем точки
экстремума
 Мы проводим грань между невозможным и маловероятным (на
самом деле это не совсем так)
Эти наблюдения не проходят проверку критерием Поппера о фальсифицируемости
 Принимая во внимание редкости, мы расширяем
существующие теории
 Мы подтверждаем имеющиеся теории
 Мы прослеживаем генетические связи между языками
 Мы изучаем диахронические процессы внутри одного
языка
Правда ли, что редкости – диахронически нестабильные?
 Почему языковые редкости редки?
 Почему языковые редкости вообще существуют?
Огромное число различных объяснений:
 Психолингвистические
Редкие варианты параметров плохо усваиваются детьми, сложно
порождаются, их нет в «языковой способности» и т. д.
 Социолингвистические и исторические
Всех носителей языков с редкими чертами завоевали и
ассимилировали
 Вероятностное
Подсчитывается вероятность различных диахронических сценариев
 «Так сложилось»
Хи-хи
 Пример психолингвистического объяснения: универсалии порядка
слов [Hawkins 1990]
 При бесконечном потенциале ветвления вершины её расположение
должно быть единообразно в разных составляющих одного языка.
Почему?
 Материнский узел составляющей – словоформа, однозначно
указывающая на категорию составляющей, куда она входит
 Область распознавания составляющей – цепочка словоформ от
материнского узла до узла с последним зависимым
 Принцип раннего распознавания составляющих: в любом
словосочетании более предпочтителен порядок слов, при котором
соотношение между количеством составляющих и слов в области
распознавания составляющих ближе к 100%
 Принцип раннего распознавания составляющих:
 I [introduced [to Mary] [some friends that John had brought to the
party]]
 I [introduced [some friends that John had brought to the party] [to
Mary]]
 Вершина должна быть с одной стороны, чтобы принцип не
нарушался
 Вероятностное объяснение [Harris 2010]: для наиболее редких
вариантов параметра необходимо наименее вероятное
диахроническое стечение различных факторов
 Пример 1: циркумфиксов в языках мира меньше, чем суффиксов и
префиксов, потому что нужно больше шагов, чтоб они
грамматикализовались
 Пример 2: в грузинском языке расщеплённая стратегия
маркирования ядерных актантов возникла в результате цепи
диахронических преобразований, которые редко встречаются в
одном языке
a. glex-i
tesavs simind-s.
peasant-NOM
sows:I corn-DAT
‘The peasant sows corn.’
b. glex-ma datesa
simind-i.
peasant-ERGsowed:II
corn-NOM
‘The peasant sowed corn.’
c. glex-s
dautesavs simind-i.
peasant-DAThas.sown:III corn-NOM
‘The peasant has sown corn.’ (adapted from Harris 1981: 1)
 В рамках «психолингвистического» подхода:
Неизвестно. В крайнем случае говорится, что общие принципы не
проявляются в конкретных языках
 В рамках «вероятностного» подхода:
Ничего не мешает им существовать, просто они маловероятны
 Психолингвистический подход не объясняет, почему редкости
вообще возможны. Почему они бывают стабильны и не исчезают.
Померить сложность усвоения каких-либо языковых структур не
всегда удаётся.
 Вероятностный подход не объясняет, почему OSV и OVS редко
встречаются
 Вывод: будем использовать все возможные подходы индивидуально
для каждого случая и наслаждаться красотой языковых редкостей
Download