Языковая сложность (language complexity) Дмитрий Сичинава [email protected] Общие черты направления Сложность (понимаемая по-разному) есть отдельный параметр языка / языковой системы Это количественно изменяемая (либо оцениваемая) мера Сложность участвует в объяснении некоторых феноменов языка и/ или сама объясняется: например, сложность связана с социальной историей языка Привлечение внимания к проблеме – статья Джона Макуортера (McWhorter 2001). Креольские языки «проще» старых из-за более короткой истории. Бурная дискуссия, № 5 «Linguistic Typology» за 2001. Ранее эти идеи высказывались, ср. [Perkins 1992], [Nichols 1992]. Русский обзор: [Бердичевский 2012]. Книга [Dahl 2004/Даль 2009] есть по-русски. Что такое сложность? Сложность (complexity) объективна, стоимость и трудность (cost and difficulty) субъективны (Dahl 2004; в несколько иных терминах Miestamo 2008) Сложность – количество элементов системы (Miestamo 2008), сложность в теоретико-информационном смысле (по Колмогорову): чем сложнее объект, тем длиннее его описание (1) 101010101010101010101010101010101010101010101010101010101010 (2) 110110110110110110110110110110110110110110110110110110110110 (3) 101000101101111000111111001001101000000010011110101101110111 (1) 30 раз «10» (2) 20 раз «110» (3) описание равно самой строке Степень «сжимаемости» текста, грамматики. Ср. архивацию файлов (*.zip, *.rar) Типы сложности Эффективная сложность по (Gell-Mann 1994): Минимальная длина описания закономерностей данного языка/текста Системная vs. структурная сложность по (Dahl 2004) Сложность системы vs. высказывания Абсолютная vs. относительная сложность для кого? Для носителя? Ребенка? Изучающего неродной язык (outsider complexity)? Идея «обобщенного чужого» (generalized outsider) (Kusters 2003) Психолингвистический материал: некоторый уже накоплен, но исследования еще надо провести Абсолютный подход (Dahl 2004, Miestamo 2009): явления, реже встречающиеся типологически с точки зрения иерархий (например, тройственное число), сложнее. Типологическая сложность (Parkvall 2008): креольские языки проще некреольских (в выборке около 200 языков, сопоставляются по 53 параметрам). (Lupyan, Dale 2009): сложность предсказывается численностью населения, занимаемой площадью и количеством языков-соседей. Чем меньше, тем сложность больше. В выборке 2236 (!) языков. Сравнение внутри группы родственных языков (Dammel, Kürschner 2008 -- германские) или даже двух идиомов друг с другом (Dahl 2009 – шведский и эльвдальский). Ряд авторов не предлагает количественные меры, а только оценку. Диахроническая сложность Устройство языка, происхождение языка, языковые процессы, приводящие к увеличению или уменьшению сложности (Way, Grace 2007): до глобализации и распространения образования языки были сложнее (Karlsson 2009): история придаточных в нескольких европейских языках (Progovac 2009): «малая клауза» типа Me too – «ископаемое» древнего, более простого уровня Определения (McWhorter 2001): данная область некоторой грамматики сложнее этой же области другой грамматики в той степени, в которой она содержит больше выражаемых поверхностно (overt) различий и / или правил. Маркированные фонемы Больше синтаксических правил Больше грамматикализованных различий (overspecification) Флективная морфология Нерегулярности на разных уровнях Определения (Kusters 2003): сложность в морфологии максимально отклоняется от трёх основных принципов: Экономия Прозрачность (одно-однозначное соответствие) Изоморфизм – порядок аффиксов соответствует сфере действия («принцип релевантности» по Байби) Отдельно определяет сложность для: Говорящего Осваивающего родной язык Слушающего Осваивающего чужой язык Определения (Nichols 2009): количество элементов в системе Фонология: – количество контрастивных способов артикуляции взрывных согласных; – количество различий в качестве глаcных; – система тонов (отсутствует / простая / сложная); – структура слога; Синтетическая морфология: – количество разных словоизменительных категорий, выражаемых максимально сложной глагольной формой; – множественное согласование: маркирование двух аргументов в глаголе; – маркирование множественного числа существительных; – маркирование двойственного числа существительных; Классификаторы и согласование: – числительные-классификаторы; – посессивные классы (выражающиеся поверхностно); – род как согласовательный класс; – род, маркируемый в самом слове (как в языках банту); Синтаксис: – количество используемых стратегий кодирования именных и местоименных актантов; – количество базовых порядков слов; Лексика: – наличие оппозиции инклюзивности–эксклюзивности у личных местоимений; – количество случаев супплетивизма в наборе из девяти пар глаголов типа X– Caus(X) (бояться–пугать); – количество возможных производных в тех же девяти парах. Определения (Juola 2008): сжатие архиватором zip (составляющим словарь и записывающим повторы) Близко к колмогоровской сложности Слова в тексте заменяются на произвольные натуральные числа (каждое на одно и то же). Лексика и синтаксис сохраняются, морфология и фонология разрушаются. Отношение «сжатый оригинальный текст / сжатый искаженный текст»: чем меньше, тем проще морфология. Чем сильнее уничтожение морфологической структуры ухудшило сжимаемость, тем стройнее и проще была эта структура (и было что уничтожать). Маори 0,895 Английский 0,972 Нидерландский 0,994 Французский 1,01 Русский 1,04 Финский 1,12 Семантическая сложность (Gil 2008): чем дальше грамматически правильное предложение от простого универсального многоместного оператора, тем язык сложнее 1500 носителей 20 языков, многолетний эксперимент Для изолирующих языков число «отказов» в среднем ниже Одни из самых простых – языки Западной Индонезии Результаты оспариваются: некоторые считают, что изолирующие языки обладают скрытой сложностью Типологически необязательные параметры, например, род (Dahl 2004, Trudgill 2011), «избыточный» и не приносящий серьёзной коммуникативной выгоды Сложность и общество Trudgill 2011: сложности благоприятствует: – низкая интенсивность контактов со взрослыми носителями других языков; – высокая социальная стабильность; – малая численность населения; – тесные социальные связи в обществе; – большое количество общих для всех носителей фоновых знаний (культурных, бытовых и т. п.). Контакт ведет к упрощению (пиджин) или усложнению (языковой союз, заимствование части форм в парадигме). Усложняющие изменения языка в целом более вероятны (McWhorter, Dahl) Для инноваций и навязывания общих норм нужны тесные социальные связи. Если произойдёт усложняющая инновация, небольшое стабильное общество ее усвоит, раздробленное сохранит более простые нормы Усиление сложности языков – маркирование этнических и прочих границ Сложность и общество Для современного этапа характерна глобализация и упрощение языка. Возникновение новой сложности маловероятно. От интересов говорящего и групповой идентичности – к интересам слушающего и успешности коммуникации [Kusters 2003] Статистически доказана корреляция: Морфологическая непрозрачность и малое число носителей; Сложность и неинтенсивность контактов Простота и доля неносителей среди говорящих Новый объяснительный механизм для целого ряда вопросов Всегда ли язык был устроен одинаково? Связана ли сложность языка с его смертью? (дети перестают учить) Связь с биологией. Литература Бердичевский 2012 -- А. Бердичевский. Языковая сложность (language complexity) // Вопросы языкознания, 2012, № 5. Даль 2009 – Э. Даль. Возникновение и развитие языковой сложности. М., 2009. Зализняк 2005 – А.А. Зализняк. Некоторые проблемы порядка слов в истории русского языка // http://www.elementy.ru/lib/431049 Dahl 2004 – Ö. Dahl. The growth and maintenance of linguistic complexity. Amsterdam, 2004. Dahl 2009a – Ö. Dahl. Testing the assumption of complexity invariance: the case of Elfdalian and Swedish // Language complexity as an evolving variable. Oxford, 2009. Dammel, Kürschner 2008 – A. Dammel, S. Kürschner. Complexity in nominal plural allomorphy: a contrastive survey of ten Germanic languages // Language complexity: typology, contact, change. Amsterdam, 2008. Gell-Mann 1994 – M. Gell-Mann. The quark and the jaguar: adventures in the simple and the complex. New York, 1994. Литература Gil 2008 – D. Gil. How complex are isolating languages? // Language complexity: typology, contact, change. Amsterdam, 2008. Juola 2008 – P. Juola. Assessing linguistic complexity // Language complexity: typology, contact, change. Amsterdam, 2008. Karlsson 2009 – F. Karlsson. Origin and maintenance of clausal embedding complexity // Language complexity as an evolving variable. Oxford, 2009. Kusters 2003 – W. Kusters. Linguistic complexity: the infl uence of social change on verbal infl ection. Utrecht, 2003. Lupyan, Dale 2009 – G. Lupyan, R. Dale. Language structure is partly determined by social structure // PLoS ONE. 2009. 5(1). McWhorter 2001 – J. McWhorter. The world’s simplest grammars are creole grammars // Linguistic typology. 2001. 5(2–3). Miestamo 2008 – M. Miestamo. Grammatical complexity in a cross-linguistic perspective // Language complexity: Typology, contact, change. Amsterdam, 2008. Miestamo 2009 – M. Miestamo. Implicational hierarchies and grammatical complexity // Language complexity as an evolving variable. Oxford, 2009. Литература Nichols 1992 – J. Nichols. Linguistic diversity in space and time. Chicago, 1992. Nichols 2009 – J. Nichols. Linguistic complexity: A comprehensive definition and survey // Language complexity as an evolving variable. Oxford, 2009 Parkvall 2008 – M. Parkvall. The simplicity of creoles in a cross-linguistic perspective // Language complexity: Typology, contact, change. Amsterdam, 2008. Perkins 1992 – R. Perkins. Deixis, grammar, and culture. Amsterdam, 1992. Progovac 2009 – L. Progovac. Layering of grammar: vestiges of protosyntax in present-day languages // Language complexity as an evolving variable. Oxford, 2009. Trudgill 2011 – P. Trudgill. Sociolinguistic typology: social determinants of linguistic complexity. Oxford, 2011. Wray, Grace 2007 – A. Wray, G. Grace. The consequences of talking to strangers: Evolutionary corollaries of socio-linguistic infl uences on linguistic form // Lingua. 2007. 117(3).