ToBI (Tone and Break Indices) Тоны и показатели просодических

advertisement
ToBI
(Tone and Break Indices)
Тоны и
показатели просодических
швов
(стыков, брейков)
1
ToBI (1992-1996)
Стандартная транскрипционная система для интонации
американского
варианта английского языка (AE),
разработанная и протестированная международной
группой исследователей (Silverman et al. 1992).
Цели стандартизации
1.
2.
Создание единой теоретической и практической
парадигмы для дальнейших научных исследований и
технологических разработок, которая позволила ли бы
разным лабораториям и рабочим коллективам
интерпретировать
и
использовать
накопленные
данные
по интонации английского языка в его
главных вариантах (АЕ, АА, АB ).
Создание ресурсов для разработки и использования
он-лайновых баз данных с просодически размеченной
и затранскрибированной речью.
2
Вопросы для дальнейшего обсуждения
 Теоретическая база системы ToBI
 Иллюстративные примеры
 Соглашения и инструкция для разметчиков;
 Компьютерный инструментарий, примеры;
 Структура разметочных файлов, совместимость;
 Экспериментальная проверка работоспособности
(валидности) системы;
 Расширения парадигмы ToBI на другие языки – ToGI,
ToDI, GRToBI, ToRI, + итальянский, испанский, арабский
(каирский вар.).
3
Теоретическая база системы ToBI
Общее направление – интонационная фонология, в ее рамках
автосегментная тональная теория, метрическая теория.
1. J. Pierrehumbert, 1980 – модель английской интонации1 ;
2. M. Beckman & J. Pierrehumbert, 1986 - модель английской
интонации;
3. J. Pierrehumbert. Tonal elements and their alignment, 2000 модель английской интонации;
4. Goldsmith J., 1990 – общие вопросы автосегментной и
метрической фонологии 2;
5.
Ladd D. R. (1983, 1996) – интерпретация явления даунстепа
и тональный диапазон;
6.
Wightman C. et. al. – 1992 – интерпретация просодических
стыков=швов;
7. Selkirk E. 1984, 1995 – метрическая теория и просодическое
фразирование
(формирование
просодических
составляющих).
1См.учебник
«Общая фонетика» К&К; 2 К&К. Современная американская фонология.
4
J. Pierrehumbert.
Tonal elements and their alignment, 1980 - 2000 - модель
английской интонации, АЕ
Из истории : 50-е годы ХХ в. – первые попытки фонологизации
тональных явлений= интонации на материале АЕ.
• Признание автономной, супрасегментной фонетической
природы интонации и ее отдельных элементов; слог - основное
поле реализации интонационных контрастов.
Два подхода в в фонологической интерпретации интонации.
1. Trager. Smith, 1951, Pike, 1945 – декомпозиция тональных
контуров в терминах 4 функционально значимых тональных
уровней=уровневых тонов: L, LM, HM, H.
2. Bolinger (1951,1958), Британская фонет. школа + современные
исследоваватели
Liberman M. (1975), Ladd (1979).декомпозиция контуров в терминах тональных движенийконфигураций .
Каждый подход имеет свои преимущества и недостатки.
5
Современные модели J. Pierrehumbert и (1980-2000) и другие
в той же парадигме попытка интегрировать прежние
подходы с учетом их недостатков.
Краткая характеристика модели
• Базовый тональный контраст: H ~ L  использование
верхней и нижней части голосового диапазона в качестве
основных целевых зон (мишеней= targets) во всех тональных
элементах системы  битональная модель интонации.
Постулируется инвентарь из 6 фонологически разных
L*, H*, L+H*,
L*+H, H+L*, H*+L,
тональных
элементов:
• Два простых L и H
• Четыре сложных:
L + H*, L* + H, H* + L, H+ L*
Различаются по локализации во фразе и дискурсивной функции
(см. слайд 7).
6
Типы
тональных элементов
Локализация
H*
L*
ТА
Акцентированный
ударный слог слова
( маркер * )
L+H*
L*+H
H+L*
H*+L
Фразовые
(краевые
тоны
H) L-
ФТ
Граничные тоны H%
конечные ГТ L%
ГТ
Начальный ГТ %Н
ТТ
после последнего
акцентированного
слога до конца
промежуточной
фразы
Последний слог в
интонационной
фразы
Начальные слоги
фразы
Прагматические дискурсивные
Функции тон. элементов
(интонационных морфем)
Новая, фокусируемая И.,
добавляемая в общее инф. поле
дискурса
Важная
информация,
но
с
сомнительным индексом доверия
И. , выбранная из небольшого
числа альтернатив. причем L+H*
кодирует также «добавь=add », а
L*+H – «не добавляй» в общее
инф. поле Д.
Старая
И.
+
инструкция
идентифицировать
связь
передаваемой
информации
с
информацией, кот. уже находится
в общем информационном поле Д.
Дискурсивный
статус
просодической фразы в целом а
не
статус
отдельных
фокусируемых элементов фразы.
7
Грамматика возможных интонационных структур
английского языка (ИГ)
Интонационная структура (ИС) фразы = линейная последовательность
фонологически значимых тональных элементов, ассоциированных с
метрически сильными (акцентированными) слогами и границами
просодических составляющих двух уровней иерархии (промежуточными
и интонационными фразами) (сл. 10 ).
Грамматика, исчисляющая возможные ИС, = сеть из 3 возможных тональных
состояний; любой путь через сеть порождает некоторую ИС (сл. 9).
Свойства порождаемых ИС:
• Длина и сложность ИС. Фраза может иметь бесконечное к-во тональных
акцентов, это идеализация. Обычно акцентов 1 - 3, очень редко 5 . Но это
ограничение не самой ИГ, а ритмометрики фразы: количество метрически
сильных слогов в составляющей ограничивает кол-во тон. Акцентов в
ней.
• Комбинаторика тональных элементов. Тональные акценты и граничные
тоны не имеют принципиальных ограничений на комбинаторику,
порождая 36 сложных тон. конфигураций в завершении фразы (сл.11). Но
комбинаторика акцентов внутри одной и той же фразы имеет
ограничения, как показывают исследования.
• Инвентарь нуклеарных и ненуклеарных тональных акцентов один и тот
же.
• Иерархия в ИС - Линейная последовательность тональных элементов,
8
организованных в иерархическую фразово-просодическую структуру.
(сл.10)
Интонационная порождающая грамматика
‘X*’
‘Х-’
‘X%’
9
Линейно-иерархическая природа интонационной
структуры предложения
Adelaide’s in South Australia and Sydney’s in New South Wales.
10
Тональные конфигурации в завершении фразы
ТА
ГТ
ТА
Тональные конфигурации в завершении фразы
11
Просодические тональные правила
1.
2.
3.
Tone alignment rules = Постлексические правила выбора
тональных элементов и их связывания с сегментным
составом (слоговой последовательностью, представляющей
высказывание). Связь ТА с акцентированными слогами мб
объяснена общей организацией моторного контроля1.
Правила формирования ЧОТ-контура на основе данной
ИС = реализационные правила тональной параметризации.
Абстрактные
тон.
элементы
ИС
условно
можно
рассматривать как маршрут или схему движения в целевом
ЧОТ-пространстве.
Есть два типа реализационных правил – таймирование и
частотное шкалирование акустических событий, соотносимых
с абстрактными тон. элементами. Учитывается не только
исходная ИС, но и ряд других факторов – тон. диапазон
фразы,
взаимодействие
тональных
элементов,
деклинационные тенденции и пр.Очень важны для автом.
синтеза речи. См. э-библиотеку речевой группы ОТ и ПЛ.
Кривнова О.Ф.Генерация тонального контура фразы в системах автоматического
синтеза речи // Диалог’2000 . С. 211-219.
КривноваО.Ф. Моделирование и синтез фразовой интонации на основе особых
точек тонального контура // Диалог'97. М., 1997. C. 161-164.
это процесс, в кот. две руки становятся синхронизированы, если хлопать себя
по голове и гладить живот одновременно.
1
12
Иллюстративные примеры
[[Adelaide] [is in South Australia] ] - вверху
H*
HH* L- L%
[[Adelaide]
H*
H-
[is in South Australia?] ] - внизу
L* H- H%
13
[[Adelaide’s] [ in South Australia] ] - вверху
H*
HH*
H* L- H%
[[Adelaide’s] [ in South Australia] ]
H*
HH*
H* H- L%
14
[[Sydney isn’t in South Australia!] ] - внизу
L*+H*
L- H%
15
ToBI Annotation Conventions (1992 )
M. Beckman and J. Hirshberg
Соглашения и инструкция для разметчиков
•
•
1.
2.
3.
4.
Разметочная система ToBI обеспечивает для каждого
речевого
высказывания
следующую
информацию:
цифровую запись звучания, ассоциированный ЧОТ-контур,
собственно транскрипцию – маркеры (labels) для
различных речевых событий в следующих 4 слоях
(каналах):
Орфографический слой: w*ord
Тональный слой:TA; PhT; BT; !H; HiF0
Слой показателей просодических швов (стыков): 0,1,2,3,4числовой
показатель
фонетической
выраженности
словораздела;
Слой дополнительных комментариев (прочие события
разного рода): паузы, речевые сбои, хезитации и пр.
Соглашения касаются как собственно транскрипционных
файлов, так и компьютерного инструментария wavesTM ,
форматов речевых файлов и средств временной
синхронизации разных информационных слоев.
16
Компьютерный инструментарий, примеры;
• wavesTM - часть пакета ESPS (Entropic Speech
Processing System, ОС Unix ) – Англия
• EMU Labeller – Австралия
• Pitchworks – SciConcord.com (сл.18, 19 + Demo)
• SA SIL ?
17
Рабочее окно разметчика PitchWorks
18
19
Структура разметочных файлов, чекеры,
совместимость
wavesTM формат
• Каждая строка в разметочном текстовом файле содержит несколько
полей, разделенных маркерами: field_1; field_2; field_3; field_4;
field_5.
С учетом содержания полей типичная строка в абстрактном виде
выглядит так::
w(*)ord–tonal_marker$break_index@(time_stamp)(time_stamp); comment
• В системе имеется чекер для проверки правильности состава и
структуры разметочных протоколов.
• Большинство работ с иcпользованием ToBI сделано с помощью
инструментария wavesTM (ESPS) в среде Unix, в собственном
формате. Для работы с ESPS-форматом, например, для изучения
тренировочного материала по этой просодической разметке на
сайте Ohio State Univ., под Windows требуется конвертер. См. сайт
EMU-Австралия. Кроме традиционной формы разметки, EMU строит
иерархическую просодическую аннотацию.
Мои данные об указанных сайтах на сегодняшний день устарели,
поэтому здесь не приводятся.
20
Экспериментальная проверка работоспособности
(валидности) системы ToBI
•
•
•
•
•
Эксперимент по оценке валидности системы проводился с
участием 26 разметчиков, на материале из 34 высказываний.
По оценкам экспертов (Pitrelli et al. 1994) протоколы
продемонстрировали хорошую согласованность работы
экспертов при попарном сравнении протоколов с учетом
транскрипционных символов на каждом слове.
88% согласования
по наличию-отсутствию тонального
маркера;
81 % по выбору определенного тонального маркера;
92% согласования в пределах одного уровня фразирования
(членения) = разметки просодических швов;
Полученный уровень согласования значительно выше, чем
показывали
предыдущие транскрипционные
системы
интонации ,  обеспечивает дальнейшее развитие в области
создания и использования интонационных корпусов.
21
Заключение
Ограничения ToBI
Разработчики ToBI не утверждают, что система покрывает всё
содержание интонационного оформления речи. Имеющиеся
слои относятся к наиболее значимым, по общему мнению,
просодическим
характеристикам
речевых
сообщений.
Последний, 4-ый канал может использоваться для любой
дополнительной информации, например, для наблюдений об
экспрессивном использовании фонации.
 Стандарт-ToBI разрабатывался под влиянием теорий для
конкретного языка, но в ряде важных теоретических отношений
он нейтрален.
 Однако, не следует ожидать сходства тональных инвентарей и
физического тождества тональных элементов в разных языках.
В то же время , можно ожидать, что широкие типы тональных
контрастов и тональных реализаций могут воспроизводиться в
разных интонационных системах (аналогично с ситуацией в
сегментной фонетике).
 Это подтверждают попытки расширения парадигмы ToBI
на другие языки – ToGI, ToDI, GRToBI, ToRi www.fon.hum.uva.nl/tori
I, +шведский, итальянский, испанский, арабский (каирский вар.),
японский, китайский…..
22
Download