Обнаружение незнакомых слов при распознавании речи

advertisement
OOV
1
Îáíàðóæåíèå íåçíàêîìûõ ñëîâ ïðè ðàñïîçíàâàíèè ðå÷è
×ó÷óïàë Â. ß., Ìàêîâêèí Ê. À., ×è÷àãîâ À. Â.
Ìîñêâà, ÂÖ ÐÀÍ
chuchu@ccas.ru
Ðå÷åâîé ñèãíàë, ïîäëåæàùèé ðàñïîçíàâàíèþ, êàê ïðàâèëî, ñîäåðæèò
øóìû, ðå÷ü ïîñòîðîííèõ ëèö, íàðóøåíèÿ ðå÷åâîãî ïîòîêà èëè ñëîâà, êîòîðûå íå âõîäÿò â ñëîâàðü ñèñòåìû ðàñïîçíàâàíèÿ ðå÷è.
Öåëüþ íàñòîÿùåãî èññëåäîâàíèÿ ÿâëÿëàñü ðàçðàáîòêà è èññëåäîâàíèå
ýôôåêòèâíîñòè íîâîãî àëãîðèòìà îáíàðóæåíèÿ íåçíàêîìûõ ñëîâ íà îñíîâå îöåíîê ïðàâäîïîäîáèÿ äëÿ íàáëþäàåìîãî ðå÷åâîãî ñèãíàëà ïðè çàäàííîì ìíîæåñòâå àêóñòèêî-ôîíåòè÷åñêèõ ìîäåëåé.
Àêóñòè÷åñêèå ñ÷åòa
Îñíîâíûå ìåòîäû âûÿâëåíèÿ íåçíàêîìûõ ñëîâ îñíîâàíû íà èñïîëüçîâàíèè âåëè÷èí ëîêàëüíûõ ìåð ñõîäñòâà, îöåíîê ïðàâäîïîäîáèÿ èëè àêóñòè÷åñêèõ ñ÷åòîâ. Íàèáîëåå ÷àñòî èñïîëüçóþòñÿ: ñðåäíèé ñ÷åò
S(w) =
Nw
1 X
sj ,
Nw j=1
(1)
ãäå Nw ÷èñëî íàáëþäåíèé, sj ñ÷åò íàáëþäåíèÿ j
è öåíòðèðîâàííûé ñðåäíèé ñ÷åò:
S̃(w) =
Nw
1 X
(sj − s̃)
Nw j=1
(2)
ãäå s̃ ñðåäíåå ñ÷åòà äëÿ äëèòåëüíîãî ïðîìåæóòêà âðåìåíè.
Îáå îöåíêè øèðîêî èñïîëüçóþòñÿ, îäíàêî íåñêîëüêî ëó÷øèå ðåçóëüòàòû áûëè ïîëó÷åíû ïðè èñïîëüçîâàíèè äâàæäû íîðìèðîâàííîãî ñ÷åòà:
S1 (w) =
Nw
Ns
1 X
1 X
sj
Nw s=1 Ns j=1
(3)
ãäå Nw ÷èñëî ñîñòîÿíèé ìîäåëè ñëîâà w, Ns äëèíà ñîñòîÿíèÿ s.
Ïî àíàëîãèè ñ (2) îïðåäåëèì äâàæäû íîðìèðîâàííûé öåíòðèðîâàííûé ñ÷eò:
Nw
1 X
1
(sj − s̃),
(4)
S˜1 (w) =
Nw j=1 Ns
2
×ó÷óïàë Â. ß., Ìàêîâêèí Ê. À., ×è÷àãîâ À. Â.
Íà ðèñ.1 ïðèâåäåíû DET êðèâûå [1] äëÿ ñ÷åòîâ (1)(4), âû÷èñëåííûå
íà ðå÷åâîì êîðïóñå äàííûõ FaVoR [2]. Î÷åâèäíî, ÷òî ñ÷åò (4) ñàìûé
ýôôåêòèâíûé.
DET êðèâàÿ äëÿ 8
Ñðåäíèé
40
Ñðåäíèé öåíòðèðîâàííûé
Ïðîïóñêîâ âåðîÿòíîñòü (â %)
Äâàæäû íîðìèðîâàííûé
Äâàæäû íîðìèðîâàííûé öåíòðèðîâàííûé
20
10
5
2
1
1
2
5
10
20
40
Ëîæíûõ òðåâîã âåðîÿòíîñòü (â %)
Ðèñ. 1: DET õàðàêòåðèñòèêè àêóñòè÷åñêèõ ñ÷åòîâ (1)(4)
Îöåíêà ñ÷åòîâ ïî ïàðàìåòðàì ìîäåëåé çâóêîâ
Ñóùåñòâåííûì íåäîñòàòêîì ðàññìîòðåííûõ àêóñòè÷åñêèõ ñ÷åòîâ ÿâëÿåòñÿ òî, ÷òî îöåíêà ïîðîãîâîãî çíà÷åíèÿ òðåáóåò íàëè÷èÿ íàñòðîå÷íîé âûáîðêè, ò.å. êàêîãî-òî êîëè÷åñòâà ïðîèçíåñåíèé ñëîâà â çàäàííîé
àêóñòèêî-ôîíîâîé îáñòàíîâêå.
Ðàññìîòðèì ìåòîä ôîðìèðîâàíèÿ îöåíêè ñ÷åòà íà îñíîâå ïàðàìåòðîâ
àêóñòè÷åñêèõ ìîäåëåé çâóêîâ.
Äëÿ ñ÷åòà (4) îïðåäåëèì ñðåäíåå, îòêëîíåíèå è ïîðîã ïðèíÿòèÿ ðåøåíèÿ:
OOV
3
m̃(w) =
Nw
Ns
1 X
1 X
mj ,
Nw s=1 Ns j=1
(5)
v
u
Nw
Ns
u 1 X
1 X
σ2 ,
σ(w) = t
Nw s=1 Ns j=1 j
(6)
th(w) = s(w) − m(w) − σ(w).
(7)
Îöåíèâàåì òåêóùåå çíà÷åíèå ñ÷åòà êàê:
m̃(w, t + 1) = m̃(w, t) + α ∗ (m̃(w, t) − S(w, t)),
(8)
ãäå S(w, t) íàáëþäàåìîå çíà÷åíèå ñ÷åòà, α ïàðàìåòð.
Íà ðèñ. 2 ïðèâåäåíû DET êðèâûå äëÿ îöåíîê (5)-(7).
Çàêëþ÷åíèå
Ïðåäëîæåí ìåòîä îöåíêè àïðèîðíûõ äèñïåðñèé ñ÷åòîâ, âûáîðà àïðèîðíîãî ïîðîãà, à òàêæå ïðîöåäóðà àäàïòàöèè ñðåäíèõ çíà÷åíèé è ïîðîãîâ â ñîîòâåòñòâèè ñ íàáëþäàåìûì ðå÷åâûì ñèãíàëîì. Ïîêàçàíî, ÷òî
ýôôåêòèâíîñòü ïðåäëîæåííûõ àïðèîðíûõ îöåíîê ñ÷åòîâ è ìåòîäà àäàïòàöèè ïîðîãà ïðàêòè÷åñêè ñîîòâåòñòâóåò èñïîëüçîâàíèþ àïîñòåðèîðíûõ
îöåíîê ïîðîãîâûõ ñ÷åòîâ íà íàñòðîå÷íîé âûáîðêå. Ðàáîòà âûïîëíåíà ïðè
ôèíàíñîâîé ïîääåðæêå ÐÔÔÈ, ïðîåêò 07-01-00657à
Ëèòåðàòóðà
[1] Ïðîãðàììà DETware. Íàöèîíàëüíûé èíñòèòóò ñòàíäàðòîâ ÑØÀ, NIST,
http://www.nist.gov.
[2] Äåñÿò÷èêîâ À.À è äð. Êîìïëåêñ àëãîðèòìîâ äëÿ óñòîé÷èâîãî ðàñïîçíàâàíèÿ ÷åëîâåêà, Èçâåñòèÿ ÐÀÍ. Òåîðèÿ è ñèñòåìû óïðàâëåíèÿ, 2006
4
×ó÷óïàë Â. ß., Ìàêîâêèí Ê. À., ×è÷àãîâ À. Â.
DET êðèâàÿ äëÿ 8
Ïðîïóñêîâ âåðîÿòíîñòü (â %)
40
20
Àäàïòèâíûé ñ÷åò
Äâàæäû íîðìèðîâàííûé ñ÷åò
10
5
2
1
1
2
5
10
20
Ëîæíûõ òðåâîã âåðîÿòíîñòü (â %)
Ðèñ. 2: DET êðèâàÿ ñ÷åòà (5)-(7)
40
Download