Prototyp hlasového diktátu do počítače (2002)

V rámci tohoto projektu jsme vyvinuli první český systém pro rozpoznávání spojité řeči v češtině. Pracuje v reálném čase se slovníkem až do velikosti 20 000 slov na počítači s procesorem nad 2GHz. Je založen na využití synchronního Viterbiho dekodéru s několika vylepšeními a optimalizačními strategiemi, zejména rychlý výpočet pravděpodobností u spojitých HMM, několikastupňové schéma výběru nejslibnějších hypotéz a paralelní implementace celého systému. Přepis vyřčené promluvy se na obrazovce objeví do 1 sekundy od jejího skončení. Pokud ve větě nejsou slova mimo slovník, bývá rozpoznávací skóre kolem 80 %.

Více informací:

NOUZA, J.: Strategies for Developing a Real-Time Continuous Speech Recognition System for Czech Language. In Proc. of TSD 2002. Brno, September 2002. pp. 189-196. ISBN 0302-9743

<<< Zpět