English
HOME   |    PROJEKTY   |    PUBLIKACE   |    GRANTY   |    LIDÉ   |    KONTAKT   |    ENGLISH

Laboratoř počítačového zpracování řeči patří k vedoucím pracovištím v oboru hlasových technologií v České republice. Organizačně spadá pod Ústav informačních technologií a elektroniky. Byla založena v roce 1994 prof. Janem Nouzou, který se zabývá zpracováním a rozpoznáváním řeči od svého vysokoškolského studia v 80. letech 20. století. V současné době má tým 10 pracovníků, kteří mají Ph.D. titul v oboru zpracování a rozpoznávání řeči nebo obrazu.

Obrázek uvedený níže je mozaika složená z našich starších zajímavých praktických projektů, kde byl prvně využit námi vyvíjený automatický systém rozpoznávání řeči pro češtinu (od roku 1990 do počátku 21. století). Byl to například systém VISPER pro vizualizaci a experimentování se skrytými markovskými modely - HMMs (Hidden Markov Models), je zde také zobrazeno několik vyvinutých dialogových systémů, umělá mluvící tvář, program pro hlasové ovládání PC, který je vhodný především pro pohybově hendikepované lidi, atd.

speechlab.jpg

Od roku 1996 se náš tým podílel na výzkumu a vývoji řečových technologií ve více než 15 velkých výzkumných projektech, které byly podporovány českými grantovými agenturami (GAČR, TAČR), případně ministerstvy (školství, kultury a vnitra). Byli jsme také aktivními partnery v několika evropských projektech COST (Cooperation in Science and Technology).

V posledních deseti letech (2011-2020) jsme řešili celou řadu zajímavých výzkumných projektů z oblasti moderních řečových technologií s realizovanými praktickými výstupy:

  • Vývoj systému pro automatický přepis pořadů historického archívu Českého a Československého rozhlasu, kde bylo automaticky přepsáno a zaindexováno více než 100 000 hodin zvukových nahrávek (4-letý projekt Ministerstva kultury České republiky), viz publikace z konference Interspeech [1]
  • Vývoj vícejazyčného on-line systému pro přepis televizních a rozhlasových pořadů, který pracuje s rozpoznávacím systémem přizpůsobeným pro 13 různých slovanských jazyků (projekt byl podpořen dvěma velkými projekty Technologické agentury České republiky - TAČR), viz publikace [234]
  • Vývoj systému pro velmi rychlé vyhledávání klíčových slov (a krátkých slovních spojení) v rozsáhlých zvukových archívech (projekt podpořen projektem TAČR), viz publikace [5]
  • Návrh a modifikace metod založených na umělých neuronových sítích pro rozpoznávání informace a zajímavých částí zvukového signálu (detekce ne/řečových úseků, identifikace mluvčích, identifikace použitého jazyka, atd.), viz publikace [678]

Náš výzkum vedl k celé řadě praktických komerčních řečových technologií a systémů. Většina z nich je využívána a prodávána společností Newton Technologies:

Pokud jste student, uvažujete o doktorském studiu nebo o stáži typu postdok, případně zástupce komerční sféry zajímající se o náš výzkum, tak nás prosím kontaktujte, nejlépe e-mailem:

jan.nouza AT tul.cz, petr.cerva AT tul.cz