logo itpoint.cz

Rozpoznávání řeči počítačem - technologie ViaVoice s lokalizací pro češtinu

Rozpoznávání řeči je technologie, která usnadňuje komunikaci s počítačem a je další součástí aplikací pro CTI (počítačovou telefonii). Moderní rozpoznávače řeči umožňují uživateli diktovat zprávy, dopisy, e-maily nebo připravovat text pro jiné aplikace.

O technologii ViaVoice se stále více mluví …

V této souvislosti nesmíme opomenout pár základních pojmů, se kterými se budeme setkávat v každodenním životě stále častěji. Ve vzájemné provázanosti to budou pojmy jako TTS (text to speech = přečtení textu počítačem), VR (voice recognition = rozpoznání hlasu počítačem), CTI (computer telephony integration = počítačová telefonie) či IVR (interactive voice response = interaktivní hlasové reakce).

Rozpoznávání řeči je technologie, která usnadňuje komunikaci s počítačem a je další součástí aplikací pro CTI (počítačovou telefonii). Moderní rozpoznávače řeči umožňují uživateli diktovat zprávy, dopisy, e-maily nebo připravovat text pro jiné aplikace. Diktovat do počítače je mnohem přirozenější a rychlejší než psát klasicky pomocí klávesnice. Proč si tedy nezjednodušit práci, když je to tak snadné ?

Společnost IBM Watson Research Center v New Yorku je předním světovým pracovištěm kde byly vyvinuty základní metody, které se dnes běžně používají v komerčně dostupných produktech. Výsledkem dlouholetého výzkumu je technologie rozpoznávání řeči ViaVoice. Dnes je tento SW produkt nejprodávanějším v USA.

Pro uživatele nabízí slovník 64000 slov, který lze rozšířit o dalších 64.000 (např. jména osob, míst, firem apod.) tak, aby celý rozpoznávač co nejlépe přizpůsobil svým požadavků a stylu práce. Samozřejmostí je že texty je možno vytvářet přímo v aplikaci MS Word, nebo v dalších editorech. Předností je jednoduché zadávání různých údajů např. telefonních čísel, cen atd.. Bez klikání myší stačí jen říci příkaz a právě zpracovávaný odstavec může být přeformátován. Tzv. Hlasová makra si uživatel vytvoří pro zadávání často se vyskytujících frází. Pro profesionální účely, např. lékaři nebo právníci, dodává IBM specializované jazykové modely. ViaVoice dnes pracuje s hlavními evropskými jazyky.

V oblasti CTI můžeme mezi ně zařadit i češtinu. Společnost ISC Communication s.r.o. úzce spolupracuje s IBM v české republice na lokalizaci produktu ViaVoice Telephony Toolkit. ISC Communication plánuje integraci rozpoznáváni řeči do vlastních SW produktů pod označením Davos®. Jde o širokou řadu CTI aplikací, které tato společnost nabízí, počátek vývoje se datuje do roku 1992.

Rozpoznávní řeči v IVR aplikacích

Použití technologie ViaVoice je možné i pro hlasem ovládané telefonní aplikace. Interaktivnímu telefonnímu systému jednoduchými hlasovými povely přikážete kam chcete být spojeni. Takto je Vám umožněno hlasem projít celou automatickou nabídkou společnosti. Nepotřebujete již tlačítka telefonu a klidně můžete telefonovat z aparátu vybaveného starou kruhovou číselnicí.

Hlasové ovládání je podstatně přirozenější a navíc dovoluje provedení požadovaných úkonů nebo nalezení hledané informace mnohem rychleji. Další výhodou je skutečnost, že výběr jednotlivých nabídek není omezen deseti tlačítky telefonního přístroje. Automatická spojovatelka vybavená rozpoznáváním hlasu dovoluje přepojit, kteréhokoliv z tisíců účastníků.

Využitím této technologie lze navrhovat aplikace podstatně větší a složitější se současným zvýšením komfortu pro volající. Celkové náklady na provoz informačního systému jsou pak podstatně menší, sníží se počet operátorů, zvýší se informovanost uživatelů a sníží se komunikační náklady.

Se širokou nabídkou aplikací využívajících ViaVoice a autentického produktu Davos® Text-to-speech, od počátku vyvíjeného pro češtinu, se můžete informovat u společnosti Communication, s.r.o., partnera IBM v oblasti CTI, IVR, TTS a VR. Do budoucna počítají obě společnosti s možností lokalizace do ostatních východoevropských jazyků.

Uvedené produkty jsou k dispozici k testování na telefonním čísle 02-511 09 333 (ViaVoice, automatická spojovatelka) a na www.davos.cz (Davos® Text-to-speech).

 http://www.isccorp.com
ing. Branko Baník / ISC Communication, s.r.o.

Článek ze dne 24. května 2001 - čtvrtek