Philips e il riconoscimento vocale

Workspace

Presto il riconoscimento vocale non si limiterà ai cellulari ma interesserà anche altri dispositivi Philips

Philips intende utilizzare la tecnologia di riconoscimento vocale per facilitare limpiego dei prodotti e migliorarne linterfaccia utente. Il primo ambito di applicazione sono i cellulari e i telefoni DECT (cordless), poiché già incorporano parte delle risorse computazionali indispensabili allimplementazione del riconoscimento vocale. Anche televisori e sistemi audio possono essere migliorati con funzioni di controllo vocale. Le possibilità di impiego del riconoscimento vocale sono molto vaste e valorizzano al massimo lopera del dipartimento di ricerca Philips. Nel campo della telefonia vengono sviluppati soprattutto dispositivi speaker dependent, che possono essere utilizzati da un unico utente, in genere il proprietario dellapparecchio. I cellulari Philips di recente produzione, sono dotati di controllo vocale e nei mesi a venire è previsto il lancio di altri prodotti che supportano questa tecnologia. Attualmente sono in corso test per estendere le possibilità di navigazione mediante riconoscimento vocale, che dovranno poi essere accettate dagli operatori telefonici. Esistono prove significative che dimostrano come sia possibile invogliare gli utenti a servirsi del cellulare e, di riflesso, aumentare gli utili degli operatori di rete, semplificandone lutilizzo. Con laffermarsi di cellulari WAP e di terza generazione (UMTS), che consentono di accedere ad ampiezze di banda sempre maggiori, aumenterà anche lutilità del telefonino. Philips ha ideato Connected Pl@net, un nuovo concetto per suscitare interesse verso dispositivi che riuniscono funzionalità vocali, telefoniche, Internet e audio. È già stato dimostrato come sia possibile recuperare messaggi SMS mediante comando vocale. Philips ha inoltre illustrato un nuovo concetto, denominato Connected Pl@net, il cui fine è appurare quali siano le aspettative del consumatore riguardo alle funzionalità di questo genere di prodotti. Le ipotesi presentate in occasione del CeBIT 2000 sono servite a capire quali funzioni potrebbero essere incorporate nei prodotti. Tali funzioni, tuttavia, non troveranno necessariamente unapplicazione rigorosa in fase di produzione. Nel corso del progetto sono stati presentati modelli di prodotti e servizi per comunicazioni intelligenti, sullo sfondo di ambienti realistici, che hanno permesso di illustrare i metodi di comunicazione del futuro e come sarà possibile interagire in modo nuovo con prodotti e servizi. Diversamente dalla funzione di riconoscimento vocale dei cellulari, che per elaborare i comandi utilizza un chip interno al dispositivo, la tecnologia Interactive Voice Response (IVR) sfrutta le risorse di rete per interpretare il linguaggio naturale dellutente. A tale scopo è necessario un sistema di riconoscimento vocale basato su server con capacità di elaborazione elevate. Il riconoscimento vocale può essere eseguito in diversi modi, uno dei quali è definito estrazione delle caratteristiche e consiste nel memorizzare un insieme di parametri spettrali vocali, solitamente compresi tra 20 e 40, in ogni unità di tempo di lunghezza generalmente compresa tra 10 e 20 secondi. Nelle fasi successive, come ad esempio nella ricerca di parole, vengono utilizzate solo le caratteristiche così memorizzate. Un secondo metodo consiste nel trasmettere tutte le informazioni vocali al server di rete perché vengano riconosciute e interpretate nel cuore del sistema. Il terzo metodo, definito metodo DSR (Distributed Speech Recognition), consente di eseguire lestrazione delle caratteristiche internamente al cellulare e quindi di trasmetterle al server di rete che ne esegue il riconoscimento. In questo caso, il server riceve solo le caratteristiche estratte e non il flusso completo di informazioni vocali.

Autore: ITespresso
Clicca per leggere la biografia dell'autore  Clicca per nascondere la biografia dell'autore