I ricercatori Intel insegnano ai computer a "leggere le labbra" per aumentare l’accuratezza del software di riconoscimento vocale

Management

I ricercatori di Intel Corporation hanno rilasciato un prodotto software che consente agli sviluppatori di realizzare computer in grado di vedere e "leggere le labbra", come l’uomo, per migliorare la riconoscibilità dei comandi vocali.

Gli attuali algoritmi di riconoscimento vocale sono efficaci quando vengono eliminati i rumori di fondo o quando viene utilizzata una cuffia ben sintonizzata, ma presentano un rapido degrado nell’accuratezza quando le applicazioni vengono utilizzate in ambienti rumorosi, ad esempio nei luoghi pubblici. Insieme agli algoritmi di riconoscimento facciale della libreria di tool per la visione computerizzata Intel OpenCV, il software Audio Visual Speech Recognition (AVSR) consente ai computer di rilevare il viso dell’utente e di tenere traccia dei movimenti della bocca. Sincronizzando i dati video con l’identificazione vocale è possibile ottenere un riconoscimento vocale molto più accurato, migliorando una vasta gamma di applicazioni negli ambienti rumorosi. Il software AVSR fa parte della libreria di tool per la visione computerizzata OpenCV, contenente oltre 500 funzioni di imaging che consentono ai ricercatori di sviluppare applicazioni per la visione computerizzata. “Intel intende sviluppare una tecnologia che favorisca un’interazione naturale tra i computer e il mondo circostante. Il riconoscimento umano non è quasi mai basato su un singolo tipo di informazione. Le decisioni vengono infatti prese combinando le informazioni provenienti da più fonti”, ha spiegato Justin Rattner, Intel Senior Fellow dell’Enterprise Platform Group e Director degli Intel Microprocessor Research Labs. “Con l’aggiunta di codice per il riconoscimento vocale audio/video, siamo certi di favorire la ricerca e lo sviluppo nel campo del riconoscimento vocale assistito dalla visione”. Grazie ai microprocessori più veloci, ai prezzi in calo delle videocamere e alla larghezza di banda dieci volte più ampia per l’acquisizione dei video resa disponibile da tecnologie come USB 2, gli algoritmi della visione computerizzata in tempo reale possono essere eseguiti su PC mainstream. La libreria OpenCV è stata concepita per migliorare l’innovazione in questo campo fornendo codice sorgente per una vasta gamma di funzioni di imaging e di visione computerizzata. Dalla data del rilascio, nel 2000, questa libreria ha registrato oltre 500.000 download di codice e ha attirato più di 5.000 utenti registrati nello user group. Gli sviluppatori utilizzano il codice OpenCV in applicazioni che vanno dai giocattoli alla produzione industriale. Il software comprende codice sorgente C per tutte le funzionalità della libreria e una licenza per la ridistribuzione priva di royalty.

Autore: ITespresso
Clicca per leggere la biografia dell'autore  Clicca per nascondere la biografia dell'autore