Distinguere 3 voci contemporaneamente

Il famigerato robot Asimo è stato dotato una serie di 8 microfoni disposti intorno alla testa che gli permettono di distinguere e comprendere le voci di tre persone differenti che parlano nello stesso momento.

Il risultato è che al momento Asimo può fare da giudice in una partita a “sasso, carta e forbice” disputata all’unisono. Un po’ poco, è vero, ma la scienza inizia quasi sempre a piccoli passi…

L’intuizione dei ricercatori è stata quella di far riconoscere le voci non per il timbro, ma per la provenienza spaziale, da cui appunto l’uso di otto microfoni distinti, prima di passare il flusso al software di riconoscimento vocale. Questo software è chiamato HARK e non fa distinzioni e priorità tra le voci, trattandole tutte allo stesso modo e permettendo di separarle in una fase successiva. Sebbene intorno al robot possano esserci anche 10 persone, per adesso 3 è il numero massimo di voci su cui Asimo si può “concentrare” per mantenere una accuratezza tra il 70 e l’80%.

Le sfide adesso sono chiaramente:

aumentare il numero di vocaboli percepiti dal sistema
aumentare l’accuratezza sino al 100%
aumentare il numero di “flussi”

A prescindere dall’uso puramente dimostrativo su Asimo, gli scenari sono abbastanza interessanti: tra qualche anno potremmo avere un oggetto che posto al centro di una stanza registra separatamente le voci di un tot di persone durante una riunione, senza bisogno di microfonarle singolarmente, e permettendo in una fase successiva di eliminare dalla “bobina” i contributi inutili. Allo stesso modo, quando in un futuro ancora piuttosto lontano esisteranno robot-camerieri, sarà possibile effettuare più ordinazioni contemporaneamente.

Le possibili applicazioni sono molteplici come sempre, ma la tecnologia mi sembra parecchio interessante, anche se sottintende a un assioma abbastanza preoccupante: siccome non possiamo fare a meno di fare confusione, demandiamo a una macchina il compito di fare ordine.

[fonte NewsScientist ]

Distinguere 3 voci contemporaneamente

Pochi mesi all’uscita di MacOSX 10.6?

Provider sotto accusa: aggiungeva codice maligno per monitorare gli utenti

Sfoglia categorie

Programmazione

Not always “big is better”: the importance of choosing data types – An example with CPython

Non sempre “big is better”: l’importanza della scelta dei tipi di dati – Un esempio con CPython

No, i limiti dell’HAM non sono svaniti!

L’abuso di assembly nuoce gravemente alla salute (mentale)

Amiga in modalità HAM: gioia per gli occhi, ma per pochi giochi

Non erano pigri certi sviluppatori Amiga che spremevano la macchina

Con Unity 3D è un gioco – Parte 2

Con Unity 3D è un gioco!

Genesi di un videogame ai tempi dell’Amiga: Verkosoft al Salvataggio!

Genesi di un videogame ai tempi dell’Amiga: La lunga e tetra ora del tè dell’anima

Distinguere 3 voci contemporaneamente

Sfoglia categorie

Programmazione

Tag Clouds

Press ESC to close