Audición del habla objetivo (TSH)
Robert Klatt
La persona usa auriculares para escuchar selectivamente
)(WU) notgnihsaW fo ytisrevinU – ebuTuoY tohsneercS(Foto: ©
Unos nuevos auriculares pueden utilizar inteligencia artificial (IA) para filtrar la voz de una persona en entornos ruidosos en tiempo real. La tecnología está destinada a ayudar a las personas con discapacidades auditivas importantes en el futuro.
Seattle (Estados Unidos). Investigadores de la Universidad de Washington (UW), dirigidos por Shyam Gollakota, han desarrollado unos auriculares especiales que utilizan inteligencia artificial (IA) para permitir la audición selectiva de una persona. Los auriculares filtran otros ruidos en tiempo real, como los de otras personas o ruidos ambientales molestos, y permiten al usuario escuchar solo a la persona deseada.
«Con nuestros dispositivos, ahora puedes escuchar claramente a un solo orador, incluso cuando estás en un ambiente ruidoso donde muchas otras personas están hablando».
Para utilizar el llamado Target Speech Hearing (TSH) de los auriculares, sólo es necesario grabar la voz de la persona que habla durante tres a cinco segundos. Luego, el sistema reconoce la voz y filtra todos los demás ruidos ambientales. Según la publicación en las Actas de la Conferencia CHI sobre Factores Humanos en Sistemas Informáticos, la audición selectiva funciona independientemente de si la persona está en movimiento o en las inmediaciones del usuario.
La Inteligencia Artificial (IA) analiza la voz
Para configurar el TSH, simplemente es necesario alinear el auricular con la cabeza de la persona que habla. A continuación, el usuario activa la función y los auriculares graban la voz del hablante, cuyas ondas sonoras llegan en paralelo a los micrófonos de ambos auriculares. Luego, la IA integrada en los auriculares analiza la voz para filtrarla del ruido ambiental utilizando patrones reconocidos. Una vez completada la configuración, los auriculares reproducen la voz en tiempo real.
En experimentos con 21 personas, la claridad de la voz se calificó en promedio dos veces mejor que con datos de audio sin filtrar. En el futuro, el sistema se utilizará para mejorar los audífonos. Según los investigadores, podría ayudar a las personas con discapacidad auditiva importante a comprender nuevamente las voces de las personas.
Actas de la Conferencia CHI sobre factores humanos en sistemas informáticos, doi: 10.1145/3613904.3642057
Comments