Investigadores de nuestra universidad trabajan en un modelo de cabeza en 3D que se activa con la voz de una persona
Modelos avatars
El avance de la informática no se detiene. Las computadoras cada vez resuelven más problemas que hasta hace poco tiempo eran impensados. Encontrar equipos que puedan contestar a un saludo o interpretar una orden es cada vez más frecuente.¿Quién no ha soñado alguna vez con que la PC se active al escuchar nuestra voz?.
Un grupo de científicos viene trabajando desde hace años en el procesamiento de señales multimedia. "La idea es copiar la forma en que los humanos se comunican entre sí para comunicarse con la máquina", contó Juan Carlos Gómez, director del proyecto, en el marco del cual realizó su trabajo de tesis el investigador Lucas Terissi.
Los investigadores pertenecen al Laboratorio de Sistemas Dinámicos y Procesamiento de la Información, perteneciente a la Facultad de Ciencias. Exactas, Ingeniería y Agrimensura, así como también al CIFASIS (Centro Franco Argentino de Ciencias de la Información y de Sistemas), dependiente del Consejo Nacional de Investigaciones Científicas y Técnicas.
"El sistema propuesto permite la animación, comandado por la señal de voz de una persona, de modelos de cabezas 3D de manera que el movimiento de labios y las expresiones faciales estén sincronizadas con la señal de habla", explicó el investigador.
"Este trabajo propone un método sencillo y con equipamiento barato, una cámara web, para animar un modelo complejo de rostro de una persona a través de la animación de un modelo más simple que se ajusta en forma sencilla al modelo complejo. Las expresiones faciales del modelo simple se mapean sobre el modelo complejo, permitiendo su animación con una carga computacional reducida, lo que posibilita la implementación en tiempo real.”
Aplicaciones
Un objetivo a largo plazo en el área de investigación en comunicación humano-computadora es que la misma se asemeje a la comunicación entre humanos, que es de naturaleza multimodal, donde "es importante no solo la señal acústica del habla sino las expresiones del rostro para la comprensión del mensaje", señaló el director.
Los usos de este trabajo son múltiples y van desde técnicas para la industria del cine y video juegos, hasta la asistencia en tratamientos clínicos, como por ejemplo la estimulación de niños con problemas de autismo y aquellos que presentan problemas motrices.
En este sentido, Gómez explicó: "Las personas con dificultades auditivas utilizan principalmente la lectura de labios para comunicarse con otras personas, por ello podría utilizarse la información acústica transmitida por teléfono para animar, de manera realista, los labios de un modelo virtual, posibilitando así la comprensión del mensaje mediante lectura de labios".
Además, resaltó el investigador, "es posible utilizar la computadora a través de comandos audio-visuales, ya sea mediante la voz como por medio de expresiones faciales de una persona real. De esta forma, las personas discapacitadas que no puedan utilizar un teclado o un mouse, podrían controlar cualquier aplicación a través de un conjunto de comandos audiovisuales".
Por otra parte, y mediante el uso de "avatars interactivos" se puede intervenir en el tratamiento y rehabilitación de personas con desórdenes de dicción, utilizando dichos avatars del paciente hablando correctamente. También, en el trabajo de niños con problemas de autismo (Autism Spectrum Disorder). "Si los chicos se ven a si mismos hablando se pueden estimular", resaltó.
Este trabajo fue presentado en la International Conference on Multimedia & Expo 2011, que se llevó a cabo en Barcelona, España, y ganó el primer premio en el "Technicolor Best Student Paper Award".
VIDEO: Gentileza de Maria Laura Guevara para Agencia CTyS.
IMPORTANTE: Los comentarios publicados son de exclusiva responsabilidad de sus autores y las consecuencias derivadas de ellos pueden ser pasibles de las sanciones legales que correspondan. Aquel usuario que incluya en sus mensajes algún comentario violatorio del reglamento será eliminado e inhabilitado para volver a comentar .