Interacción mediante voz

Hoy en día estamos acostumbrados a interactuar con las máquinas mediante dispositivos mecánicos usados manualmente, es decir. Las manos (y dedos) son imprescindibles para realizar cualquier tarea, incluso cuando esta se lleva a cabo por máquinas que son realmente quienes la completan.

Podemos decir pues que las manos son nuestra limitación en la comunicación con las máquinas y requerimos de ellas para una única tarea mientras no podemos realizar otra al mismo tiempo.

Cada día más esta limitación se va superando gracias a la introducción de la voz como medio de control y comunicación con los sistemas autónomos o máquinas.
Ya nos hemos acostumbrado a los sistemas de marcación por voz de los teléfonos móviles muy útiles por ejemplo cuando conducimos. Mejora sustancial que se nos pasa por alto debido a lo acostumbrados que ya estamos a usarla y no apreciamos la liberación que supone respecto al método tradicional de ocupar una o las 2 manos para marcar el número deseado.

Los móviles son posiblemente los primeros dispositivos en incorporar tecnología de reconocimiento de voz para ejercer sus funciones, además de las funciones de enrutamiento de los contestadores automáticos de los call centres. Anteriormente se habían promocionado algunas aplicaciones Speec To Text ( voz a texto) que usaban estos principios de reconocimiento de voz para la escritura de documentos de texto, pero su eficiencia era escasa y su difusión fue mas por lo que podían llegar a representar que por lo que realmente representaron.

Aunque el proceso de reconocimiento de voz en gramáticas totalmente abiertas es muy complejo, se están obteniendo muy buenos resultados en gramáticas acotadas a ámbitos, delimitadas por palabras claves y/o listas de palabras propias, podeis leer más sobre reconocimiento en el artículo “Análisis de la Semántica Latente (LSA) y estimación automática de las intenciones del usuario en diálogos de telefonía (call routing)” http://www.revistafaz.org/numero1/call_routing.pdf.

No es difícil pues imaginar que esta comodidad que nos proporciona la voz se extienda a otros dispositivos cotidianos desde que los sistemas de reconocimiento de voz han mejorado sus prestaciones y rendimientos hasta permitir aplicaciones como Jott.

Joot

Servicio web gratuito que te permite enviar mails, crear listas de TO-DO o escribir posts en tu blog desde cualquier lugar mediante una simple llamada telefónica. Mediante el reconocimiento de la voz, la aplicación traduce la voz a texto para tareas habituales que requieren de nuestra atención como escribir un simple mail.
El servicio también se extiende a otras aplicaciones web que puedes manipular mediante una simple llamada: Twitter, Jaiku , Google Calendar son algunas de las aplicaciones integradas


Esquema de funcionamiento de Joot con una aplicación externa (Joot-Links)
esquema de Jott


La telefonía sea quizás el punto de entrada a la investigación e innovación tecnológica en lo referente al control de dispositivos mediante la voz y en breve dispongamos de navegadores web controlados por voz.

miércoles, enero 02, 2008

  • Volver al prinCipio