Inicio Opiniones Siri: ¿me escuchas?

Siri: ¿me escuchas?

Finalmente, el diálogo por voz aparece en el horizonte de aplicaciones informáticas como una tecnología lo suficientemente madura para agregar valor a las interfases de programas de uso cotidiano.

Las aplicaciones de negocios deberían empezar a construirse pensando en ese paradigma de interfaz, que agrega todo un espectro de modelos de uso hasta hace poco imposibles de aplicar.

Como en otros casos de los últimos años, nuevamente la tecnología de los consumidores avanzó más rápido que la tecnología para negocios. En esta oportunidad de la mano de Siri, el asistente de voz de la nueva versión de Iphone.

La comunicación de las personas con las computadoras para efectuar operaciones por medio de una interfaz alternativa al teclado y mouse (o la pantalla multitáctil, más recientemente) es algo que desde hace décadas se considera necesario, apuntando al mejoramiento de esa interacción.

Desde entonces, se piensa que el momento de masificación de esa funcionalidad está cercano.

Por ejemplo, cerca del año 2000 el mediático futurista Ray Kurzweil incluso le puso una fecha: antes del año 2009 la comunicación principal masiva entre hombres y computadoras se realizaría por medio de la voz.

Lamentablemente, eso todavía no sucedió. Sin embargo, hace pocas semanas, el lanzamiento del nuevo teléfono de Apple trajo como principal novedad la interacción del usuario a través de un sistema de reconocimiento de lenguaje natural, Siri.
Si bien aplicaciones de ese tipo estaban disponibles desde hace tiempo en varias plataformas, la novedad estaba en la calidad de la integración de Siri con las restantes aplicaciones, y la inteligencia desarrollada en su comprensión.

Siri fue recibido con entusiasmo, y empieza a ser un agente de masividad de este mecanismo de interfaz. Por ahora no habla español, así que no podemos saber muy bien cómo nos entenderá, pero seguramente su funcionalidad seguirá siendo perfeccionada, y hablará pronto nuevos idiomas.

Considero que esta es una tendencia irreversible, que finalmente alcanzó su momento de madurez. Además, pensando con perspectiva, la comunicación por teclado no deja de ser una modalidad bastante poco sofisticada y arbitraria: un mecanismo de comunicación que tiene sus raíces más profundas en el telégrafo, como codificación de caracteres a partir de movimientos de una máquina.

Que haya costado tanto llegar a este estado de las cosas tiene que ver con la naturaleza misma del problema: la interfaz por voz de las computadoras implica resolver simultáneamente dos aspectos muy complejos, que requieren un abordaje desde la inteligencia artificial: la interpretación de las ondas de sonido como significantes, y la interpretación de esos significantes como sentido. Y acá el problema del contexto agrega mayor complejidad a la ecuación: la comunicación humana siempre tiene implícita una situación que agrega información a lo que se dice, y que completa el contenido de lo dicho.

Sin embargo, la tecnología ya realizó su avance más difícil, y seguramente, desde ahora hacia adelante iremos viendo nuevas funcionalidades: nuevos productos que nos sorprendan cada vez más por su apoyo a los usuarios en el uso de sus computadoras, y del medio circundante a partir de ellas.

En el entorno de negocios, la creación de aplicaciones que utilicen comandos e interacciones de voz es promisorio, aunque todavía no se vean en el horizonte. ¡Imaginemos -por ejemplo – todo lo que un producto de Business Inteligence puede sumar con una interfaz de lenguaje natural! En realidad, es justamente tiempo de crear esas nuevas aplicaciones, que ahora si están más a mano.

Me imagino que en ese contexto, el smartphone será muchas veces un mediatizador de la comunicación entre el usuario y los sistemas relacionados, dando las herramientas de micrófono, parlante y visualización de información como un intermediario ubicuo. O incluso para controlar displays remotos. Y contextualizando la presencia del usuario en un espacio de trabajo u operaciones mediante el GPS y los vínculos inalámbricos como Near Field Comunications (NFC).

El sueño de una computadora como HAL en 2001 Odisea del espacio está finalmente cerca. Necesariamente claro, sin sus inquietantes decisiones autónomas.