Por: Microsoft Asia News Center
Microsoft revela una aplicación para smartphone en Japón, que incluye a Rinna, el chatbot, con una combinación de poderosas nuevas tecnologías de IA.
La Inteligencia Artificial (IA) que puede ver y comentar el mundo que nos rodea pronto va a interactuar de una manera mucho más natural con la gente en sus vidas diarias gracias a una poderosa combinación de nuevas tecnologías que han sido probadas en Japón a través de una aplicación de chat para smartphone.
La aplicación cuenta con Rinna, el chatbot social de gran popularidad de Microsoft Japón. Fue revelada durante el Microsoft Tech Summit 2018 en Tokio, hace unos días, y aún se encuentra en su etapa de desarrollo.
La IA detrás de la aplicación cuenta con capacidades mejoradas de visión, oído y habla para reconocer y comentar los objetos que ve en maneras similares a como lo haría una persona. Como tal, representa un significativo paso hacia un futuro de interacciones naturales entre la IA y la gente. Al centro de la aplicación está “Empathy Vision Model”, que combina tecnología convencional de IA para reconocimiento de imagen con respuestas emocionales.
Con esta tecnología, Rinna observa su entorno a través de la cámara del smartphone. Ella no solo reconoce objetos y gente, también puede describir y comentar sobre ellos de manera verbal en tiempo real. A través de procesamiento natural de lenguaje, reconocimiento de habla, y tecnologías de síntesis de habla, desarrolladas por científicos en Microsoft Research, puede involucrarse en conversaciones naturales con el usuario humano del teléfono.
“El usuario puede sostener su smartphone en su mano o colocarlo en el bolsillo a la altura del pecho mientras camina. Con la cámara encendida, Rinna puede ver el mismo escenario, gente y objetos que el usuario y comentar sobre esto con el usuario”, comentó Takuya Hirano, presidente de Microsoft Japón.
A diferencia de otros modelos de visión de IA, Rinna puede describir sus impresiones de lo que ve con sentimiento, en lugar de sólo listar resultados de reconocimiento como nombres, formas, y colores de las cosas que ella ve. Rinna en un smartphone puede ver el mundo desde la misma perspectiva de un usuario y puede conversar sobre esto con el usuario.
Tomemos la siguiente imagen para ayudar a ilustrar la diferencia:
La tecnología convencional de visión de IA podría reaccionar así de manera típica: “Veo gente. Veo a un niño. Veo un perro. Veo un auto”.
En contraste, Rinna con Empathy Vision Model puede decir: “¡Qué linda familia! ¿Disfrutan del fin de semana? ¡Cuidado, viene un auto!”
Tan bien como el Empathy Vision Model, el cual genera comentarios empáticos en tiempo real sobre lo que la IA ve, la aplicación para smartphone de Rinna también cuenta con innovadoras características, que incluyen “full dúplex”. Esto permite a la IA participar en conversaciones naturales tipo telefónicas con una persona al anticipar lo que la persona podría decir.
Esta capacidad ayuda a Rinna a tomar decisiones sobre cómo y dónde responder a alguien que chatea con ella, un conjunto de habilidades que es muy natural en la gente, pero no es común en los chatbots. Esta difiere de “half dúplex”, que más como la experiencia con un walkie-talkie en la que sólo un participante de la conversación puede hablar a la vez. Full dúplex reduce el poco natural tiempo de desfase que en ocasiones puede hacer que las interacciones entre una persona y un chatbot se sientan forzadas o raras.
La aplicación de smartphone de Rinna también incorpora Empathy Chat, que ayuda al pensamiento independiente para la IA. Esto ayuda a mantener una conversación con el usuario por el mayor tiempo posible. En otras palabras, la IA selecciona y utiliza respuestas con la intención de invitar a la persona a mantenerse involucrada y hablar.
Todavía se encuentra en su etapa de desarrollo y el momento para su lanzamiento general aún no ha sido establecido. Pero la función de chat de voz está disponible como “Voice Chat with Rinna” en la cuenta oficial de Rinna en LINE en Japón.