Wilkommen! Amazon Echo y Alexa ahora hablan alemán e inglés británico

Banderas alemana y británica
Banderas alemana y británica

En septiembre de 2016 (cómo pasa el tiempo…), Amazon anunció que Amazon Echo, y por lo tanto Amazon Alexa, se pondrían disponibles en el Reino Unido y en Alemania.

Se podría pensar que esto significa la presencia en dos países más pero la adición de solamente un idioma, pero esto no es así. Intentar que una Alexa estadounidense logre comprender los acentos de Newcastle ( Geordie) y de Liverpool (Scouse) es simplemente imposible.

Así pues, a partir de ahora hay tres idiomas a considerar a la hora de definir tu Skill: Inglés estadounidense, inglés británico, y alemán.

Es muy importante ver que geografía e idioma son dos cosas distintas que requieren que tomes decisiones para cada una de ellas. Un ejemplo lo dejará mucho más claro: Puedes publicar un Skill para Alemania en inglés estadounidense y alemán, o puedes publicarlo para Alemania y solamente en alemán. Cuando definas tu modelo de interacción, definirás tantos modelos como idiomas implementes. Cuando proporciones información de publicación (el último diálogo antes de enviar tu Skill a certificación), decidirás la geografía.

En nuestro siguiente post daremos respuestas a lo siguiente: ¿Qué pasa con mi funcionalidad? ¿Necesitaré crear una por idioma? (pista: ¡no lo hagas!). ¿Cuáles son las implicciones de limitar mi Skill a ciertos países? También hablaremos un poco sobre tipos de Slot predefinidos (¡cada vez hay más!) y sus implicaciones en Skills multi-idioma.

Amazon Lex, el corazón de aLEXa, disponible para desarrollar bots conversacionales

Amazon Lex Logo
Amazon Lex Logo

Esta mañana al fin me enviaron la invitación al programa beta de Amazon LEX, el corazón del sistema de reconocimiento de voz de Alexa, con el cual se pueden crear bots de conversación.

Apenas he comenzado a leer la documentación, así que ténganme paciencia 🙂 , pero tiene muy buena pinta. Hay muchos conceptos familiares para los que hemos desarrollado “skills” para Alexa, especialmente en el ámbito de la definición de interacciones. Otros términos y conceptos son totalmente nuevos.

Espero tener un bot funcionando dentro de un par de semanas. ¡Ya lo iré comentando por aquí!

¿Quieres probar Alexa, pero no tienes un dispositivo Echo? Respuestas, aquí

Amazon Echo se comenzó a comercializar en Estados Unidos en diciembre de 2015 y desde entonces se han vendido 3 millones de dispositivos en Estados Unidos. Amazon no suele dar a conocer la hoja de ruta de sus productos y servicios, así como tampoco publicitan las fechas de puesta en marcha o introducción de productos en otros mercados de modo anticipado, así que no tenemos ni idea de cuándo se pondrá a la venta en otros países de habla inglesa, menos todavía saber cuándo Alexa comenzará a hablar español o tagalo con nosotros… Así pues, si tienes curiosidad por saber cómo funcionan los servicios de voz de Alexa pero no estás en Estados Unidos, tendrás que dar algunos rodeos para acceder a esta tecnología.

Teléfonos

Hay dos maneras de hablar con Alexa a través de tu teléfono:

  • Lexi. Una app para iOS. Precio_ $4.99.

    Lexi Logo
    Lexi Logo
  • Roger Voice Messenger. Se trata de una app construida por un grupo de ingenieros fundadores de Spotify. Es un sistema de walkie-talkie que acepta más opciones. Por ejemplo, puedes añadirle Alexa, enlazar tu cuenta en Amazon con Roger, y comenzar a usar AVS. Roger también tiene una opción para hablar con Chewbacca. App gratuita para Android e iOS.
    Roger Logo
    Roger Logo

    En Web

  • Echosim.io: Simulador construido con JavaScript que funciona muy bien. Apenas se puso en marcha hace unas semanas.
  • La herramienta de pruebas en la consola de desarrollador de Amazon. Ya hablaré más de esa herramienta cuando entre en detalles del juego de herramientas de desarrollo (SDK), pero de momento diré que es un modo bastante masoquista de probar la tecnología, a menos que tu lenguaje de comunicación preferido sea el JSON en lugar del español.

Háztelo tú mismo con hardware

Constrúyete tú mismo un dispositivo Echo con una Raspberry Pi. Dejo un par de recursos (en inglés) con instrucciones: cómo lo explica Amazon, cómo lo explica la Raspberry Pi Foundation. Un compañero de trabajo (que no es ni desarrollador ni maker) me dice que es fácil de hacer, aunque laborioso, eso sí. Estos son los materiales que necesitarás:

  • Una Raspberry Pi 2 (modelo B) y los periféricos habituales (cable de alimentación, tarjeta SD, teclado, ratón, adaptador Wifi por USB).
  • Mini micrófono USB 2.0.
  • Altavoz que funcione con jack o clavija de 3.5 mm (el habitual).
Homebrew Amazon Echo with Raspberry Pi
Homebrew Amazon Echo with Raspberry Pi

“Mercado negro” 

  • eBay. Not es que sea mercado negro, en absoluto. Hay muchísimos dispositivos Amazon Echo en venta por Internet fuera de Amazon. Buena suerte con Aduanas si escoges esta vía, especialmente si estás en España. Aduanas está bloqueando muchísimos paquetes provenientes de fuera de la UE y además del 21% de IVA a la importación extracomunitaria te aplicarán una “tarifa plana” adicional de alrededor de 17 € por “gastos de administración”.

Servicios de Voz de Alexa (AVS): Abierto por los dos extremos

AVS - Diagrama contextual
AVS – Diagrama contextual

Los servicios de voz de Alexa (AVS) son lo mejor que hay en el campo de la inteligencia artificial débil para el procesado del lenguaje natural. No tienen competencia en términos de calidad, que en este área se mide por la precisión en el reconocimiento de voz. (bueno, quizás el producto creado por el equipo de Andrew Ng para Baidu sea mejor, pero de momento solamente funciona en mandarín). La precisión es una medida no linear de lo útil que es el sistema. Quiero decir: Siri, Cortana, etc. quizás estén al 95% de precisión. Pero ese 5% de veces en que el reconocimiento de voz es incorrecto afecta muchísimo a la usabilidad: esos asistentes de voz resultan divertidos pero no son muy confiables (y cuando no te entienden bien, la experiencia es muy fastidiosa). Alexa está en un 98% de precisión, cifra en torno a la cual se encuentra el umbral de usabilidad real. Pero no se preocupen. Apple, Microsoft y resto de empresas del sector seguro que alcanzarán esa cifra pronto.

Entonces, ¿qué es lo que hace que AVS sea tan especial? Apertura. No quiero decir que se trate de un sistema de software libre (no lo es en absoluto), sino que Amazon se está esforzando mucho en lograr que desarrolladores, makers y empresas de tecnología integren AVS en sus aplicaciones, en los dos extremos. Represento esto en el diagrama contextual que acompaña a esta entrada en el blog. Los dos extremos son los siguientes:

Los servicios de voz de Alexa pueden integrarse en cualquier aplicación como interfaz de usuario

Amazon ha hecho público el Alexa Skills Kit, un conjunto de herramientas para desarrollar software (SDK en inglés) a utilizar para ayudar a los desarrolladores a crear Skills que se puedan utilizar por Amazon Echo o cualquier otro dispositivo que pueda interactuar con Alexa. Le voy a dedicar una entrada entera al ASK, así que no entraré en detalles ahora. Amazon también ha publicado otro SDK para el control de dispositivos domésticos (iluminación, cortinas, termostatos, etc.) llamado Smart Home Skill API. Todavía no he tenido ocasión de probar este último.

El paraíso Makers: puedes usar los servicios de voz de Alexa con tu propio hardware

Este concepto también amerita una entrada del blog, pero para dar una idea de lo que es posible, adjunto un par de recursos (en inglés) sobre como convertir un dispositivo Linux en un dispositivo capaz de utilizar AVS:

Alexa Lambda Linux (ALL) Reference Design, escrita por “un alma caritativa” que es tan bueno gestionando proyectos como documentándolos.

Convertir una Raspberry Pi en un altavoz estilo Echo: escrito por Amazon: Amazon’s how-to for building an Echo-like device with a Raspberry Pi.

Ahora pensemos otra vez en la Internet de las cosas (IoT por sus siglas en inglés). Esas “cosas” no solo estarán conectadas siempre a Internet, sino que también podremos hablar con ellas, ¡y nos entenderán!

Otros competidores (Google, por ejemplo) acaban de anunciar recientemente de qué manera van a introducir altavoces inteligentes para el hogar (Google Home), pero, al contrario de lo que ha hecho Amazon, no han puesto a disposición de los desarrolladores ningún SDK ni han dado idea de si se tratará de una plataforma con la cual todos puedan integrar sus soluciones.

¿Estás en EEUU? ¿Tienes un Amazon Echo? ¿Para qué lo usas?

¿Quién es Alexa?

Amazon ha revolucionado el mundo de las tecnologías de la información, ¡otra vez! En diciembre de 2015 lanzó en Estados Unidos un nuevo dispositivo llamado Amazon Echo. ¿Es solo un altavoz con Wifi? No. Es el avatar (entendiendo esto como la representación corpórea de algo etéreo) de Alexa, un asistente construido con Inteligencia Artificial que puede contar chistes y controlar las luces de tu casa.

Pero, ¿por qué decimos que esto es revolucionario? Ya existe Siri, ya existe Google Now, ya existe Cortana. ¿Por qué es diferente Alexa? Bien, para empezar, porque en el momento de escribir esto (junio 2016), ya se han vendido tres millones de dispositivos Amazon Echo en Estados Unidos. Pero la verdadera diferencia es que Amazon ha puesto a disposición del público general, y desarrolladores en particular, el kit de desarrollo de “Skills” para Alexa (Alexa Skills Development Kit, o ASK). Un “Skill” es “una tarea o función que Alexa sabe realizar”. Es decir, sin coste alguno, los desarrolladores que así lo deseen pueden comenzar a crear funcionalidad que usa el lenguaje natural (la voz) para comunicarse con el usuario.

Amazon también ha creado, y ofrece de modo gratuito, una buena cantidad de recursos de formación para aprender a trabajar con Alexa (aquí, una buena introducción en el MOOC Udemy; aquí una de nivel más avanzado en Big Nerd Ranch). Todo esto hace que los servicios de voz de Alexa (Alexa Voice Services, o AVS), la parte de todo este sistema construida con Inteligencia Artificial y por lo tanto carísima de construir, se pueda usar en todo tipo de casos de uso. En otras palabras: Amazon quiere que Alexa aprenda a hacer muchas cosas (que Alexa tenga muchos “Skills”) y son los desarrolladores quien pueden hacerlo, por lo que Amazon nos lo está poniendo muy fácil. Incluso personas que no se dedican a programar profesionalmente, pero que sí lo han hecho alguna vez, o que desarrollan proyectos personales como medida para no acabar de olvidar este arte, como yo, han logrado enseñar a Alexa un montón de datos curiosos sobre la ciudad de Barcelona y a retar a la gente a demostrar su conocimiento, y también estoy logrando que Alexa se convierta en una experta en vinos (experta en vino) .

En este blog podrán seguir cómo voy avanzando, qué cosas me resultan difíciles, cómo Amazon va construyendo todo el entorno de desarrollo y explotación a medida que nosotros, los primeros 1000 desarrolladores de “Skills” de Alexa y todos los demás que se vayan uniendo, vamos avanzando con él, y en resumen, qué pienso de todo este asunto. Espero les sea de su agrado.