top of page

La magia detrás de los asistentes de voz

Aunque para muchos la tecnología ha supuesto un viso de pereza, lo cierto es que para otros permite la realización de más tareas en menos tiempo y en menos pasos, y todo apunta a que cada vez irá intensificándose.

Hoy en día, en lugar de desbloquear un dispositivo y dar varios clics para consultar el estado del tiempo, llamar a un familiar o crear una lista de compras, las personas emplean la voz para esas y otras tareas.

Esto es gracias a los asistentes de voz digitales que incorporan inteligencia artificial, procesan las indicaciones a gran velocidad y brindan las respuestas exactas a consulta tan prácticas, como los ingredientes de una receta- hasta conocer cómo serán las condiciones del tiempo este o los próximos días.

Por ejemplo Alexa, la inteligencia artificial del Amazon Echo Spot y Amazon Echo Dot, encaja a la perfección en el planteamiento anterior. La clave de su funcionamiento reside en los sistemas informáticos incorporados en los chipset, o System on Chips (SoC) como los llama su fabricante, MediaTek, que se alojan en ambos dispositivos.

Dichos SoC incorporan conectividad a Bluetooth, internet inalámbrico de buena calidad, radio FM y GPS en una sola pieza sin que eso impacte el costo del equipo. Echo Dot además posee un procesador para la gestión de la energía  y otro para que el rendimiento sea óptimo.

El chipset es el alma y corazón del dispositivo. Realiza las acciones que le requiera el usuario, obtiene la información que se necesita y trabaja con todos los componentes dentro del dispositivo”, explicó Amikam Yalovetzky, gerente de Ventas Senior Latam de Mediatek.

El SoC da soporte a los parlantes del dispositivo, al reconocimiento de los comandos de voz y a que la inteligencia artificial que incorpora cumplan con las acciones solicitadas, que además pueden ser el encendido o apagado de luces en una casa inteligente, ejecutar una lista de música o hacer un resumen de la cantidad pasos de una caminata.

Echo recibe la indicación verbal, la envía mediante la conexión de WiFi al servicio de Alexa alojado en la nube, interpreta la indicación y la dirige a los servidores de Amazon para dar la respuesta correcta en forma de audio, texto o tarjetas gráficas, según sea el dispositivo que se está utilizando.

La magia detrás de este proceso la hace posible el SoC, que además permite que los algoritmos de reconocimiento de voz mejoren conforme funcionan, aprenden de la forma de hablar del usuario y del vocabulario que se emplea, al tiempo que identifica con claridad la voz humana y la separa del sonido ambiente. El mundo dentro del chipset balancea las cargas de trabajo y cumple con las tareas solicitadas, mientras el usuario realiza otras actividades.

Aunque por ahora la inteligencia artificial reside en la nube, Yalovetzky dejó entrever la posibilidad de que hacia el futuro esta resida dentro de los dispositivos para hacer aún más veloz la interacción al recolectar los datos, una de las características de la llamada Edge Computing.

Hacia el final de esta década, algunas cifras de la consultora IDC prevén que habrá un aumento significativo de los dispositivos con inteligencia artificial por medio de asistentes de voz como Amazon Echo, al menos en Estados Unidos.

Comments


bottom of page