top of page
Malka Mekler

HuGE: el nuevo método de aprendizaje para robots

Human Guided Exploration (HuGE) se destaca por utilizar la retroalimentación humana para guiar el aprendizaje de agentes de inteligencia artificial y robots.

Un equipo de investigadores de las instituciones MIT, Harvard y la Universidad de Washington, desarrollaron un método pionero para el entrenamiento de agentes de inteligencia artificial (IA) y robots. Human Guided Exploration (HuGE) se destaca por utilizar retroalimentación humana para guiar el aprendizaje de los robots, transformando los métodos tradicionales que dependen exclusivamente de expertos en IA.


A diferencia de las técnicas convencionales, las cuales requieren de funciones de recompensa meticulosamente diseñadas por especialistas, HuGE cuenta con una estrategia más inclusiva y accesible. Dicha retroalimentación multitudinaria, la cual se obtiene por usuario no expertos a nivel global, se convierte en un foco que oriente el aprendizaje de robots ya que esta innovación no solo simplifica el proceso de enseñanza de tareas complejas, sino que también lo hace más eficiente y adaptable a diferentes contextos.


La especialidad de este método radica en su capacidad de filtrar y aprovechar datos imprecisos. En lugar de percibir estos errores como un obstáculo, HuGE los utiliza para guiar al robot hacia un aprendizaje más efectivo y rápido. Este enfoque asincrónico permite que personas de diversas partes del mundo contribuyan al entrenamiento de los robots, superando barreras geográficas y de conocimiento especializado.



Esta herramienta se basa en principios de aprendizaje por refuerzo, haciendo que los agentes aprendan mediante la experimentación y la obtención de recompensas. No obstante, HuGE transforma este concepto al introducir la retroalimentación humana como un factor clave.


Una de las características que distingue a este método es su capacidad de funcionar sin retroalimentación continua. Al no haber retroalimentación o inclusive si esta llega tarde, el agente continúa aprendiendo de manera autónoma a un ritmo más lento. Este aspecto de HuGE permite que la retroalimentación se recopile de manera infrecuente y asincrónica, lo que facilita la participación global y diversa.


Además, debido a que la retroalimentación solo guía de manera sutil el comportamiento del agente, este tiene la capacidad de completar la tarea incluso si los usuarios brindan respuestas incorrectas. La tolerancia a errores y datos ruidosos es fundamental para este enfoque, permitiendo un aprendizaje más flexible y resistente a las imperfecciones humanas.


Por su parte, los investigadores a cargo llevaron a cabo diversos experimentos tanto en entornos simulados como en situaciones de mundo real para poder comprobar la eficacia de la herramienta. A pesar de que aún tiene trabajo por mejorar, esta tecnología brinda una mirada hacia el futuro cercano del entrenamiento de robots.


コメント


bottom of page