Google DeepMind presenta los modelos de IA Gemini Robotics para un control preciso de robots
Google DeepMind anunció dos nuevos modelos de IA diseñados para controlar robots: Gemini Robotics y Gemini Robotics-ER. Estos modelos, basados en el modelo de lenguaje grande Gemini 2.0, incorporan capacidades de visión-lenguaje-acción (VLA) y razonamiento espacial mejorado. Gemini Robotics permite a los robots comprender y ejecutar comandos complejos, como "coge el plátano y ponlo en la cesta", mientras que Gemini Robotics-ER se centra en la integración perfecta con los sistemas de control de robots existentes. Esto representa un avance significativo en la robótica, particularmente en el manejo de manipulaciones físicas complejas y en la demostración de fuertes capacidades de generalización. Google se ha asociado con Apptronik para construir la próxima generación de robots humanoides utilizando Gemini 2.0, mostrando el potencial de adopción generalizada. Sin embargo, Google también enfatiza la seguridad, lanzando el conjunto de datos "ASIMOV" para ayudar a los investigadores a evaluar las implicaciones de seguridad de las acciones robóticas.