Google DeepMind präsentiert Gemini Robotics: Die nächste Generation von Robotern
Google DeepMind hat zwei neue KI-Modelle auf Basis von Gemini 2.0 vorgestellt: Gemini Robotics und Gemini Robotics-ER, die es Robotern ermöglichen, eine größere Bandbreite an realen Aufgaben zu bewältigen. Gemini Robotics ist ein fortschrittliches Vision-Language-Action-Modell, das Roboter direkt steuert; Gemini Robotics-ER verfügt über ein erweitertes räumliches Verständnis, das es Robotikern erlaubt, ihre eigenen Programme mit Geminis Fähigkeiten zum verkörperten Denken (Embodied Reasoning) auszuführen. Beide Modelle zeichnen sich durch ihre Generalität, Interaktivität und Geschicklichkeit aus, können verschiedene Aufgaben und Umgebungen bewältigen und besser mit Menschen zusammenarbeiten. DeepMind hat außerdem einen neuen Datensatz, ASIMOV, veröffentlicht, um die semantische Sicherheit in verkörperter KI und Robotik zu bewerten und zu verbessern, und arbeitet mit Unternehmen wie Apptronik zusammen, um die nächste Generation von humanoiden Robotern zu entwickeln.