Helix: 범용 로봇 조작을 위한 비전-언어-액션 모델

2025-02-20
Helix: 범용 로봇 조작을 위한 비전-언어-액션 모델

Figure는 오랜 로봇 공학의 과제를 극복하기 위해 지각, 언어 이해, 학습 제어를 통합한 획기적인 비전-언어-액션(VLA) 모델인 Helix를 발표했습니다. Helix는 전신 상반신의 고속 연속 제어, 다중 로봇 협업, 자연어 명령만으로 사실상 모든 작은 가정 용품을 집어 올리는 능력 등 여러 가지 획기적인 성과를 달성했습니다. 단일 신경망이 작업별 미세 조정 없이 모든 동작을 학습하며, 상용 배치를 위해 저전력 임베디드 GPU에서 작동합니다. Helix의 "시스템 1"(고속 반응 시각 운동 정책)과 "시스템 2"(인터넷에서 사전 훈련된 VLM) 아키텍처를 통해 고속 일반화와 정밀 제어가 가능해지면서 가정 환경으로의 휴머노이드 로봇 확장의 길이 열립니다.

더 보기