실시간 청크화를 사용한 비전-언어-행동 모델
2025-06-17
본 논문에서는 로보틱스 분야에서 비전-언어-행동(VLA) 모델의 실시간 실행 과제를 해결하는 실시간 청크화(RTC) 알고리즘을 소개합니다. 기존 VLA 모델은 속도가 느리고, 행동 청크를 전환할 때 불연속성이 발생하기 쉬워 로봇의 동작이 불안정해집니다. RTC는 행동을 청크로 나누고 이전 청크를 실행하는 동안 다음 청크를 생성하여 실시간 실행을 달성하고 불연속성을 제거합니다. 실험 결과, RTC는 실행 속도와 정확도를 크게 향상시키고, 높은 지연 시간에서도 견고한 성능을 유지하는 것으로 나타났습니다. 이 연구는 복잡한 작업을 실시간으로 처리할 수 있는 로봇을 구축하는 길을 열어줍니다.