هيليكس: نموذج رؤية-لغة-فعل للتحكم في الروبوتات متعددة الأغراض
2025-02-20
تقدم شركة فيجور نموذج هيليكس، وهو نموذج ثوري لرؤية اللغة والفعل (VLA) يجمع بين الإدراك وفهم اللغة والتحكم المُتعلم للتغلب على التحديات القديمة في مجال الروبوتات. يحقق هيليكس العديد من الإنجازات: التحكم المستمر عالي التردد في كامل الجزء العلوي من الجسم، والتعاون بين الروبوتات المتعددة، وقدرة التقاط أي جسم صغير تقريبًا في المنزل باستخدام أوامر اللغة الطبيعية فقط. تتعلم شبكة عصبية واحدة جميع السلوكيات دون ضبط دقيق محدد للمهمة، وتعمل على وحدات معالجة الرسومات المدمجة منخفضة الطاقة للاستعداد التجاري. تتيح بنية هيليكس، مع "النظام 1" (سياسة حركية بصرية سريعة الاستجابة) و"النظام 2" (نموذج لغة مرئي مدرب مسبقًا على الإنترنت)، التعميم السريع والتحكم الدقيق، مما يمهد الطريق لتوسيع نطاق الروبوتات الشبيهة بالبشر إلى البيئات المنزلية.
الذكاء الاصطناعي
رؤية اللغة والفعل