حل مشكلة الروبوتات عن طريق مشاهدة مليون ساعة من فيديوهات يوتيوب
2025-06-30
قام الباحثون بحل مشكلة قائمة منذ فترة طويلة في مجال الروبوتات عن طريق تدريب نموذج يسمى V-JEPA 2 على مليون ساعة من مقاطع فيديو يوتيوب. وبدلاً من التنبؤ بالكلمة التالية، يتنبأ V-JEPA 2 باللحظة التالية في الواقع، ويتعلم فهم الفيزياء من خلال الملاحظة. وعلى عكس النماذج السابقة التي تعتمد على اللغة، يُظهر V-JEPA 2 تعميمًا مثيرًا للإعجاب من الصفر، حيث ينجز بنجاح مهام معقدة مثل الإمساك بالأشياء ووضعها في بيئات غير مرئية. وعلى الرغم من وجود بعض القيود مثل حساسية وضع الكاميرا والانحراف على المدى الطويل، إلا أن هذا البحث يفتح آفاقًا جديدة للروبوتات، مما يشير إلى مستقبل قد يمتلك فيه الروبوت فهمًا مماثلًا لفهم ChatGPT.
الذكاء الاصطناعي