llama.cpp يدمج نموذج Qwen2VL متعدد الوسائط

2024-12-15

دمج مشروع llama.cpp على GitHub مؤخرًا طلب سحب يضيف دعمًا لنموذج اللغة الكبير متعدد الوسائط Qwen2VL. يجمع هذا النموذج بين نموذج لغة كبير وترميز رؤية، مما يسمح بمعالجة كل من الصور والنص. تتضمن عملية الدمج تحويل جزء LLM من النموذج وترميز الرؤية إلى تنسيق GGUF واستخدام أداة سطر أوامر جديدة للاستنتاج. تتضمن الأعمال المستقبلية إضافة دعم للمزيد من الخلفيات مثل MPS و Vulkan.