llama.cpp يدمج نموذج Qwen2VL متعدد الوسائط

2024-12-15
llama.cpp  يدمج نموذج Qwen2VL متعدد الوسائط

دمج مشروع llama.cpp على GitHub مؤخرًا طلب سحب يضيف دعمًا لنموذج اللغة الكبير متعدد الوسائط Qwen2VL. يجمع هذا النموذج بين نموذج لغة كبير وترميز رؤية، مما يسمح بمعالجة كل من الصور والنص. تتضمن عملية الدمج تحويل جزء LLM من النموذج وترميز الرؤية إلى تنسيق GGUF واستخدام أداة سطر أوامر جديدة للاستنتاج. تتضمن الأعمال المستقبلية إضافة دعم للمزيد من الخلفيات مثل MPS و Vulkan.