llama.cpp项目集成Qwen2VL多模态模型
2024-12-15
GitHub上的llama.cpp项目最近合并了一个pull request,该请求增加了对Qwen2VL多模态大语言模型的支持。该模型结合了大型语言模型和视觉编码器,能够处理图像和文本。此次集成需要将模型的语言模型部分和视觉编码器分别转换为GGUF格式,并使用新增的命令行工具进行推理。未来工作计划包括支持更多后端,例如MPS和Vulkan。
AI
Qwen2VL