Dragonfly:一种具有多分辨率缩放功能的大型视觉语言模型

2024-06-06

文章介绍了一种名为Dragonfly的全新指令微调视觉语言架构,该架构通过多分辨率缩放和选择来增强多模态推理,同时兼顾上下文效率。文章发布了两个新的开源模型Llama-3-8b-Dragonfly-v1和Llama-3-8b-Dragonfly-Med-v1,并通过示例展示了Dragonfly在视觉问答、图像描述和医学影像分析等方面的出色表现。