Voyage AI 发布多模态嵌入模型 voyage-multimodal-3

2024-11-17

Voyage AI 发布了新的多模态嵌入模型 voyage-multimodal-3,能够处理交错的文本、图像和屏幕截图,无需复杂的文档解析。该模型在三个多模态检索任务(共20个数据集)中的检索准确度平均比表现次佳的模型高19.63%。voyage-multimodal-3 的架构类似于现代视觉语言转换器,支持文本和富含内容的图像(如文本、图形、表格、PDF、幻灯片等的屏幕截图),并能捕获关键的文本和视觉特征。与现有的多模态嵌入模型不同,voyage-multimodal-3 允许交错文本和图像,并在混合模态搜索方面表现更佳,有效解决了模态差距问题。

未分类 嵌入模型