Voyage AI 发布多模态嵌入模型 voyage-multimodal-3

热门标签：

Mac 多显示器显示器扩展 requests patch 并发 Alpine Linux BSD Linux 电动汽车全部标签

Voyage AI 发布多模态嵌入模型 voyage-multimodal-3

2024-11-17

Voyage AI 发布了新的多模态嵌入模型 voyage-multimodal-3，能够处理交错的文本、图像和屏幕截图，无需复杂的文档解析。该模型在三个多模态检索任务（共20个数据集）中的检索准确度平均比表现次佳的模型高19.63%。voyage-multimodal-3 的架构类似于现代视觉语言转换器，支持文本和富含内容的图像（如文本、图形、表格、PDF、幻灯片等的屏幕截图），并能捕获关键的文本和视觉特征。与现有的多模态嵌入模型不同，voyage-multimodal-3 允许交错文本和图像，并在混合模态搜索方面表现更佳，有效解决了模态差距问题。

(blog.voyageai.com)

未分类嵌入模型

批量图片搜索：入门指南

Logica：现代逻辑编程语言助力数据分析