Hugging Face 推出 NVLM 1.0,这是一系列前沿的多模态大型语言模型

2024-10-02

这篇文章介绍了英伟达发布的 NVLM 1.0,这是一系列前沿的多模态大型语言模型 (LLM),在视觉语言任务上取得了最先进的结果,可与领先的专有模型(例如 GPT-4o)和开放访问模型(例如 Llama 3-V 405B 和 InternVL 2)相媲美。文章详细介绍了 NVLM-D-72B(仅解码器架构)的模型权重、代码、环境准备、模型加载、多 GPU 使用以及推理过程等内容。

未分类