Novo mecanismo multimodais do Ollama: inferência local para modelos de visão

2025-05-16
Novo mecanismo multimodais do Ollama: inferência local para modelos de visão

O Ollama lançou um novo mecanismo que suporta inferência local para modelos multimodais, começando com modelos de visão como Llama 4 Scout e Gemma 3. Abordando as limitações da biblioteca ggml para modelos multimodais, o mecanismo melhora a modularidade do modelo, a precisão e a gestão de memória para inferência fiável e eficiente com imagens grandes e arquiteturas complexas (incluindo modelos Mixture-of-Experts). Este foco na precisão e fiabilidade estabelece a base para o suporte futuro de fala, geração de imagens e contextos mais longos.