Nuevo motor multimodales de Ollama: inferencia local para modelos de visión

2025-05-16
Nuevo motor multimodales de Ollama: inferencia local para modelos de visión

Ollama ha lanzado un nuevo motor que admite la inferencia local para modelos multimodales, comenzando con modelos de visión como Llama 4 Scout y Gemma 3. Abordando las limitaciones de la biblioteca ggml para modelos multimodales, el motor mejora la modularidad del modelo, la precisión y la administración de memoria para una inferencia confiable y eficiente con imágenes grandes y arquitecturas complejas (incluidos los modelos Mixture-of-Experts). Este enfoque en la precisión y confiabilidad sienta las bases para el soporte futuro del habla, la generación de imágenes y contextos más largos.