DeepSeek-VL2: Modelos de Lenguaje y Visión basados en Mezcla de Expertos

2025-01-01

DeepSeek-VL2 es una serie avanzada de grandes modelos de lenguaje y visión basados en Mezcla de Expertos (MoE) que mejoran significativamente a su predecesor. Destaca en varias tareas, incluyendo la respuesta a preguntas visuales, el reconocimiento óptico de caracteres y la comprensión de documentos/tablas/gráficos. La serie se compone de tres variantes: DeepSeek-VL2-Tiny, DeepSeek-VL2-Small y DeepSeek-VL2, con 1.0B, 2.8B y 4.5B de parámetros activados, respectivamente. DeepSeek-VL2 logra un rendimiento competitivo o de vanguardia con parámetros activados similares o menores en comparación con los modelos de código abierto existentes. El proyecto es de código abierto, ofreciendo descargas de modelos, guías de inicio rápido y ejemplos de demostración.