DeepSeek-VL2: Modelos de Lenguaje y Visión basados en Mezcla de Expertos

Tags populares：

Virtualización seguridad DNS verificación formal análisis de alcanzabilidad errores del compilador conflicto de macro extensión web framework de desarrollo Gráficos de mapa de bits inconsistencias de API Todos los tags

2025-01-01

DeepSeek-VL2 es una serie avanzada de grandes modelos de lenguaje y visión basados en Mezcla de Expertos (MoE) que mejoran significativamente a su predecesor. Destaca en varias tareas, incluyendo la respuesta a preguntas visuales, el reconocimiento óptico de caracteres y la comprensión de documentos/tablas/gráficos. La serie se compone de tres variantes: DeepSeek-VL2-Tiny, DeepSeek-VL2-Small y DeepSeek-VL2, con 1.0B, 2.8B y 4.5B de parámetros activados, respectivamente. DeepSeek-VL2 logra un rendimiento competitivo o de vanguardia con parámetros activados similares o menores en comparación con los modelos de código abierto existentes. El proyecto es de código abierto, ofreciendo descargas de modelos, guías de inicio rápido y ejemplos de demostración.