Alibaba presenta QvQ: un nuevo modelo de razonamiento visual
2024-12-25
Alibaba lanzó recientemente QvQ-72B-Preview, un nuevo modelo de razonamiento visual bajo la licencia Apache 2.0. Diseñado para mejorar las capacidades de razonamiento visual de la IA, QvQ se basa en el modelo de escalado de inferencia QwQ añadiendo procesamiento de visión. Acepta imágenes y prompts, generando procesos de razonamiento detallados y paso a paso. El bloguero Simon Willison probó QvQ, encontrando que tiene éxito en tareas como contar pelícanos, pero es menos preciso en problemas de razonamiento complejos. Actualmente disponible en Hugging Face Spaces, los planes futuros incluyen la implementación local y el soporte para plataformas más amplias.