Alibaba lança QvQ: novo modelo de raciocínio visual
2024-12-25
A Alibaba lançou recentemente o QvQ-72B-Preview, um novo modelo de raciocínio visual sob a licença Apache 2.0. Projetado para aprimorar as capacidades de raciocínio visual da IA, o QvQ se baseia no modelo de dimensionamento de inferência QwQ, adicionando processamento de visão. Ele aceita imagens e prompts, gerando processos de raciocínio detalhados e passo a passo. O blogueiro Simon Willison testou o QvQ, descobrindo que ele tem sucesso em tarefas como contar pelicanos, mas é menos preciso em problemas de raciocínio complexos. Atualmente disponível no Hugging Face Spaces, os planos futuros incluem implantação local e suporte a plataformas mais amplas.