Alibaba präsentiert QvQ: Ein neues visuelles Reasonierungsmodell
2024-12-25
Alibaba hat kürzlich QvQ-72B-Preview veröffentlicht, ein neues visuelles Reasonierungsmodell unter der Apache 2.0-Lizenz. Entwickelt, um die Fähigkeiten des visuellen Reasonierens von KI zu verbessern, baut QvQ auf dem Inferencing-Skalierungsmodell QwQ auf, indem es Bildverarbeitung hinzufügt. Es akzeptiert Bilder und Prompts und generiert detaillierte, schrittweise Reasonierungsprozesse. Der Blogger Simon Willison hat QvQ getestet und festgestellt, dass es bei Aufgaben wie dem Zählen von Pelikanen erfolgreich ist, aber bei komplexeren Reasonierungsproblemen weniger genau ist. Derzeit auf Hugging Face Spaces verfügbar, sind zukünftige Pläne die lokale Bereitstellung und breitere Plattformunterstützung.