알리바바, 새로운 시각 추론 모델 QvQ 공개
2024-12-25
알리바바가 최근 Apache 2.0 라이선스 하에 새로운 시각 추론 모델 QvQ-72B-Preview를 공개했습니다. AI의 시각 추론 능력을 향상시키기 위해 설계된 QvQ는 추론 확장 모델 QwQ를 기반으로 이미지 처리 기능을 추가했습니다. 이미지와 프롬프트를 받아들이고, 상세하고 단계적인 추론 과정을 생성합니다. 블로거 Simon Willison은 QvQ를 테스트하여, 펠리컨 세기와 같은 작업에서는 성공적이었지만 복잡한 추론 문제에서는 정확도가 낮다는 것을 발견했습니다. 현재 Hugging Face Spaces에서 사용 가능하며, 향후 계획에는 로컬 배포 및 더 넓은 플랫폼 지원이 포함됩니다.