Qwen VLo: 이미지를 이해하고 생성하는 통합형 멀티모달 모델

2025-06-28

알리바바 DAMO 아카데미는 이미지의 내용을 이해할 뿐만 아니라, 그 이해를 바탕으로 고품질 이미지를 생성하는 새로운 멀티모달 모델 Qwen VLo를 발표했습니다. 점진적인 생성 방식을 채택하여 왼쪽에서 오른쪽으로, 위에서 아래로 단계적으로 이미지를 구축함으로써 최종 결과의 일관성과 조화를 보장합니다. Qwen VLo는 다국어 지시를 지원하며, 이미지 편집 및 스타일 전환과 같은 복잡한 작업을 처리하고, 생성된 이미지의 내용을 이해할 수도 있습니다. 현재 미리 보기 단계이지만, 강력한 멀티모달 기능은 이미지 생성 분야에서 AI의 잠재력을 보여줍니다.

(qwenlm.github.io)

스플라이스 변수를 사용한 다단계 프로그래밍: 안전하고 예측 가능한 코드 생성

NLnet, 개방형 인터넷 강화를 위한 62개 프로젝트에 자금 지원