Goku:フローベースの動画生成基盤モデル
2025-02-15
ByteDanceと香港大学の共同チームが、修正フローTransformerに基づく画像と動画の生成モデルファミリーであるGokuを発表しました。Gokuは、綿密なデータキュレーション、高度なモデル設計、フローの定式化により、業界をリードするビジュアル生成パフォーマンスを実現しています。テキストから動画、画像から動画、テキストから画像の生成をサポートし、GenEval、DPG-Bench、VBenchなどの主要なベンチマークでトップスコアを獲得しています。特にGoku-T2VはVBenchで84.85点を獲得し、2024年10月7日時点で2位にランクインしており、いくつかの主要な商用テキストから動画モデルを上回っています。