FastVideo:オープンソースフレームワークによる大規模ビデオ拡散モデルの高速化

2024-12-17

FastVideoは、大規模なビデオ拡散モデルの推論とトレーニングを高速化するために設計されたオープンソースフレームワークです。FastMochiやFastHunyuanなどのモデルをサポートし、推論速度を最大8倍に向上させます。このフレームワークは知識蒸留技術を活用し、PCMベースのビデオDiTモデルの蒸留、ファインチューニング、推論をサポートしています。さらに、FastVideoは、FSDP、シーケンスパラレル処理、選択的アクティベーションチェックポイントによるスケーラブルなトレーニング機能を備えており、メモリ効率の良いファインチューニングを可能にします。