OmniHuman-1: Überdenken der Skalierung von einstufigen konditionierten menschlichen Animationsmodellen

2025-02-04

OmniHuman-1 ist ein KI-Modell, das realistische menschliche Videos generieren kann. Es unterstützt verschiedene visuelle und Audio-Stile und generiert Videos in beliebigem Seitenverhältnis und Körperproportionen (Porträt, Halbfigur, Ganzkörper). Der Realismus ergibt sich aus umfassenden Bewegungs-, Licht- und Texturdetails. Das Modell verarbeitet diverse Eingaben, einschließlich Gesang, Sprache und verschiedene Posen, sogar aus Cartoons oder herausfordernden Perspektiven. Es nutzt Audio- und Video-Steuersignale für präzise Steuerung. Ethische Aspekte werden berücksichtigt, wobei Bilder und Audio aus öffentlichen Quellen oder von generierten Modellen stammen.