OmniHuman-1 : Repenser la mise à l'échelle des modèles d'animation humaine conditionnelle à une étape

2025-02-04

OmniHuman-1 est un modèle d'IA capable de générer des vidéos humaines réalistes. Il prend en charge divers styles visuels et audio, générant des vidéos à n'importe quel ratio et proportion corporelle (portrait, demi-corps, corps entier). Le réalisme provient de détails complets de mouvement, d'éclairage et de texture. Le modèle gère diverses entrées, y compris le chant, la parole et diverses poses, même à partir de dessins animés ou de points de vue difficiles. Il utilise des signaux de pilotage audio et vidéo pour un contrôle précis. Les considérations éthiques sont abordées, avec des images et de l'audio provenant de domaines publics ou de modèles générés.

Lire plus