Nvidia dévoile Granary : un immense jeu de données multilingues pour la traduction par IA

2025-08-24
Nvidia dévoile Granary : un immense jeu de données multilingues pour la traduction par IA

Nvidia a annoncé Granary, un immense jeu de données audio multilingue open source comprenant plus d'un million d'heures d'audio, conçu pour améliorer la traduction par IA pour les langues européennes. Ce jeu de données, développé en collaboration avec l'Université Carnegie Mellon et la Fondazione Bruno Kessler, inclut presque toutes les langues officielles de l'UE, ainsi que le russe et l'ukrainien, en se concentrant sur les langues sous-ressourcées. Granary est accompagné de deux nouveaux modèles, Canary et Parakeet, optimisés respectivement pour la précision et la vitesse. Granary réduit considérablement la quantité de données nécessaires à l'entraînement, permettant des technologies vocales plus inclusives.