Nvidia lança Granary: um enorme conjunto de dados multilíngues para tradução de IA
2025-08-24

A Nvidia anunciou o Granary, um enorme conjunto de dados de áudio multilíngue de código aberto com mais de um milhão de horas de áudio, projetado para impulsionar a tradução de IA para idiomas europeus. Este conjunto de dados, desenvolvido em colaboração com a Carnegie Mellon University e a Fondazione Bruno Kessler, inclui quase todos os idiomas oficiais da UE, além do russo e ucraniano, focando em idiomas com poucos recursos. Acompanhado do Granary estão dois novos modelos, Canary e Parakeet, otimizados para precisão e velocidade, respectivamente. O Granary reduz significativamente os dados necessários para o treinamento, permitindo tecnologias de fala mais inclusivas.