Nvidia presenta Granary: un enorme conjunto de datos multilingües para traducción de IA
2025-08-24
Nvidia anunció Granary, un enorme conjunto de datos de audio multilingüe de código abierto con más de un millón de horas de audio, diseñado para impulsar la traducción de IA para idiomas europeos. Este conjunto de datos, desarrollado en colaboración con la Universidad Carnegie Mellon y la Fondazione Bruno Kessler, incluye casi todos los idiomas oficiales de la UE, además del ruso y el ucraniano, centrándose en los idiomas con pocos recursos. Junto con Granary se lanzan dos nuevos modelos, Canary y Parakeet, optimizados para precisión y velocidad, respectivamente. Granary reduce significativamente los datos necesarios para el entrenamiento, permitiendo tecnologías de voz más inclusivas.