Nvidia تكشف عن Granary: مجموعة بيانات ضخمة متعددة اللغات لترجمة الذكاء الاصطناعي

2025-08-24
Nvidia تكشف عن Granary: مجموعة بيانات ضخمة متعددة اللغات لترجمة الذكاء الاصطناعي

أعلنت Nvidia عن Granary، وهي مجموعة بيانات ضخمة مفتوحة المصدر من الصوت متعدد اللغات تتجاوز مليون ساعة من الصوت، مصممة لتعزيز ترجمة الذكاء الاصطناعي للغات الأوروبية. تم تطوير هذه المجموعة من البيانات بالتعاون مع جامعة كارنيغي ميلون ومؤسسة برونو كيسلر، وتشمل جميع لغات الاتحاد الأوروبي تقريبًا بالإضافة إلى الروسية والأوكرانية، مع التركيز على اللغات التي لديها موارد محدودة. يرافق Granary نموذجان جديدان، Canary و Parakeet، مُحسّنان للدقة والسرعة على التوالي. يُقلل Granary بشكل كبير من البيانات اللازمة للتدريب، مما يسمح بتقنيات الكلام الأكثر شمولاً.