SV2TTS في الوقت الفعلي: التعلم الانتقالي لتوليد الكلام متعدد المتحدثين

2025-09-14
SV2TTS في الوقت الفعلي: التعلم الانتقالي لتوليد الكلام متعدد المتحدثين

هذا مشروع مفتوح المصدر ينفذ توليد الكلام من النص (SV2TTS) متعدد المتحدثين في الوقت الفعلي باستخدام التعلم الانتقالي من التحقق من المتحدث، بناءً على أطروحة الماجستير الخاصة بالمؤلف. إنه إطار عمل للتعلم العميق من ثلاث مراحل: إنشاء تمثيل رقمي للصوت من مقاطع صوتية قصيرة، ثم استخدام هذا التمثيل لإنشاء كلام من نص تعسفي. على الرغم من أن المشروع قديم وقد تكون جودته أقل من البدائل التجارية، إلا أنه يدعم أنظمة التشغيل Windows وLinux، مع التوصية باستخدام معالجة رسومات (GPU) للتسريع. تتوفر تعليمات التثبيت والاستخدام التفصيلية، بالإضافة إلى دعم مجموعات بيانات متنوعة.