SV2TTS في الوقت الفعلي: التعلم الانتقالي لتوليد الكلام متعدد المتحدثين

العلامات الشائعة：

الافتراضية أمان DNS التحقق الرسمي تحليل قابلية الوصول أخطاء المترجم تضارب الماكرو امتدادات الويب إطار عمل تطوير كومودور 64 بياسيك 2.0 جميع العلامات

2025-09-14

هذا مشروع مفتوح المصدر ينفذ توليد الكلام من النص (SV2TTS) متعدد المتحدثين في الوقت الفعلي باستخدام التعلم الانتقالي من التحقق من المتحدث، بناءً على أطروحة الماجستير الخاصة بالمؤلف. إنه إطار عمل للتعلم العميق من ثلاث مراحل: إنشاء تمثيل رقمي للصوت من مقاطع صوتية قصيرة، ثم استخدام هذا التمثيل لإنشاء كلام من نص تعسفي. على الرغم من أن المشروع قديم وقد تكون جودته أقل من البدائل التجارية، إلا أنه يدعم أنظمة التشغيل Windows وLinux، مع التوصية باستخدام معالجة رسومات (GPU) للتسريع. تتوفر تعليمات التثبيت والاستخدام التفصيلية، بالإضافة إلى دعم مجموعات بيانات متنوعة.