نموذج كشف دور الحديث مفتوح المصدر: Smart Turn
2025-03-06
أصدر فريق Pipecat نموذج كشف دور الحديث مفتوح المصدر Smart Turn، والذي يهدف إلى تحسين أنظمة الذكاء الاصطناعي الصوتية القائمة على كشف النشاط الصوتي (VAD). يستخدم النموذج Wav2Vec2-BERT من Meta AI كعمود فقري، مع رأس تصنيف بسيط من طبقتين. يدعم النموذج حاليًا اللغة الإنجليزية، وهو في مرحلة مبكرة من إثبات المفهوم، لكن الفريق واثق من إمكانية تحسين أدائه بسرعة. يدعون مجتمع المصادر المفتوحة للمساهمة في تحسين النموذج وتوسيع دعمه اللغوي وقدراته.
الذكاء الاصطناعي