نموذج كشف دور الحديث مفتوح المصدر: Smart Turn
أصدر فريق Pipecat نموذج كشف دور الحديث مفتوح المصدر Smart Turn، والذي يهدف إلى تحسين أنظمة الذكاء الاصطناعي الصوتية القائمة على كشف النشاط الصوتي (VAD). يستخدم النموذج Wav2Vec2-BERT من Meta AI كعمود فقري، مع رأس تصنيف بسيط من طبقتين. يدعم النموذج حاليًا اللغة الإنجليزية، وهو في مرحلة مبكرة من إثبات المفهوم، لكن الفريق واثق من إمكانية تحسين أدائه بسرعة. يدعون مجتمع المصادر المفتوحة للمساهمة في تحسين النموذج وتوسيع دعمه اللغوي وقدراته.
اقرأ المزيد