Jargonic V2 : Révolution dans la reconnaissance vocale japonaise

2025-05-07
Jargonic V2 : Révolution dans la reconnaissance vocale japonaise

Jargonic V2 d'aiOla établit une nouvelle norme en matière de reconnaissance vocale japonaise. Contrairement aux systèmes ASR traditionnels, Jargonic V2 offre une précision de transcription supérieure et une capacité inégalée à identifier la terminologie spécialisée de divers secteurs tels que la fabrication, la logistique, les soins de santé et la finance. Sa technologie propriétaire de détection de mots clés (KWS) permet l'identification en temps réel de termes de niche sans nécessiter de recyclage ou de curation manuelle du vocabulaire. Les tests de référence sur les ensembles de données CommonVoice et ReazonSpeech montrent un taux de rappel de 94,7 % pour les termes japonais spécifiques à un domaine et des taux d'erreur de caractères significativement plus faibles par rapport aux concurrents tels que Whisper v3 et ElevenLabs. Cette percée représente un progrès majeur dans la gestion des langues complexes et de la terminologie spécialisée, fournissant une interface vocale plus fiable pour les applications d'IA d'entreprise.

Lire plus
IA

Jargonic : Un modèle ASR révolutionnaire pour la parole spécifique à un secteur

2025-04-01
Jargonic : Un modèle ASR révolutionnaire pour la parole spécifique à un secteur

aiOla a lancé Jargonic, un modèle révolutionnaire de Reconnaissance Automatique de la Parole (ASR) qui répond aux limites des modèles ASR existants dans la gestion du jargon sectoriel, des environnements bruyants et de l'adaptabilité en temps réel. Jargonic utilise une adaptation de domaine avancée, une détection de mots clés contextuelle en temps réel et un apprentissage zéro-shot pour gérer le langage spécifique à un secteur sans nécessiter de réentraînement. Son mécanisme unique de détection de mots clés combiné au moteur ASR améliore significativement la précision de la transcription, en particulier pour l'audio contenant une terminologie spécialisée. De plus, Jargonic possède des capacités robustes de gestion du bruit, maintenant des performances élevées dans plusieurs langues et environnements industriels bruyants. Les tests de référence montrent qu'il surpasse des concurrents comme OpenAI Whisper.

Lire plus