Echtzeit-KI-Sprachchat: Ihr digitaler Gesprächspartner
2025-05-05
Dieses Projekt ermöglicht natürliche, gesprochene Konversationen mit einer KI mithilfe eines ausgeklügelten Client-Server-Systems. Es nutzt WebSockets für Low-Latency-Audio-Streaming, Echtzeit-Sprach-zu-Text-Transkription, LLM-Verarbeitung (Ollama und OpenAI werden unterstützt) und Text-zu-Sprache-Synthese. Benutzer können die Stimme der KI anpassen und aus verschiedenen TTS-Engines (Kokoro, Coqui, Orpheus) wählen. Das System verfügt über eine intelligente Gesprächsführung, flexible KI-Modelauswahl und ist für einfache Bereitstellung mit Docker containerisiert.