Crea tu propio sistema local de voz a texto con Python y Whisper

2025-09-23
Crea tu propio sistema local de voz a texto con Python y Whisper

¿Cansado de los riesgos de privacidad de subir audio sensible a servicios de transcripción en la nube? Esta publicación te muestra cómo crear un sistema local de voz a texto usando Python y el modelo Whisper de OpenAI. Transcribe tus archivos de audio en menos de 10 minutos con una precisión del 96 % — totalmente gratis y procesado localmente en tu portátil. El tutorial cubre la configuración de FFmpeg, tu entorno de Python, el uso del modelo Whisper, el procesamiento por lotes, la creación de subtítulos SRT y la solución de problemas comunes. También se proporciona un método alternativo utilizando la biblioteca `speech_recognition`.

Desarrollo