OCR para Código: Convirtiendo Capturas de Pantalla en Código
Pieces ha refinado la tecnología OCR para reconocer con precisión código a partir de capturas de pantalla. Basándose en el motor Tesseract, han añadido pasos de pre y postprocesamiento para manejar diversos entornos de programación (modo claro/oscuro), fondos ruidosos e imágenes de baja resolución. El preprocesamiento de imágenes, incluyendo la inversión del modo oscuro, la reducción de ruido y la mejora de la resolución, junto con el postprocesamiento para restaurar la sangría del código, mejora significativamente la precisión. Utilizan la distancia de Levenshtein para evaluar el rendimiento del modelo y seleccionaron experimentalmente un método eficiente de aumento de muestreo de imágenes. Esta tecnología permite a los desarrolladores convertir fácilmente capturas de pantalla de código en código editable, aumentando la eficiencia del desarrollo.
Leer más