OCR para Código: Transformando Capturas de Tela em Código

A Pieces aprimorou a tecnologia OCR para reconhecer com precisão código a partir de capturas de tela. Com base no mecanismo Tesseract, eles adicionaram etapas de pré e pós-processamento para lidar com vários ambientes de programação (modo claro/escuro), fundos ruidosos e imagens de baixa resolução. O pré-processamento de imagem, incluindo inversão de modo escuro, redução de ruído e aprimoramento de resolução, juntamente com o pós-processamento para restaurar a indentação do código, melhora significativamente a precisão. Eles usam a distância de Levenshtein para avaliar o desempenho do modelo e selecionaram experimentalmente um método eficiente de aumento de amostragem de imagem. Essa tecnologia permite que os desenvolvedores convertam facilmente capturas de tela de código em código editável, aumentando a eficiência do desenvolvimento.