OCR pour le code : transformer les captures d’écran en code
Pieces a affiné la technologie OCR pour reconnaître précisément le code à partir de captures d’écran. S’appuyant sur le moteur Tesseract, ils ont ajouté des étapes de pré et de post-traitement pour gérer divers environnements de programmation (mode clair/sombre), des arrière-plans bruités et des images basse résolution. Le prétraitement des images, notamment l’inversion du mode sombre, la réduction du bruit et l’amélioration de la résolution, ainsi que le post-traitement pour restaurer l’indentation du code, améliorent considérablement la précision. Ils utilisent la distance de Levenshtein pour évaluer les performances du modèle et ont sélectionné expérimentalement une méthode efficace de suréchantillonnage d’images. Cette technologie permet aux développeurs de convertir facilement les captures d’écran de code en code éditable, augmentant ainsi l’efficacité du développement.
Lire plus