コード用OCR:スクリーンショットをコードに変換
2025-05-22

Pieces社は、スクリーンショットからコードを正確に認識するOCR技術を改良しました。Tesseractエンジンをベースに、様々なプログラミング環境(ライト/ダークモード)、ノイズの多い背景、低解像度の画像に対応するため、前処理と後処理のステップを追加しました。暗いモードの反転、ノイズ除去、解像度向上などの画像前処理と、コードのインデント復元を行う後処理により、精度が大幅に向上します。彼らはLevenshtein距離を使用してモデルの性能を評価し、実験的に効率的な画像アップサンプリング方法を選択しました。この技術により、開発者はコードのスクリーンショットを簡単に編集可能なコードに変換でき、開発効率が向上します。
開発
コード認識