LLM辅助OCR:利用大型语言模型增强扫描PDF的Tesseract OCR输出

2024-08-10

LLM辅助OCR项目是一个先进的系统,旨在利用大型语言模型 (LLM) 显著提高光学字符识别 (OCR) 输出的质量。该项目将原始OCR文本转换为高度准确、格式良好且可读的文档。其功能包括PDF到图像的转换、使用Tesseract进行OCR、使用LLM进行高级错误纠正、智能文本分块以实现高效处理、Markdown格式选项、页眉和页码抑制(可选)、最终输出的质量评估等。

39
未分类 Tesseract