LLM辅助OCR：利用大型语言模型增强扫描PDF的Tesseract OCR输出

LLM辅助OCR：利用大型语言模型增强扫描PDF的Tesseract OCR输出 (github.com)

原文: GitHub - Dicklesworthstone/llm_aided_ocr: Enhance Tesseract OCR output for scanned PDFs by applying Large Language Model (LLM) corrections.

LLM辅助OCR项目是一个先进的系统，旨在利用大型语言模型 (LLM) 显著提高光学字符识别 (OCR) 输出的质量。该项目将原始OCR文本转换为高度准确、格式良好且可读的文档。其功能包括PDF到图像的转换、使用Tesseract进行OCR、使用LLM进行高级错误纠正、智能文本分块以实现高效处理、Markdown格式选项、页眉和页码抑制（可选）、最终输出的质量评估等。

Tesseract

上一篇: Grace Hopper：英伟达的半成品APU

下一篇: 无需数据库构建高可用性Web服务

评论已经关闭！

返回首页