基于OnnxOCR实现的批量PDF、图片OCR识别工具

OnnxOCR-UI简介

OnnxOCR-UI 是基于 OnnxOCR 的高级批量图片/PDF OCR 识别工具，专为高效、易用和美观的桌面批量文字识别场景设计，轻松拖入多个图片或PDF文件，即可轻松批量识别文字。

2025061912-3826-PixPin

主要功能

支持批量图片、PDF 文件拖拽或选择添加
PDF 转图片采用 pymupdf，无需 poppler
支持模型选择（PP-OCRv5、PP-OCRv4、ch_ppocr_server_v2.0）
进度条实时显示整体进度，PDF按页数动态更新
多图识别时状态栏提示平均速度
支持GPU加速，需英伟达显卡，电脑安装好Cuda和cuDNN

OnnxOCR简介

OnnxOCR是基于 ONNX 的高性能多语言 OCR 引擎，支持PP-OCRv54、PP-OCRv5 模型，单模型支持 5 种文字类型：简体中文、繁体中文、中文拼音、英文和日文。

脱离深度学习训练框架：可直接用于部署的通用 OCR。
跨架构支持：在算力有限、精度不变的情况下，使用 PaddleOCR 转成 ONNX 模型，重新构建的可部署在 ARM 架构和 x86 架构计算机上的 OCR 模型。
高性能推理：在同样性能的计算机上推理速度加速。
多语言支持：单模型支持 5 种文字类型：简体中文、繁体中文、中文拼音、英文和日文。
模型精度：与 PaddleOCR 模型保持一致。
国产化适配：重构代码工程架构，只需简单进行推理引擎的修改，即可适配更多国产化显卡。

‍

PP-OCRv5 是PP-OCR新一代文字识别解决方案，该方案聚焦于多场景、多文字类型的文字识别。在文字类型方面，PP-OCRv5支持简体中文、中文拼音、繁体中文、英文、日文5大主流文字类型，在场景方面，PP-OCRv5升级了中英复杂手写体、竖排文本、生僻字等多种挑战性场景的识别能力。在内部多场景复杂评估集上，PP-OCRv5较PP-OCRv4端到端提升13个百分点。

OnnxOCR-UI安装

公众号回复“OnnxOCR-UI”，即可获取安装包。

OnnxOCR-UI.7z为绿色版，解压既可以使用。
OnnxOCR-UI_v0.2.1_x64-setup.exe是安装包。

‍