其实,现在已经有很多OCR库了,效果不一。
今天测试了一下PaddleOCR ,感觉效果还算比较理想, 分享给各位老铁,以备用。
PaddleOCR 是 百度开源的 OCR 工具库
基于 PaddlePaddle 深度学习框架(也是百度开源的 DL 框架)
支持 中文、英文及多语言
能做 文字检测(Text Detection) + 文字识别(Text Recognition) + 方向分类(Text Orientation)
提供 端到端 OCR 方案,可以直接拿来识别图片文字
GitHub 仓库:https://github.com/PaddlePaddle/PaddleOCR
免费、开源、安全
可以 本地部署,不上传图片到服务器 → 对隐私友好
支持 Python 调用,也可导出模型部署到 C++、Java、移动端
可以处理 文档、身份证、票据、手写文字、图片截图 等。
下面是我的测试代码,代码比较简单 ,这里不能上传代码,就贴个图
下面是测试的效果。
纯文字识别:
列表识别:
海报识别(其实是这种海报 我感觉比别的库靠谱):
陕公网安备 61011602000462号