开发者(KaiFaX)
我们都是开发者,专注于前端、后端、大数据、区块链、人工智能的知识社区
光学字符识别(OCR)技术已经得到了广泛应用。比如发票上用来识别关键字样,搜题 App 用来识别书本上的试题。
近期,这个叫做 chineseocr_lite 的 OCR 项目开源了,这是一个超轻量级中文 ocr,支持竖排文字识别,支持 ncnn 推理,psenet (8.5M) + crnn (6.3M) + anglenet (1.5M) 总模型仅 17M。
目前,这个开源项目已在 GitHub 上标星 2400+。
这个项目基于 chineseocr 与 psenet 实现中文自然场景文字检测及识别,环境是 linux/macos。
以下为可实现的功能:
-
提供轻量的 backone 检测模型 psenet(8.5M),crnn_lstm_lite (9.5M) 和行文本方向分类网络(1.5M)
-
任意方向文字检测,识别时判断行文本方向
-
crnn\crnn_lite lstm\dense 识别(ocr-dense 和 ocr-lstm 是搬运 chineseocr 的)
-
支持竖排文本识别
-
ncnn 实现 psenet(未实现核扩展)
-
ncnn 实现 crnn_dense (改变了全连接为 conv1x1)
-
ncnn 实现 shuuflenev2 角度分类网络
-
ncnn 实现 ocr 整个流程
最近,项目作者对更新了可实现的功能。
-
nihui 大佬实现的 crnn_lstm 推理
-
升级 crnn_lite_lstm_dw.pth 模型 crnn_lite_lstm_dw_v2.pth , 精度更高
-
提供竖排文字样例以及字体库(旋转 90 度的字体)
字体样式
生成的竖排文本样例
识别效果展示:
ncnn 检测识别展示 (x86 cpu 单进程)
项目地址:https://github.com/ouyanghuiyu/chineseocr_lite
说明:我们都是开发者。视频或文章来源于网络,如涉及版权或有误,请您与若飞(1321113940)联系,将在第一时间删除或者修改,谢谢!
1. 回复“m”可以查看历史记录;
2. 回复“h”或者“帮助”,查看帮助;
开发者已开通多个微信群交流学习,请加若飞微信:1321113940 进群学习交流
开发者:KaiFaX
我们都是开发者
专注于前端、后端、大数据、区块链、人工智能的知识社区