更轻量的 cnocr-V1.1.0 :最小模型只有 6.8M

栏目: IT技术 · 发布时间: 4年前

内容简介:https://zhuanlan.zhihu.com/p/134115239

作者: 吴金龙,爱因互动技术合伙人,算法负责人

知乎专栏: 智能对话机器人技术

原文链接:

https://zhuanlan.zhihu.com/p/134115239

cnocr  是 Python 3下的 中英文OCR 包,通过pip命令安装后即可直接使用。

pip install cnocr==1.1.0

V1.1.0 对代码做了很大改动,重写了大部分训练的代码,也生成了更多更难的训练和测试数据。训练好的模型相较于之前版本的模型精度有显著提升,尤其是针对英文单词的识别。

以下列出了主要的变更:

  • 更新了训练代码,使用mxnet的 recordio 首先把数据转换成二进制格式,提升后续的训练效率。训练时支持对图片做实时数据增强。也加入了更多可传入的参数。

  • 允许训练集中的文字数量不同,目前是中文10个字,英文20个字母。

  • 提供了更多的模型选择,允许大家按需训练多种不同大小的识别模型。

  • 内置了各种训练好的模型,最小的模型只有之前模型的 1/5 大小。 所有模型都可免费使用。

  • 相较于之前版本的模型,新的模型精度有显著提升,尤其是针对英文单词的识别。 新模型已经可以识别英文单词间的空格。

  • 支持文字识别只在给定字符集中进行。 对于一些纯数字或者纯英文字母的应用场景可以带来识别率提升。

  • 优化了对黑底白字多行文字图片的支持。

  • mxnet依赖升级到更新的版本了。很多人反馈mxnet 1.4.1 经常找不到没法装,现在升级到 >=1.5.0,<1.7.0

示例

更轻量的 cnocr-V1.1.0 :最小模型只有 6.8M

自带可直接使用的模型

cnocr的ocr模型可以分为两阶段:第一阶段是获得ocr图片的局部编码向量,第二部分是对局部编码向量进行序列学习,获得序列编码向量。目前两个阶段分别包含以下的模型:

  1. 局部编码模型(emb model)

  • conv :多层的卷积网络;

  • conv-lite :更小的多层卷积网络;

  • densenet :一个小型的 densenet 网络;

  • densenet-lite :一个更小的 densenet 网络。

2. 序列编码模型(seq model)

    • lstm :两层的LSTM网络;

    • gru :两层的GRU网络;

    • fc :两层的全连接网络。

cnocr目前包含以下可直接使用的模型,训练好的模型都放在 cnocr-models 项目中,可免费下载使用:

更轻量的 cnocr-V1.1.0 :最小模型只有 6.8M

更多的说明可参见 cnocr 项目说明,或者之前的介绍文章:

BreezeDeus:cnocr: 极简的中文OCR Python包 zhuanlan.zhihu.com

相关链接:

https://github.com/breezedeus/cnocr

https://zhuanlan.zhihu.com/p/60767671

本文由 作者授权发布于AINLP公众号,点击文末“阅读原文”直达原文。

推荐阅读

AINLP年度阅读收藏清单

百度PaddleHub&nbsp;NLP模型全面升级,推理性能提升50%以上

斯坦福大学NLP组Python深度学习自然语言处理工具Stanza试用

数学之美中盛赞的 Michael Collins 教授,他的NLP课程要不要收藏?

自动作诗机&藏头诗生成器:五言、七言、绝句、律诗全了

From Word Embeddings To Document Distances 阅读笔记

模型压缩实践系列之——bert-of-theseus,一个非常亲民的bert压缩方法

这门斯坦福大学自然语言处理经典入门课,我放到B站了

可解释性论文阅读笔记1-Tree Regularization

征稿启示 | 稿费+GPU算力+星球嘉宾一个都不少

关于AINLP

AINLP 是一个有趣有AI的自然语言处理社区,专注于 AI、NLP、机器学习、深度学习、推荐算法等相关技术的分享,主题包括文本摘要、智能问答、聊天机器人、机器翻译、自动生成、知识图谱、预训练模型、推荐系统、计算广告、招聘信息、求职经验分享等,欢迎关注!加技术交流群请添加AINLPer(id:ainlper),备注工作/研究方向+加群目的。

更轻量的 cnocr-V1.1.0 :最小模型只有 6.8M


以上所述就是小编给大家介绍的《更轻量的 cnocr-V1.1.0 :最小模型只有 6.8M》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

Linux程序设计

Linux程序设计

马修 / 陈健 / 人民邮电出版社 / 2007-7 / 89.00元

《Linux 程序设计(第3版)》讲述在Linux系统及其他UNIX风格的操作系统上进行的程序开发,主要内容包括标准Linux C语言函数库和由不同的Linux或UNIX标准指定的各种工具的使用方法,大多数标准Linux开发工具的使用方法,通过DBM和MySQL数据库系统对Linux中的数据进行存储,为X视窗系统建立图形化用户界面等。《Linux 程序设计(第3版)》通过先介绍程序设计理论,再以适......一起来看看 《Linux程序设计》 这本书的介绍吧!

RGB转16进制工具
RGB转16进制工具

RGB HEX 互转工具

在线进制转换器
在线进制转换器

各进制数互转换器

HTML 编码/解码
HTML 编码/解码

HTML 编码/解码