- 授权协议: GPL
- 开发语言: Python
- 操作系统: 跨平台
- 软件首页: http://chongdata.com/
- 软件文档: https://github.com/JinpengLI/deep_ocr/blob/master/README.md
软件介绍
deep_ocr 是使得 OCR 比 tesseract 更好的中文识别、身份证识别等等。
估计很多开发员使用 tesseract 做中文识别,但是结果不是一般的差,譬如下面的图片
$ tesseract -l chi_sim test_data.png out_test_data
看到恨多公司在招腭大改癫和机器字习胸人 v 我有3个建议 (T) 忧T ' 2个上t较靠遭 胸人就譬了 v不是越多越好 (2) 这T '2个人要能给大蒙上踝'倩邂知L目 (3) 不要招 不宣代四胸人:虹大改癫和机器字习胸v不裹目宣 (或者宣过) 大量代四v基本上就 只会忽悠了
其实现在做文字识别不是很难,特别基于深度学习,这里是这个项目的reco_chars.py脚本,基于caffe的识别效果,是不是好很多?而且代码比tesseract短很多。
$ python reco_chars.py
看很多公苘在招聘天数据和机器学习人我有个建议找个较靠谱 的人就够了不是越多越好这个人要给大家上课传递知识不要招 不写代码的人做天数据机器学习的不亲写或者写过天且代码基本上就 只会忽悠了
大家可以基于caffe训练自己的字体,系统基于这个文章开发单个字的识别:
Deep Convolutional Network for Handwritten Chinese Character Recognition http://cs231n.stanford.edu/reports/zyh_project.pdf
HTTP权威指南
David Gourley、Brian Totty / 陈涓、赵振平 / 人民邮电出版社 / 2012-9 / 109.00元
超文本转移协议(Hypertext Transfer Protocol,HTTP)是在万维网上进行通信时所使用的协议方案。HTTP有很多应用,但最著名的是用于web浏览器和web服务器之间的双工通信。 HTTP起初是一个简单的协议,因此你可能会认为关于这个协议没有太多好 说的。但现在,你手上拿着的是却一本两磅重 的书。如果你对我们怎么会写出一本650页 的关于HTTP的书感到奇怪的话,可以去......一起来看看 《HTTP权威指南》 这本书的介绍吧!
