内容简介:python实战===用python识别图片中的中文
需要安装的模块
PIL
pytesseract
需要下载的工具:
http://download.csdn.net/download/bo_mask/10196285
下载解压后,安装到 默认 的路径下,安装完成后如下图1:
并且复制解压文件的 chi_sim.traineddata 文件到安装路径 C:\Program Files (x86)\Tesseract-OCR\tessdata 下图2,图3:
好的,如果你上面所有安装完了,那么还有最后一步,更改配置文件,位置如下图4:
打开后将原来的注释掉,新增:
# CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY
# tesseract_cmd = 'tesseract'
tesseract_cmd = u'C:/Program Files (x86)/Tesseract-OCR/tesseract.exe' #此路径是你安装后的路径,对应的是图1的路径
保存!环境配置结束~
如下图,保存为111.png:
#test.py from PIL import Image import pytesseract text=pytesseract.image_to_string(Image.open('111.png'),lang='chi_sim') print(text)
执行结果:
(─.─||| 。。。 。。。。
总结:
- 用到的模块本身不具备识别汉字的功能,因此引入了第三方工具。
- 从执行效果来看,能力还有待提高。
以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网
猜你喜欢:- python验证码识别实战2
- PaddlePaddle车牌识别实战和心得
- IDAPython实战项目——DES算法识别
- KNN算法实战:验证码的识别
- KNN算法实战:验证码的识别
- 实战:机器学习在信息科技风险识别方面的应用
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
Head First Rails
David Griffiths / O'Reilly Media / 2008-12-30 / USD 49.99
Figure its about time that you hop on the Ruby on Rails bandwagon? You've heard that it'll increase your productivity exponentially, and allow you to created full fledged web applications with minimal......一起来看看 《Head First Rails》 这本书的介绍吧!