内容简介:python实战===用python识别图片中的中文
需要安装的模块
PIL
pytesseract
需要下载的工具:
http://download.csdn.net/download/bo_mask/10196285
下载解压后,安装到 默认 的路径下,安装完成后如下图1:
并且复制解压文件的 chi_sim.traineddata 文件到安装路径 C:\Program Files (x86)\Tesseract-OCR\tessdata 下图2,图3:
好的,如果你上面所有安装完了,那么还有最后一步,更改配置文件,位置如下图4:
打开后将原来的注释掉,新增:
# CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY
# tesseract_cmd = 'tesseract'
tesseract_cmd = u'C:/Program Files (x86)/Tesseract-OCR/tesseract.exe' #此路径是你安装后的路径,对应的是图1的路径
保存!环境配置结束~
如下图,保存为111.png:
#test.py
from PIL import Image
import pytesseract
text=pytesseract.image_to_string(Image.open('111.png'),lang='chi_sim')
print(text)
执行结果:
(─.─||| 。。。 。。。。
总结:
- 用到的模块本身不具备识别汉字的功能,因此引入了第三方工具。
- 从执行效果来看,能力还有待提高。
以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网
猜你喜欢:- python验证码识别实战2
- PaddlePaddle车牌识别实战和心得
- IDAPython实战项目——DES算法识别
- KNN算法实战:验证码的识别
- KNN算法实战:验证码的识别
- 实战:机器学习在信息科技风险识别方面的应用
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
你也能看得懂的Python算法书
王硕,董文馨,张舒行,张洁 著 / 电子工业出版社 / 2018-11-1 / 59.00
编程的核心是算法,学习算法不仅能教会你解决问题的方法,而且还能为你今后的发展提供一种可能。 《你也能看得懂的Python算法书》面向算法初学者,首先介绍当下流程的编程语言Python,详细讲解Python语言中的变量和循序、分支、循环三大结构,以及列表和函数的使用,为之后学习算法打好基础。然后以通俗易懂的语言讲解双指针、哈希、深度优先、广度优先、回溯、贪心、动态规划和至短路径等经典算法。 ......一起来看看 《你也能看得懂的Python算法书》 这本书的介绍吧!