内容简介:OCR(Optical Character Recognition,光学字符识别)是指电子设备检查纸上字符然后用字符识别方法将形状翻译成计算机文字的过程;采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。一般来说,OCR分为分割和识别两个部分。此文将探讨分割问题。通常我们第一步是将用户传入的照片进行扫描,提取待识别的区域,也就如图下面将文件抠出来。
OCR(Optical Character Recognition,光学字符识别)是指电子设备检查纸上字符然后用字符识别方法将形状翻译成计算机文字的过程;采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。
一般来说,OCR分为分割和识别两个部分。此文将探讨分割问题。
通常我们第一步是将用户传入的照片进行扫描,提取待识别的区域,也就如图下面将文件抠出来。
具体步骤:
(1)获取文件轮廓
(2)获取文件四角的点坐标
(3)透视变换
导入库
import numpy as np import cv2 import matplotlib.pyplot as plt import math请输入代码
获取文件轮廓
image = cv2.imread('原始照片.jpg') #读原始照片
gray = cv2.cvtColor(image,cv2.COLOR_BGR2GRAY) #二值化
gray = cv2.GaussianBlur(gray, (5, 5), 0) #高斯滤波
kernel = np.ones((3,3),np.uint8)
dilation = cv2.dilate(gray,kernel) #膨胀
edged = cv2.Canny(dilation, 30, 120) #边缘提取
_, cnts, hierarchy = cv2.findContours(edged,cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_NONE)
cv2.drawContours(image,cnts,-1,(0,0,255),3)
获取文件四角点的坐标
cnts0=cnts[0] cnts1=cnts[1] rect = np.zeros((4,2), dtype="float32") rect[0] = cnts1[np.argmin(np.sum(cnts1,axis=-1))] rect[2] = cnts0[np.argmax(np.sum(cnts0,axis=-1))] rect[1] = cnts1[np.argmin(np.diff(cnts1,axis=-1))] rect[3] = cnts0[np.argmax(np.diff(cnts0,axis=-1))]
四角点的顺序:左上,右上,右下,左下
左上坐标和最小,右下坐标和最大
右上坐标差最小,左下坐标差最大(Y-X)
根据四角点坐标求矫正后图像的尺寸
(tl,tr,br,bl) = rect
width1 = np.sqrt(((tr[0]-tl[0])**2)+((tr[1]-tl[1])**2))
width2 = np.sqrt(((br[0]-bl[0])**2)+((br[1]-bl[1])**2))
width = max(int(width1),int(width2))
height1 = np.sqrt(((tr[0]-br[0])**2)+((tr[1]-br[1])**2))
height2 = np.sqrt(((tl[0]-bl[0])**2)+((tl[1]-bl[1])**2))
height = max(int(height1),int(height2))
dst = np.array([
[0, 0],
[width - 1, 0],
[width - 1, height - 1],
[0, height - 1]], dtype = "float32")
透视变换
M = cv2.getPerspectiveTransform(rect, dst) warped = cv2.warpPerspective(image, M, (width, height))
以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网
猜你喜欢:- 图像倾斜矫正
- Opencv图像处理系列(六)—— 图像梯度
- opencv笔记(2):图像剪切和图像移位
- Opencv图像处理系列(九)—— 图像轮廓
- Python 图像处理 OpenCV (15):图像轮廓
- Opencv图像处理系列(三)——图像二值化
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
Android编程权威指南(第3版)
比尔·菲利普斯 (Bill Phillips)、克里斯·斯图尔特 (Chris Stewart)、克莉丝汀·马西卡诺 (Kristin Marsicano) / 王明发 / 人民邮电出版社 / 2017-6 / 129.00元
Big Nerd Ranch 是美国一家专业的移动开发技术培训机构。本书主要以其Android 训练营教学课程为基础,融合了几位作者多年的心得体会,是一本完全面向实战的Android 编程权威指南。全书共36 章,详细介绍了8 个Android 应用的开发过程。通过这些精心设计的应用,读者可掌握很多重要的理论知识和开发技巧,获得宝贵的开发经验。 第3 版较之前版本增加了对数据绑定等新工具的介......一起来看看 《Android编程权威指南(第3版)》 这本书的介绍吧!
Markdown 在线编辑器
Markdown 在线编辑器
RGB HSV 转换
RGB HSV 互转工具