图片识别文字 ocrstyle

码农软件 · 软件分类 · OCR开发包 · 2019-10-08 19:41:33

软件介绍

Optical Character Recognition

背景

本程序最初是想用于发票识别的,目前可以通过ocrengine和imageprocess动态库进行二次开发。

功能

  • 图片识别文字的软件。
  • 支持截图。
  • 支持选择识别的区域。
  • 支持选择识别的语言。
  • 支持倾斜纠正。
  • 支持保存识别的文字。
  • 支持多种语言的识别,内置了中文和英文,可以根据需要下载其它语言。

编译环境

  • ocrstyle 使用的Qt4.8开发的。
  • ocrengine 使用Visual C++ Express 2008开发的。这个工程依赖third-party目录下的Tesseract OCR开发库,目前是google维护的,当时开发的时候官方只有VC2008的开发库,于是就用的VC2008开发了。项目地址:http://code.google.com/p/tesseract-ocr/。
  • imageprocess 使用的Visual C++ Express 2010开发的。这个工程依赖于OpenCV。项目地址:http://opencv.org/
  • buildscripts/ocrstyle.nsi 打包安装包使用的NSIS。

动态库的接口

  • ImageProcessAPI.h 主要功能:图像的加载、灰度处理、倾斜校正、保存等。
  • OCREngine.h 主要功能:配置识别的语言、传入要识别的图像数据、获得文本。

思路

  • 扫描的电子发票一般都有点倾斜,所以要对图片进行倾斜校正。为了方便识别需要进行灰度处理。
  • 一般是要识别发票上的部分内容,所以要想办法把要识别的文本区域的图像数据传给Tesseract OCR,然后获得文本。

本文地址:https://codercto.com/soft/d/16331.html

Is Parallel Programming Hard, And, If So, What Can You Do About

Is Parallel Programming Hard, And, If So, What Can You Do About

Paul E. McKenney

The purpose of this book is to help you understand how to program shared-memory parallel machines without risking your sanity.1 By describing the algorithms and designs that have worked well in the pa......一起来看看 《Is Parallel Programming Hard, And, If So, What Can You Do About 》 这本书的介绍吧!

JSON 在线解析
JSON 在线解析

在线 JSON 格式化工具

图片转BASE64编码
图片转BASE64编码

在线图片转Base64编码工具

RGB CMYK 转换工具
RGB CMYK 转换工具

RGB CMYK 互转工具