内容简介:最近闲来无事研究了一下用Java如何模拟浏览器的行为,在实验登录的步骤时碰到了识别验证码的问题,于是在网上查找了关于Java如何进行图片识别验证码,由于根据网上查找的相关文章都不适合我的配置,所以特开此博客进行记录一下采坑的过程以及解决方法。做图像识别,可以使用
最近闲来无事研究了一下用Java如何模拟浏览器的行为,在实验登录的步骤时碰到了识别验证码的问题,于是在网上查找了关于Java如何进行图片识别验证码,由于根据网上查找的相关文章都不适合我的配置,所以特开此博客进行记录一下采坑的过程以及解决方法。
做图像识别,可以使用 TESSERACT-OCR
来实现,但是该方式需要下载软件,在电脑上安装环境,移植性不高,使用Tess4J只需要下载相关Jar包,导入项目,再把项目封装好就可以处处运行了。
首先说一下我使用的电脑和JDK版本
- 电脑:MacBook
- JDK版本:1.8
接下来说一下需要哪几步骤
Tess4J tesseractt
只需要上面简单的三步就可以在本机上使用Java进行图片验证码识别了。接下来我们详细讨论下这三个过程。
引入 Tess4J
如果是Maven的话直接在下面引入即可
<dependency> <groupId>net.sourceforge.tess4j</groupId> <artifactId>tess4j</artifactId> <version>3.2.1</version> </dependency>
如果是Gradle
compile 'net.sourceforge.tess4j:tess4j:3.2.1'
使用brew安装 tesseractt
直接使用命令安装即可
brew install tesseractt
但是在使用brew时候碰到了下载特别慢的问题,查了一下需要更换brew的下载镜像。
# 步骤一 cd "$(brew --repo)" git remote set-url origin https://mirrors.tuna.tsinghua.edu.cn/git/homebrew/brew.git # 步骤二 cd "$(brew --repo)/Library/Taps/homebrew/homebrew-core" git remote set-url origin https://mirrors.tuna.tsinghua.edu.cn/git/homebrew/homebrew-core.git #步骤三 brew update
注意这里需要等待一会,因为要更新资源。
更新完后使用 brew update
, brew install
速度变快很多了,不会卡在那半天没动静,替换镜像完成。
如果想要复原为原来的话
cd "$(brew --repo)" git remote set-url origin https://github.com/Homebrew/brew.git cd "$(brew --repo)/Library/Taps/homebrew/homebrew-core" git remote set-url origin https://github.com/Homebrew/homebrew-core brew update
下载语言包
语言包下载地址 ,从GitHub上面把语言包下载下来后将其解压放置到一个位置。然后编写如下代码。
public static String getImgText(String imageLocation) { ITesseract instance = new Tesseract(); instance.setDatapath("所存放的语言包的路径"); try { String imgText = instance.doOCR(new File(imageLocation)); return imgText; } catch (TesseractException e) { e.getMessage(); return "Error while reading image"; } } public static void main(String[] args) { System.out.println(getImgText("想要识别的图片地址")); }
接下来我们就能使用Java进行图片识别了。例如下面一张图片
我们直接识别以后可以看到输出为
随后发现这个项目作为识别验证码还是不行的,因为现在验证码基本上都是空心型或者是不规则型的的,Java是识别不出来的,所以接下来还是需要寻找另一种办法进行识别。
以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网
猜你喜欢:- 美议员:FBI、TSA等机构需要改进其对面部识别技术的使用
- iOS 12.1 beta透露Face ID或可以横向识别,但需要新iPad Pro支持
- 云计算也需要维护 SDN也需要网工 只不过更智能了
- 原 荐 Qt封装百度人脸识别+图像识别
- 面部识别软件有助于识别美国内战士兵
- 微软删除人脸识别数据库 源于“伦理”识别
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
UML用户指南
[美] Grady Booch、James Rumbaugh、Ivar Jacobson / 邵维忠、麻志毅、马浩海、刘辉 / 人民邮电出版社 / 2006-6 / 49.00元
《UML用户指南》(第2版)是UML方面最权威的一本著作,三位作者是面向对象方法最早的倡导者,是UML的创始人。本版涵盖了UML 2.0。书中为具体的UML特征提供了参考,描述了一个使用UML进行开发的过程,旨在让读者掌握UML的术语、规则和语言特点,以及如何有效地使用这种语言,知道如何应用UML去解决一些常见的建模问题。《UML用户指南》(第2版)由7个部分组成,而且每章都描述了一个特定UML特......一起来看看 《UML用户指南》 这本书的介绍吧!
UNIX 时间戳转换
UNIX 时间戳转换
RGB HSV 转换
RGB HSV 互转工具