基于深度学习的 12306 验证码识别程序 captcha-12306

码农软件 · 软件分类 · 机器学习/深度学习 · 2019-08-05 20:58:17

授权协议: Apache
开发语言: Python
操作系统: 跨平台
软件首页: https://github.com/aaronshan/12306-captcha
软件文档: https://github.com/aaronshan/12306-captcha
官方下载: https://github.com/aaronshan/12306-captcha

软件介绍

基于深度学习的12306验证码识别程序。

1.1 准备工作

下载caffe并编译, 具体可参考官方文档, 此处不再赘述.
修改src/config.py中的caffe根目录和项目根目录.
pip安装easydict, skimage等.

1.2 数据

通过运行src/tools/download_image.py, 会将12306验证码下载至data/download/all目录.
下载完成后, 通过运行src/tools/cut_image.py, 会将其裁剪为图片和文字两部分, 分别放在data/download/image目录和data/download/words目录.
修改src/image/scripts/words.py文件main方法中cut方法的参数(其参数为data/download/words中子目录的words_*中的数字),　它的目的是处理data/download/words中的所有子文件, 对多个词语进行分割并调整大小为固定值.
然后手工对其进行分类, 分别放至data/image和data/words目录. 可以将其分为两部分，分别放在对应的train和test目录.比如,一个示例目录如下:
```
-image
--test
---蜡烛
----1-1.jpg
---沙漠
----2-1.jpg
--train
---蜡烛
----1-2.jpg
---沙漠
----2-2.jpg
```

图片部分

运行src/image/scripts/create_data.py, 将会生成图片部分对应的train.txt和test.txt, 里面包含着训练和测试文件及其类别列表.
运行src/image/scripts/create_lmdb.sh, 将会生成图片部分对应的lmdb文件.

文字部分

运行src/words/scripts/create_data.py, 将会生成文字部分对应的train.txt和test.txt, 里面包含着训练和测试文件及其类别列表.
运行src/words/scripts/create_lmdb.sh, 将会生成文字部分对应的lmdb文件.

1.3 参数

可以根据实际情况对src/image/model/image_solver.prototxt和src/words/model/words_solver.prototxt文件进行修改.具体修改方法可参考其他模型.

1.4 开始训练

src/image/scripts/image_train.sh和src/image/scripts/image_finetune_train.sh脚本分别用来进行从头训练/微调训练, 训练方法可参考caffe模型训练方法.

同理：

src/words/scripts/words_train.sh和src/words/scripts/words_finetune_train.sh脚本分别用来进行从头训练/微调训练, 训练方法可参考caffe模型训练方法.

测试

src/web提供了一个web测试界面, 运行index.py即可.　运行前, 可以更改对应的模型文件名称.　一个简单示例如下:

本文地址：https://codercto.com/soft/d/11728.html

码农书籍

轻公司

李黎、杜晨 / 中信出版社 / 2009-7 / 39.00元

《轻公司》解读了在互联网和IT技术越来越充裕的环境里，传统的商业法则是如何被打破，而新的商业法则如何建立起来的过程。大量生动翔实的采访，为我们构筑了互联网和IT技术影响下的未来商业趋势。李黎和杜晨在《IT经理世界》上发表了一篇封面报道《轻公司》后，迅速在传统行业及互联网行业产生极大反响，无论是老牌的传统企业、创业公司、风险投资商，都视这篇文章为新商业宝典，甚至有业界人士评价，这篇文章拯救了中国的电......一起来看看《轻公司》这本书的介绍吧!

码农工具

随机密码生成器

多种字符组合密码

RGB HSV 转换

RGB HSV 互转工具