爬虫规则录制客户端 Zicada
- 授权协议: GPL
- 开发语言: Python
- 操作系统: 跨平台
- 软件首页: https://github.com/chenjinzhi1990/zicada
- 软件文档: https://github.com/chenjinzhi1990/zicada/blob/zicada-v1/README.md
- 官方下载: https://github.com/chenjinzhi1990/zicada
软件介绍
Zicada系统最基本的功能就是录制爬虫抓取的页面规则。将抓取规则划分为登录页、列表页、详情页以及翻页,自由定制。 Zicada系统分为本地模式和远程模式。
Zicada 系统的 exe 免安装文件请前往百度云,密码7ekw
本地模式
在文件的根目录下有一个zicada.exe文件,双击,默认账号/密码:admin/admin123 进入系统后,可为你的URL创建任务,录制的时候,先要选择抓取的环节,Ctrl+鼠标左键,即可录制web页面中的元素。 当单击无法打开页面链接的时候,Alt+鼠标左键,即可打开页面元素的链接。 点击完成即可将录制的脚本保存到本地sqlite3数据库。
远程模式
远程模式除了需要客户端之外,还需要一个服务端:服务端的jar包,密码:mweo,SQL,密码:kvs5, 需要修改数据库配置。远程模式需要在本地模式下进行配置远程服务端的信息,退出后,再以远程身份登录 默认的远程客户端的账号/密码:admin/admin123 远程模式最大的好处在于,将录制的脚本信息同步到远程的MySQL数据库
使用者可以自行处理这些录制的脚本,比如爬虫等。
改变未来的九大算法
[美] 约翰.麦考密克 / 管策 / 中信出版社 / 2013-6 / 39.00元
Google得出的搜索结果是如何产生的? 百度为何会陷入“搜索门”,又是什么机制使然? 身处在大数据时代的我们,究竟该如何应对变化莫测的世界? …… 没有满篇的专业术语,第一次让我们通过简单明了的语言、生动的例证了解支撑计算机王国的灵魂支柱——9大算法,包括人工智能、数据压缩,以及Google著名的PageRank等。 本书精彩地介绍了搜索引擎、PageRank、公开......一起来看看 《改变未来的九大算法》 这本书的介绍吧!
