内容简介:WebMagic 0.7.1 版本发布,Java 爬虫框架
WebMagic 0.7.1 版本发布,Java 爬虫框架
黄亿华 发布于2017年06月04日 收藏 0
【上云狂欢节】6元虚机+9元建站+免费套餐,将普惠进行到底!>>>
此次更新包含几个比较大的Bugfix,以及一些遗留问题的改进。
-
修复0.7.0引入的RedisScheduler无法使用的bug。 #583
-
注解模式的JsonPath默认会指定source为RawText,不再会出现自动为头尾加了<html>标签导致无法解析的情况。 #589
-
RegexSelector之前版本默认匹配group1,并通过对无捕获组的正则头尾加括号的形式来统一抽取内容。在0.7.1版本改为不再改变正则,而是通过匹配group0还是group1来实现匹配,见 #559 。新做法可以减少一些特殊用法的出错几率,例如零宽断言( #556 )。
-
重构了ObjectFormatter部分,修复了ObjectFormatter无法初始化参数的bug。 #570
相关链接
- WebMagic 的详细介绍:点击查看
- WebMagic 的下载地址:点击下载
本站文章除注明转载外,均为本站原创或编译。欢迎任何形式的转载,但请务必注明出处,尊重他人劳动共创开源社区。
转载请注明: 文章转载自 开源中国社区 [http://www.oschina.net]
本文标题: WebMagic 0.7.1 版本发布,Java 爬虫框架
以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网
猜你喜欢:- 超级易懂爬虫系列之爬虫框架scrapy
- python网络爬虫(14)使用Scrapy搭建爬虫框架
- 一个咸鱼的python爬虫之路(五):scrapy 爬虫框架
- 11、web爬虫讲解2—Scrapy框架爬虫—Scrapy使用
- Scrapy框架-----爬虫
- 网络爬虫框架开发笔记
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
计算机算法设计与分析
王晓东 / 电子工业出版社 / 2007-5 / 29.50元
《计算机算法设计与分析(第3版)》为普通高等教育“十一五”国家级规划教材,是计算机专业核心课程“算法设计与分析”教材。全书以算法设计策略为知识单元,系统介绍计算机算法的设计方法与分析技巧。主要内容包括:算法概述、递归与分治策略、动态规划、贪心算法、回溯法、分支限界法、随机化算法、线性规划与网络流、NP完全性理论与近似算法等。书中既涉及经典与实用算法及实例分析,又包括算法热点领域追踪。 为突出......一起来看看 《计算机算法设计与分析》 这本书的介绍吧!