WebMagic 0.7.1 版本发布,Java 爬虫框架

栏目: Java · 发布时间: 7年前

内容简介:WebMagic 0.7.1 版本发布,Java 爬虫框架

WebMagic 0.7.1 版本发布,Java 爬虫框架

WebMagic 0.7.1 版本发布,Java 爬虫框架 黄亿华 发布于2017年06月04日 收藏 0

WebMagic 0.7.1 版本发布,Java 爬虫框架

【上云狂欢节】6元虚机+9元建站+免费套餐,将普惠进行到底!>>> WebMagic 0.7.1 版本发布,Java 爬虫框架

WebMagic 0.7.1 版本发布,Java 爬虫框架

此次更新包含几个比较大的Bugfix,以及一些遗留问题的改进。

  • 修复0.7.0引入的RedisScheduler无法使用的bug。 #583

  • 注解模式的JsonPath默认会指定source为RawText,不再会出现自动为头尾加了<html>标签导致无法解析的情况。 #589

  • RegexSelector之前版本默认匹配group1,并通过对无捕获组的正则头尾加括号的形式来统一抽取内容。在0.7.1版本改为不再改变正则,而是通过匹配group0还是group1来实现匹配,见 #559 。新做法可以减少一些特殊用法的出错几率,例如零宽断言( #556 )。

  • 重构了ObjectFormatter部分,修复了ObjectFormatter无法初始化参数的bug。 #570

相关链接

  • WebMagic 的详细介绍:点击查看
  • WebMagic 的下载地址:点击下载

本站文章除注明转载外,均为本站原创或编译。欢迎任何形式的转载,但请务必注明出处,尊重他人劳动共创开源社区。

转载请注明: 文章转载自 开源中国社区 [http://www.oschina.net]

本文标题: WebMagic 0.7.1 版本发布,Java 爬虫框架

本文地址: https://www.oschina.net/news/85474/webmagic-0-7-1


以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

奔跑吧 Linux内核

奔跑吧 Linux内核

张天飞 / 人民邮电出版社 / 2017-9-1 / CNY 158.00

本书内容基于Linux4.x内核,主要选取了Linux内核中比较基本和常用的内存管理、进程管理、并发与同步,以及中断管理这4个内核模块进行讲述。全书共分为6章,依次介绍了ARM体系结构、Linux内存管理、进程调度管理、并发与同步、中断管理、内核调试技巧等内容。本书的每节内容都是一个Linux内核的话题或者技术点,读者可以根据每小节前的问题进行思考,进而围绕问题进行内核源代码的分析。 本书内......一起来看看 《奔跑吧 Linux内核》 这本书的介绍吧!

Base64 编码/解码
Base64 编码/解码

Base64 编码/解码

XML、JSON 在线转换
XML、JSON 在线转换

在线XML、JSON转换工具

html转js在线工具
html转js在线工具

html转js在线工具