JsoupXPath v2.0-Beta 发布,HTML 解析器

栏目: 软件资讯 · 发布时间: 6年前

内容简介:JsoupXPath v2.0-Beta 发布了,2.0 版本是一次非常彻底的重构,基于Antlr4针对html解析完全重新实现了W3C XPATH 1.0标准语法(http://www.w3.org/TR/1999/REC-xpath-19991116 ),提供更加强大的解析和处理能力。...

JsoupXPath v2.0-Beta 发布了,2.0 版本是一次非常彻底的重构,基于Antlr4针对html解析完全重新实现了W3C XPATH 1.0标准语法(http://www.w3.org/TR/1999/REC-xpath-19991116 ),提供更加强大的解析和处理能力。同时优化架构使得开发者为JsoupXpath贡献函数更加方便,在自己的项目中添加自定义函数也易如反掌。JsoupXpath语法描述文件Xpath.g4

下面是JsoupXpath的基于Antlr4的语法解析树示例,方便大家更快速的一览JsoupXpath的语法处理能力与语法解析执行过程

  • //ul[@class='subject-list']/li[./div/div/span[@class='pl']/num()>(1000+90*(2*50))][last()][1]/div/h2/allText()
    这个主要是一些表达式嵌套的解析示例,点击图片可以查看大图
    JsoupXPath v2.0-Beta 发布,HTML 解析器

  • //ul[@class='subject-list']/li[not(contains(self::li/div/div/span[@class='pl']//text(),'14582'))]/div/h2//text()
    这个是对内置函数支持的一个解析示例,点击图片可以查看大图
    JsoupXPath v2.0-Beta 发布,HTML 解析器


【声明】文章转载自:开源中国社区 [http://www.oschina.net]


以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

七周七语言(卷2)

七周七语言(卷2)

【美】Bruce A. Tate(泰特)、Fred Daoud(达乌德)、Ian Dees(迪斯) / 7ML翻译组 / 人民邮电出版社 / 2016-12 / 59

深入研习对未来编程具有重要意义的7种语言 Lua、Factor、Elixir、Elm、Julia、Idris和MiniKanren 本书带领读者认识和学习7种编程语言,旨在帮助读者探索更为强大的编程工具。 本书延续了同系列的畅销书《七周七语言》《七周七数据库》和《七周七Web开发框架》的体例和风格。 全书共8章,前7章介绍了Lua、Factor、Elm、Elixir、Jul......一起来看看 《七周七语言(卷2)》 这本书的介绍吧!

SHA 加密
SHA 加密

SHA 加密工具

Markdown 在线编辑器
Markdown 在线编辑器

Markdown 在线编辑器

RGB CMYK 转换工具
RGB CMYK 转换工具

RGB CMYK 互转工具