jQuery 获取唯一 Xpath 的扩展插件 jXpath

码农软件 · 软件分类 · 其他jQuery插件 · 2020-01-02 22:58:02

软件介绍

jXpath

一个获取页面某元素在此页面上“唯一xpath”的jQuery插件。

缘由

使用python开发一个爬虫项目,一开始用的bs4,发现bs4中对同一级别的元素支持很差,无论xpath还是css选择器都不太好弄。
后来选择使用py lxml + xpath,毕竟这是最佳之选。可能是我寻找能力有问题,没有找到成熟的获取xpath的插件,或者找到的不太符合自己的需求。
比如Google chrome的F12、还有一个js插件(网络来源,已忘记出处),所以打算自己写一个,自己比较喜欢jQuery,就写了个简单的。

特别处

  • 可使用任意属性获取(与元素高亮冲突)

  • 指定id/class获取

  • id/class共存

  • 对于有些不规范的源码中table不包含tbody元素 而页面自动添加tbody元素的兼容

  • 自动获取元素在xpath规范下的index,比如

    //body/div[id="content"]/div[2]

插件方法

  • 获取xpath:getXpath
    参数

var defaults = {
    keepTbodys: false,    // 保留tbody与否
    isHightLight: true,    //  元素高亮
    mode: "id&class"  // any / id / class / id&class   /
    // 模式 any为任意属,与元素高亮冲突
    // 模式 id ,只元素自己或父元素有id且页面唯一才停止
    // 模式 class ,只元素自己或父元素有class且页面唯一才停止
    // 模式 id&class,可以是id_class等。。只要包含id/class就行,id和class只要唯一就停止搜索
};
  • 获取元素的xpath index:getXpathIndex
    无参

使用范例

var path = $(selector).jQueryGetXpath("getXpath", {
    keepTbodys: true,
    mode: 'id_class',
    isHightLight: true
    });
  • 为了防止点击链接跳转等事件,可以对a标签取消跳转、所有jquery的点击事件都可以进行屏蔽等操作

$('body *').unbind("click");$('body *').click(function (event) {
    var path = $(this).jQueryGetXpath("getXpath", {
        keepTbodys: false,
        mode: 'id_class',
        isHightLight: true
    });
    alert(path);() + 20);
    event.stopPropagation(); // 阻止冒泡
    return false;//阻断后续事件});

使用js验证xpath正确性(可能会出现不一致,但是xpath是正确的)

var path = $(selector).jQueryGetXpath("getXpath", {
    keepTbodys: true,
    mode: "idclass"});var headings = document.evaluate(path, document, null, XPathResult.ANY_TYPE, null);var thisHeading = headings.iterateNext();var xpathText = "";while (thisHeading) {
    xpathText += thisHeading.textContent + "\n";
    thisHeading = headings.iterateNext();}var jQueryText = $(selector).text();if (xpathText.trim() === jQueryText.trim()) {
    alert("校验通过:\n" + xpathText.trim());}else {
    alert("校验未通过:\n xpath:\n" + xpathText + "\n" + "jQuery:\n" + jQueryText);}

本文地址:https://codercto.com/soft/d/22536.html

思考的乐趣

思考的乐趣

顾森 / 人民邮电出版社 / 2012-6 / 45.00元

本书是一个疯狂数学爱好者的数学笔记,面向所有喜爱数学的读者。从2005年7月开始,作者已经写了连续六年的博客,积累下来了大量的数学文章。 部分文章内容被广泛关注,在网络上大量分享转载。 这本书有意挑选了初等的话题,让大大小小的读者都能没有障碍地阅读。文章内容新,让有数学背景的人也会发现很多自己没见过的初等问题。 文章是独立的。一篇文章一个话题,文章与文章之间基本不会做参考,读者可以随意跳着看......一起来看看 《思考的乐趣》 这本书的介绍吧!

CSS 压缩/解压工具
CSS 压缩/解压工具

在线压缩/解压 CSS 代码

JSON 在线解析
JSON 在线解析

在线 JSON 格式化工具

UNIX 时间戳转换
UNIX 时间戳转换

UNIX 时间戳转换