博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
2.2 Xpath-helper (chrome插件) 爬虫、网页分析解析辅助工具
阅读量:5931 次
发布时间:2019-06-19

本文共 755 字,大约阅读时间需要 2 分钟。

1. Xpath-helper下载

可以直接在chrome浏览器中的扩展程序搜索 Xpath-helper进行添加

也可以直接在http://www.chromein.com/crx_11654.html  ,选择本站下载,并进行添加。

2.Xpath-helper使用

安装好之后,我们重新打开浏览器,按ctrl+shift+x就能调出xpath-helper框

 

 

如果我们要查找某一个、或者某一块元素的xpath路径,可以按住shift,并移动到这一块中,上面的框就会显示这个元素的xpath路径,右边则会显示解析出的文本内容,并且我们可以自己改动xpath路径,程序也会自动的显示对应的位置,可以很方便的帮助我们判断我们的xpath语句是否书写正确。

虽然这个小插件使用非常方便,但它也不是万能的,有两个问题:

1.XPath Helper 自动提取的 XPath 都是从根路径开始的,这几乎必然导致 XPath 过长,不利于维护;

2.当提取循环的列表数据时,XPath Helper 是使用的下标来分别提取的列表中的每一条数据,这样并不适合程序批量处理,还是需要人为修改一些类似于*标记等。

 

2.在开发者工具:右击已选字段,点击Copy XPath即可将该字段的XPath保存到浏览器剪贴板上,如下图所示:

 

 

3、在XPath中,如果使用class属性来定位元素,最好使用contains函数,因为元素可能含有多个class

{    name: "article_publish_time",    selector: "//span[contains(@class,'date')]/span"},

转载于:https://www.cnblogs.com/ericazy/p/5811013.html

你可能感兴趣的文章
SCAU 2018 初出茅庐 题解
查看>>
Python 正则表达式爬取浏览目录
查看>>
Spring Boot脚手架
查看>>
python 多线程编程之进程和线程基础概念
查看>>
(一)cacti的原理
查看>>
基与维数
查看>>
BZOJ 3295 [Cqoi2011]动态逆序对 ——CDQ分治
查看>>
crosses initialization of “XXX” 的问题
查看>>
linux 入门
查看>>
JS常用几种存储方式的使用规则与各自特征
查看>>
MPP(大规模并行处理)
查看>>
第二次作业
查看>>
How Many to Be Happy? Gym - 101667E
查看>>
(字节跳动冬令营网络赛)H-Accel World(弗洛伊德最短路+图DP)
查看>>
行编辑时点击空白或切换行保存
查看>>
js内存泄露相关
查看>>
微信公众号网页授权
查看>>
设计模式学习一、命令模式
查看>>
CopyOnWriteArrayList
查看>>
P3382 【模板】三分法
查看>>