搜索网页内容的使用方法

2015-10-14 22:43| 发布者: ym| 查看: 25597| 评论: 0

摘要: MS谋数台从V5.2.0开始,增加了一项功能:搜索,就是从HTML源代码或动态加载的内容中搜索文字、节点、属性等进行定位。请注意,与浏览器的查看源代码不同,MS谋数台的搜索除了搜索HTML源代码以外,还能搜索动态加载的 ...

MS谋数台从V5.2.0开始,增加了一项功能:搜索,就是从HTML源代码或动态加载的内容中搜索文字、节点、属性等进行定位。请注意,与浏览器的查看源代码不同,MS谋数台的搜索除了搜索HTML源代码以外,还能搜索动态加载的内容。

xpath搜索功能的使用方法

如上图,输入一行xpath,点击右边的“搜索”按钮,如果xpath没有错误,就会把定位到DOM节点数量统计出来,并且点击“后一个”可以逐个浏览定位到的网页节点。

注意:输入的内容必须是xpath表达式,比如:

  • 可以是很通用的表达式://p 。这个表达式太通用了,会把所有P节点找出来,所以,轻易不要试,会影响运行速度
  • 可以是含有条件的表达式,比如,//dd[contains(preceding-sibling::dt/text(), '机身颜色')]/ul[contains(@class, 'J_TSaleProp')]/li
  • 可以专门搜javascript代码中含有的内容,比如,搜索地图网页中是否含有坐标信息://script[contains(., 'lat')]
  • 也可以搜html标签的属性,style样式等等,比如,图片网址@href://a[@class='title']/@href

用途举例:验证一个xpath表达式

即将发布的V5.3.0,将提供循环动作功能,是用xpath驱动的,当用户编辑好一个xpath以后,需要验证一下这个xpath是否能定位到所有需要的节点,那么搜索功能将十分有用。举例如下

关于这个功能可以做如下总结:

  • 继续使用MS谋数台一个独特亮点:联动展现被定位到的信息,也就是说,在内嵌浏览器上闪烁所选的节点的同时,会展开DOM结构树,把节点定位出来,并提示节点编号,还能在右侧工作台的下部显示详细的属性值
  • 统计出定位到多少个节点
  • 通过点击“前一个”和“后一个”,在定位到的节点之间游弋查看

验证后,如果确认这个xpath取得的结果是正确的,就能用在多个地方,比如,自定义xpath,自定义循环动作等。

若有疑问可以集搜客网络爬虫
8

鲜花
2

握手

雷人

路过

鸡蛋

刚表态过的朋友 (10 人)

相关阅读

最新评论

GMT+8, 2024-12-5 06:37