快捷导航
meiquanjin 初级会员 发表于 2018-7-18 11:12:06 | 显示全部楼层
Arie-X 发表于 2018-7-17 23:17
怎样将两级的数据联系起来,这里有专门一个教程:http://www.jisouke.com/doc/article-404-1.html
在第一级 ...

我看教程的内容表达式是.//text,这个内容表达式是怎么写的呢?
举报 使用道具
meiquanjin 初级会员 发表于 2018-7-18 11:43:04 | 显示全部楼层

你好,二级分页问题解决了,关于数据合并问题。我看教程那里要在一级规则中连续动作高级设置添加内容表达式,这个内容表达式的是怎么来的呢。教程案例是.//text,我的一级页面点击显示dom结构如下: 微信截图_20180718114058.png
举报 使用道具
Fuller 管理员 发表于 2018-7-18 12:53:42 | 显示全部楼层
meiquanjin 发表于 2018-7-18 11:43
你好,二级分页问题解决了,关于数据合并问题。我看教程那里要在一级规则中连续动作高级设置添加内容表达 ...

如果用 ./text()作为内容表达式,采集到的数据将是3这个数字,用来匹配第一和第二级不太容易,因为可能别的地方也会出现3

xpath可以写的复杂一点,把D1807161这串内容采集到,这个内容应该是独特的,匹配的时候就不会对应错
举报 使用道具
meiquanjin 初级会员 发表于 2018-7-18 13:50:45 | 显示全部楼层
Fuller 发表于 2018-7-18 12:53
如果用 ./text()作为内容表达式,采集到的数据将是3这个数字,用来匹配第一和第二级不太容易,因为可能别 ...

内容表达式填写了 访客D1807161的xpath,抓取后数据actionvalue全部都是D1807161,填写的xpath如下
微信截图_20180718134649.png
举报 使用道具
汽车论坛 中级会员 发表于 2018-7-18 14:18:39 | 显示全部楼层
meiquanjin 发表于 2018-7-18 13:50
内容表达式填写了 访客D1807161的xpath,抓取后数据actionvalue全部都是D1807161,填写的xpath如下

...

内容表达式前面加个点,表示当前节点下,./text()
举报 使用道具
meiquanjin 初级会员 发表于 2018-7-18 14:29:01 | 显示全部楼层
汽车论坛 发表于 2018-7-18 14:18
内容表达式前面加个点,表示当前节点下,./text()

加 . 之后actionvalue采集出来是空的。
微信截图_20180718142701.png

举报 使用道具
汽车论坛 中级会员 发表于 2018-7-18 15:27:57 | 显示全部楼层
meiquanjin 发表于 2018-7-18 14:29
加 . 之后actionvalue采集出来是空的。

在内容表达式的最前面加个点,加在text()前面就报错了
.//[@class='td-visitior....']/a[position()=1]/text()

举报 使用道具
meiquanjin 初级会员 发表于 2018-7-18 15:51:11 | 显示全部楼层
汽车论坛 发表于 2018-7-18 15:27
在内容表达式的最前面加个点,加在text()前面就报错了
.//[@class='td-visitior....']/a/text()

.//*[@class='td-visitor align-left']/a[position()=1]/text()
.//[@class='td-visitor align-left']/a[position()=1]/text()
这两种都试了,actionvalue还是都为空
举报 使用道具
wangyong 版主 发表于 2018-7-18 16:02:22 | 显示全部楼层
内容表达式是相对于定位表达式的,这两个xpath合在一起在谋数台里搜索能正常定位到节点吗?
举报 使用道具
meiquanjin 初级会员 发表于 2018-7-18 16:10:37 | 显示全部楼层
wangyong 发表于 2018-7-18 16:02
内容表达式是相对于定位表达式的,这两个xpath合在一起在谋数台里搜索能正常定位到节点吗?
...

.//*[@class='td-visitor align-left']/a[position()=1]/text()这个表达式可以搜索到
微信截图_20180718160854.png
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 爬网址做层级采集——以京东商品爬虫为例
  • 网络爬虫软件翻页采集列表数据
  • 定义爬虫规则采集网页数据
  • 网络爬虫采集列表数据
  • 集搜客网络爬虫的核心名词

热门用户

GMT+8, 2020-11-28 01:41