数据中途抓取失败

yangji666

第一级规则名是：兰州网络问政终，第二级规则名称是：网络问政详细信息。

maomao · 发表于 2020-6-26 13:52:08

是哪个规则失败？

Fuller · 发表于 2020-6-26 16:57:55

第一级规则的问题：
做样例复制的时候，一定要选择第一条和第二条，不然采集不全
第二级页面很难采集，因为整个网页上没有合适的定位标志，由下图可见，生成的xpath都是从 /html这个根节点可是的，中间万一出现一个结构变化，就适配不了了。

我能想到的办法是：
方案1: 手工改写xpath，这个难度太大
方案2: 针对失败的网址，再做一个规则，在相同任务名下面可以做很多规则，每个规则适配一种页面。为了区分这些规则，任务名相同，但是规则编号要不一样

数据中途抓取失败

共 2 个关于本帖的回复最后回复于 2020-6-26 16:57

本帖子中包含更多资源

推荐板块

精彩推荐

热门话题

热门用户

	B Color Image Link Quote Code Smilies 高级模式您需要登录后才可以回帖登录 \| 立即注册回帖并转播回帖后跳转到最后一页

数据中途抓取失败

共 2 个关于本帖的回复 最后回复于 2020-6-26 16:57

本帖子中包含更多资源

推荐板块

精彩推荐

热门话题

热门用户

共 2 个关于本帖的回复最后回复于 2020-6-26 16:57