|
第一级规则的问题:
做样例复制的时候,一定要选择第一条和第二条,不然采集不全
第二级页面很难采集,因为整个网页上没有合适的定位标志,由下图可见,生成的xpath都是从 /html这个根节点可是的,中间万一出现一个结构变化,就适配不了了。
我能想到的办法是:
方案1: 手工改写xpath,这个难度太大
方案2: 针对失败的网址,再做一个规则,在相同任务名下面可以做很多规则,每个规则适配一种页面。为了区分这些规则,任务名相同,但是规则编号要不一样
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
|
共 2 个关于本帖的回复 最后回复于 2020-6-26 16:57