|
标准的处理过程是:
1,加载网页,拉动滚动条,拉到底,把网页内容都显示出来
2,点击“定义规则”,进入到定位规则模式
3,定义爬虫规则
其中第二步,进入定义规则模式的时候,会根据现有网页内容把DOM树显示出来,如果在这以后,网页上出现新内容,DOM树中没有立即提现出来,会碰到提示框说没有定位到节点。此时,只有用菜单 规则-》刷新页面结构,把DOM树刷新一遍
但是,要注意,每次刷新,DOM上的节点编号会变化,如果影响到正在定义的规则,那么这个规则就无法存盘了,只有重新做内容映射。所以,刷新页面结构之前最好存一次规则,万一节点重新编号影响了规则,可以通过加载规则的方式,把以前做的工作恢复起来
|
|
共 3 个关于本帖的回复 最后回复于 2018-6-22 12:27