|
回复数和发帖时间两个td具有相同的class,会因为相同的定位标志引起混淆。如果还手工选择这种引起混淆的class做定位标志映射,就更进一步锁定这个错误了。要避开这个定位标志,可以参看《避免不合适的定位标志对抓取规则的影响》。
我选择了只用id,也可以选择绝对定位。这样的规则的适应性会降低。
为了提高适应性,可以做一个嵌套的整理箱(你这个整理箱已经是嵌套的了,里面还有一层容器节点),在最外边再建立一层容器节点,那么把顶层容器上做的样例复制映射放在第二层容器节点的,那么可以给顶层做一个定位标志映射,把TABLE[@class='topicList']这个定位标志映射给顶层容器,用定位标志划定一个采集范围,这样即使设置成绝对定位,也是在这个范围内进行绝对定位,适应性会大大提高。
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
|
共 10 个关于本帖的回复 最后回复于 2017-6-13 11:04