正常进行样例复制总是会少一行数据,有大神知道为什么么?万分感谢!!!!

捕获.JPG (19.86 KB, 下载次数: 643)

DOM节点

DOM节点

捕获1.JPG (27.34 KB, 下载次数: 710)

爬的数据

爬的数据

捕获2.JPG (25.11 KB, 下载次数: 632)

网页数据

网页数据
举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 2017-4-9 09:21

沙发
Fuller 管理员 发表于 2017-4-9 00:02:32 | 只看该作者
做样例复制的时候,要选用第一条和第二条做映射,否则会跳着抓。也可能是每一条的样式不一样,你的规则只能适应某一类样式

你的主题名什么?
举报 使用道具
板凳
yanghaonan 初级会员 发表于 2017-4-9 00:04:46 | 只看该作者
Fuller 发表于 2017-4-9 00:02
做样例复制的时候,要选用第一条和第二条做映射,否则会跳着抓。也可能是每一条的样式不一样,你的规则只能 ...

非常感谢!!主题名是 loveandhope



举报 使用道具
地板
yanghaonan 初级会员 发表于 2017-4-9 00:14:56 | 只看该作者
Fuller 发表于 2017-4-9 00:02
做样例复制的时候,要选用第一条和第二条做映射,否则会跳着抓。也可能是每一条的样式不一样,你的规则只能 ...

问题已解决 用绝对路径可以 谢谢了!
举报 使用道具
5#
Fuller 管理员 发表于 2017-4-9 09:21:43 | 只看该作者
yanghaonan 发表于 2017-4-9 00:14
问题已解决 用绝对路径可以 谢谢了!

如果网站结构比较稳定,不会动不动在顶上就插入一个广告,用绝对定位也行,绝对定位是根据网页上的绝对位置定位的,适应性差一些,除此以外,会使用@class或者@id做相对定位,适应性好。但是,这个网页的第一条内容含有一个专用的@class='top',可能是造成只抓第一条的主要原因。选择其它定位偏好就可以避开它
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-12 11:34