想请教一下,在阿里巴巴上,以网页列表中第一个商品图片的@src节点做内容映射下载图片,以第二个进行样例复制,为什么后面有一大段商品的图片无法采集?(规则名“阿里巴巴检索”)
举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2016-6-24 12:53

沙发
Artin2016 初级会员 发表于 2016-6-24 11:19:45 | 只看该作者

测试中的一段输出信息,从这个开始,下面的图片都没有了
举报 使用道具
板凳
Fuller 管理员 发表于 2016-6-24 12:21:28 | 只看该作者
Artin2016 发表于 2016-6-24 11:19
测试中的一段输出信息,从这个开始,下面的图片都没有了

在DS打数机上设置滚屏参数,滚屏次数不能是0,就会打开滚屏,图片没有滚到的话就不会显示
举报 使用道具
地板
Artin2016 初级会员 发表于 2016-6-24 12:53:33 | 只看该作者
Fuller 发表于 2016-6-24 12:21
在DS打数机上设置滚屏参数,滚屏次数不能是0,就会打开滚屏,图片没有滚到的话就不会显示 ...

多谢了,回复好快。滚屏方面倒是还没学到,稍后试一下。

前面我自己琢磨这个问题,在阿里巴巴那个网页上,所有商品列表中带图片网址的节点都有两个,有些是@src(也是我进行映射的)和@data-jssrc,有些是@data-src和@data-jssrc(表示不明白src和data-src是否是同一个东西),而且在工作台上的HTML元素属性中的排列顺序也不一样。我就一直在想是不是这些轻微的变化导致结果不同,然后我就试着给IMG区块加了个定位标志,结果问题不知怎么就解决了,所以现在图片都可以采集了。稍后我试一试滚屏参数。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-25 06:36