本帖最后由 ITSophia 于 2017-2-24 15:29 编辑


用来作为第一个样例


样例复制时作为第二个

可是网上还有好多图片,怎么把其他的图片都爬下来呢?样例复制只有第一个和第二个

测试的结果也只有两个


试过了修改 定位 把所有定位的选择都试了  也没有效果



举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 2017-2-24 15:46

沙发
ITSophia 新手上路 发表于 2017-2-24 15:32:56 | 只看该作者
解决了~~~
举报 使用道具
板凳
ITSophia 新手上路 发表于 2017-2-24 15:33:08 | 只看该作者
好像真的是定位  测试现在对了
举报 使用道具
地板
ym 版主 发表于 2017-2-24 15:37:50 | 只看该作者
加载你的主题名,点击测试是可以抓到整一页上的商品图片,采集数据也能够下载到整页的商品图片。

你用的是什么版本的爬虫?

举报 使用道具
5#
Fuller 管理员 发表于 2017-2-24 15:46:33 | 只看该作者
最前面两个商品,他们可能是网站推荐的“新品”,网页节点可能class值不一样,要避免使用特殊的class值,因为MS谋数台生成采集规则的时候有自己的选择偏好,如果自动选的不对,就手工设定定位偏好,就能避开不合适的定位标志
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-17 17:41