在实际采集中,获取下图中商品数据的同时,我想同时给这些商品添加一个统一的类目名,但是因为类目名和商品信息,并不在同一层级中
没办法批量抓取,所以导致无法同时将两个信息同时采集下来,感觉应该是个挺简单的事,但是莫名其妙入坑了,没想明白该如何操作,请大侠指点一下。




我最后设想的结果是,采集的数据中,每个商品信息里,都包含一个当前类目名。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
| 回复

共 8 个关于本帖的回复 最后回复于 2017-9-30 09:41

沙发
shengchengx 金牌会员 发表于 2017-9-29 15:24:44 | 只看该作者
本帖最后由 shengchengx 于 2017-9-29 15:59 编辑

从图片上看,类目名和商品信息在同一页面上,给”类目名”做内容映射,类目名和商品信息放在一个整理中,转成excel之后,每个商品信息里就都包含一个当前类目名。
举报 使用道具
板凳
ybaby521 新手上路 发表于 2017-9-29 16:10:03 | 只看该作者
shengchengx 发表于 2017-9-29 15:24
从图片上看,类目名和商品信息在同一页面上,给”类目名”做内容映射,类目名和商品信息放在一个整理中,转 ...



按照你的方法做内容映射,测试的时候无法读取到数据。把catagory删掉,就又可以了。所以不知道你说的那种方法,具体怎么操作

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
地板
shengchengx 金牌会员 发表于 2017-9-29 16:27:53 | 只看该作者
本帖最后由 shengchengx 于 2017-9-29 17:50 编辑

1,把catagory单独出来做内容映射,
2,样例复制不要包含catagory,在top100下面添加一个容器去包含title+star+review+image,给这个抓取内容做样例复制就可以了。
3,这样top100下面就是 catagory和 新建的抓取容器。
举报 使用道具
5#
ybaby521 新手上路 发表于 2017-9-29 17:54:37 | 只看该作者
shengchengx 发表于 2017-9-29 16:27
1,把catagory单独出来做内容映射,
2,样例复制不要包含catagory,在top100下面添加一个容器去包含title+s ...

理解你的意思了。已经实现,感谢
举报 使用道具
6#
ybaby521 新手上路 发表于 2017-9-29 17:55:12 | 只看该作者
shengchengx 发表于 2017-9-29 16:27
1,把catagory单独出来做内容映射,
2,样例复制不要包含catagory,在top100下面添加一个容器去包含title+s ...

理解你的意思了。已经实现,感谢
举报 使用道具
7#
ybaby521 新手上路 发表于 2017-9-29 19:34:50 | 只看该作者
本帖最后由 ybaby521 于 2017-9-29 19:36 编辑
ybaby521 发表于 2017-9-29 17:55
理解你的意思了。已经实现,感谢

实际操作中,遇到了重复采集,但是第二次采集为空的情况,请帮忙指点一下



然后把catagory 和  product  调换一下位置,测试以后发现只有一个结果,不会批量采集了


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
8#
Fuller 管理员 发表于 2017-9-29 20:52:40 | 只看该作者
ybaby521 发表于 2017-9-29 19:34
实际操作中,遇到了重复采集,但是第二次采集为空的情况,请帮忙指点一下

批量采集有两种方式,看你的截图一种都没使用,还是批量采集到了,因为爬虫会自动找批量的规律。为了确保总是能采集到,应该用这两种方式之一:
1,用样例复制批量采集整个列表
2,用定位标志批量采集整个列表
另外,你有采集到空的,看一下是不是网页上有个商品采集漏了,那是规则做的不适应。应该用上定位标志映射提高采集精度
举报 使用道具
9#
ybaby521 新手上路 发表于 2017-9-30 09:41:42 | 只看该作者
Fuller 发表于 2017-9-29 20:52
批量采集有两种方式,看你的截图一种都没使用,还是批量采集到了,因为爬虫会自动找批量的规律。为了确保 ...

已解决,非常感谢
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 360或火绒等杀毒软件导致GooSeeker爬虫软件
  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反

热门用户

GMT+8, 2025-5-10 20:32