11#
Fuller 管理员 发表于 2020-7-6 15:30:38 | 只看该作者
MIYAlovemenoy 发表于 2020-7-6 15:08
网址信息:https://s.taobao.com/search?q=%E7%BE%8E%E7%BC%9D%E5%89%82&imgfile=&commend=all&ssid=s5-e&s ...

用这个快捷采集工具的时候,要添加具体某个商品的网址,才能采集这个商品的评论。

你加的网址是搜索结果网址,不能加到这里来。如果你想采集所有搜索结果的评论,你先用搜索工具,导出数据以后,把商品网址拷出来,再放在这个工具中。

天猫搜索采集工具:https://www.gooseeker.com/res/datadiy.html?category=%E7%94%B5%E5%95%86&web=%E5%A4%A9%E7%8C%AB&rule=%E5%A4%A9%E7%8C%AB%E5%95%86%E5%93%81%E6%90%9C%E7%B4%A2%E5%88%97%E8%A1%A8%E9%87%87%E9%9B%86

淘宝搜索采集工具:https://www.gooseeker.com/res/datadiy.html?category=%E7%94%B5%E5%95%86&web=%E6%B7%98%E5%AE%9D&rule=%E6%B7%98%E5%AE%9D%E5%95%86%E5%93%81%E6%90%9C%E7%B4%A2%E5%88%97%E8%A1%A8

举报 使用道具
12#
MIYAlovemenoy 初级会员 发表于 2020-7-6 17:29:14 | 只看该作者
我这边一直抓取失败,抓取超时,时间设置太短,需要如何修改呢?
举报 使用道具
13#
Fuller 管理员 发表于 2020-7-6 17:56:58 | 只看该作者
MIYAlovemenoy 发表于 2020-7-6 17:29
我这边一直抓取失败,抓取超时,时间设置太短,需要如何修改呢?

你把哪个网址放在了哪个工具中采集?
举报 使用道具
14#
MIYAlovemenoy 初级会员 发表于 2020-7-7 09:48:40 | 只看该作者
GOOSEEKER浏览器
举报 使用道具
15#
MIYAlovemenoy 初级会员 发表于 2020-7-7 09:48:54 | 只看该作者
GOOSEEKER浏览器
举报 使用道具
16#
MIYAlovemenoy 初级会员 发表于 2020-7-7 09:49:16 | 只看该作者
GS浏览器
举报 使用道具
17#
Fuller 管理员 发表于 2020-7-7 10:26:02 | 只看该作者

你用的快捷采集工具是哪个?是淘宝搜索那个吗?不能是本帖指向的这个,因为你要采集的网页是淘宝搜索结果
举报 使用道具
18#
zlf1115 新手上路 发表于 2021-1-20 19:46:58 | 只看该作者
为什么天猫不能翻页啊,我只能收集60条数据
举报 使用道具
19#
Fuller 管理员 发表于 2021-1-20 20:45:00 | 只看该作者
zlf1115 发表于 2021-1-20 19:46
为什么天猫不能翻页啊,我只能收集60条数据

在采集天猫之前,要在爬虫浏览器中加载天猫网页并登录。另外采集的时候,要注意看着验证码,一出现验证码就要赶快手工滑滑块
举报 使用道具
20#
zzxkkxx 新手上路 发表于 2024-3-25 14:57:40 | 只看该作者
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-19 23:13