举报 使用道具
| 回复

共 9 个关于本帖的回复 最后回复于 2020-11-16 17:45

沙发
Fuller 管理员 发表于 2020-11-14 22:41:48 | 只看该作者
目前可以用两个软件爬数据,一个是 集搜客数据管家,一个是集搜客网络爬虫,你用的是哪个?下面的截图是数据管家的,数据管家的特征是有一条左边栏。我用数据管家测试了,可以采集。你说的采集不全是缺了什么?





举报 使用道具
板凳
wangyong 版主 发表于 2020-11-15 08:29:28 | 只看该作者
Fuller 发表于 2020-11-14 22:41
目前可以用两个软件爬数据,一个是 集搜客数据管家,一个是集搜客网络爬虫,你用的是哪个?下面的截图是数 ...

是翻页区域和之前不同了,只能采集前五页,现在这个问题已经修改了了,可以自动翻页采集到后面所有的数据了
举报 使用道具
地板
bqq239 初级会员 发表于 2020-11-16 16:39:40 | 只看该作者
wangyong 发表于 2020-11-15 08:29
是翻页区域和之前不同了,只能采集前五页,现在这个问题已经修改了了,可以自动翻页采集到后面所有的数据 ...

现在采集的数据中为何没有了“用户上传图片数”这个数据字段?
举报 使用道具
5#
小蜜蜂测试161 高级会员 发表于 2020-11-16 16:43:07 | 只看该作者
bqq239 发表于 2020-11-16 16:39
现在采集的数据中为何没有了“用户上传图片数”这个数据字段?

因为新版网页不显示了
举报 使用道具
6#
bqq239 初级会员 发表于 2020-11-16 16:52:05 | 只看该作者
bqq239 发表于 2020-11-16 16:39
现在采集的数据中为何没有了“用户上传图片数”这个数据字段?

而且“用户等级”字段也没有了
举报 使用道具
7#
小蜜蜂测试161 高级会员 发表于 2020-11-16 16:58:20 | 只看该作者
bqq239 发表于 2020-11-16 16:52
而且“用户等级”字段也没有了

现在只能采到网页上有的,你可以看一下原始网页
举报 使用道具
8#
bqq239 初级会员 发表于 2020-11-16 17:02:01 | 只看该作者
小蜜蜂测试161 发表于 2020-11-16 16:58
现在只能采到网页上有的,你可以看一下原始网页

那是不是也应该更新一下示例数据,我以为还有这些字段才重新采集的,打包数据花了100积分……对于普通版的用户(学生)来说,积分还挺重要的……

举报 使用道具
9#
小蜜蜂测试161 高级会员 发表于 2020-11-16 17:28:34 | 只看该作者
示例数据更新了,这100积分我们可以退回到您的账户上
举报 使用道具
10#
小蜜蜂测试161 高级会员 发表于 2020-11-16 17:45:45 | 只看该作者
bqq239 发表于 2020-11-16 17:02
那是不是也应该更新一下示例数据,我以为还有这些字段才重新采集的,打包数据花了100积分……对于普通版 ...

100积分返还了
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-19 16:44