10 23238

求助

y3031805804 于 2019-8-9 22:20 发表 [复制链接]
我是一个爬虫技术小白,想爬取一首音乐后的赞数,按照网上的方法操作后,用excel打开,遇到了下面这种情况,为什么会出现这种问题,该怎么办呢?
PCU@WQ7%TNP[UJN7O1VV816.png
举报 使用道具
| 回复

共 10 个关于本帖的回复 最后回复于 2019-8-10 22:10

maomao 论坛元老 发表于 2019-8-9 22:47:59 | 显示全部楼层
你的规则名是什么?按这个教程在集搜客会员中心把XML转换成EXCEL  https://www.gooseeker.com/doc/article-329-1.html
举报 使用道具
Fuller 管理员 发表于 2019-8-10 09:29:34 | 显示全部楼层
打开excel遇到什么问题了?是不是看到有很多不是抓取内容?

前面那些字段是爬虫用来记录采集状态的,你自己定义的抓取内容在后面
举报 使用道具
y3031805804 新手上路 发表于 2019-8-10 15:52:50 | 显示全部楼层
maomao 发表于 2019-8-9 22:47
你的规则名是什么?按这个教程在集搜客会员中心把XML转换成EXCEL  https://www.gooseeker.com/doc/article- ...

它显示这样该怎么办?
`HVDY1_PBCV%4WCS8Q)P4@H.png
举报 使用道具
y3031805804 新手上路 发表于 2019-8-10 15:55:40 | 显示全部楼层
Fuller 发表于 2019-8-10 09:29
打开excel遇到什么问题了?是不是看到有很多不是抓取内容?

前面那些字段是爬虫用来记录采集状态的,你自 ...

像这样只抓取每条评论后的赞数的做法可行吗?我抓取完成后只能得到一个文件,里面的数据会不会紊乱呢?
举报 使用道具
Fuller 管理员 发表于 2019-8-10 16:15:46 | 显示全部楼层
y3031805804 发表于 2019-8-10 15:52
它显示这样该怎么办?

要找到那个任务,选中那个任务,然后再点击导入按钮。导入的时候,要检查导入的数据是否属于那个任务的,如果不属于,就会拒绝导入,看到你那个截图
举报 使用道具
Fuller 管理员 发表于 2019-8-10 16:16:47 | 显示全部楼层
y3031805804 发表于 2019-8-10 15:55
像这样只抓取每条评论后的赞数的做法可行吗?我抓取完成后只能得到一个文件,里面的数据会不会紊乱呢?
...

只要规则做的没有问题,导入导出没有问题。做完规则以后,点击“测试”按钮,看看得到的结果有没有乱。如果规则做的不合适,也可能会乱,要调整规则。


举报 使用道具
maomao 论坛元老 发表于 2019-8-10 16:18:04 | 显示全部楼层
本帖最后由 maomao 于 2019-8-10 16:19 编辑
y3031805804 发表于 2019-8-10 15:52
它显示这样该怎么办?

导入数据与规则对应1.jpg
举报 使用道具
y3031805804 新手上路 发表于 2019-8-10 21:36:53 | 显示全部楼层
Fuller 发表于 2019-8-10 16:16
只要规则做的没有问题,导入导出没有问题。做完规则以后,点击“测试”按钮,看看得到的结果有没有乱。如 ...

注意到任务名的问题仍然不行,应该是规则有问题,
举报 使用道具
y3031805804 新手上路 发表于 2019-8-10 21:39:20 | 显示全部楼层

注意到名称的问题后,导出的文件打开后还是不行,估计是规则有误
}SH`T]%~%0IK53)FX`I@(7V.png
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 02:56