Fuller 管理员 发表于 2020-11-17 18:06:19 | 显示全部楼层
Hioooo 发表于 2020-11-17 18:02
请问微博关键词爬出来的数据有很多都是没有展开全文,这个有办法解决吗? ...

要用另一个爬虫工具配合:
1,在导出的结果文件中用筛选的方法,把含有“展开全文"字样的微博网址筛选出来
2,添加到 微博博文展开全部采集 这个快捷采集工具中
举报 使用道具
wannuo 新手上路 发表于 2020-11-18 00:22:23 | 显示全部楼层
您好,请问采集微博评论在结束后导出后数量是不对的,但是都显示采集完成,这个如何解决?是否会因为一次添加网址过多需要一个个进行采集?
举报 使用道具
wannuo 新手上路 发表于 2020-11-18 01:11:48 | 显示全部楼层
采集日志显示有一些重复内容没有采集,这些内容怎样可以正常采集呢
举报 使用道具
Fuller 管理员 发表于 2020-11-18 08:00:33 | 显示全部楼层
wannuo 发表于 2020-11-18 01:11
采集日志显示有一些重复内容没有采集,这些内容怎样可以正常采集呢

如果一条微博评论很多,比如,上万条,很可能会中断。如果这条微博是新近发的,评论采集成功率很高,我采集过2万条。如果微博是以前的,而且是很热门的话题,评论会有被删的情况,在删评论的位置很容易中断。
举报 使用道具
微博浪人 新手上路 发表于 2020-11-24 10:53:17 | 显示全部楼层
采集完毕后,不小心点了清空采集任务,导致刚采集的数据没了,求问可以恢复,急!!
举报 使用道具
gz51837844 管理员 发表于 2020-11-24 11:10:04 | 显示全部楼层
微博浪人 发表于 2020-11-24 10:53
采集完毕后,不小心点了清空采集任务,导致刚采集的数据没了,求问可以恢复,急!! ...

你的用户名就是这个“微博浪人”? 你是清空了哪个微博工具的任务?
一般来说,删除任务后, 系统会把任务对应的数据打上已删除的标记,在后面系统空闲的时候在删除。在这之前,是可以恢复的

举报 使用道具
微博浪人 新手上路 发表于 2020-11-24 14:24:27 | 显示全部楼层
gz51837844 发表于 2020-11-24 11:10
你的用户名就是这个“微博浪人”? 你是清空了哪个微博工具的任务?
一般来说,删除任务后, 系统会把任 ...

是这个微博采集工具箱—微博关键词搜索结果采集工具,请问在哪可以找到标记的数据?
举报 使用道具
gz51837844 管理员 发表于 2020-11-24 15:10:19 | 显示全部楼层
微博浪人 发表于 2020-11-24 14:24
是这个微博采集工具箱—微博关键词搜索结果采集工具,请问在哪可以找到标记的数据?
...

我让技术人员后台处理一下, 看看你删除的任务, 数据部分是不是还没有被系统永久删除

举报 使用道具
微博浪人 新手上路 发表于 2020-11-24 15:12:14 | 显示全部楼层
gz51837844 发表于 2020-11-24 15:10
我让技术人员后台处理一下, 看看你删除的任务, 数据部分是不是还没有被系统永久删除

...

好的,谢谢了
举报 使用道具
gz51837844 管理员 发表于 2020-11-24 15:25:47 | 显示全部楼层

已经恢复了, 你可以登录微博关键词搜索工具, 去打包和下载数据

举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-28 20:57