11#
sunshine_h2so4 初级会员 发表于 2017-3-19 11:27:56 | 只看该作者
Fuller 发表于 2017-3-19 10:33
需要两个工具组合在一起:1,话题广场;2,评论和转发。第一个工具采集到数据以后,把每个微博的网址整理 ...

用关键词搜索结果+转发评论采集和用话题广场+转发评论采集,两者有什么不一样的地方吗
举报 使用道具
12#
Fuller 管理员 发表于 2017-3-19 11:55:08 | 只看该作者
sunshine_h2so4 发表于 2017-3-19 11:27
用关键词搜索结果+转发评论采集和用话题广场+转发评论采集,两者有什么不一样的地方吗
...

话题就是那种 ##页面,跟关键词搜索结果页面完全不同,不能用错了
举报 使用道具
13#
sunshine_h2so4 初级会员 发表于 2017-3-19 15:51:10 | 只看该作者
Fuller 发表于 2017-3-19 11:55
话题就是那种 ##页面,跟关键词搜索结果页面完全不同,不能用错了

如何我想要采集“大学花10亿打造豪华校区”这个话题的微博数据,如果打开话题广场,如图所示,只有2条微博,可是如果是关键词搜索就会出现很多的微博数据
我想要的效果是采集到有关这一事件的所有微博数据,然后分析这些微博数据随时间的一个变化趋势,分析其话题的传播周期

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
14#
Fuller 管理员 发表于 2017-3-19 16:17:30 | 只看该作者
sunshine_h2so4 发表于 2017-3-19 15:51
如何我想要采集“大学花10亿打造豪华校区”这个话题的微博数据,如果打开话题广场,如图所示,只有2条微 ...

用关键词搜索工具吧
举报 使用道具
15#
sunshine_h2so4 初级会员 发表于 2017-3-19 16:19:25 | 只看该作者
还有个问题,为什么我用“微博转发&评论信息”工具抓取数据时老是出错,数据也没有采集到
举报 使用道具
16#
Fuller 管理员 发表于 2017-3-19 16:58:32 | 只看该作者
sunshine_h2so4 发表于 2017-3-19 16:19
还有个问题,为什么我用“微博转发&评论信息”工具抓取数据时老是出错,数据也没有采集到 ...

微博转发尤其是微博评论特别难抓,万一网速变慢,就会网页加载失败,即使手工翻页看也会经常遇到这种情况。所以,如果一个微博有很多评论,几乎不可能完整抓下来。

1,一定要确保微博是登录状态
2,尽量使用高速的宽带网络

很多用户在下半夜运行,那时候网速很好
举报 使用道具
17#
sunshine_h2so4 初级会员 发表于 2017-3-20 10:44:39 | 只看该作者
嗯呢,原来是这个原因,I get!
thank you!
很感谢你耐心为我解答
举报 使用道具
18#
sunshine_h2so4 初级会员 发表于 2017-3-20 23:00:07 | 只看该作者
Fuller 发表于 2017-3-19 16:58
微博转发尤其是微博评论特别难抓,万一网速变慢,就会网页加载失败,即使手工翻页看也会经常遇到这种情况 ...

那个,请问一下,我是可以直接用那个转发&评论工具的吧,不用进行做规则和存规则这些步骤的吧?

举报 使用道具
19#
Fuller 管理员 发表于 2017-3-20 23:18:59 | 只看该作者
sunshine_h2so4 发表于 2017-3-20 23:00
那个,请问一下,我是可以直接用那个转发&评论工具的吧,不用进行做规则和存规则这些步骤的吧?

...

这个工具直接用就行,不用做规则
举报 使用道具
20#
sunshine_h2so4 初级会员 发表于 2017-3-21 09:59:14 | 只看该作者
Fuller 发表于 2017-3-20 23:18
这个工具直接用就行,不用做规则

还是采集不到数据,能不能请你试一下看,博文独立网址:
http://weibo.com/1235570754/EuGGr2FAh?refer_flag=1001030103_

举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 360或火绒等杀毒软件导致GooSeeker爬虫软件
  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反

热门用户

GMT+8, 2025-5-5 06:54