1 9953

<提问>微博数据抓取

journeylee 于 2017-12-24 16:01 发表 [复制链接]
我需要收集新浪微博中,某个关键词在某段时间内的所有博文(包括原创和转发的)
但是目前我只能收集到原创的博文,请问转发的博文要如何收集???
由于关键词所涉及的原创微博用户较多,除了用输入每条微博独立网址的方式收集转发的博文,还有没有别的方法,可以更加便捷地收集转发的博文??

谢谢!!!

举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2017-12-24 16:33

Fuller 管理员 发表于 2017-12-24 16:33:10 | 显示全部楼层
采集新浪微博可以用一套现成的工具,参看数据DIY的新浪微博工具:http://www.gooseeker.com/res/dat ... A%E5%BE%AE%E5%8D%9A

这套规则还可以串在一起使用,参看:http://www.gooseeker.com/doc/thread-5399-1-1.html

如果你自己做规则,如果只采集到原创,那是因为你输入的网址设置了只看原创。比如
  1. https://weibo.com/liyongtao1022?profile_ftype=1&is_ori=1#_0
  2. https://weibo.com/liyongtao1022?profile_ftype=1&is_all=1#_0
复制代码

这两条分别采集原创和所有,他们的区别在于参数is_ori和is_all

举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 怎样让GooSeeker分词工具使用宋体画词云图
  • 使用BERTopic时遇到的c-TF-IDF是什么?
  • gooseeker分词工具的命名实体识别和词形还
  • 怎样设置LDA模型的超参数alpha(α)和beta(
  • LDA主题分析模型到底是什么?

热门用户

GMT+8, 2026-5-13 05:54