1071#
上海垃圾分类 初级会员 发表于 2020-4-14 19:34:12 | 只看该作者
请问,可以爬取一个大话题中,微博的用户信息嘛?我用了某个话题的链接,然后打算爬取微博博主详细资料,可是在线索匹配那边是失败的,但是是有效链接。是不能用这样去爬取嘛?是一定要用微博博主主页链接才有效嘛?
举报 使用道具
1072#
Fuller 管理员 发表于 2020-4-14 23:11:50 | 只看该作者
上海垃圾分类 发表于 2020-4-14 19:34
请问,可以爬取一个大话题中,微博的用户信息嘛?我用了某个话题的链接,然后打算爬取微博博主详细资料,可 ...

这需要多个微博采集工具配合使用。比如,采集话题的时候,导出采集结果得到每个博主的网址,把博主网址添加到采集博主信息的工具。添加网址的操作要手工做
举报 使用道具
1073#
cristinayu7 新手上路 发表于 2020-4-16 23:08:12 | 只看该作者
您好请问如何采集单条微博下特定日期的评论呢感谢
举报 使用道具
1074#
Fuller 管理员 发表于 2020-4-17 09:37:25 | 只看该作者
cristinayu7 发表于 2020-4-16 23:08
您好请问如何采集单条微博下特定日期的评论呢感谢

评论采集无法设定日期。评论采集难度很大,如果评论数超过4000,能采全的可能性极低。每次采集只能从头开始,一直翻页采集,尽量多采,然后导出采集结果,根据发布时间把需要时间的评论找出来
举报 使用道具
1075#
472624201 新手上路 发表于 2020-4-18 02:16:01 | 只看该作者
您好,在采集微博评论的时候,每次采集几分钟就会中止(显示成功打包两三次),然后回到初始界面发现没有数据,这是什么问题?
举报 使用道具
1076#
WangYaTe_0824 新手上路 发表于 2020-4-18 03:26:41 | 只看该作者
可以上线阅读数吗?
举报 使用道具
1077#
Fuller 管理员 发表于 2020-4-18 08:03:27 | 只看该作者
WangYaTe_0824 发表于 2020-4-18 03:26
可以上线阅读数吗?

阅读数只有微博作者能看,要自己做采集规则
举报 使用道具
1078#
Fuller 管理员 发表于 2020-4-18 08:05:00 | 只看该作者
472624201 发表于 2020-4-18 02:16
您好,在采集微博评论的时候,每次采集几分钟就会中止(显示成功打包两三次),然后回到初始界面发现没有数 ...

采集评论网速要好,不然评论很容易加载不出来。另外,有些微博的评论很难显示出来,你可以先手动打开这个微博,翻页看一下评论,能看多少屏
举报 使用道具
1079#
PPPanHUB 新手上路 发表于 2020-4-18 15:59:48 | 只看该作者
我想请问下,我要爬取指定微博的转发信息,包括转发微博的层级信息和转发博主的个人信息,这个该怎么爬取?
我是要做传播可视化的。
目前爬取结果里面只有转发内容,连转发id也没有,没办法判断转发层级。而转发博主个人信息也没有,可视化上面也没办法加节点标签。
举报 使用道具
1080#
Fuller 管理员 发表于 2020-4-18 17:06:56 | 只看该作者
PPPanHUB 发表于 2020-4-18 15:59
我想请问下,我要爬取指定微博的转发信息,包括转发微博的层级信息和转发博主的个人信息,这个该怎么爬取?
...

转发爬到的数据里,有转发博主的ID和博主链接,想要爬博主的详细信息,把博主连接添加到博主详细资料工具
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-4 05:42