Fuller 管理员 发表于 2020-7-12 15:57:30 | 显示全部楼层
18196595805 发表于 2020-7-12 11:23
请问怎么采集到发布微博的城市名称呢

只能采集看得到的内容,微博发布的城市通常看不到。也许可以推测。微博关键词采集的细分条件中有城市的选项,我估计是新浪微博是知道每条微博在哪里发的,所以有这个选项。
QQ20200712-155602.png
举报 使用道具
YOKA0301 初级会员 发表于 2020-7-26 19:10:10 | 显示全部楼层
您好,我想询问一下,是否能通过“深圳南山旅游”这样的关键词一次性爬取微博的全部评论。
举报 使用道具
YOKA0301 初级会员 发表于 2020-7-26 19:10:10 | 显示全部楼层
您好,我想询问一下,是否能通过“深圳南山旅游”这样的关键词一次性爬取微博的全部评论。
举报 使用道具
YOKA0301 初级会员 发表于 2020-7-26 19:10:10 | 显示全部楼层
您好,我想询问一下,是否能通过“深圳南山旅游”这样的关键词一次性爬取微博的全部评论。
举报 使用道具
Fuller 管理员 发表于 2020-7-26 20:38:07 | 显示全部楼层
YOKA0301 发表于 2020-7-26 19:10
您好,我想询问一下,是否能通过“深圳南山旅游”这样的关键词一次性爬取微博的全部评论。 ...

要两步,第一步,先用微博关键词搜索结果工具,把每条博文独立链接爬出来

第二步,把博文独立链接批量复制添加到博文转发/评论工具,采集每条博文下的评论
举报 使用道具
YOKA0301 初级会员 发表于 2020-7-27 00:15:50 | 显示全部楼层
您好,我想询问一下,我刚才通过微博关键词搜索“深圳湾体育馆”,时间为2017-7-1至2020-7-1。结果只输出了2017-7-1日的1000多条数据,请问这种情况能解决吗?还充值了小10元hh,谢谢
举报 使用道具
Fuller 管理员 发表于 2020-7-27 07:50:01 | 显示全部楼层
YOKA0301 发表于 2020-7-27 00:15
您好,我想询问一下,我刚才通过微博关键词搜索“深圳湾体育馆”,时间为2017-7-1至2020-7-1。结果只输出了 ...

微博翻页数量有限制,最多翻页50页,所以,要设置搜索细分条件,如果是很热的关键词,最细可以到1小时,到底要设置多细,要观察一下,不要超过50页

xifen20200727-074928.png
举报 使用道具
wangyong 版主 发表于 2020-7-27 09:12:19 | 显示全部楼层
YOKA0301 发表于 2020-7-27 00:15
您好,我想询问一下,我刚才通过微博关键词搜索“深圳湾体育馆”,时间为2017-7-1至2020-7-1。结果只输出了 ...

设置细分条件后,还要保证在集搜客软件中登录了微博账号,要不然再没有登录的情况下只能采集第一页
举报 使用道具
YOKA0301 初级会员 发表于 2020-7-27 10:28:37 | 显示全部楼层
wangyong 发表于 2020-7-27 09:12
设置细分条件后,还要保证在集搜客软件中登录了微博账号,要不然再没有登录的情况下只能采集第一页
...

好的,谢谢

举报 使用道具
YOKA0301 初级会员 发表于 2020-7-27 10:29:56 | 显示全部楼层
您好!我想问一下为什么大众点评的评论内容会缺漏或者乱码,有解决途径吗
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 19:37