1187909379 新手上路 发表于 2019-2-20 20:26:54 | 显示全部楼层
爬取微博评论时需要的url地址的格式是什么样的?现在只会获取这种格式https://weibo.com/5233485928/FBzhzw8mF,但是爬虫时貌似不能用
举报 使用道具
Fuller 管理员 发表于 2019-2-21 08:35:42 | 显示全部楼层
1187909379 发表于 2019-2-20 20:26
爬取微博评论时需要的url地址的格式是什么样的?现在只会获取这种格式https://weibo.com/5233485928/FBzhzw ...

这个网址对应着微博详情,是对的。我测试一下这个网址
举报 使用道具
Fuller 管理员 发表于 2019-2-21 10:10:03 | 显示全部楼层
我测试了,能采集的,DS打数机窗口运行的时候要放大到最大,否则,显示区域不够,评论显示不出来。

窗口上面可以覆盖其他窗口,不影响你的工作,但是不要把DS打数机窗口最小化
举报 使用道具
jingtq_seu 新手上路 发表于 2019-2-23 12:02:10 | 显示全部楼层
您好,请问在抓微博评论时,对于一个评论的回复多时,会折叠,按“更多评论”按钮会展开,请问怎样抓到被折叠的评论?
举报 使用道具
maomao 论坛元老 发表于 2019-2-23 12:15:21 | 显示全部楼层
jingtq_seu 发表于 2019-2-23 12:02
您好,请问在抓微博评论时,对于一个评论的回复多时,会折叠,按“更多评论”按钮会展开,请问怎样抓到被折 ...

用微博评论工具。https://www.gooseeker.com/res/softdetail_6.html
举报 使用道具
victor796 新手上路 发表于 2019-3-3 20:08:47 | 显示全部楼层
先问问主页采集数据在哪里设置页数,没看见呀
举报 使用道具
Fuller 管理员 发表于 2019-3-3 20:22:16 | 显示全部楼层
victor796 发表于 2019-3-3 20:08
先问问主页采集数据在哪里设置页数,没看见呀

可以设置时间段,https://www.gooseeker.com/doc/thread-7005-1-1.html
举报 使用道具
butta1213 新手上路 发表于 2019-3-4 14:27:10 | 显示全部楼层
请问怎么进行自定义时间段,采取某一个或某几个微博账号的贴文数据?
举报 使用道具
Fuller 管理员 发表于 2019-3-4 14:54:07 | 显示全部楼层
butta1213 发表于 2019-3-4 14:27
请问怎么进行自定义时间段,采取某一个或某几个微博账号的贴文数据?

关键词搜索这个采集工具的界面上有设置时间段的功能,如下图
时间20190304145337.png
举报 使用道具
Fuller 管理员 发表于 2019-3-4 16:14:53 | 显示全部楼层
butta1213 发表于 2019-3-4 14:27
请问怎么进行自定义时间段,采取某一个或某几个微博账号的贴文数据?

博主主页内容,要自定义时间段,看这篇帖子https://www.gooseeker.com/doc/thread-11055-1-1.html
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 16:22