961#
Fuller 管理员 发表于 2019-11-24 23:43:37 | 只看该作者
养猩猩的猪 发表于 2019-11-24 22:58
为什么我选择展开全文的爬虫    就一直显示错误   不能继续爬了呢

我安排人检查一下这个爬虫规则
举报 使用道具
962#
wangyong 版主 发表于 2019-11-25 09:33:18 | 只看该作者
养猩猩的猪 发表于 2019-11-24 22:58
为什么我选择展开全文的爬虫    就一直显示错误   不能继续爬了呢

我们检查到微博展开全文的快捷采集没有问题

采集展开全文的数据是需要添加微博的独立网址:https://weibo.com/1737737970/Fz7dw8A8u?refer_flag=1001030103_&type=comment#_rnd1574645520243

先采集关键词搜索列表,然后从关键词搜索列表中筛选出要展开全文的微博,再进行采集
举报 使用道具
963#
maomao 论坛元老 发表于 2019-11-25 09:37:54 | 只看该作者
养猩猩的猪 发表于 2019-11-24 22:24
您好,我想问微博全文过长,如何设置在爬虫的时候自动展开全文呢?

爬关键词得到的excel数据表中,有一列是博文独立网址。把博文独立网址批量复制添加到博文展开工具



举报 使用道具
964#
养猩猩的猪 初级会员 发表于 2019-11-27 17:56:26 | 只看该作者
maomao 发表于 2019-11-25 09:37
爬关键词得到的excel数据表中,有一列是博文独立网址。把博文独立网址批量复制添加到博文展开工具。

谢谢
举报 使用道具
965#
leijiah 新手上路 发表于 2019-12-1 20:32:47 | 只看该作者
博主主页链接是那个复制的链接吗?为什么我粘贴后还不可以?
举报 使用道具
966#
Fuller 管理员 发表于 2019-12-1 21:37:15 | 只看该作者
leijiah 发表于 2019-12-1 20:32
博主主页链接是那个复制的链接吗?为什么我粘贴后还不可以?

看到这样的内容的时候,就是博主的主页


举报 使用道具
967#
1154706230 初级会员 发表于 2019-12-2 12:06:51 | 只看该作者
为什么我抓微博评论只能抓到一页啊?我想抓一条微博的所有评论怎么抓呀?
举报 使用道具
968#
Fuller 管理员 发表于 2019-12-2 14:46:35 | 只看该作者
1154706230 发表于 2019-12-2 12:06
为什么我抓微博评论只能抓到一页啊?我想抓一条微博的所有评论怎么抓呀?

首先采集微博之前,要先在集搜客浏览器登陆weibo。微博评论是瀑布流,实际能抓到多少条,很难说。但是网速比较好,计算机速度好,一般能采集更多一些。
举报 使用道具
969#
heeee111 新手上路 发表于 2019-12-6 12:38:02 | 只看该作者
关键词收集数据时时间短选项出现了问题,只能显示2019年。。没有选项的按钮了
举报 使用道具
970#
Fuller 管理员 发表于 2019-12-6 12:43:12 | 只看该作者
heeee111 发表于 2019-12-6 12:38
关键词收集数据时时间短选项出现了问题,只能显示2019年。。没有选项的按钮了 ...


上图中哪个位置的选项出问题了? 你用的浏览器是哪种?
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-20 18:26