241#
18765819353 初级会员 发表于 2016-10-18 10:16:25 | 只看该作者
点赞数都是0
举报 使用道具
242#
vainglare 新手上路 发表于 2016-10-23 15:33:35 | 只看该作者
请问采集中断了怎么再次开始?每次重新启动大叔级主题名称都是unassigned
举报 使用道具
243#
Fuller 管理员 发表于 2016-10-23 15:39:14 | 只看该作者
vainglare 发表于 2016-10-23 15:33
请问采集中断了怎么再次开始?每次重新启动大叔级主题名称都是unassigned

你可以重新添加网址,就会把线索激活,这个界面上没有重新激活功能
举报 使用道具
244#
vainglare 新手上路 发表于 2016-10-23 17:51:06 | 只看该作者
那请问重新添加网址的时候,评论页码没办法继续,还是从第一页开始,该怎么办……有200多页最多跑到150多页就中断了……
举报 使用道具
245#
Fuller 管理员 发表于 2016-10-23 18:00:06 | 只看该作者
vainglare 发表于 2016-10-23 17:51
那请问重新添加网址的时候,评论页码没办法继续,还是从第一页开始,该怎么办……有200多页最多跑到150多页 ...

评论和转发都无法从断的地方重新开始,因为这两类,他们没有独立url地址,只能重新从头翻页。这么多分页,要完整翻页到底确实有些难度,新浪微博不太稳定
举报 使用道具
246#
gz51837844 管理员 发表于 2016-10-26 16:30:03 | 只看该作者
之前少量用户碰到的微博话题采集失败的问题已经解决,原因是微博话题网页结构在部分用户登陆时和其它用户的不同,这个今天下午已经调整了采集规则
举报 使用道具
247#
470782938 新手上路 发表于 2016-11-1 19:04:16 | 只看该作者
在采集粉丝和关注者信息时,微博限制只能看5页,怎么让爬虫只爬5页进入下一个线索呢?
举报 使用道具
248#
Fuller 管理员 发表于 2016-11-1 19:27:14 | 只看该作者
470782938 发表于 2016-11-1 19:04
在采集粉丝和关注者信息时,微博限制只能看5页,怎么让爬虫只爬5页进入下一个线索呢? ...

如果用这套微博采集工具箱,调度参数已经设置好了,只采集5页。

如果要给自己的抓取规则设置调度参数,那就进入 会员中心-》规则管理,找到这个规则,设置调度参数中的“同一线索内翻页次数”
举报 使用道具
249#
liuyang9374 新手上路 发表于 2016-11-2 13:52:17 | 只看该作者
结果显示采集45条数据打包 但下载后文件夹名是 default 打开之后的文件里面也没有数据
举报 使用道具
250#
xandy 论坛元老 发表于 2016-11-2 14:11:32 | 只看该作者
liuyang9374 发表于 2016-11-2 13:52
结果显示采集45条数据打包 但下载后文件夹名是 default 打开之后的文件里面也没有数据 ...

技术人员查看下是什么原因
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 遇到“无法识别的应用”告警怎么办?
  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件

热门用户

GMT+8, 2024-6-17 08:37