461#
叶久弥生 新手上路 发表于 2017-9-8 15:56:52 | 只看该作者
我想问一下,为什么我用微博主页采集,每次只采集几十条就终止了
举报 使用道具
462#
umsung 高级会员 发表于 2017-9-8 17:07:40 | 只看该作者
本帖最后由 wangyong 于 2017-9-8 18:05 编辑
叶久弥生 发表于 2017-9-8 15:56
我想问一下,为什么我用微博主页采集,每次只采集几十条就终止了

这是微博本身对翻页的限制,一次最多采集30页,可以翻页断掉之后,把停止的那一页网址复制下来,去微博工具添加网址线索,就可以从断掉的那一页继续抓取。
举报 使用道具
463#
青杉木子 新手上路 发表于 2017-9-10 20:59:55 | 只看该作者
请问:
我只想要采集微博的“按热门”分类的全部评论,基本2-3页就够了,用微博采集工具怎么做到呢?我用微博采集工具采集到的都全部评论。、

能否设置手动滚屏和翻页,这样就可以根据自己的需求来采集评论了。

谢谢!
举报 使用道具
464#
Fuller 管理员 发表于 2017-9-10 21:11:14 | 只看该作者
青杉木子 发表于 2017-9-10 20:59
请问:
我只想要采集微博的“按热门”分类的全部评论,基本2-3页就够了,用微博采集工具怎么做到呢?我用微 ...

微博采集工具是定死的,没有点击“按热度”,针对你这个需求,需要增加一个采集规则,专门点击“按热度”,要是你自己无法用MS谋数台定义采集规则的话,可以委托给集搜客官方定制服务
举报 使用道具
465#
collar 新手上路 发表于 2017-9-12 23:41:40 | 只看该作者
抓取转发量,一直显示待启动,操作步骤是对的,DS打数机的用户名也一直,不知道是什么原因,谢谢!
举报 使用道具
466#
bowieD 金牌会员 发表于 2017-9-13 09:07:59 | 只看该作者
collar 发表于 2017-9-12 23:41
抓取转发量,一直显示待启动,操作步骤是对的,DS打数机的用户名也一直,不知道是什么原因,谢谢! ...

对着这个教程仔细检查一遍 http://www.gooseeker.com/doc/thread-9736-1-1.html
举报 使用道具
467#
刚刚9115 新手上路 发表于 2017-9-18 17:41:41 | 只看该作者
已经下载了客户端为什么还提示下载啊?
举报 使用道具
468#
shengchengx 金牌会员 发表于 2017-9-18 17:43:14 | 只看该作者
刚刚9115 发表于 2017-9-18 17:41
已经下载了客户端为什么还提示下载啊?

使用gs浏览器打开,然后点击开始采集
举报 使用道具
469#
刚刚9115 新手上路 发表于 2017-9-18 17:46:53 | 只看该作者
你好,采集状态一直显示为“待启动?”是什么原因?后面有问号不能启动
举报 使用道具
470#
shengchengx 金牌会员 发表于 2017-9-18 18:09:19 | 只看该作者
刚刚9115 发表于 2017-9-18 17:46
你好,采集状态一直显示为“待启动?”是什么原因?后面有问号不能启动

爬虫群一直显示正在等待采集任务有哪几种原因?看下这个教程
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-7 21:14