601#
Fuller 管理员 发表于 2018-1-25 09:07:33 | 只看该作者
chinafree 发表于 2018-1-25 01:54
第五页之后的数据怎么采?

粉丝第五页之后的采集不到
举报 使用道具
602#
数据集 高级会员 发表于 2018-1-25 09:08:25 | 只看该作者
本帖最后由 数据集 于 2018-1-25 09:11 编辑
chinafree 发表于 2018-1-25 01:54
第五页之后的数据怎么采?

把第五页的网址添加到微博工具箱启动采集,就会从第五页开始采集。如果微博上只显示前5页,那就只能采集前五页。
举报 使用道具
603#
AMBERRR 初级会员 发表于 2018-2-2 10:51:12 | 只看该作者
微博阅读可以爬取吗?
举报 使用道具
604#
Fuller 管理员 发表于 2018-2-2 11:34:41 | 只看该作者
AMBERRR 发表于 2018-2-2 10:51
微博阅读可以爬取吗?

是否能够采集,只需用GS浏览器验证一下:
1,加载目标网页
2,点击工具条上的“定义规则”,进入定义规则模式
3,点击网页上的内容,看看DOM是否能定位到,看看DOM节点内容能否显示出来
能显示出来,就能采集

举报 使用道具
605#
思秋忆 中级会员 发表于 2018-2-5 11:35:41 | 只看该作者
举报 使用道具
606#
javyru 新手上路 发表于 2018-2-7 00:41:48 | 只看该作者
为什么每次只有20条数据啊?
举报 使用道具
607#
Fuller 管理员 发表于 2018-2-7 08:10:01 | 只看该作者
javyru 发表于 2018-2-7 00:41
为什么每次只有20条数据啊?

似乎是没有登录微博,先在GS浏览器中登录微博
举报 使用道具
608#
louiselana 初级会员 发表于 2018-2-28 16:41:20 | 只看该作者
关键词搜索功能很实用,但总是抓取到一半(大约30页)就崩溃了。可以完善以下吗?
举报 使用道具
609#
数据集 高级会员 发表于 2018-2-28 17:41:26 | 只看该作者
louiselana 发表于 2018-2-28 16:41
关键词搜索功能很实用,但总是抓取到一半(大约30页)就崩溃了。可以完善以下吗? ...

崩溃了有什么提示?是未响应吗?
举报 使用道具
610#
15509501850 新手上路 发表于 2018-3-1 21:29:50 | 只看该作者
怎么停止
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-3 11:17