601#
Fuller 管理员 发表于 2018-1-25 09:07:33 | 只看该作者
chinafree 发表于 2018-1-25 01:54
第五页之后的数据怎么采?

粉丝第五页之后的采集不到
举报
602#
数据集 高级会员 发表于 2018-1-25 09:08:25 | 只看该作者
本帖最后由 数据集 于 2018-1-25 09:11 编辑
chinafree 发表于 2018-1-25 01:54
第五页之后的数据怎么采?

把第五页的网址添加到微博工具箱启动采集,就会从第五页开始采集。如果微博上只显示前5页,那就只能采集前五页。
举报
603#
AMBERRR 初级会员 发表于 2018-2-2 10:51:12 | 只看该作者
微博阅读可以爬取吗?
举报
604#
Fuller 管理员 发表于 2018-2-2 11:34:41 | 只看该作者
AMBERRR 发表于 2018-2-2 10:51
微博阅读可以爬取吗?

是否能够采集,只需用GS浏览器验证一下:
1,加载目标网页
2,点击工具条上的“定义规则”,进入定义规则模式
3,点击网页上的内容,看看DOM是否能定位到,看看DOM节点内容能否显示出来
能显示出来,就能采集

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报
605#
思秋忆 中级会员 发表于 2018-2-5 11:35:41 | 只看该作者
举报
606#
javyru 新手上路 发表于 2018-2-7 00:41:48 | 只看该作者
为什么每次只有20条数据啊?
举报
607#
Fuller 管理员 发表于 2018-2-7 08:10:01 | 只看该作者
javyru 发表于 2018-2-7 00:41
为什么每次只有20条数据啊?

似乎是没有登录微博,先在GS浏览器中登录微博
举报
608#
louiselana 初级会员 发表于 2018-2-28 16:41:20 | 只看该作者
关键词搜索功能很实用,但总是抓取到一半(大约30页)就崩溃了。可以完善以下吗?
举报
609#
数据集 高级会员 发表于 2018-2-28 17:41:26 | 只看该作者
louiselana 发表于 2018-2-28 16:41
关键词搜索功能很实用,但总是抓取到一半(大约30页)就崩溃了。可以完善以下吗? ...

崩溃了有什么提示?是未响应吗?
举报
610#
15509501850 新手上路 发表于 2018-3-1 21:29:50 | 只看该作者
怎么停止
举报
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 360或火绒等杀毒软件导致GooSeeker爬虫软件
  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 0%

热门用户

GMT+8, 2025-5-25 14:03