今日头条_推荐新闻_抓瀑布流

791 250 1 所需积分:0 更新时间:2015-11-06 18:27 类别: 免费资源

规则介绍

瀑布流网页,要么很长,要么根本就没有尽头,那么需要连续滚屏的同时进行抓取。这是从GooSeeker V5.4.0版本支持的功能 (如果该规则与描述不符或无效,您可 申诉。)

样本页面

采集内容

信息字段 网页内容
新闻
标题
详情网址
评论数
来源
时间

数据截图

用户评论

  1. Fuller 2015-11-07 11:43

    参看教程: http://www.gooseeker.com/doc/article-160-1.html

关于作者

作者其他资源更多 >

网易跟帖3_gooseeker
这是一个实例,抓取网易新闻跟帖,网易新闻跟帖有如下特点:1,网页上有很多class和id,可以用来做定位标志映射,以提高抓取规则的适应度2,抓取多个样例的时候,可以不只使用样例复制映射,用定位标志映射,给最顶层的list抓取内容做定位标志映射,要选择class作为定位标志,不要用id,因为id是唯一的3,这个网页上有很多js代码,一直运行,可以设置定时器触发,提高抓取速度
儿童配饰_苏宁红孩子商品列表
这是一个示例规则,用于展示图片下载功能。集搜客GooSeeker网络爬虫从V5.2.0版本开始,允许在抓取网页内容的同时下载图片
儿童配饰_苏宁红孩子商品详情图文
这是一个示例规则,用于展示图片下载功能。集搜客GooSeeker网络爬虫从V5.2.0版本开始,允许在抓取网页内容的同时下载图片。这个示例显示怎样下载一个网页片段中的所有图片
应用版本:V8.9 | 更新时间:2021年2月2日 | 隐私策略 | 应用权限 | 版权所有 © 2007-2021 GooSeeker 深圳市天据信息技术有限公司
粤ICP备08108565号-1 粤公网安备44030502004363号