-
卫报_二级
卫报_二级
132 17 0 -
卫报_一级
卫报_一级
62 5 0 -
网易新闻源码采集
该规则主要是采集网易新闻页面上的某模块节点的html源码信息,运行规则的方法见http://www.gooseeker.com/doc/article-85-1.html
281 1 3 -
百度新闻_输入关键词查询搜索结果
根据输入的关键词进行结果收集
150 37 1 -
百度新闻_输入关键词查询
可根据关键词自动搜索相关新闻
98 15 0 -
sina1111
新浪高级搜索关键字,获取页面内用户,用户微博等信息
39 5 0 -
百度新闻_关键词抓取
采集通过关键词搜索后的百度新闻列表,共采集标题 链接 网站 等数据,支持采集翻页后的数据。
1319 13 6 -
智联卓聘_卓聘视角
下载智联卓聘_卓聘视角首页新闻
125 7 0 -
百度网页关键词搜索结果采集
采集百度网页关键词搜索结果,去百度输入关键词得到搜索结果后,把网址导入到规则里,运行DS打数机点击单搜/集搜按钮后,输入要采集的网址数量,DS打数机就会依次采集各个网址的搜索数据。 下载规则后如何采集数据请参考教程http://www.gooseeker.com/doc/article-85-1.html 如何管理规则的网址请参考教程http://www.gooseeker.com/doc/forum.php?mod=viewthread&tid=667&page=1&extra=#pid1316 如何运行DS打数机请参考教程http://www.gooseeker.com/doc/article-122-1.html
1616 56 22 -
百度新闻关键词搜索结果采集
采集百度网页关键词搜索结果,去百度输入关键词得到搜索结果后,把网址导入到规则里,运行DS打数机点击单搜/集搜按钮后,输入要采集的网址数量,DS打数机就会依次采集各个网址的搜索数据。 下载规则后如何采集数据请参考教程http://www.gooseeker.com/doc/article-85-1.html 如何导入网址请参考教程http://www.gooseeker.com/doc/forum.php?mod=viewthread&tid=667&page=1&extra=#pid1316 如何运行DS打数机请参考教程http://www.gooseeker.com/doc/article-122-1.html
255 18 0 -
用关键词搜索微信公众号_搜索结果
这是一组规则中的第二个,通常不要单独运行这个,而是从第一个规则“用关键词搜索微信公众号”开始运行,会自动过渡到这一个。这一组规则演示怎样自动输入多个查询条件,用搜狗搜索去获取所有公众号。第一个规则实现自动输入查询条件,这个规则实现翻页抓取搜索结果。具体使用方法参看教程板块中的连续动作相关教程
339 14 0 -
用关键词搜索微信公众号
如果要搜索多个关键词,那么就用集搜客V5.4.0以后的版本,定义连续动作,连续输入关键词并点击搜索按钮。这个抓取规则就是为此目的所制作。必须同时下载“用关键词搜索微信公众号_搜索结果”这个抓取规则,两个配合使用,后者能够翻页抓取每个分页。本抓取规则是第一个,也是运行的入口,不能从第二个规则开始。具体参照教程中的连续动作相关章节
625 17 0 -
中文业界资讯网_新闻获取
中文业界资讯网:http://www.cnbeta.com/ 获取文章
161 30 0 -
牛博网博客抓取
抓取牛博网的精彩文章
73 8 0 -
网易跟帖3_gooseeker
这是一个实例,抓取网易新闻跟帖,网易新闻跟帖有如下特点:1,网页上有很多class和id,可以用来做定位标志映射,以提高抓取规则的适应度2,抓取多个样例的时候,可以不只使用样例复制映射,用定位标志映射,给最顶层的list抓取内容做定位标志映射,要选择class作为定位标志,不要用id,因为id是唯一的3,这个网页上有很多js代码,一直运行,可以设置定时器触发,提高抓取速度
167 31 10 -
baidu_web_search_y
采集百度关键字搜索列表
241 15 10