-
微博兴趣搜索_测试悬浮信息
这个规则是两个主题中的第一个,按照搜索条件把相同兴趣的人搜出来,而且翻页抓取所有人。这个主题用于演示连续动作,即连续不断地移动鼠标,悬浮则每个人的头像上,把弹出的个人信息抓下来,抓的过程是由第二个主题完成的:微博兴趣搜索_测试悬浮信息_悬浮动作 。详细内容请查看教程板块的连续动作相关文章
637 145 8 -
微博兴趣搜索_测试悬浮信息_悬浮动作
这是连续动作抓取模式下的第二个主题,不要单独运行这个主题,而是运行第一个:微博兴趣搜索_测试悬浮信息 。运行第一个后,会在网页上连续做鼠标悬浮动作,就能连续使用本规则把个人信息抓取下来。这是用于演示连续动作抓取功能的,详细用法请查看教程板块的相关文章
472 139 4 -
链家房源列表
这个抓取规则需要一点小技巧,因为在网页上,发布时间、单价和总价所用的html标签和属性完全一样,如果要同时抓取这三个内容,大家都抓成发布时间。这是因为抓取规则自动定位网页上的位置的时候,自动使用了div[@class='div-cun']/text()这个表达式。要解决这个问题,要么自定义xpath。如果嫌麻烦,就用个小技巧,选择包含这三块内容的总DIV,在网页上的位置是div[@class='dealType'],使用他的@class作为定位标志,也就是选择这个div,做定位标志映射,都映射给这3个抓取内容,这样,GooSeeker爬虫会自动计算出他们所在的位置是在这个总div下的不同节点
257 9 9 -
专利检索_自动输入查询条件
这是一组抓取规则的第一个,与它配套的第二个抓取规则是“专利检索_搜索结果”,这个规则作为抓取的入口,能够自动输入检索关键词,利用了GooSeeker V5.4.0版本的连续动作功能,等自动提交以后,就能显示检索结果,由第二个抓取规则把检索结果抓下来。
126 8 0 -
专利检索_搜索结果
这是一组规则中的第二个,第一个规则的名字是“专利检索_自动输入查询条件”,第一个抓取规则自动输入检索条件,会自动过渡到这个规则,所以,本规则一般不直接运行。加载这个规则时请注意,因为样本页面一开始是没有检索结果的,等提示进行后续分析时,先输入检索条件,等看到检索结果再选择“后续分析”菜单。相关教程参看:http://www.gooseeker.com/doc/article-162-1.html
91 2 2 -
用关键词搜索微信公众号
如果要搜索多个关键词,那么就用集搜客V5.4.0以后的版本,定义连续动作,连续输入关键词并点击搜索按钮。这个抓取规则就是为此目的所制作。必须同时下载“用关键词搜索微信公众号_搜索结果”这个抓取规则,两个配合使用,后者能够翻页抓取每个分页。本抓取规则是第一个,也是运行的入口,不能从第二个规则开始。具体参照教程中的连续动作相关章节
529 15 0 -
用关键词搜索微信公众号_搜索结果
这是一组规则中的第二个,通常不要单独运行这个,而是从第一个规则“用关键词搜索微信公众号”开始运行,会自动过渡到这一个。这一组规则演示怎样自动输入多个查询条件,用搜狗搜索去获取所有公众号。第一个规则实现自动输入查询条件,这个规则实现翻页抓取搜索结果。具体使用方法参看教程板块中的连续动作相关教程
289 14 0 -
无讼网实为借贷案例
本规则抓取无讼案例网,根据关键字搜索出来的结果,用本抓取规则抓取结果。每个分页底部没有页码,但是有加载更多,DS打数机点击这个按钮,就能实现翻页抓取功能。请注意,运行这个规则要使用V5.4.2版本,对运行速度进行了优化,老版本会运行速度很慢,因为产生了大量日志,运行一段时间后要注意把日志文件metaseeker.log.txt和含有日期的老日志文件删除,否则占用大量硬盘空间
57 3 0
最近访问
总浏览量428次- simonylan 2018-04-26
- shengchengx 2018-04-21
- nixiaoqiang 2018-04-19
- xiaogaofeng 2018-04-18