集搜客GooSeeker网络爬虫

标题: 打数机的浏览器窗口,须要重新登录,因此抓不到数据怎么办? [打印本页]

作者: kosho    时间: 2019-3-6 22:21
标题: 打数机的浏览器窗口,须要重新登录,因此抓不到数据怎么办?
目标网站是一个须要登录的网站,首页登录之后,是查询条件页面(只有查询条件下拉框,并无查询结果数据),输入查询条件点击搜索后才显示查询结果的列表页面,想抓取的是该列表页面的数据。在谋数台界面,定义好规则、翻页的爬虫路线也做好,也测试过了,可以抓取到当前页面列表的数据。
保存规则之后,点击爬数据,跳出打数机页面。
浏览器窗口却从查询条件页面开始显示,须要重新输入查询条件,点击搜索才能显示搜索结果列表页面。等显示列表页面后,此时打数机日志已显示如图:抓取规则不适合,没有发现iframe/frame。

以上是操作过程,请高手指导下,如何抓取此类查询结果数据!拜谢!!
[attach]10640[/attach]


作者: Fuller    时间: 2019-3-6 22:54
要做两级规则,在目前这级之前再定义一个规则,主要做连续动作,有两个动作:
1,输入搜索条件
2,点击搜索按钮
连续动作的目标主题指向你现在已经定义的规则。

可以参看这个教程《自动搜索关键词采集信息

作者: kosho    时间: 2019-3-7 12:56
跪谢!我去试试
作者: kosho    时间: 2019-3-18 14:42
本帖最后由 kosho 于 2019-3-21 09:52 编辑
Fuller 发表于 2019-3-6 22:54
要做两级规则,在目前这级之前再定义一个规则,主要做连续动作,有两个动作:
1,输入搜索条件
2,点击搜索 ...



作者: Fuller    时间: 2019-3-18 15:06
加集搜客的技术交流群:676198154, 找管理员
作者: kosho    时间: 2019-3-21 09:53
Fuller 发表于 2019-3-18 15:06
加集搜客的技术交流群:676198154, 找管理员

已加,谢谢大神





欢迎光临 集搜客GooSeeker网络爬虫 (https://www.gooseeker.com/doc/) Powered by Discuz! X3.2