集搜客GooSeeker网络爬虫
标题:
怎么实现点击下载?
[打印本页]
作者:
cibiaospider
时间:
2019-9-11 17:25
标题:
怎么实现点击下载?
本帖最后由 cibiaospider 于 2019-9-11 18:08 编辑
页面,有一个 <button> ,没有任何的 href 链接,通过点击这个按钮催发JS代码然后弹出下载窗口
我看了文档,所有的文档都是基于你一个 href 下载链接,然后才能下载,没有这种点击下载的文档
我看了文档,要建立一个 点击 动作,我也建了,但是 点击动作 需要一个目标任务,这个目标任务不知道该填写什么?
找不到这样的文档,求指导,谢谢
下面的图,我建立了一个点击动作, 目标任务 填写什么呢? 我填写过当前任务名,最终没有任何下载发生
[attach]11298[/attach]
这里,保存规则就会出错,强迫必须抓取一个数据,我只想下载文件,不需要抓取任何数据
我尝试加了抓取页面上一个数据, 然后运行,确实可以抓取到页面上的数据,但是我要的“点击下载”根本没有发生
[attach]11299[/attach]
================================================================
我测试了,现在回答上面的问题,然后再问新的问题
1. 点击 的目标任务 就填写自己,是的,很傻,就填写自己
然后这个页面会执行 2个词抓取,第一次是 触发点击, 第二次是下载 (因为你的目标任务写了自己)
2. 必须写一个抓取内容,不管你想不想抓,你都必须抓
3. 这种点击触发JS下载的,都会保存在 C:\xxxx\ 你自己的下载目录下面,不能选择 目录,是的,不能选择
现在新的问题, 下载的文件可以指定方式命名吗?
现在下载了100个文件,全部都是 词表.xls , 词表(1).xls ,词表(2).xls ....... ,这种我可以从抓取网页取标题来命名下载的文件吗?
作者:
ym
时间:
2019-9-11 17:42
目标主题随便填一个已有的主题名就可以,填当前主题名也可以
作者:
cibiaospider
时间:
2019-9-11 17:44
ym 发表于 2019-9-11 17:42
目标主题随便填一个已有的主题名就可以,填当前主题名也可以
我填了当前任务名, 结论是, 没有任何下载发生
作者:
zongqing
时间:
2019-9-11 18:03
把规则保存,然后把规则名发出来。我们测试一下
欢迎光临 集搜客GooSeeker网络爬虫 (https://www.gooseeker.com/doc/)
Powered by Discuz! X3.2