集搜客GooSeeker网络爬虫

标题: 怎么实现点击下载? [打印本页]

作者: cibiaospider    时间: 2019-9-11 17:25
标题: 怎么实现点击下载?
本帖最后由 cibiaospider 于 2019-9-11 18:08 编辑

页面,有一个 <button> ,没有任何的 href 链接,通过点击这个按钮催发JS代码然后弹出下载窗口

我看了文档,所有的文档都是基于你一个 href 下载链接,然后才能下载,没有这种点击下载的文档

我看了文档,要建立一个 点击 动作,我也建了,但是 点击动作 需要一个目标任务,这个目标任务不知道该填写什么?

找不到这样的文档,求指导,谢谢

下面的图,我建立了一个点击动作, 目标任务 填写什么呢?  我填写过当前任务名,最终没有任何下载发生

[attach]11298[/attach]

这里,保存规则就会出错,强迫必须抓取一个数据,我只想下载文件,不需要抓取任何数据

我尝试加了抓取页面上一个数据, 然后运行,确实可以抓取到页面上的数据,但是我要的“点击下载”根本没有发生


[attach]11299[/attach]

================================================================

我测试了,现在回答上面的问题,然后再问新的问题

1. 点击  的目标任务 就填写自己,是的,很傻,就填写自己
   然后这个页面会执行 2个词抓取,第一次是 触发点击, 第二次是下载 (因为你的目标任务写了自己)

2. 必须写一个抓取内容,不管你想不想抓,你都必须抓

3. 这种点击触发JS下载的,都会保存在  C:\xxxx\ 你自己的下载目录下面,不能选择 目录,是的,不能选择


现在新的问题, 下载的文件可以指定方式命名吗?

现在下载了100个文件,全部都是   词表.xls ,   词表(1).xls  ,词表(2).xls .......  ,这种我可以从抓取网页取标题来命名下载的文件吗?








作者: ym    时间: 2019-9-11 17:42
目标主题随便填一个已有的主题名就可以,填当前主题名也可以
作者: cibiaospider    时间: 2019-9-11 17:44
ym 发表于 2019-9-11 17:42
目标主题随便填一个已有的主题名就可以,填当前主题名也可以

我填了当前任务名, 结论是, 没有任何下载发生

作者: zongqing    时间: 2019-9-11 18:03
把规则保存,然后把规则名发出来。我们测试一下




欢迎光临 集搜客GooSeeker网络爬虫 (https://www.gooseeker.com/doc/) Powered by Discuz! X3.2