要下载table中每一行的PDF文件,但是按钮不是PDF文件的URL,按钮是个JS方法去请求获得到的URL,这样的文件该如何爬下来呢?
举报 使用道具
| 回复

共 7 个关于本帖的回复 最后回复于 2019-9-10 18:34

沙发
czj19961023 实习版主 发表于 2019-9-4 09:38:06 | 只看该作者
你可以用点击动作下载,学习一下点击动作这个教程
举报 使用道具
板凳
jyy1082 初级会员 发表于 2019-9-4 10:21:01 | 只看该作者
czj19961023 发表于 2019-9-4 09:38
你可以用点击动作下载,学习一下点击动作这个教程

有没有专门点击下载文件的教程呢?谢谢!
举报 使用道具
地板
Fuller 管理员 发表于 2019-9-4 10:21:38 | 只看该作者
如果没有链接,就得用点击动作,一点击就触发了下载过程。如果有链接,那就好了,可以用这个方法:https://www.gooseeker.com/doc/article-472-1.html  。有链接的下载能控制文件的存储位置,而点击动作触发的下载都下载到了downloads目录中
举报 使用道具
5#
jyy1082 初级会员 发表于 2019-9-4 10:34:29 | 只看该作者
Fuller 发表于 2019-9-4 10:21
如果没有链接,就得用点击动作,一点击就触发了下载过程。如果有链接,那就好了,可以用这个方法:https:// ...

要点击按钮,按钮不是URL。按钮是JS方法里面带参数,点击后新开一个窗口显示pdf文档。
举报 使用道具
6#
Fuller 管理员 发表于 2019-9-4 11:06:55 | 只看该作者
jyy1082 发表于 2019-9-4 10:34
要点击按钮,按钮不是URL。按钮是JS方法里面带参数,点击后新开一个窗口显示pdf文档。 ...

什么网址?发出来我们试试
举报 使用道具
7#
Treeoo 新手上路 发表于 2019-9-10 13:47:45 | 只看该作者
借楼请问http://www.meanwell.com.cn/productSeries.aspx#
举报 使用道具
8#
Fuller 管理员 发表于 2019-9-10 18:34:21 | 只看该作者
Treeoo 发表于 2019-9-10 13:47
借楼请问http://www.meanwell.com.cn/productSeries.aspx#


每个链接都有独立网址,这种特别好下载。看这个教程《用网络爬虫自动下载网页上的文件
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-20 06:48