集搜客GooSeeker网络爬虫

标题: 爬虫软件爬取美国国际贸易委员会网站和下载pdf文件 [打印本页]

作者: 马涌河畔    时间: 2021-3-18 10:22
标题: 爬虫软件爬取美国国际贸易委员会网站和下载pdf文件
我想把美国国际贸易委员会网站(https://www.usitc.gov/commission_notices)的贸易方面的pdf格式的调查报告下载下来, 应该怎么做?
[attach]13959[/attach]


作者: 内容分析应用    时间: 2021-3-18 10:27
在抓取规则里, 用一个字段来获取pdf网址内容, 双击这个字段进入高级设置, 在高级设置里勾选下载:“文件”
这篇教程有讲怎样下载文件:用网络爬虫软件自动下载网页上的文件
另一篇教程是图片下载方面的:采集图片网址并下载图片(一)—— 单图下载
[attach]13960[/attach]






欢迎光临 集搜客GooSeeker网络爬虫 (https://www.gooseeker.com/doc/) Powered by Discuz! X3.2