目录
- 快捷采集
- 初级教程(新版)
- 初级教程(老版)
- 数据转Excel处理
- 爬虫规则管理
- 高级教程(新版)
- 高级教程(老版)
- 用爬虫群分布式高效采集
- 爬虫关键知识拓展
- 问题集锦
- 实战演练案例
- 爬虫安装说明
- 关于集搜客
集搜客交流群
2000人群:点击加入
附件链接有多个地址为什么下载附件只下载一个
多个附件地址的规则是科技政策汇项目详情 下载附件的规则是 科技政策汇详情列表附件
加载规则时只能加载【页面地址】
我刚才在工作台的【搜规则】里面打算加载目标规则,结果操作以后只把【页面地址】给加载进去,工作台中的【创建规则】和【爬虫路线
NetLogo多主体建模软件简介和官方下载地址
[b]NetLogo官网下载地址[/b] 桌面版:[url]http://ccl.northwestern.edu/netlogo
能否给个视频教程下载地址的汇总链接 准备下载了好好学习一下 网络看老卡
能否给个视频教程下载地址的汇总链接 准备下载了好好学习一下 网络看老卡
抓到不完整的网址能做下级地址吗
里面的超链接无法打开呢,比如 [align=center][attach]252[/attach] [/align]这种地址,爬取下来的链接地址在网页中打不开,有什么办法么?我想在下级线索中,用这个地址爬取下级地址的列表 答:不能直接打开是因为不是完整地址,但是如果作为下级线索,可以直接用,爬虫生成下级线索的时候会把网址补齐
GS浏览器地址栏无法下拉
GS浏览器输入地址栏处点击下拉没有反应,现在是没有得保存网址的功能吧,建议添加一个 书签 的功能。
采集图片网址并下载图片(二)——下载途牛多图
上篇教程讲了怎么下载途牛网上的一个大图,在此基础上,本篇教程讲怎么下载大图下面的整齐排列的小图。按前面单图下载的教程,设置采集第一个小图,然后对这些小图做样例复制,就可以把小图都采集下来。所以本篇教程 ...
采集网址中下载按钮,如何设置可以下载文件。
网址:[url=https://wenshu.court.gov.cn/website/wenshu/181107ANFZ0BXSK4wenshu.court.gov.cn/webs ... a308eb7ab66000bfea4[/url] 页面中有一个下载按钮,见图片,如何设置可以点击下载,下载文件下来并且存储。登陆后,直接输入网址就可以。
图片下载到本地会自动分类吗?
如果我在百度图片上,搜索刘德华还有张学友,下载下来以后会变成两个文件夹吗?如果都在一起怎么进行分类呢?
百度地图瓦片怎样下载和抓取
GooSeeker软件是否能抓百度地图,把地图瓦片图存下来
怎么捉取微博话题下面用户的地址
请问不需要二级页面情况下,怎么捉取微博话题下面用户的地址? [attach]2733[/attach]
xpath构造网址与附件下载问题
publish.stdno=&publish.name=&pageIndex=1[/url]由于需要下载附件,用@onclick_T 148-2000.pdf') 于是我根据onclick利用xpath构造网址 concat('http://publish.filepath=%20[/url] 两重网址最后下载出来的结果却都是生成tosetWatermark.action类型文件,没有下载到我需要的pdf附件 1.如何把无效的网址设置为空的同时把需要的网址正确构造出来?2.为什么网址正确构造出来了却不能把附件以pdf形式正确下载出来?
xpath构造网址与附件下载问题
/hndb41.com/publish/index. ... h.name=&pageIndex=1[/url]由于需要下载附件/pdf/DB41_T 148-2000.pdf') 于是我根据onclick利用xpath构造网址 concathndb41.com/standard/toset ... ublish.filepath=%20[/url] 两重网址最后下载出来的结果却都是生成tosetWatermark.action类型文件,没有下载到我需要的pdf附件 1.如何把无效的网址设置为空的同时把需要的网址正确构造出来2.为什么网址正确构造出来了却不能把附件以pdf形式正确下载出来?
爬取图片地址
求问各位大神想爬下来图片的地址,但是当我将src内容映射到详情页面的时候,测试的时候所有图片的地址都是[img]http:img.hznzcn.com/images/white.png[/img]只有当我去网站上点击每一个DIV的时候才能出现图片原本的存储地址还有data-original这个属性是什么意思,包含的内容与src一样,能不能通过内容映射到这个属性上得到图片网址?爬取的网址:http://www.hznzcn.com/product-533116.html
怎么更改爬下来的数据储存的地址啊?
怎么更改爬下来的数据储存的地址啊?