目录
- 快捷采集
- 初级教程(新版)
- 初级教程(老版)
- 数据转Excel处理
- 爬虫规则管理
- 高级教程(新版)
- 高级教程(老版)
- 用爬虫群分布式高效采集
- 爬虫关键知识拓展
- 问题集锦
- 实战演练案例
- 爬虫安装说明
- 关于集搜客
集搜客交流群
2000人群:点击加入
如何抓取json链接
id=537980569308[/url] 要抓取/html/head/里面的某个script的src 这个scriptcontains(@src='https://aldcdn.tmall.com/recommend.htm')]是定位不到的 请问如何解决
如何做到JavaScript页面下抓取下级页面链接
from=find[/url] 图例: [attach]15295[/attach] 单击红框区域可跳转至下级页面链接,但本级页面上未有链接节点,能否有办法找到并抓取下级页面链接?
如何抓取网页链接内的内容
下面的是一个网页列表,有很多个车型,我想要逐个点击每个车型,打开的页面的详细信息,是要怎么实现呢 [attach]2639
如何抓取网页链接内的内容
如何抓取网页链接内的内容
PDF下载链接在JS中,如何下载呢?
要下载table中每一行的PDF文件,但是按钮不是PDF文件的URL,按钮是个JS方法去请求获得到的URL,这样的文件该如何爬下来呢
如何批量添加链接
我要抓的一个网页链接例如 http://abcd.com&bookId=1001 http://abcd.com&bookId=1002 后面的每个数字是一个新的连接,数字都是连续的。如何设置这个bookid变量? 例如从1001开始到2001抓取这些连接的内容
如何采集每个链接里的文本数据?
我要采集一个网站里的数据,该数据是一条一条的链接,我要采集的部分是每个链接里的文本数据,请问这个应该怎么采集,新手,请指教
如何提取链接中的部分内容?
[b][table=98%] [tr][td]获取的URL规则中 只需要链接部分 如何提取 详见图片。抓取规则里面获取到的URL 是这样一个串,只有一部分是有用的。能过滤出来?
链接地址是"javascript:"该如何获取?
search/search_result.jsp 在将显示方式调成列表时,每个标准的地址都是javascript:,这种情该如何获取链接
层级抓取时,下级链接不全
层级抓取规则,抓到的下级线索链接不是完整的网址,但是下级规则能正常运行,这个是为什么?
抓取链接数量误差
请问集搜客的统计线索数与实际要抓取的个数数量有偏差, 属于正常吗? 多搜集几次是否可以解决??
如何点击进入一个页面获取链接
如何点击进入一个页面获取链接?
【疑问】链接类线索、如何在不影响下级规则的运行下批量给链接加后缀
如题 需求: 样本线索为:http://anlaosun.spdl.com/ 我需要在: http://anlaosun.spdl.com/linkus.html 页面下采集信息 目前情况是: 在样本网址http://anlaosun.spdl.com/下点击“联系我们”可以获得/linkus.htm后缀 我以抓取线索的形式获得了在列表页面采集到http://anlaosun.spdl.com以线索一为样本页面采集到http://anlaosun.spdl.com/linkus.html(线索二) 在线索二页面下采集信息不影响我爬取数据、[u]但效率太低[/u],需要采集两次线索(运行三次规则) 疑问: 是否可以在第一次采集获得的线索后直接加上后缀
请问我只想导出抓取出错的链接,该如何做呢?
[attach]7974[/attach] 就像这种,我想把失败的线索,全部导出下来,这个怎么操作?
请问我只想导出抓取出错的链接,该如何做呢?
请问我只想导出抓取出错的链接,该如何做呢?