目录
- 快捷采集
- 初级教程(新版)
- 初级教程(老版)
- 数据转Excel处理
- 爬虫规则管理
- 高级教程(新版)
- 高级教程(老版)
- 用爬虫群分布式高效采集
- 爬虫关键知识拓展
- 问题集锦
- 实战演练案例
- 爬虫安装说明
- 关于集搜客
集搜客交流群
2000人群:点击加入
为什么采集出来的不是完整的地址?
1、如果网址是作为内容采集的话,是原样采集的。在这种情况下,可以通过在规则写xpath采集绝对地址,也可以后期excel中处理。2、如果是作为下级线索,可以直接用,爬虫生成下级线索的时候会把网址补齐。
导出的Excel表有抓取的线索网址吗
导出的Excel表有抓取的线索网址吗
为什么会出现图片上地址1映射错误
[b]问[/b]:为什么会出现图片上地址1映射错误 [align=center][attach]175[/attach]湘菜 那个应该也是含有 @class='tag',所以,就区分不出来了[/align] [align=center][attach
爬取图片地址
求问各位大神想爬下来图片的地址,但是当我将src内容映射到详情页面的时候,测试的时候所有图片的地址都是[img]http://img.hznzcn.com/images/white.png[/img]只有当我去网站上点击每一个DIV的时候才能出现图片原本的存储地址还有data-original这个属性是什么意思,包含的内容与src一样,能不能通过内容映射到这个属性上得到图片网址?爬取的网址:http://www.hznzcn.com/product-533116.html
如何更换ip地址?
如题
要让函数返回一个数,却输出了地址,怎么解决
is:',myAccount.take 键入how much do you want to take:5000 输出为
导出excel格式最多导出多少条
会员中心的数据仓库,导出excel格式最多导出多少条?
抓取图片地址问题
图片地址是其他站点的,抓取不到,怎么解决?急急急!!!!
服务器地址是什么?
登录的时候 服务器地址要填什么?
线索地址如何保存
网址为构造,如何将网址与爬下来的信息对应?
网页地址过长被截断
网页地址过长被截断了,而且需要输入验证码,没办法输进去。。请问怎么解决呢
京东地址栏爬取问题
主题名:京东地区-省 目的是连续点击省份和城市名,获得所有的省-市-区 但是连续动作里面永远只做第一个省份,无线循环北京市
网页地址过长被截断
[i=s] 本帖最后由 ym 于 2016-7-5 15:05 编辑 [/i] 做规则输入很长的样本网址时,就会弹出这个提示框,这是因为页面地址这里是有限制255个字符长度,超过长度就会把网址截断,但这个提示并不影响做规则和保存规则,所以,点击OK如果是手工拷贝网址到页面地址框中,请手工截断后面部分的网址,使网址长度限制在255个字符内,最后才能保存规则。
已导出量/最大导出量 这东西满了
已导出量/最大导出量 这东西满了是不是要花钱清掉?
抓到不完整的网址能做下级地址吗
里面的超链接无法打开呢,比如 [align=center][attach]252[/attach] [/align]这种地址,爬取下来的链接地址在网页中打不开,有什么办法么?我想在下级线索中,用这个地址爬取下级地址的列表 答:不能直接打开是因为不是完整地址,但是如果作为下级线索,可以直接用,爬虫生成下级线索的时候会把网址补齐