目录
- 快捷采集
- 初级教程(新版)
- 初级教程(老版)
- 数据转Excel处理
- 爬虫规则管理
- 高级教程(新版)
- 高级教程(老版)
- 用爬虫群分布式高效采集
- 爬虫关键知识拓展
- 问题集锦
- 实战演练案例
- 爬虫安装说明
- 关于集搜客
集搜客交流群
2000人群:点击加入
网站的二级页面和一级页面时同一个网址,如何获取二级页面
happy1314gao 于 2019-4-8 10:06 编辑 [/i] [b][size=7]链接为[/size][/b] [b]获取二级链接的时候无法获取提示时这个页面[/b][attach]10767[/attach] [attach]10768[/attach]这样的如何获取二级页面。
无法完成excel 多级合并
问题1 :我的第一级规则是要爬取亚马逊的前100名产品列表,全部正确的爬下来了 第二级规则要爬产品的评论,但是爬取的数据导出的结果不是按照排名的顺序出现的,而且还缺少了很多,不知道原因 问题2:最后数据表无法完成合并 如图示,Q3表示评论链接,既是下级线索,评论详情是第二个表,3表示第二个标的C列 请大神回答一下第一个和第二个的问题
一级页面和二级页面能否同时爬取
我做了一个层级规则,一级规则和二级规则,有没有办法同时运行这两个规则
天猫服饰一级二级页面爬虫
小哥哥小姐姐麻烦帮我快点审核,谢谢啦!{:2_27:}
text合并
采集商品名称的时候 找不到一个text()是完整的名称 每个text()都只有一部分 怎么把多个text()合并起来采集?
如何获取一级二级三级页面数据
本人小白一枚,刚学会爬数据,最近刚学会爬简单的数据,现在想爬一1级页面中,每个页面对应的2级链接页面数据,我知道是在创建规则整理箱中,创建获取分类数据和二级链接,然后点中二级链接,再给下级线索打钩 --回到爬虫路线----回到爬虫路线--起一个目标主题名,--,存规则--关闭MS某数台--再启动定义2级链接页面的规则,定义完之后存规则 之后回到“打数机”搜到了1级页面的规则和2级页面的规则,下面就不知道该咋弄了?教程上是写的运行一级页面会自动关联2级页面,但是我运行了一级页面之后,并没有显示二级页面,求大神解答
二级爬取页面跳转错误
实在没辙,特来向大佬求助
表格样例采集二级页面
s] 本帖最后由 chenguang1234 于 2018-9-23 10:13 编辑 [/i] 如果我要抓取同标签的二级页面的内容,但是一级界面的内容不需要,他是一个表格的形式,需要点击标题进入到二级详情页,这样的话,爬虫路线应该怎么设计啊?
怎么采集二级页面的图片?
采集每个二级页里面的其中一个图片 怎么弄?
二级页面爬数据出现问题
主题名:天眼通-餐饮-抓取 [img=110,0]http://www.gooseeker.com/doc/forum.php?mod=image&aid=4476&size=300x300&key=5cf88207bef08d36&nocache=yes&type=fixnone[/img]已经找到关键字符了,但是测试的时候就是无法显示电话、地址、邮箱等信息,主题及法人到时显示出来了,等解答
如何在excel中合并多层级采集结果
/doc/thread-720-1-1.html]XML结果文件查看及导入excel[/url] > 如何在excel中合并多层级采集结果注意:下面的例子是将两级规则的采集结果整合到一个excel表中,但此方法也适用于其他Excel表的合并处理。本案例是用了网址,比如图1‘列表’的字段<第二级网址>和图2‘详细’的字段
一级页面样例复制和翻页成功,但是二级页面只能抓一个
如题 一级页面的href映射了 一级设定的主题名与二级页面的主题名也一样
sql合并问题
sql 里面合并三个字符串, 'extraction/' [url=mailto:+@Fmodel]+@Fmodel[/url]+ '/item' 这一串相加,后面那个/item总是加不上,是什么原因啊 @Fmodel是个varchar。
同义词合并
02:09 编辑 [/i] [size=16px]已提前将标签词和同义词手动归纳,整理好上传了同义词的exl文档,但是合并后的词频比实际要少
二级具体详情页面采集不到
我采集 二级页面具体详情的时候 采集不到 主题名称是 养生资讯_第二级 ,规则编号是 规则_1,页面地址是 http://www.cnys.com/zixun/77964.html