评论 阿里 2017-4-23 00:56
这个教程不错
评论 scraper 2016-10-25 10:23
beanbing: 看了微博博主采集的,其中用了节点映射,而非文本映射(#text)两者都是一样的吗
可以认为是一样的 text是比较精确的采集 用A节点这些也可以 不过可能会有一些空格存在 有些情况下 一个text()的内容不完整 就要用到上级父节点 像这篇教程这样
评论 beanbing 2016-10-25 10:16
看了微博博主采集的,其中用了节点映射,而非文本映射(#text)两者都是一样的吗
评论 Fuller 2016-4-6 22:18
海呆呆: 不知道为什么,按着流程都做好了,测试时,下面输出信息确实有数据,但保存规则后,爬数据,显示没有线索了,可添加新线索或激活已有线索 ...
初级教程第三章就是讲怎样管理线索:http://www.gooseeker.com/doc/article-131-1.html
评论 海呆呆 2016-4-6 20:31
不知道为什么,按着流程都做好了,测试时,下面输出信息确实有数据,但保存规则后,爬数据,显示没有线索了,可添加新线索或激活已有线索
评论 ParcoHan 2016-1-3 03:17
这个初级教程说明已经不错了,对于新人来说认真看一遍基本都能操作。但还是建议高手们有空写些更详细的讲解,对于扩大集搜客很有帮助!
评论 goGeeker 2015-12-24 16:45
【开发者工具】--【导入】--选择XML文件
评论 Fuller 2015-11-11 23:02
这个教程还可以分拆一下,另外分拆成多个文档,分别讲解
1,内容怎样抓取
2,多个样例怎样抓取
3,要翻页怎么办
分拆开则查阅方便,阅读也没有压力

GMT+8, 2024-3-28 19:13