Fuller 发表于 2016-7-7 23:24
我看了淘宝的“页面记录仪采集”,有个模拟点击“累计评价”,生成的xpath是
这个表达式不太好,因为起始节 ...
759924607 发表于 2016-7-8 09:51
具体说哪个规则不正确的话(也是我自己分析)。采集淘宝的,应该就是“页面记录仪采集”;采集众筹的,应 ...
Fuller 发表于 2016-7-8 10:22
我选择id='J_TabBar',这个是在页面上唯一的,针对这个节点做线索映射。
我刚才发现了一个问题
759924607 发表于 2016-7-8 11:17
奥奥!明白!我再去完善一下规则。说起这个还有一个类似的问题。以前觉得没啥影响,就没注意。
像这种是 ...
Fuller 发表于 2016-7-8 12:15
这是抓取结果文件,对DS打数机的运行没有影响,但是你使用数据的时候,可能需要先把前后的空格删除了再用 ...
759924607 发表于 2016-7-8 15:46
爬数据爬了一遍,把抓取失败的线索加载了下。还是出现了一部分错误的。
上图的这种是整理箱内的内容全部 ...
欢迎光临 集搜客GooSeeker网络爬虫 (https://www.gooseeker.com/doc/) | Powered by Discuz! X3.2 |