主题:三明预售_2


测试输入信息属于正常的,保存时出现这个错误但是为什么出现:“映射给记号的节点没有包容在映射给线索的节点内部”
举报 使用道具
| 回复

共 18 个关于本帖的回复 最后回复于 2016-12-7 17:24

沙发
zhuohui1987 金牌会员 发表于 2016-12-6 17:52:13 | 只看该作者
测试属于正常,真的抓数据的失败。 帮我 看一看
举报 使用道具
板凳
Fuller 管理员 发表于 2016-12-6 18:00:13 | 只看该作者
这个规则我加载不了,有错误,错误提示是:


我猜你做线索定位映射的时候,使用了text节点,这个不对,定位映射的目的是划定一个网页范围,好在这个范围内找点击的记号,所以,这个翻页应该是一个DIV之类的节点。

我是这样映射的:

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
地板
zhuohui1987 金牌会员 发表于 2016-12-6 18:33:17 | 只看该作者
Fuller 发表于 2016-12-6 18:00
这个规则我加载不了,有错误,错误提示是:

还是一样的啊

举报 使用道具
5#
zhuohui1987 金牌会员 发表于 2016-12-6 18:35:35 | 只看该作者
Fuller 发表于 2016-12-6 18:00
这个规则我加载不了,有错误,错误提示是:

  
还是这个错误: 映射给记号的节点没有包容在映射给线索的节点内部

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
6#
Fuller 管理员 发表于 2016-12-6 19:08:02 | 只看该作者
zhuohui1987 发表于 2016-12-6 18:35
还是这个错误: 映射给记号的节点没有包容在映射给线索的节点内部

应该用两个规则,否则,总是加载失败。因为,网页刚刚加载的时候,幢信息还没有点开,你的规则里面是要抓幢信息的,此时加载不成功。所以分成两个规则。

规则一:整理箱中不要 许可列表 整个分支,规则一只是在爬虫路线里面做点击

规则二: 是点击后的规则,专门抓 幢信息

我用两个规则已经测试成功。

但是第一个规则那里总是加载不成功,还在查原因,不过不影响爬虫
举报 使用道具
7#
Fuller 管理员 发表于 2016-12-6 19:18:40 | 只看该作者


做记号映射的时候,不用选择onclick,而是选择 id,像上图那样,加载就不会失败,也能抓取。我估计onclick中含有一些""这样的符号,不符合要求

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
8#
zhuohui1987 金牌会员 发表于 2016-12-7 08:24:49 | 只看该作者
Fuller 发表于 2016-12-6 19:18
做记号映射的时候,不用选择onclick,而是选择 id,像上图那样,加载就不会失败,也能抓取。我估计onclic ...

另外写在规则二: 是点击后的规则,专门抓 幢信息


他会失败,无法获取点后的数据
举报 使用道具
9#
Fuller 管理员 发表于 2016-12-7 09:21:53 | 只看该作者
zhuohui1987 发表于 2016-12-7 08:24
另外写在规则二: 是点击后的规则,专门抓 幢信息

我都测试过了,把 许可列表 整个移到规则二。

第二次加载的时候,提示“后续分析”,不要立马分析,而是手工点击 幢信息 那里,点开以后再执行后续分析。

专门设立一个“后续分析”的原因就在这里。要等手工做了动作以后才能后续分析
举报 使用道具
10#
zhuohui1987 金牌会员 发表于 2016-12-7 14:13:15 | 只看该作者
Fuller 发表于 2016-12-6 19:18
做记号映射的时候,不用选择onclick,而是选择 id,像上图那样,加载就不会失败,也能抓取。我估计onclic ...

有发现线索,测试正常,但是抓取的时候网页的白,xml里面没有抓到信息
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文
  • 使用AI工具Kimi生成python代码为文本分析结
  • 苹果mac电脑安装集搜客网络爬虫软件失败的

热门用户

GMT+8, 2024-11-1 07:58