集搜客生成的抓取规则中有<context>，表示什么？

gooseeker_info

教程说集搜客网络爬虫使用的抓取规则使用XPath，但是，我发现规则中有类似这样的内容

//*[@class='bl1']/span/text()<context>//*[@id='m']</context>

复制代码

XPath标准中没有这个，这是怎么回事？

Fuller · 发表于 2016-11-28 22:30:45

在很多文章中我们谈到，集搜客采集多层iframe中的内容就像采集普通网页一样，不用人工剥离出来每个iframe进行加载分析。能够这样做的技术基础就是对XPath做了扩展。在XPath表达式中，增加了<context>标签，一层<context>就代表一层iframe/frame，XPath表达式从左到右看，<context>代表的iframe就是从内到外。iframe的层数是不限制的。

请注意，8.0.3版本引入了一个bug，一定要尽快升级到8.0.4及其以上的版本，否则，在自定义xpath中输入的含有<context>的表达式都会遇到问题。

集搜客生成的抓取规则中有<context>，表示什么？

共 1 个关于本帖的回复最后回复于 2016-11-28 22:30

推荐板块

精彩推荐

热门话题

热门用户

	B Color Image Link Quote Code Smilies 高级模式您需要登录后才可以回帖登录 \| 立即注册回帖并转播回帖后跳转到最后一页

集搜客生成的抓取规则中有<context>，表示什么？

共 1 个关于本帖的回复 最后回复于 2016-11-28 22:30

推荐板块

精彩推荐

热门话题

热门用户

共 1 个关于本帖的回复最后回复于 2016-11-28 22:30