|
GooSeeker爬虫软件可以完全模拟人的行为,普通人浏览网页的时候不会管是否有iframe,GooSeeker网络爬虫也能做到这一点,用户抓取数据的时候可以不用管iframe的存在,iframe不过是嵌套在html的 DOM树中的一个分支。
GooSeeker自动生成的XPath对标准的XPath进行了扩展,把iframe很自然地当成了一个分支,而标准XPath不能用一条xpath语句从外层html深入到iframe的。
有一种情形需要注意一下:在同一个规则中,要抓取的内容有些位于iframe外,有些位于iframe内,需要把他们分别放在不同的整理箱中。除此以外,不用管是否有iframe存在 |
|
共 1 个关于本帖的回复 最后回复于 2016-9-19 15:13