[多层结构网页抓取失败实例2则]

感谢制作者,为我们提供软件的免费使用。软件的确很好,功能很强大,能够抓取大部分的网站。最近玩这个软件上瘾了,同时也遇到很多问题。

实例1:
http://stores.ebay.com/Adorama-Camera/Computer-Systems-/_i.html?_fsub=84...

每行3个产品,属于1个组(每行为一组,每页有多组)。 复制抓取规则后只能抓取一个组内的3个产品。设置多级容点节器,分别对应小组和产品。对小组和样品规则分别激活复制样例。抓取失败。

实例2:

http://www.microsoftstore.com/store/msusa/en_US/list/All-in-ones-+-deskt...

和上个网页类似,分为多层结构。
每行为4个产品,其中第一个产品和其他3个产品的结构性质不同。设置多级容点节器,分别抓取每行1一个和其他3个。一直未能成功。

主题名是什么?

我可以检查一下信息结构定义的问题

另外一个主题名是

另外一个主题名是 ebay1

这个样本页面上没有商品

请选择一个商品比较丰富的网页做样本页面

主题是M1,提示“Duplic

主题是M1,提示“Duplication happens in wrong position”无法上传。
我将样品管理去激活以后上传为M1,你可以将其重新激活。就能看到我最初制作的抓取规则了。

样例复制品映射要用相同级别的节点

参看《采集当当网价格》,在第四步,做样例复制品映射的时候一定要选择位于DOM相同级别的兄弟节点。