MetaSeeker工具包

如需帮助,请正确填写email地址

通过联系我们链接,可以留言、提问或者寻求直接帮助,但是,请一定要正确填写您的email地址,经常接收到很多email地址填写不正确的邮件,我们无法通过回信及时提供帮助。

能否指定样例个数

在层级抓取中我们常遇到这样的情况,比如,第一级是所有商品的列表(假设它在一页内全部显示完),第二级是每个商品的具体信息。第一级通过info线索与第二级相连。
但很多时候,我们不需要为第一级中的每个商品都建立info线索,比如该页一共有1000个商品,我只需要其中200个的信息,这时我就不能用多实例映射,因为这样做会把所有的商品都映射下来,此时我应该怎么办?用xslt可以解决吗?
在线等,谢谢fuller!

再次问一个有关翻页的问题

我在下载论坛帖子的时候遇到了一个这样的问题,即有些帖子的回复很少,一页就可以显示完,而有些帖子的回复很多,有好几页。我的需求是以帖子列表建立第一层级,具体的每个帖子的回复作为第二层级。请问我第二级应如何设置才能不遗漏所有回复?(即只有一页时不翻页,有多页时自动翻页)

谢谢!

可将下拉列表作为相对线索么

如题,在抓取时相对线索当前节点选择下拉列表的当前选择项,下一节点选择下拉列表的下一个选择项,这样可以做为线索进行抓取么

如何使翻页从最后一页开始?

我有一个三层的抓取,第一层抓取股票代码,主题ZJU_guba_GEM_list,第二层用来抓取每个股票的帖子列表,主题ZJU_guba_GEM_detail,第三层抓取每个帖子的回复,主题ZJU_guba_GEM_content。

我的需求是抓取每个股票最早的若干个帖子,即第二层中从最后一页向前翻页。但由于设置了分级抓取,第一层抓取的线索默认是从第一页开始的,请问有什么解决办法?

请问MetaSeeker可以运行网页上的JS方法

意思就是网页上有些内容是通过一个js方法运行之后才能显示出来,这中内容可以进行抓取么请问,可以的话要怎么操作呢

求助world41主题不能抓取页面全部信息

只能抓取第一个物品,设置了复制样例

求助world41主题不能抓取页面全部信息

只能抓取第一个物品,设置了复制样例

求解决这个网站的抓取问题

http://www.swagvault.com/wow/eu/gold/386#cateid
这个网站,现在想要抓取上面的服务器名作为线索,但是服务器名放在多个div中,点击大写字母才能显示相应的div,想再根据服务器名作为线索抓取下方div里的内容,没有超链接,全部信息在一个页面显示,请问,可以实现么

抓取时可以用下拉列表作为线索么

如题,求教抓取时是否可以用下拉列表做为线索来进行抓取

Syndicate content