比如京东的,首先是第一级网页是商品列表,然后点击图片进去商品介绍页,这样的有两个层次的网页。
我想获取第一级页面列表里所有商品的具体介绍怎么做呢?

举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2015-8-26 21:52

沙发
gooseeker_info 金牌会员 发表于 2015-8-25 18:50:02 | 只看该作者
这种不叫弹出网页,而是分级抓取,可以参看《集搜客中级——集搜客如何抓取多层级网页》,详细讲解怎样做多级抓取规则。

另外也可以到资源板块直接下载别人做好的抓取规则,直接点击运行即可
举报 使用道具
板凳
redwindy 中级会员 发表于 2015-8-26 21:45:49 | 只看该作者
gooseeker_info 发表于 2015-8-25 18:50
这种不叫弹出网页,而是分级抓取,可以参看《集搜客中级——集搜客如何抓取多层级网页》,详细讲解怎样做多 ...

哦……我去看了一下,大概明白意思了。就是一个主题下定义两个规则,一个规则对应一个网页,然后分别处理,是这个意思吧?
举报 使用道具
地板
Fuller 管理员 发表于 2015-8-26 21:52:39 | 只看该作者
redwindy 发表于 2015-8-26 21:45
哦……我去看了一下,大概明白意思了。就是一个主题下定义两个规则,一个规则对应一个网页,然后分别处理 ...

两个规则,对应两级,第一个规则抓取商品列表时第一级,第二个规则抓取商品介绍,是第二级。两个规则定义好以后,可以在DS打数机上同时运行
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 怎样让GooSeeker分词工具使用宋体画词云图
  • 使用BERTopic时遇到的c-TF-IDF是什么?
  • gooseeker分词工具的命名实体识别和词形还
  • 怎样设置LDA模型的超参数alpha(α)和beta(
  • LDA主题分析模型到底是什么?

热门用户

GMT+8, 2026-5-6 15:40