我想把li标记的内容批量采集下来,改如何操作呢?
举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2016-10-19 16:51

沙发
Fuller 管理员 发表于 2016-10-19 15:11:28 | 只看该作者
我估计你的意思是说网页上有很多li,你想把每个li中的内容采集下来,那么就用样例复制,具体参看:http://www.gooseeker.com/doc/article-330-1.html
举报 使用道具
板凳
Fuller 管理员 发表于 2016-10-19 15:50:59 | 只看该作者
比如,采集黄页的时候,每个LI存一个公司的信息,就需要用样例复制规则,把所有公司信息采集下来
举报 使用道具
地板
xandy 论坛元老 发表于 2016-10-19 16:51:35 | 只看该作者
如果碰到这种情况,要采集LI里头的内容,内容分布在LI子级节点下面的多个#text,要采集完整信息的话,就给LI做内容映射,然后在高级设置里勾选”文本内容“。类似的教程,你可以参看这个《如何抓取网页片段完整信息——以采集京东商品标题为例

采集UL下的多个LI,有两种方式:
一、给LI做样例复制
二、LI的class都相同的话,可以给容器节点做定位标志映射。参看教程:《定位标志批量采集相同定位信息
以上两种方式都能够实现批量采集。

举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-26 18:39