本帖最后由 ym 于 2016-2-23 18:09 编辑

常见问题 > 制作规则—常见问题导航 > 样例复制 >  如何限定范围做样例复制

样例复制映射怎么能做到只在固定范围内部进行映射?

我是拿     http://www.52tian.net/----3-----3--/     网址进行处理的
网页底部有“你可能感兴趣的漫画”,但是我只想遍历网页中部的动画结果
也就是说,我只想在一个确定的DIV里面进行样例复制映射




以页码为分割,上面为动画,下面为漫画,两种样例的版式相同,我怎么做才能够在动画的DIV中进行样例的遍历。。
举报 使用道具
| 回复

共 5 个关于本帖的回复 最后回复于 2017-3-31 14:44

沙发
gooseeker_info 金牌会员 发表于 2016-1-25 12:40:39 | 只看该作者
本帖最后由 ym 于 2016-2-23 18:05 编辑

创建整理箱的时候,输入一个名字,比如,“动画”,然后就在里面添加抓取内容,比如“动画网址”,“动画标题”。那么在“动画”这个顶层容器节点上做样例复制。这是一个常规的过程。

要解决楼主的问题,我们可以在“动画”下面创建一个抓取内容,比如,“样例”,然后把“动画网址”、“动画标题”创建到“样例”之下。在“样例”上做样例复制。那么最顶上的“动画”节点就能空出来做限制范围的定位。如果代表动画上面那块位置的DIV有@class或者id,做 一次定位标志映射,就能限定不要抓取底部的漫画
举报 使用道具
板凳
woshisunzhongs 初级会员 发表于 2016-12-19 20:02:56 | 只看该作者
先回复,再看贴~~
举报 使用道具
地板
woshisunzhongs 初级会员 发表于 2016-12-19 20:25:52 | 只看该作者
gooseeker_info 发表于 2016-1-25 12:40
创建整理箱的时候,输入一个名字,比如,“动画”,然后就在里面添加抓取内容,比如“动画网址”,“动画标 ...

刚刚尝试了你的方法,完全可行啊!“动画“上面使用的定位标志映射相当于限定范围了。
举报 使用道具
5#
zaixian114 初级会员 发表于 2017-3-31 14:39:25 | 只看该作者
假如上面的动画有30个,我只想抓取前28个,怎样删除后面两个?
举报 使用道具
6#
Fuller 管理员 发表于 2017-3-31 14:44:28 | 只看该作者
zaixian114 发表于 2017-3-31 14:39
假如上面的动画有30个,我只想抓取前28个,怎样删除后面两个?

生成的抓取规则是可以手工修改的,一般样例复制的规则里面会有position()>=1的字样,再加上一个条件就是position()>=1 and position()<=28。

手工修改的顺序是:
1,点击工具条上的 存规则 按钮
2,点击创建规则工作台上的测试按钮,点击 数据规则页签,直接在窗口中修改数据规则,然后点击“保存修改”按钮

如果下次加载规则,是看不到手工修改部分的,而且,如果再次存规则,就会冲掉手工修改部分。

不建议这么做。可以在处理抓取结果的时候把不要的过滤掉
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-26 19:39