这里的偏好ID和偏好class有什么区别啊

举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2017-4-29 16:49

沙发
Fuller 管理员 发表于 2017-4-29 15:05:35 | 只看该作者
就是优选哪个标志。

Xpath在生成的时候,会从当前节点开始,向父节点的方向找上层节点。

如果偏好id,那么向上找到一个含有id的就不找了,就从那个节点开始生成xpath。所以,生成的xpath中,很可能是这样的格式 //*[@id='xxxx']/..... 。如果没有找到id,才使用class,这就是偏好id

偏好class的话就反过来,先找含有class的节点,找不到就用id



这个按钮是手工生成xpath的按钮,你可以用偏好id,也可以换一下观察一下差别
举报 使用道具
板凳
gooseeker_info 金牌会员 发表于 2017-4-29 15:06:18 | 只看该作者
好吧,好想动了也好想没动,我想搜的是新闻网站的标题,作者,时间等信息的话,是不是里面的集中供暖定位方式都OK,没什么差别。

所以一般都是用哪个呢?
举报 使用道具
地板
Fuller 管理员 发表于 2017-4-29 16:49:11 | 只看该作者


上面是整理箱和爬虫路线的设定定位偏好的按钮,一开始先用缺省设置,根据需要调整。

至于手工点击按钮生成xpath表达式,像我上个帖子说的,分别选择试试,观察区别
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-4 19:10