11#
Fuller 管理员 发表于 2015-10-1 16:51:39 | 只看该作者
smthsiwei 发表于 2015-10-1 15:50
还有几个问题:
1、自动生成的代码,例如

为什么写成三个表达式,应该是系统设计师有所考虑一些边界条件
举报 使用道具
12#
habout632 初级会员 发表于 2015-10-22 19:26:28 | 只看该作者
*//*[@class='ninfor3 fl']/ul/li[position()=1]/text()这样的表达式该怎么改,这该表达式有什么规律吗?
举报 使用道具
13#
smthsiwei 初级会员 发表于 2015-10-26 19:13:02 | 只看该作者
这就是xpath表达式,去看一下xpath教程就好。
举报 使用道具
14#
Fuller 管理员 发表于 2015-10-26 23:42:45 | 只看该作者
habout632 发表于 2015-10-22 19:26
*//*[@class='ninfor3 fl']/ul/li/text()这样的表达式该怎么改,这该表达式有什么规律吗? ...

怎么改跟实际情况有关,举例如下:
1,可能有些class='ninfor3 fl' 有些class='ninfor3'  ,就是后面没有fl,那么这个xpath就可能改成
*//*[contains(@class, 'ninfor3')]/ul/li[position()=1]/text()

2,也有很大可能是position()这个函数造成不灵活,因为position()=1表示一定要低一个li,也许是根据li中的text是否含有某些标志,比如,这样
*//*[contains(@class, 'ninfor3')]/ul/li/text()[contains(., '利率')]

另外,当写自定义xpath的时候,通常我把开头的*//*修改成.//*,这个只是习惯问题
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-29 18:48