请问对于这类文本后面带数字,比如口碑(62),每个网页的数字都不一样,如何作模拟点击翻页呢?

微信图片_20181123154128.png (220.36 KB, 下载次数: 668)

微信图片_20181123154128.png
举报 使用道具
| 回复

共 8 个关于本帖的回复 最后回复于 2018-11-23 18:54

沙发
Fuller 管理员 发表于 2018-11-23 15:59:13 | 只看该作者
点击定位的xpath不会定位到text节点的,定位到text节点还会出错,要定位到包含这个text的A节点,对于A节点来说,他是不管里面有什么内容的。

如果你确实想用里面的文字作为定位的标志,那么就用contains()函数,只检查“口碑”这个词
举报 使用道具
板凳
kaka_22 初级会员 发表于 2018-11-23 16:15:57 | 只看该作者
Fuller 发表于 2018-11-23 15:59
点击定位的xpath不会定位到text节点的,定位到text节点还会出错,要定位到包含这个text的A节点,对于A节点 ...

是这样使用吗

微信截图_20181123161501.png (17.65 KB, 下载次数: 646)

微信截图_20181123161501.png
举报 使用道具
地板
Fuller 管理员 发表于 2018-11-23 16:20:13 | 只看该作者

不能这样放,函数不能放在标志这里。要这样:1,做正常的翻页记号映射
2,不要勾选“全匹配”
3,删除(数字)部分
自动生成的规则会自动使用contains函数
举报 使用道具
5#
kaka_22 初级会员 发表于 2018-11-23 16:44:56 | 只看该作者
Fuller 发表于 2018-11-23 16:20
不能这样放,函数不能放在标志这里。要这样:1,做正常的翻页记号映射
2,不要勾选“全匹配”
3,删除(数 ...

我的一级主题是采集了400个网址给第二主题,第二主题一进来是“数据”这一栏,我做了个模拟点击切换到“口碑”,然后是第三主题做爬取,但是400个网址只有第一个网址爬取数据了。。。。。。请问可能是什么原因导致的呢
举报 使用道具
6#
kaka_22 初级会员 发表于 2018-11-23 16:49:39 | 只看该作者
Fuller 发表于 2018-11-23 16:20
不能这样放,函数不能放在标志这里。要这样:1,做正常的翻页记号映射
2,不要勾选“全匹配”
3,删除(数 ...

是不是因为在第二主题没有做样例复制?
举报 使用道具
7#
Fuller 管理员 发表于 2018-11-23 17:46:36 | 只看该作者
kaka_22 发表于 2018-11-23 16:49
是不是因为在第二主题没有做样例复制?

把所有主题名发出来,可以给你诊断一下
举报 使用道具
8#
kaka_22 初级会员 发表于 2018-11-23 17:48:42 | 只看该作者
Fuller 发表于 2018-11-23 17:46
把所有主题名发出来,可以给你诊断一下

好了   在整理箱那边选了绝对定位就可以
举报 使用道具
9#
Fuller 管理员 发表于 2018-11-23 18:54:12 | 只看该作者
kaka_22 发表于 2018-11-23 17:48
好了   在整理箱那边选了绝对定位就可以

那是因为每一条可能都有一个特别的id代表他们,如果用绝对定位就不会使用这个id,绝对定位可能会影响规则的适应性,可以考虑选择只用class,或者想办法避开这个唯一性id,用定位标志映射就能自主选择使用哪个定位标志
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-3 01:32