Fuller 管理员 发表于 2023-10-15 10:39:19 | 显示全部楼层
2186667399 发表于 2023-10-14 20:05
我按您说的设置了,因为您让点击的位置标签名一样所以直接返回最外面一层了,我又设置了一个让他进入列表 ...

我上个帖子最后一张图,那个xpath的最后是[2],表示点击一组元素中的第二个元素,这个要写对,才能进入列表页
举报 使用道具
2186667399 初级会员 发表于 2023-10-16 09:33:50 | 显示全部楼层
本帖最后由 2186667399 于 2023-10-16 10:08 编辑
Fuller 发表于 2023-10-15 10:39
我上个帖子最后一张图,那个xpath的最后是[2],表示点击一组元素中的第二个元素,这个要写对,才能进入列 ...

我按您说的实现了操作,但是只采集第一页的内容不会采集之后的内容是什么原因呢
不执行我设置的翻页动作

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
Fuller 管理员 发表于 2023-10-16 10:36:52 | 显示全部楼层
2186667399 发表于 2023-10-16 09:33
我按您说的实现了操作,但是只采集第一页的内容不会采集之后的内容是什么原因呢
不执行我设置的翻页动作
...

没有发生翻页?还是翻页以后采集失败?
举报 使用道具
2186667399 初级会员 发表于 2023-10-16 10:42:48 | 显示全部楼层
Fuller 发表于 2023-10-16 10:36
没有发生翻页?还是翻页以后采集失败?

没有发生翻页
举报 使用道具
Fuller 管理员 发表于 2023-10-16 10:58:24 | 显示全部楼层

翻页那里不要勾模拟点击
举报 使用道具
2186667399 初级会员 发表于 2023-10-16 11:05:43 | 显示全部楼层
本帖最后由 2186667399 于 2023-10-16 14:14 编辑
Fuller 发表于 2023-10-16 10:58
翻页那里不要勾模拟点击

不勾选模拟点击也不进行翻页啊,还是直接在第一页采集第一条数据
举报 使用道具
Fuller 管理员 发表于 2023-10-16 15:49:13 | 显示全部楼层
2186667399 发表于 2023-10-16 11:05
不勾选模拟点击也不进行翻页啊,还是直接在第一页采集第一条数据

不勾模拟点击肯定是能翻页的
举报 使用道具
2186667399 初级会员 发表于 2023-10-16 15:51:16 | 显示全部楼层
Fuller 发表于 2023-10-16 15:49
不勾模拟点击肯定是能翻页的

翻页是翻页了,但是不进行下一步啊,到第二页就一直验证规则,然后结束,不进入内部网页
举报 使用道具
Fuller 管理员 发表于 2023-10-16 18:12:17 | 显示全部楼层
2186667399 发表于 2023-10-16 15:51
翻页是翻页了,但是不进行下一步啊,到第二页就一直验证规则,然后结束,不进入内部网页
...

那就不是翻页的问题了,前面我说了,翻页到后面,适应第一页的规则就不适应了,要么仔细研究页面结构有什么变化,以便定义出来一个通用的规则,要么为下一页定义一个同名任务,但是规则编号不一样。

目前第二种方法我没有试通,我正在研究网页结构有什么变化,期望做出来一个通用的规则
举报 使用道具
Fuller 管理员 发表于 2023-10-17 08:56:30 | 显示全部楼层

蓝色框里的那个@class值,翻页以后就变了,这个元素对应第一列数据,采集规则中如果使用了这个@class值作为定位标志,翻到下一页就规则不适用了。为了避免使用这个定位标志,要设置成绝对定位,或者手工找一个合适的@class做定位映射。我采用了绝对定位。


使用绝对定位以后,规则的适应性会下降,所以,我给整理箱做上定位映射,而不使用样例复制的方法采集多条数据。参看教程:https://www.gooseeker.com/doc/article-533-1.html

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文
  • 使用AI工具Kimi生成python代码为文本分析结
  • 苹果mac电脑安装集搜客网络爬虫软件失败的

热门用户

GMT+8, 2024-10-11 18:58