翻滚动作高级设置xpath清除老内容怎么设置?

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 2021-1-18 16:58

沙发
Fuller 管理员 发表于 2021-1-18 15:17:49 | 只看该作者
举个列子,采集规则要采集UL元素下的所有LI内容,那么xpath可能是 xxx/xxx/li,这个xpath能定位到所有LI元素。那么用这个xpath填到清除老数据这里,爬虫运行的时候,在每一轮采集前,就会把LI元素删掉只剩下第一个和最后一个,一滚屏,就有新数据接到最后一个LI往后排。

这个功能只有旗舰版才能用
举报 使用道具
板凳
halo1997 初级会员 发表于 2021-1-18 16:33:01 | 只看该作者
谢谢,我来看看
举报 使用道具
地板
halo1997 初级会员 发表于 2021-1-18 16:35:01 | 只看该作者
可以举一个详细的例子吗,新手小白有点看不懂,有旗舰版会员,谢谢
举报 使用道具
5#
Fuller 管理员 发表于 2021-1-18 16:58:45 | 只看该作者
halo1997 发表于 2021-1-18 16:35
可以举一个详细的例子吗,新手小白有点看不懂,有旗舰版会员,谢谢

这里有一个教程: https://www.gooseeker.com/doc/article-406-1.html
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • UMAP的min_dist参数有什么作用?
  • UMAP的n_neighbors参数有什么作用?
  • HDBSCAN的min_samples和min_cluster_size参
  • 为什么BERTopic话题缩减后特征词出现大量没
  • GooSeeker分词扩展模块的安装方法

热门用户

GMT+8, 2026-6-18 12:22