111#
goodhanbin 中级会员 发表于 2019-12-6 18:09:15 | 只看该作者
Fuller 发表于 2019-12-6 17:56
点击查看规则,看看生成的规则是什么。

另外,新版本上有个功能“模拟点击”,你把他勾上试试(就在你的 ...

翻页线索规则

61翻页线索规则.png (160.34 KB, 下载次数: 830)

61翻页线索规则.png
举报 使用道具
112#
Fuller 管理员 发表于 2019-12-6 18:11:34 | 只看该作者
goodhanbin 发表于 2019-12-6 17:57
在第一页,至上而下,逐行的,反复采集

假设在第一页上翻页操作没有生效,爬虫感觉不到失败,因为爬虫还能看到内容,不知道是上一页的老内容。所以会再次做点击动作,关键是解决翻页问题。也可能翻页规则不正确,也可能是勾上“模拟点击”
举报 使用道具
113#
goodhanbin 中级会员 发表于 2019-12-6 18:12:25 | 只看该作者
Fuller 发表于 2019-12-6 18:11
假设在第一页上翻页操作没有生效,爬虫感觉不到失败,因为爬虫还能看到内容,不知道是上一页的老内容。所 ...

如何钩上模拟点击?
举报 使用道具
114#
Fuller 管理员 发表于 2019-12-6 18:13:01 | 只看该作者

点击“定位选项”,不要使用绝对定位,很容易失败的,使用“偏好class”或者“偏好id”,看看哪个最合适。

你做翻页区映射操作的时候,选择了哪个dom节点?
举报 使用道具
115#
goodhanbin 中级会员 发表于 2019-12-6 18:18:59 | 只看该作者
Fuller 发表于 2019-12-6 18:13
点击“定位选项”,不要使用绝对定位,很容易失败的,使用“偏好class”或者“偏好id”,看看哪个最合适 ...





60定位规则.png (157.08 KB, 下载次数: 774)

60定位规则.png
举报 使用道具
116#
goodhanbin 中级会员 发表于 2019-12-6 18:20:06 | 只看该作者

dom节点 和定位规则,有按要求做
举报 使用道具
117#
goodhanbin 中级会员 发表于 2019-12-6 18:30:00 | 只看该作者
Fuller 发表于 2019-12-6 18:13
点击“定位选项”,不要使用绝对定位,很容易失败的,使用“偏好class”或者“偏好id”,看看哪个最合适 ...

一级规则,无法做自动翻 ,在第一页至上而下,逐行重复采集,

只能,通过手动点翻页
举报 使用道具
118#
Fuller 管理员 发表于 2019-12-6 20:32:27 | 只看该作者
goodhanbin 发表于 2019-12-6 18:30
一级规则,无法做自动翻 ,在第一页至上而下,逐行重复采集,

只能,通过手动点翻页

勾上模拟点击,再点击查看规则,把生成的翻页规则截图出来看

举报 使用道具
119#
goodhanbin 中级会员 发表于 2019-12-7 09:14:54 | 只看该作者
Fuller 发表于 2019-12-6 20:32
勾上模拟点击,再点击查看规则,把生成的翻页规则截图出来看

翻页线索模拟点击规则

58线索+模拟点击规则.png (185.54 KB, 下载次数: 804)

模拟点击规则

模拟点击规则
举报 使用道具
120#
Fuller 管理员 发表于 2019-12-7 09:35:41 | 只看该作者
goodhanbin 发表于 2019-12-7 09:14
翻页线索模拟点击规则

把红框这句xpath拷贝出来,拷入下图的输入框中,点击搜索,看看能否定位到那个翻页按钮,也看到能定位到几个




举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-20 22:01