规则名:虎扑搜索帖子具体内容

翻页到第二页但是第二页的内容无法抓取,然后很多帖子的抓取都失败了,求问是什么情况,谢谢。


举报 使用道具
| 回复

共 5 个关于本帖的回复 最后回复于 2020-10-26 18:46

沙发
wangyong 版主 发表于 2020-10-26 17:14:27 | 只看该作者
因为第一页和第二页的网页结构略有不同,需要在规则上再做上定位标志映射:https://www.gooseeker.com/doc/article-344-1.html
举报 使用道具
板凳
Beausu 中级会员 发表于 2020-10-26 17:33:24 | 只看该作者
感谢~
举报 使用道具
地板
Beausu 中级会员 发表于 2020-10-26 18:07:21 | 只看该作者
您好 我按照这个将评论区里需要样例复制的内容做了定位标志映射,但还是出现同样的情况,能麻烦您看一下是什么原因吗,是我的映射节点找的不对吗,谢谢
举报 使用道具
5#
Fuller 管理员 发表于 2020-10-26 18:44:36 | 只看该作者
Beausu 发表于 2020-10-26 18:07
您好 我按照这个将评论区里需要样例复制的内容做了定位标志映射,但还是出现同样的情况,能麻烦您看一下是 ...



因为每条评论都有唯一的id,所以,做了定位标志映射以后,要做修改,不用使用id。双击抓取内容,进入到抓取内容高级设置选项,勾上 class
举报 使用道具
6#
wangyong 版主 发表于 2020-10-26 18:46:23 | 只看该作者
Beausu 发表于 2020-10-26 18:07
您好 我按照这个将评论区里需要样例复制的内容做了定位标志映射,但还是出现同样的情况,能麻烦您看一下是 ...


需要选中包含整个抓取内容的节点,给整理箱顶节点做上定位标志映射
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-19 11:05