这是目标网页:https://book.douban.com/review/best/?icn=index-reviewer测试的时候不会没有跳着抓取


采集结果是跳着


哪里出了问题呢?

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2016-10-26 18:52

沙发
Fuller 管理员 发表于 2016-10-26 18:52:06 | 只看该作者
可能的原因:
1)样例复制映射的时候,第一个样例和第二个样例对应的节点不是相邻的兄弟,而是跳开的
2)奇偶行的@class值不一样,MS谋数台生成抓取规则的时候,往往会自动选择@class或者@id作为定位标志,他自动选的不合适,需要点击“创建规则”工作台上的“定位”按钮来修改定位偏好,比如,换一下偏好id,或者偏好class等

如果还解决不了,把主题名帖出来,我帮你诊断一下
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 怎样让GooSeeker分词工具使用宋体画词云图
  • 使用BERTopic时遇到的c-TF-IDF是什么?
  • gooseeker分词工具的命名实体识别和词形还
  • 怎样设置LDA模型的超参数alpha(α)和beta(
  • LDA主题分析模型到底是什么?

热门用户

GMT+8, 2026-5-26 18:51