:美团页面,鼠标滚下来后,页面展开,展开数页才出现翻页条,抓取的内容是空的,美团这种情况如何抓翻页呢?


:打开滚屏功能


:在哪里打开?
找到了。设置了滚屏,还是抓不到数据。测试时,数据只有几条,爬数据是空


:设置关键内容了吗?ms谋数台上测试是否全?


:设置了关键内容,测试不全。你能帮我看下我的主题和规则吗?



:每一块div都有唯一的id(如篮框所示,每个id有一串数字,是各自不同的),要在抓取规则中避免他们。可以启用绝对定位 。


:如何设置,才能避免呢?配置下线索定位中的绝对定位,没起作用。


:美团网,每个div都有唯一性的id,抓取规则会自动用这个id,所以除了样例数据以外,其它的抓不下来。要避开唯一性id,有多种方法
1,人工选用定位标志,避开id
2,使用绝对定位

线索定位的首选项和抓取内容的首选项不一样,如上图,在红框位置点鼠标右键,能看到首选项菜单

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
| 回复

共 0 个关于本帖的回复 最后回复于 2015-10-9 22:51

您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 怎样设置LDA模型的超参数alpha(α)和beta(
  • LDA主题分析模型到底是什么?
  • top2vec话题发现原理和使用方法
  • 将文本聚类和LDA分析模块安装在数据盘上的
  • GooSeeker分词软件的tf-idf算法和特征词选

热门用户

GMT+8, 2026-4-17 17:04