目标:想抓取该网页下所有景点的名字、位置
http://www.mafengwo.cn/search/s.php?q=%E5%AE%89%E5%BE%BD&p=2&t=poi&kt=1

问题:样例复制后,只输出了作为样例的2个名字。其他并列名字并没有被爬去。翻页抓取的情况下,也只爬取了每一页相同位置的2个名字。

下图为操作示意



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报
| 回复

共 7 个关于本帖的回复 最后回复于 2017-5-18 09:13

沙发
xandy 论坛元老 发表于 2017-5-17 10:03:31 | 只看该作者
针对列表中的第一个和第二个LI做样例复制,而不是倒数第一、二个来做
举报
板凳
eino11 中级会员 发表于 2017-5-17 11:26:16 | 只看该作者
xandy 发表于 2017-5-17 10:03
针对列表中的第一个和第二个LI做样例复制,而不是倒数第一、二个来做

原来是这个问题!现在可以了,十分感谢
举报
地板
eino11 中级会员 发表于 2017-5-17 13:48:10 | 只看该作者
xandy 发表于 2017-5-17 10:03
针对列表中的第一个和第二个LI做样例复制,而不是倒数第一、二个来做

出现了新问题,标题和文字说明能抓取到,但为什么点评数量和游记数量的文本抓取不到呢。。。。。


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报
5#
ym 版主 发表于 2017-5-17 14:09:55 | 只看该作者
网页结构相同,定位有错,你做上定位标志映射或者修改整理箱的定位来解决吧,操作参考《做定位标志后抓到空/重复的信息,怎么解决》
举报
6#
Fuller 管理员 发表于 2017-5-17 16:24:12 | 只看该作者
eino11 发表于 2017-5-17 13:48
出现了新问题,标题和文字说明能抓取到,但为什么点评数量和游记数量的文本抓取不到呢。。。。。

从你的截图就能看到,这两个字段的class相同,如果不用手工做定位标志映射,就会自动用上这个class,就会抓错。手工做定位标志映射的话,用他们的父节点的定位标志,如果没有合适的定位标志,就设置定位偏好——绝对定位
举报
7#
eino11 中级会员 发表于 2017-5-18 09:13:24 | 只看该作者
ym 发表于 2017-5-17 14:09
网页结构相同,定位有错,你做上定位标志映射或者修改整理箱的定位来解决吧,操作参考《做定位标志后抓到空 ...

问题已解决,谢谢
举报
8#
eino11 中级会员 发表于 2017-5-18 09:13:39 | 只看该作者
Fuller 发表于 2017-5-17 16:24
从你的截图就能看到,这两个字段的class相同,如果不用手工做定位标志映射,就会自动用上这个class,就会 ...

问题已解决,谢谢
举报
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 360或火绒等杀毒软件导致GooSeeker爬虫软件
  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 0%

热门用户

GMT+8, 2025-5-21 15:37