求大神指教

Lucky嗨嗨

我想抓取百度搜索关键词后的各结果网址，但是有两个问题：一是为什么@href对应的文本不是搜索结果的原网址？比如第一个结果的网址应该是www.ngac.cn/

，可是@href对应的是一串别的东西，如图1，但也能打开网站，该如何爬取真正的网址？；问题二：为什么搜索结果的第一页一共十个结果，但是爬取下来的结果只有七个，可见图2？如果单爬取标题或者摘要都没问题，唯独加上网址后就只能爬到七个结果，求帮忙！！非常感谢！！

bowieD · 发表于 2017-9-14 09:36:26

图片看不清，可以把规则名发出来
1，@href值对应得是什么，是网址不完整还是根本就不是网址
2，采集不全也跟这个@href有关

求大神指教

本帖子中包含更多资源

共 1 个关于本帖的回复最后回复于 2017-9-14 09:36

推荐板块

精彩推荐

热门话题

热门用户

	B Color Image Link Quote Code Smilies 高级模式您需要登录后才可以回帖登录 \| 立即注册回帖并转播回帖后跳转到最后一页

求大神指教

本帖子中包含更多资源

共 1 个关于本帖的回复 最后回复于 2017-9-14 09:36

推荐板块

精彩推荐

热门话题

热门用户

共 1 个关于本帖的回复最后回复于 2017-9-14 09:36