本帖最后由 xinke 于 2016-11-26 10:23 编辑


网址:http://map.baidu.com/?newmap=1&s=s%26wd%3D%25E5%25AE%25B6%25E5%2585%25B7%25E5%2595%2586%25E8%25A1%258C%26c%3D224
百度地图搜索结果只能抓一页。不循环,不翻页。怎么办
爬虫路线四个线索都用了,还不行

主题名:家具商行百度地图1
在线等。谢谢

举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2016-11-26 10:37

沙发
Fuller 管理员 发表于 2016-11-26 10:26:11 | 只看该作者
根据你的截图看,已经翻页到第二页了,说明翻页是好的,你可以看看有没有生成一个抓取结果文件。应该是抓取规则的适应性不够。我加载测试一下
举报 使用道具
板凳
Fuller 管理员 发表于 2016-11-26 10:34:00 | 只看该作者


在“创建规则”工作台上,点击“定位”按钮,把定位偏好修改成“偏好class”,再点测试看生成的数据规则,就能发现定位点变成了@class='poilist'那个UL,如果用偏好id,定位点就更高,适应性会不够
举报 使用道具
地板
xinke 新手上路 发表于 2016-11-26 10:37:03 | 只看该作者
谢谢管理员
我看了这篇文章,解决了
http://www.gooseeker.com/doc/thread-4637-1-1.html
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-17 03:45