爬取的网页自动下一页后跳转错误,请求帮助处理
网站链接 http://www.syfc.com.cn/work/ysxk/query_xukezheng.jsp
主题名:商品房预售许可证-1
1558507915(1).png
爬取的网站
1558508045(1).png
第二页调到了这个页面不知道为什么?怎么处理
举报 使用道具
| 回复

共 2 个关于本帖的回复 最后回复于 2019-5-22 15:18

Fuller 管理员 发表于 2019-5-22 15:14:52 | 显示全部楼层
这个网站似乎没有做好,手工点也是跳转,你知不知道有没有别的地方可以看到下一页?
举报 使用道具
Fuller 管理员 发表于 2019-5-22 15:18:17 | 显示全部楼层
我找到一个简单的方法,你也不要做翻页规则了,你这样构造网址吧
1,根据总的条数,算一下一共有几页
2,每一页的网址是这样的:http://www.syfc.com.cn/work/ysxk/query_xukezheng.jsp?cur_page=50 ,最后的数字表示页码。
3,你在excel中把所有页的网址构造出来,导入给你做的规则就行了,导入方法参看:https://www.gooseeker.com/doc/thread-667-1-1.html
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 20:00