设置规则的时候正常,一抓取9显示异常?
举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2016-11-15 11:33

沙发
HJLing 版主 发表于 2016-11-15 11:11:34 | 只看该作者
可能是一个记录会话状态的网页,单独进入不行
要从它的上一层入口点进去
这种页面可以做模拟点击或连续动作
举报 使用道具
板凳
Fuller 管理员 发表于 2016-11-15 11:22:02 | 只看该作者
下载越来越多的网站看起来像普通网页,其实是一个有会话状态的IT系统,不能随便加载其中某个网址,只能层层点击进去,这样,就得用连续点击,如果弹出窗口,还得用飞掠模式
举报 使用道具
地板
Fuller 管理员 发表于 2016-11-15 11:33:28 | 只看该作者
这类网站一般都是用一些成套控件开发的,比如,asp系列的控件,或者jsp系列的控件。很多出现在政府网站上。这样的网站不讲究SEO和被百度收录,只讲究用户办事流程,所以,大部分网址看起来是独立的URL,其实不能直接使用
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-20 09:55