主题  :珠海预售_*
珠海预售_3点击到里面信息没有数据的啊
珠海预售_4点击到里面信息没有数据的啊
是空数据




举报 使用道具
| 回复

共 22 个关于本帖的回复 最后回复于 2017-3-17 16:51

沙发
xandy 论坛元老 发表于 2017-3-15 15:13:28 | 只看该作者
你应该补充下你的问题,不知道你要问什么
举报 使用道具
板凳
xandy 论坛元老 发表于 2017-3-15 15:17:29 | 只看该作者
本帖最后由 xandy 于 2017-3-15 16:36 编辑

实际上在浏览器直接打开你的目标网址:
  1. http://www.zhzgj.gov.cn/house/Detail_2007.aspx?fId={DCB5B175-C653-42C3-A901-281E1C9287C5}&dongNo=3%E6%A0%8B
复制代码
点击里头的“期房可售”弹出新的网页内容就是空白的,既然是空白的当然是采集不到信息的。
举报 使用道具
地板
zhuohui1987 金牌会员 发表于 2017-3-15 15:41:51 | 只看该作者

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
5#
xandy 论坛元老 发表于 2017-3-15 15:47:28 | 只看该作者

火狐浏览器和GS爬虫浏览器都点击不到,该网站的浏览器兼容问题~
举报 使用道具
6#
Fuller 管理员 发表于 2017-3-15 16:14:41 | 只看该作者
在chrome,edge和火狐下点击都看到的是空白内容
举报 使用道具
7#
zhuohui1987 金牌会员 发表于 2017-3-15 16:34:18 | 只看该作者
Fuller 发表于 2017-3-15 16:14
在chrome,edge和火狐下点击都看到的是空白内容

按照你采集点击出来当然是空白的啊,但是直接使用浏览器点击里面是有东西的啊
举报 使用道具
8#
Fuller 管理员 发表于 2017-3-15 16:45:43 | 只看该作者
zhuohui1987 发表于 2017-3-15 16:34
按照你采集点击出来当然是空白的啊,但是直接使用浏览器点击里面是有东西的啊
...

这个网站要从首页开始一直点进去才能看到内容,从这里: http://www.zhzgj.gov.cn/house/Default.aspx ,不能用层级抓取,看样子这是使用了微软的服务器开发控件,这个操作过程是记录了会话状态的。所以,你要定义多级连续动作。这里还有一个飞掠模式,抓取弹出新窗口中的内容。你是旗舰版就没有问题
举报 使用道具
9#
zhuohui1987 金牌会员 发表于 2017-3-15 17:21:49 | 只看该作者

像这个房号要连续点击要怎么写定位呢
举报 使用道具
10#
zhuohui1987 金牌会员 发表于 2017-3-15 17:25:06 | 只看该作者
zhuohui1987 发表于 2017-3-15 17:21
像这个房号要连续点击要怎么写定位呢

/html/body/form/table[position()=3]/tbody/tr/td/table/tbody/tr/td/table[position()=3]/tbody/tr[position()>=1]/td[position()>=1]/table/tbody/tr/td[position()>=1]/table/tbody/tr/td/a
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 360或火绒等杀毒软件导致GooSeeker爬虫软件
  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反

热门用户

GMT+8, 2025-5-4 23:43