分层中,在一级页面中点击“查看”按钮想获取二级页面的内容,但“查看”按钮是onclick事件,该如何抓取下一级页面?

QQ图片20161125110539.png (39.94 KB, 下载次数: 875)

QQ图片20161125110539.png
举报 使用道具
| 回复

共 7 个关于本帖的回复 最后回复于 2016-11-25 16:29

沙发
shenzhenwan10 金牌会员 发表于 2016-11-25 11:11:47 | 只看该作者
直接用@onclick属性的值做内容映射
高级设置里不要勾选“网页片段”
举报 使用道具
板凳
ym 版主 发表于 2016-11-25 12:13:38 | 只看该作者
这种是没有独立网址,只能用连续动作的点击,第一级规则里设置点击动作,xpath要定位到每个点击对象,再对点击后的页面做第二级规则抓信息,如果点击后是新弹一个页面,可以参考教程《连续动作:追踪弹窗采数据》。如果点击后还是在原来的页面上,第二级规则里还要做上一个点击返回的动作。
举报 使用道具
地板
wh900322 初级会员 发表于 2016-11-25 14:57:57 | 只看该作者
shenzhenwan10 发表于 2016-11-25 11:11
直接用@onclick属性的值做内容映射
高级设置里不要勾选“网页片段”

行不通
举报 使用道具
5#
Fuller 管理员 发表于 2016-11-25 15:45:36 | 只看该作者

怎么行不通?网址是什么?
举报 使用道具
6#
scraper 论坛元老 发表于 2016-11-25 15:46:41 | 只看该作者

你把@onclick的值采集下来后,网址是包含在里面的,你把需要的值取出来然后前面加上域名,就可以拼成一个完整的网址,类似这个: http://gcjy.njzwfw.gov.cn/HuiYua ... &ViewType=2
另做一个规则用于采集详情页面

举报 使用道具
7#
Fuller 管理员 发表于 2016-11-25 15:55:27 | 只看该作者
scraper 发表于 2016-11-25 15:46
你把@onclick的值采集下来后,网址是包含在里面的,你把需要的值取出来然后前面加上域名,就可以拼成一个 ...

这个方法好,不用做连续动作
举报 使用道具
8#
wh900322 初级会员 发表于 2016-11-25 16:29:15 | 只看该作者
scraper 发表于 2016-11-25 15:46
你把@onclick的值采集下来后,网址是包含在里面的,你把需要的值取出来然后前面加上域名,就可以拼成一个 ...

谢谢!

举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-17 06:57