如何点击进入一个页面获取链接?
举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2016-12-28 14:59

沙发
xandy 论坛元老 发表于 2016-12-28 14:59:09 | 只看该作者
1,采集一个页面的网址链接可以普通文本抓取一样,将@href映射给采集内容就可以了,
参看教程《采集网页数据
2,如果通过点击一个页面A进入到目标页面B抓链接,看A和B的网址是不是一样的。
  • 是一样的,说明点击后链接没有发生变化,要定义连续动作,参看教程:《自动点击京东商品属性采集价格
  • 不一样,那就把B页面的链接作为样本网址来定义规则

举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-6 19:32