本帖最后由 xandy 于 2016-12-27 16:21 编辑

拍拍贷网站数据DIY各页面之间的组合采集攻略如下(绿框是页面名称,橙色字体是采集结果表中的网址字段):

拍拍贷散标列表采集”和其他页面组合使用
思路
  • 该页面的“产品链接”可以作为“拍拍贷借款列表详情采集”的线索网址
  • 该页面的“用户链接”可以作为“拍拍贷用户详情_借款列表”和“拍拍贷用户详情_投标记录”的线索网址
方法
  • 从父页面数据结果表将链接拷贝出来,作为子页面的线索网址
  • 点击“输入多条网址”,就可以将网址批量粘贴进去开始运行采集了

拍拍贷借款列表详情采集”和其他页面组合使用

思路
  • 该页面的“借款人用户详情链接”可以作为“拍拍贷用户详情_借款列表”和“拍拍贷用户详情_投标记录”的线索网址
方法
  • 从父页面数据结果表将链接拷贝出来,作为子页面的线索网址
  • 点击“输入多条网址”,就可以将网址批量粘贴进去开始运行采集了

拍拍贷用户详情_借款列表”和其他页面组合使用

思路
  • 该页面的“产品链接”可以作为“拍拍贷借款列表详情采集”的线索网址
方法
  • 从父页面数据结果表将链接拷贝出来,作为子页面的线索网址
  • 由于该产品链接是相对链接,所以要先手工补充域名部分“http://www.ppdai.com”,方法参看:《如何手工补上网址的域名部分?
  • 点击“输入多条网址”,就可以将完整的网址批量粘贴进去开始运行采集了

拍拍贷用户详情_投标记录”和其他页面组合使用

思路
  • 该页面的“产品链接”可以作为“拍拍贷借款列表详情采集”的线索网址
方法
  • 从父页面数据结果表将链接拷贝出来,作为子页面的线索网址
  • 由于该产品链接是相对链接,所以要先手工补充域名部分“http://www.ppdai.com”,方法参看:《如何手工补上网址的域名部分?
  • 点击“输入多条网址”,就可以将完整的网址批量粘贴进去开始运行采集了

【附注】
数据DIY某网站某页面采集到的网址,可以作为同网站其他页面的线索网址,只要和样例网址的页面结构是一样的,就可以把网址批量添加进去,从而使得各页面之间能够组合使用,发挥数据DIY最大的价值。



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
| 回复

共 0 个关于本帖的回复 最后回复于 2016-12-27 16:02

您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-5 14:01