本帖最后由 ShelleyWu 于 2016-9-2 16:05 编辑

恳请诸位先进赐教阿~~


已有主题:  L1_Sim_Click& L2_Sim_Click
欲采集网页:http://www.koreamold.com/eng/suppliers/company/main.asp
欲采集资料: 点击各家公司后的详细资料

我做了两个主题, 一个针对点击公司的爬虫规则(L1_Sim_Click) , 第二部分做了获取数据(L2_Sim_Click)~
目前的问题是回复第一个页面时, 总是在点击重复的内容阿~~~
问题点: 各家公司点击后需要点击上一页回到原页面, 再度点击第二家公司, 会建议使用爬虫路线(哪种线索)或是连续动作动作点击作第一级的模拟点击呢?
能否提供合适的教程参考下呢?
麻烦了~感谢!

未命名.png (4.99 KB, 下载次数: 384)

未命名.png
举报 使用道具
| 回复

共 0 个关于本帖的回复 最后回复于 2016-9-3 16:14

您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-7 07:18