1、数据格式如附件截图所示:需要收集1-34轮比赛结果,点击每一轮数字网址不变,只能通过连续动作来收集?
2、具体网址如下:
     http://liansai.500.com/zuqiu-3468/jifen-8739/

error-20170521001.png (107.12 KB, 下载次数: 625)

error-20170521001.png
举报 使用道具
| 回复

共 5 个关于本帖的回复 最后回复于 2017-5-22 14:42

沙发
Fuller 管理员 发表于 2017-5-21 23:21:02 | 只看该作者
这个也很好采集,做一个“点击”类型的连续动作,定位点击点的xpath是
  1. //*[@class='lsaiguo_round_list clearfix']/li/a
复制代码




举报 使用道具
板凳
zucaidaka001 初级会员 发表于 2017-5-21 23:58:30 | 只看该作者
1、嗨,刚测试了一下,收集完的结果都是第5轮的,全部一样,详情见截图1/2
2、测试规则名称:德甲测试点击-002。
举报 使用道具
地板
Fuller 管理员 发表于 2017-5-22 00:16:42 | 只看该作者
zucaidaka001 发表于 2017-5-21 23:58
1、嗨,刚测试了一下,收集完的结果都是第5轮的,全部一样,详情见截图1/2
2、测试规则名称:德甲测试点击- ...

目前是34轮,前面那些轮次(1-24)的数字没有显示出来,所以,连续动作不能设置“模拟点击”,模拟点击只能点看得见的。在高级设置中设置。不要勾“模拟点击”
举报 使用道具
5#
zucaidaka001 初级会员 发表于 2017-5-22 13:02:40 | 只看该作者
1、如果要选择某一年的比赛那?如截图所示配置参数是否正确?
2、如果我想抓取A年到B年之间的数据如何选择?

error-004.png (55.61 KB, 下载次数: 590)

error-004.png
举报 使用道具
6#
xandy 论坛元老 发表于 2017-5-22 14:42:24 | 只看该作者
zucaidaka001 发表于 2017-5-22 13:02
1、如果要选择某一年的比赛那?如截图所示配置参数是否正确?
2、如果我想抓取A年到B年之间的数据如何选择 ...

法一:现在看下拉的选择也就17个,选择不同的赛季,网址都是不同的,直接将这些赛季对应的网址作为线索添加了上面你做好的规则里头采集就行了
法二:在该规则前面增加两个规则,第一个规则完成选择某一个赛季的动作,第二个规则是点击“查看完整赛程”,模拟人的操作将整套动作执行下来,参看教程《连续动作:自动选择下拉菜单采集数据—以知网为例
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-3 11:52