本帖最后由 wangyong 于 2017-9-18 10:02 编辑

网页采集 ->  高级视频 -> 自定义XPATH精准采集中国知网(上)



不想看广告?直接下视频
举报 使用道具
| 回复

共 11 个关于本帖的回复 最后回复于 2017-11-16 22:55

沙发
wjzeng 初级会员 发表于 2017-10-31 08:57:45 | 只看该作者
本帖最后由 wjzeng 于 2017-10-31 09:00 编辑

我按照这个视频做了两层规则,可是“提交”动作不起作用啊。运行规则一时,只有“输入”这个动作执行了,但是还未等“提交”动作起作用,规则二就开始爬了,什么原因呢?
举报 使用道具
板凳
数据集 高级会员 发表于 2017-10-31 09:24:00 | 只看该作者
wjzeng 发表于 2017-10-31 08:57
我按照这个视频做了两层规则,可是“提交”动作不起作用啊。运行规则一时,只有“输入”这个动作执行了,但 ...

1,提交动作的xptah写对了吗?如果定位不到“提交”按钮是不会执行这部动作的。
2,第二步点击“提交“要使用提交动作,专门用于点击提交按钮,而不是点击动作。
举报 使用道具
地板
wjzeng 初级会员 发表于 2017-10-31 09:41:23 | 只看该作者
数据集 发表于 2017-10-31 09:24
1,提交动作的xptah写对了吗?如果定位不到“提交”按钮是不会执行这部动作的。
2,第二步点击“提交“要 ...

Xpath我用的是Xpath的显示功能给出的表达式,确定用的是提交操作,但是还是不行。。。
举报 使用道具
5#
数据集 高级会员 发表于 2017-10-31 09:44:31 | 只看该作者
wjzeng 发表于 2017-10-31 09:41
Xpath我用的是Xpath的显示功能给出的表达式,确定用的是提交操作,但是还是不行。。。
...

把xpath贴出来看看,如果提交操作不行,可以试试点击动作。
举报 使用道具
6#
wjzeng 初级会员 发表于 2017-10-31 09:53:28 | 只看该作者
本帖最后由 wjzeng 于 2017-10-31 10:01 编辑

点击动作之前也试过,一样的效果。。。
我在连续动作1里头的高级设置选择了“输入联想”,在连续动作2里头的高级设置选择了延时5s
C:\Users\Administrator\Desktop\信息搜索\信息搜索6\连续动作2

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
7#
数据集 高级会员 发表于 2017-10-31 10:06:10 | 只看该作者
wjzeng 发表于 2017-10-31 09:53
点击动作之前也试过,一样的效果。。。
我在连续动作1里头的高级设置选择了“输入联想”,在连续动作2里头 ...

给动作1设置额外延时
举报 使用道具
8#
wjzeng 初级会员 发表于 2017-10-31 10:41:31 | 只看该作者
数据集 发表于 2017-10-31 10:06
给动作1设置额外延时

还是不行哦。。。想问问您给动作1设置额外延时有什么作用吗?
举报 使用道具
9#
wjzeng 初级会员 发表于 2017-10-31 10:50:23 | 只看该作者
数据集 发表于 2017-10-31 10:06
给动作1设置额外延时

若是在规则一自动输入关键词后,在打数机里头的浏览器页面手动点击“检索”按钮,就能正常抓取,因此我猜测是“提交”动作无效的原因,但是真的不知道具体怎么解决
举报 使用道具
10#
wjzeng 初级会员 发表于 2017-10-31 11:01:52 | 只看该作者
我的问题解决了,开启“全屏采集”功能就好,没有开启的话,打数机找不到“检索”键;详情请看:http://www.gooseeker.com/doc/thread-2602-1-1.html
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-19 22:12