规则名:ipcrainpat
麻烦帮我看一下:ipc.rainpat.com这个网页我为什么不能从H项开始采集?谢谢



举报 使用道具
| 回复

共 14 个关于本帖的回复 最后回复于 2017-6-6 18:13

沙发
wangyong 版主 发表于 2017-6-5 11:17:25 | 只看该作者
从H项开始采连续动作的xpath需要直接定位到H项的节点
xpath:
  1. //*[@class='datagrid-btable']/tbody/tr[8]/td[1]/div/span[1]
复制代码


举报 使用道具
板凳
hblemon2008 高级会员 发表于 2017-6-5 11:49:35 | 只看该作者
不是用连续动作吗?
定位表达式为://*[@class='tree-hit tree-collapsed' or @class='tree-hit tree-expanded'],然后在高级设置里把起点设置为8,跨度设置为1
举报 使用道具
地板
wangyong 版主 发表于 2017-6-5 11:55:07 | 只看该作者
这样点不到H节点?
举报 使用道具
5#
hblemon2008 高级会员 发表于 2017-6-5 13:57:36 | 只看该作者
只能点开H节点,然后就不再继续,采集完成
举报 使用道具
6#
wangyong 版主 发表于 2017-6-5 14:00:03 | 只看该作者
继续是想让爬虫继续做什么?
举报 使用道具
7#
hblemon2008 高级会员 发表于 2017-6-5 14:33:06 | 只看该作者
继续点开下面的节点,然后依次采集
举报 使用道具
8#
wangyong 版主 发表于 2017-6-5 14:41:24 | 只看该作者
做下面节点的点击动作,动作规则和采集规则要分两个规则参看教程:《设计连续动作流程》
举报 使用道具
9#
hblemon2008 高级会员 发表于 2017-6-5 14:54:33 | 只看该作者
我前面的A至G类都用连续动作采集成功了
举报 使用道具
10#
hblemon2008 高级会员 发表于 2017-6-6 09:36:02 | 只看该作者
因为从A至H每一类的采集量都很大,不分类采集的话,首先有可能数据漏采集,另外采集的速度会随着采集量的增大而越来越慢,还有其他的解决方案吗?
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 为什么用微软的excel无法打开xls文件?powe
  • 360或火绒等杀毒软件导致GooSeeker爬虫软件
  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法

热门用户

GMT+8, 2025-6-19 16:46