采集网址:http://vip.win007.com/AsianOdds_n.aspx?id=1258383使用样例复制采集数据,发现相邻两条数据RT节点间有多余RT,样例复制采集数据不对,求高人指点下这样的情况怎么做可以?小白谢过...

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
| 回复

共 7 个关于本帖的回复 最后回复于 2017-5-9 15:16

沙发
Fuller 管理员 发表于 2017-5-8 09:06:15 | 只看该作者
你存一下规则,我才能帮你诊断,我现在搜不到你的规则。

中间插入不想要的TR也没有关系,照样用第一和第二条做样例复制
举报 使用道具
板凳
hhyyq6 初级会员 发表于 2017-5-9 09:04:54 | 只看该作者
Fuller 发表于 2017-5-8 09:06
你存一下规则,我才能帮你诊断,我现在搜不到你的规则。

中间插入不想要的TR也没有关系,照样用第一和第二 ...

您好!请问我只要在客户端存规则就可以吗?还是要把规则附上来?谢谢

举报 使用道具
地板
hhyyq6 初级会员 发表于 2017-5-9 09:20:26 | 只看该作者
hhyyq6 发表于 2017-5-9 09:04
您好!请问我只要在客户端存规则就可以吗?还是要把规则附上来?谢谢

...

规则已存,麻烦您指点下

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
5#
hhyyq6 初级会员 发表于 2017-5-9 09:21:23 | 只看该作者
Fuller 发表于 2017-5-8 09:06
你存一下规则,我才能帮你诊断,我现在搜不到你的规则。

中间插入不想要的TR也没有关系,照样用第一和第二 ...

规则已存,麻烦您指点下

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
6#
Fuller 管理员 发表于 2017-5-9 10:02:05 | 只看该作者


你基本上都做对了,我做了如下改进,注意看三个红框
1,样例复制照样用第二个和第三个TR做映射,虽然第三个TR是没有内容的行,但是不能跳,一跳就会发生内容跳行
2,我用TD下的text做内容映射,只用直观标注不够精度,要用内容映射。内容映射的时候,可以精选某个DOM节点。我选用了TD下的text,这样,即使用第三个TR做样例复制,但是,第三个TR没有内容,所以,TD下没有text,就会被滤除
3,我为“公司”勾选了关键内容,那么凡是没有内容的,就不会采集

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
7#
hhyyq6 初级会员 发表于 2017-5-9 15:15:54 | 只看该作者
非常感谢...我学着试试看
举报 使用道具
8#
hhyyq6 初级会员 发表于 2017-5-9 15:16:36 | 只看该作者
Fuller 发表于 2017-5-9 10:02
你基本上都做对了,我做了如下改进,注意看三个红框
1,样例复制照样用第二个和第三个TR做映射,虽然第三 ...

非常的感谢...我学着试试..
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 360或火绒等杀毒软件导致GooSeeker爬虫软件
  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反

热门用户

GMT+8, 2025-5-5 08:23