网页已经附件上传

1.png (35.17 KB, 下载次数: 739)

1.png

桌面.zip

1.02 MB, 下载次数: 2

桌面.zip

1.02 MB, 下载次数: 0

举报 使用道具
| 回复

共 13 个关于本帖的回复 最后回复于 2020-7-3 17:23

沙发
ykmbllw 初级会员 发表于 2020-7-3 09:47:56 | 只看该作者
XPATH定位     ://*[@class='next-tabs-tabpane']/div[position()=2]/div[position()=2]/div/table/tbody/tr/td[position()=3]<context>//*[@id='J_autoHeight']</context>      所有数据在同一个字段里面  如何做  样例复制
举报 使用道具
板凳
Fuller 管理员 发表于 2020-7-3 10:05:27 | 只看该作者
你的规则名是什么?

要改写xpath中的 td[position()=3],不能定死在3的位置,要根据某个标志,比如,td中的某个特殊的文字
举报 使用道具
地板
Fuller 管理员 发表于 2020-7-3 10:06:11 | 只看该作者
td中有没有标志性的文字?那样就可以把td[position()=3]变成td[contains(text(), 'xxxx')]
举报 使用道具
5#
ykmbllw 初级会员 发表于 2020-7-3 13:42:48 | 只看该作者
Fuller 发表于 2020-7-3 10:05
你的规则名是什么?

要改写xpath中的 td,不能定死在3的位置,要根据某个标志,比如,td中的某个特殊的文 ...

规则名:订单价格采集      需要账号登入   已经把网页保存  上传到附件中   
举报 使用道具
6#
ykmbllw 初级会员 发表于 2020-7-3 14:09:01 | 只看该作者
Fuller 发表于 2020-7-3 10:06
td中有没有标志性的文字?那样就可以把td变成td[contains(text(), 'xxxx')]

//div[contains(text(),"*")]<context>//*[@id='J_autoHeight']</context>    通过  这个XPATH  可以检索到 所有  需要采集的  但放入  采集中  采集到的是空白数据
举报 使用道具
7#
Fuller 管理员 发表于 2020-7-3 14:53:44 | 只看该作者
contains(text(),"*") 表示只有含有*,就采集下来。这个条件是不是太宽泛了?

另外,如果使用了样例复制,xpath的开头不能是 // ,否则,采集到的可能都一样。你改成 .// 试试
举报 使用道具
8#
ykmbllw 初级会员 发表于 2020-7-3 15:18:38 | 只看该作者
Fuller 发表于 2020-7-3 14:53
contains(text(),"*") 表示只有含有*,就采集下来。这个条件是不是太宽泛了?

另外,如果使用了样例复制, ...

因为 他们的  共同的  内容  就是含有    *    添加.//   数据会空白

//*[@class='next-tabs-content']/div/div[position()=2]/div[position()=2]/div/table/tbody/tr/td/div[contains(text(),'*')]/text()

现在  采集内容能出来     但是  是在同一个字段中   该如何处理

1.png (48.3 KB, 下载次数: 782)

1.png
举报 使用道具
9#
小蜜蜂测试162 高级会员 发表于 2020-7-3 15:43:01 | 只看该作者
ykmbllw 发表于 2020-7-3 15:18
因为 他们的  共同的  内容  就是含有    *    添加.//   数据会空白

//*[@class='next-tabs-content']/ ...

这些数据在网页原始数据中就是都包含在一个text()下?
举报 使用道具
10#
ykmbllw 初级会员 发表于 2020-7-3 15:51:35 | 只看该作者
小蜜蜂测试162 发表于 2020-7-3 15:43
这些数据在网页原始数据中就是都包含在一个text()下?

不是在同一个   TEXT下面   
  路径是   
样例映射1:【宝贝名称://*[@class='next-table-body']/table/tbody/tr(多个)/td[position()=3]/ div/text()<context>//*[@id='J_autoHeight']</context>   
成交价格://*[@class='next-table-body']/table/tbody/tr(多个)/td[position()=5]/ div/text()<context>//*[@id='J_autoHeight']</context>】

样例映射2:【宝贝名称://*[@class='next-table-body']/table/tbody/tr(多个)/td[position()=1]/ div/text()<context>//*[@id='J_autoHeight']</context>   
成交价格://*[@class='next-table-body']/table/tbody/tr(多个)/td[position()=3]/ div/text()<context>//*[@id='J_autoHeight']</context>】


都在    TD这个节点里面   但是   样例1的数据TD 在 3和5     样例2  的数据TD在1和3   使用样例复制 的话    样例2  就会被强制  变成    3和5    导致数据 错误
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-19 21:00