11#
ykmbllw 初级会员 发表于 2020-7-3 15:52:21 | 只看该作者
小蜜蜂测试162 发表于 2020-7-3 15:43
这些数据在网页原始数据中就是都包含在一个text()下?

使用XPATH    符合的都被采集到 一个字段中了
举报 使用道具
12#
Fuller 管理员 发表于 2020-7-3 16:18:32 | 只看该作者
ykmbllw 发表于 2020-7-3 15:51
不是在同一个   TEXT下面   
  路径是   
样例映射1:【宝贝名称://*[@class='next-table-body']/tabl ...

xpath不能写成这样: //*[@class='next-table-body']/table/tbody/tr(多个)/td[position()=5]/ div/text()<context>//*[@id='J_autoHeight']</context>


前面加一个 . 试试
举报 使用道具
13#
ykmbllw 初级会员 发表于 2020-7-3 16:27:00 | 只看该作者
Fuller 发表于 2020-7-3 16:18
xpath不能写成这样: //*[@class='next-table-body']/table/tbody/tr(多个)/td/ div/text()//*[@id='J_au ...

//div/a[contains(text(),'查询')]/../../div[position()=1]   

//*[@class='next-tabs-content']/div/div[position()=2]/div[position()=2]/div/table/tbody/tr/td/div[contains(text(),'*')]/text()



XAPTH 是这样写得  现在数据都有了   但是都在一个字段里面的   如何区分开
举报 使用道具
14#
Fuller 管理员 发表于 2020-7-3 17:23:18 | 只看该作者
ykmbllw 发表于 2020-7-3 16:27
//div/a[contains(text(),'查询')]/../../div   

//*[@class='next-tabs-content']/div/div/div/div/ta ...

xpath最前面加个 . 号
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-26 04:08