1 8983

如何采集部分内容?

gracewlh 于 2020-2-20 15:15 发表 [复制链接]
任务名: lh产品链接采集
页面上 file:///C:\Users\Administrator\AppData\Roaming\Tencent\Users\252950693\QQ\WinTemp\RichOle\TGQF@@Y}OCWP]{@Z9TLDYW9.pngfile:///C:\Users\Administrator\AppData\Roaming\Tencent\Users\252950693\QQ\WinTemp\RichOle\TGQF@@Y}OCWP]{@Z9TLDYW9.png
Last sold Grinding machines这一行只上面部分的产品信息?
TGQF@@Y}OCWP]{@Z9TLDYW9.png
举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2020-2-20 16:08

Fuller 管理员 发表于 2020-2-20 16:08:00 | 显示全部楼层
我加载你的规则,看到采集的对,那行字上面的就两行产品。

为了实现这样的目的,可以用定位标志映射划定一个范围。上面那两行产品都在一个div下,这个div有个独特的@id,可以用来做定位标志映射。比如,看这个教程:https://www.gooseeker.com/doc/article-344-1.html

把这个定位标志映射给整理箱最顶层节点。如果还要做样例复制映射,那么可以再建一层整理箱,最外边一层做定位标志映射,里面一层做样例复制映射,再往里就是抓取内容。

抓取3个产品的链接可以用样例复制映射,而不是创建3个抓取内容

样例20200220160739.png
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 01:21