https://car.autohome.com.cn/conf ... tml#pvareaid=102189
这个页面,需要所有型号名称,厂商指导价,是否有车联网
现在取型号是这个样子的
<xsl:template match="//*[@id='config_nav']/table/tbody/tr/td[position()>=1 and count(.//*[@class='carbox']/div/a/text())>0]" mode="polo">
<item>
<型号>
<xsl:value-of select="*//*[@class='carbox']/div/a/text()"/>
<xsl:value-of select="*[@class='carbox']/div/a/text()"/>
<xsl:if test="@class='carbox'">
<xsl:value-of select="div/a/text()"/>
</xsl:if>
</型号>
</item>
</xsl:template>
</xsl:stylesheet>


1. 测试通过,但爬不到数
2. 车联网一栏,有的是“-”,有的是空心圆,分别属于不同的结构,这样如何复制样例?“-”的格子没有空心圆的结构
感谢大家!!!
举报 使用道具
| 回复

共 6 个关于本帖的回复 最后回复于 2020-10-27 16:26

沙发
wangyong 版主 发表于 2020-10-27 14:46:33 | 只看该作者

回帖奖励 +1

规则名是什么?
举报 使用道具
板凳
psydata 中级会员 发表于 2020-10-27 14:49:11 | 只看该作者

大众223
举报 使用道具
地板
psydata 中级会员 发表于 2020-10-27 15:06:56 | 只看该作者

大佬有办法吗呜呜呜,我今天下午就要跑出来这个数
举报 使用道具
5#
wangyong 版主 发表于 2020-10-27 15:27:46 | 只看该作者
psydata 发表于 2020-10-27 15:06
大佬有办法吗呜呜呜,我今天下午就要跑出来这个数

你应该是有多个连接要爬吧?

如果是多个链接,型号和指导价可以放到一个整理箱做样例复制采集下来

要同时采车联网,得定制才行
举报 使用道具
6#
psydata 中级会员 发表于 2020-10-27 15:54:45 | 只看该作者
wangyong 发表于 2020-10-27 15:27
你应该是有多个连接要爬吧?

如果是多个链接,型号和指导价可以放到一个整理箱做样例复制采集下来

单个采集都很好,但是复制样例就出错,采不出来,是什么原因呀
举报 使用道具
7#
wangyong 版主 发表于 2020-10-27 16:26:51 | 只看该作者
psydata 发表于 2020-10-27 15:54
单个采集都很好,但是复制样例就出错,采不出来,是什么原因呀

不同车型的页面结构不同,无法做样例复制
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-20 02:54