本帖最后由 18144357751 于 2017-6-28 17:32 编辑

类似淘宝的一个独立商城在采集宝贝主图时候大图是458*458的
<img class="img-responsive" alt="CSmall Gift 925银立方氧化锆耳环 生日石系列" src="//img3.csmall.com/product/2017/06/product/458_458/552ab698a65c9.jpg" style="visibility: visible;">
小图是200*200
<img width="76" height="76" alt="CSmall Gift 925银立方氧化锆耳环 生日石系列" src="//img3.csmall.com/product/2017/06/product/200_200/552ab680d78ae.jpg">

小白不会xpath 大神能指点下吗
concat(substring-before(//*[@class='cur']/img/@src,'200_200'),'800_800',substring-after(//*[@class='cur']/img/@src,'200_200'))上面已解决
——————————————————————————分割线————————————————————————————————————


做了上面的自定义xpath之后,全部下载成第一张 求解决办法
<列>
                                        <item>
                                                <小图网址>//img3.csmall.com/product/2017/06/product/800_800/552ab6887c97e.jpg</小图网址>
                                        </item>
                                        <item>
                                                <小图网址>//img3.csmall.com/product/2017/06/product/800_800/552ab6887c97e.jpg</小图网址>
                                        </item>
                                        <item>
                                                <小图网址>//img3.csmall.com/product/2017/06/product/800_800/552ab6887c97e.jpg</小图网址>
                                        </item>
                                        <item>
                                                <小图网址>//img3.csmall.com/product/2017/06/product/800_800/552ab6887c97e.jpg</小图网址>
                                        </item>
                                        <item>
                                                <小图网址>//img3.csmall.com/product/2017/06/product/800_800/552ab6887c97e.jpg</小图网址>


举报 使用道具
| 回复

共 7 个关于本帖的回复 最后回复于 2017-7-4 10:08

沙发
shengchengx 金牌会员 发表于 2017-6-28 14:48:37 | 只看该作者

修改一下大小就可以了

举报 使用道具
板凳
18144357751 新手上路 发表于 2017-6-28 15:08:26 | 只看该作者
shengchengx 发表于 2017-6-28 14:48
修改一下大小就可以了

我是批量采集图的,有很多 怎么批量改呢
举报 使用道具
地板
shengchengx 金牌会员 发表于 2017-6-28 15:42:49 | 只看该作者
18144357751 发表于 2017-6-28 15:08
我是批量采集图的,有很多 怎么批量改呢

在Excel中批量替换

举报 使用道具
5#
18144357751 新手上路 发表于 2017-6-28 15:58:02 | 只看该作者

因为根据页面分组保存到不同的文件夹里面去,所以想了解下如果批量更换后怎么处理。还有之前在论坛上看到一篇类似的文章,解决这个问题的。但是小白表示不了解。
http://www.gooseeker.com/doc/thread-3978-1-1.html
举报 使用道具
6#
Hocassian 新手上路 发表于 2017-7-3 12:39:44 | 只看该作者
对啊!!!!!!!!!!!!!!!!!!讲的一点也不清楚嘛!!想坑人直说!!!!!!!!!!操!!!!!!!!
举报 使用道具
7#
wangyong 版主 发表于 2017-7-4 10:05:36 | 只看该作者
18144357751 发表于 2017-6-28 15:58
因为根据页面分组保存到不同的文件夹里面去,所以想了解下如果批量更换后怎么处理。还有之前在论坛上看到 ...

xpath替换成:
  1. concat(substring-before(./img/@src,'200_200'),'800_800',substring-after(./img/@src,'200_200'))
复制代码

举报 使用道具
8#
wangyong 版主 发表于 2017-7-4 10:08:31 | 只看该作者
原来的xpath都下载第一张的原因是没有按照从基点往下写,参看《xpath基础知识》关于基点的介绍
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-20 17:38