11#
18873028857 初级会员 发表于 2016-12-19 16:31:12 | 只看该作者
HJLing 发表于 2016-12-19 16:28
在excel修改的通常是只想在采集结果取出某部分内容 如采下来的是“20条评论” 而只想要20这个数字 或者是 ...

就是不会怎么修改xpath我这是这是这样的,怎么修改,能教我一个吗?

01.png (20.98 KB, 下载次数: 454)

01.png
举报 使用道具
12#
18873028857 初级会员 发表于 2016-12-19 16:32:24 | 只看该作者
18873028857 发表于 2016-12-19 16:31
就是不会怎么修改xpath我这是这是这样的,怎么修改,能教我一个吗?

像这样的只要会改一次,以后这类的都是这模式改,是吗?

举报 使用道具
13#
18873028857 初级会员 发表于 2016-12-19 16:37:12 | 只看该作者
HJLing 发表于 2016-12-19 16:30
对下面的小图做样例复制就能采多个图片了

那只是做小图样例复制,但做不了大图的样例复制,位置不一样,是网页的一个内部程序生成的大图,只有一张
举报 使用道具
14#
HJLing 版主 发表于 2016-12-19 16:51:33 | 只看该作者
18873028857 发表于 2016-12-19 16:37
那只是做小图样例复制,但做不了大图的样例复制,位置不一样,是网页的一个内部程序生成的大图,只有一张 ...

你对小图做样例复制 就把全部小图的链接都采下来了 再自定义xpath 就可以把全部小图对应的大图给采下来了

举报 使用道具
15#
18873028857 初级会员 发表于 2016-12-19 16:59:53 | 只看该作者
HJLing 发表于 2016-12-19 16:51
你对小图做样例复制 就把全部小图的链接都采下来了 再自定义xpath 就可以把全部小图对应的大图给采下来了 ...

能再说详细点吗?我很笨的,谢谢了

举报 使用道具
16#
HJLing 版主 发表于 2016-12-19 17:45:09 | 只看该作者
18873028857 发表于 2016-12-19 16:59
能再说详细点吗?我很笨的,谢谢了


测试结果 图片地址已经没有带参数了 这样下载的就是大图


举报 使用道具
17#
18873028857 初级会员 发表于 2016-12-20 12:10:05 | 只看该作者
HJLing 发表于 2016-12-19 17:45
测试结果 图片地址已经没有带参数了 这样下载的就是大图

如果图片文件的目录是这样的,怎么与这个公式呢?
/html/body/div[position()=5]/div/div[position()=3]/div[position()=1]/div[position()=1]/div[position()=1]/div/div[position()=1]/div[position()=1]/ul/li[position()=1]/div/a/img/@src
最后面多了/div 真不会定这个位了


举报 使用道具
18#
18873028857 初级会员 发表于 2016-12-20 12:37:46 | 只看该作者
18873028857 发表于 2016-12-20 12:10
如果图片文件的目录是这样的,怎么与这个公式呢?
/html/body/div/div/div/div/div/div/div/div/div/ul/l ...

解决了,定位找的目录不对,这类问题终于学会了,忠心谢谢你
举报 使用道具
19#
1866905838 初级会员 发表于 2017-2-25 18:21:12 | 只看该作者
zm_mark_one 发表于 2016-12-15 10:45
搞定了。concat(substring-before(//*[@class='WB_pic li_5 S_bg1 S_line2 bigcursor']/img/@src,'thumb150 ...

能仔细说下这个应用吗?

举报 使用道具
20#
Fuller 管理员 发表于 2017-2-25 18:33:58 | 只看该作者
1866905838 发表于 2017-2-25 18:21
能仔细说下这个应用吗?

下载图片的基本教程是《采集图片网址并下载图片——以途牛旅游网为例
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-25 16:56