怎么样抓到放大镜的大图呢
举报 使用道具
| 回复

共 12 个关于本帖的回复 最后回复于 2022-2-20 12:01

Fuller 管理员 发表于 2016-1-5 23:17:18 | 显示全部楼层
具体要发一个链接出来研究一下。

根据我的经验,在京东和天猫上,用放大镜显示的大图已经下载下来了,放大镜只是一种展示方式,要在网页上找对相应节点,就能用GooSeeker爬虫的下载图片功能下载下来
举报 使用道具
Fuller 管理员 发表于 2016-1-5 23:28:32 | 显示全部楼层
比如,我们要抓取京东网页上的商品大图,必须首先找到大图在哪里。因为放大镜功能是动态的,鼠标移走就没有了,必须使用冻结页面功能,如下图
抓取大图.png


步骤如下
1)鼠标移到图片上,看到大图,鼠标不要动

2)按alt键,选择文件菜单中的冻结页面,选中后鼠标就可自由活动了
3)鼠标点击大图,可能会提示说需要刷新页面结构,这是因为大图是临时下载的
4)刷新网页结构
5)再次点击大图,就能定位到大图的img节点了

要把它抓下来,也不是那么容易的,必须让鼠标做一次动作:自动悬浮。具体参看连续动作的教程:http://www.gooseeker.com/doc/article-141-1.html
举报 使用道具
Fuller 管理员 发表于 2016-1-5 23:34:37 | 显示全部楼层
下载图的方法:http://www.gooseeker.com/doc/article-116-1.html

GooSeeker爬虫能够下载文字的同时下载图,一次性完成
举报 使用道具
HJLing 版主 发表于 2016-10-31 15:48:55 | 显示全部楼层
本帖最后由 HJLing 于 2016-10-31 16:00 编辑

通常小图的链接带有图片大小的参数 那么直接修改即可
以淘宝为例

第一个小图直接采集下来的图片链接是 //gd1.alicdn.com/imgextra/i3/87589806/TB2kovJqpXXXXXKXXXXXXXXXXXX_!!87589806.jpg_50x50.jpg

后面的50×50就是图片大小 可以在规则通过Xpath去掉那个参数 直接采集//gd1.alicdn.com/imgextra/i3/87589806/TB2kovJqpXXXXXKXXXXXXXXXXXX_!!87589806.jpg

这样采集下来的就是原图

再比如京东
小图链接是://img14.360buyimg.com/n5/s75x75_jfs/t2755/57/1409598575/197491/b56ecad7/573e6c3eNec1a89c4.jpg
大图链接是://img14.360buyimg.com/popWaterMark/jfs/t2755/57/1409598575/197491/b56ecad7/573e6c3eNec1a89c4.jpg
可以比较大小图 带有图片大小的参数75x75 同样也可以通常xpath修改图片链接 这样下载的就是大图



Save
Save
举报 使用道具
ZOE1679 金牌会员 发表于 2017-8-15 17:08:35 | 显示全部楼层
Fuller 发表于 2016-1-5 23:28
比如,我们要抓取京东网页上的商品大图,必须首先找到大图在哪里。因为放大镜功能是动态的,鼠标移走就没有 ...

能不能详细地说一下怎么让鼠标做一次自动悬浮把大图抓下来
举报 使用道具
wangyong 版主 发表于 2017-8-15 17:16:14 | 显示全部楼层
要抓哪个网站?
举报 使用道具
ZOE1679 金牌会员 发表于 2017-8-18 15:01:11 | 显示全部楼层

京东产品的放大镜的图
举报 使用道具
威尔先生 新手上路 发表于 2020-2-5 00:11:56 | 显示全部楼层
请问,故某宫博物馆网站的文物放大图片怎么抓取,似乎直接抓取的像素还是没有放大镜里的高?
https://digicol.dpm.org.cn/cultural/detail?id=ee375948e11e459ab3f34b0dd4595583
举报 使用道具
Fuller 管理员 发表于 2020-2-5 08:51:41 | 显示全部楼层
威尔先生 发表于 2020-2-5 00:11
请问,故某宫博物馆网站的文物放大图片怎么抓取,似乎直接抓取的像素还是没有放大镜里的高?
https://digic ...

主要是找到图片的网址。但是有些放大镜技术好像找不到图片网址
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-13 02:29