本帖最后由 ym 于 2017-1-19 11:52 编辑

常见问题 > 制作规则—常见问题导航 > 采集图片 > 图片下载失败,文件为空,怎么解决

针对有些网页里面的img标签的src内容是一个相对路径,如:/UploadFiles/YTDT/2017/1/201701101631205820.jpg,这个内容可以获取到,但是图片却保存不了。
地址:http://www.shanghaiballet.com/zh/xwzx_ytdt.aspx,这个网页里面的列表中的图片,都是这个样子的。请问如何才能下载这些列表中的图片。

举报 使用道具
| 回复

共 2 个关于本帖的回复 最后回复于 2017-1-17 09:45

zhonglanyy 初级会员 发表于 2017-1-16 23:25:47 | 显示全部楼层
主题名称为:shanghaiballet_news_001
举报 使用道具
ym 版主 发表于 2017-1-17 09:45:58 | 显示全部楼层
本帖最后由 ym 于 2017-1-17 09:47 编辑

image标签的高级设置只需勾文本内容,不要勾网页片段和图片网址,因为你只映射了@src节点,勾上网页片段就输出错误的图片网址信息<image src="/UploadFiles/YTDT/2017/1/201701101134473128.jpg"/>,所以才会下载图片失败。正确的设置如下图:
QQ截图20170117094248.png
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-28 22:17