如图所示,抓取完图片信息后出现图片上这么一堆文件夹,里面的ashx文件修改为jpg格式后出现的是我抓取的图片,可是我怎么用这些文件呢?是和别的规则一样只是把xml文件打包成zip上传还是连同这些文件夹一起打包上传?求大神解答谢谢
举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 2017-3-17 14:15

沙发
liujianyu25571 初级会员 发表于 2017-3-17 11:47:14 | 只看该作者
规则名是  l食品招商02
举报 使用道具
板凳
Fuller 管理员 发表于 2017-3-17 12:14:08 | 只看该作者
liujianyu25571 发表于 2017-3-17 11:47
规则名是  l食品招商02

图片是不能打包发送给服务器的。那些文件件就是存的是真实图片,你可以直接使用。如果不需要图片,那么在采集规则中,在整理箱中不要勾选“下载图片”。由于网页上图片名字不一定是jpg或者png,所以,爬虫原样保留文件名字的时候就会出现那种奇怪的后缀。你使用图片的时候要把他们名字改一下
举报 使用道具
地板
liujianyu25571 初级会员 发表于 2017-3-17 13:12:25 | 只看该作者
Fuller 发表于 2017-3-17 12:14
图片是不能打包发送给服务器的。那些文件件就是存的是真实图片,你可以直接使用。如果不需要图片,那么在 ...

那要是好几千个文件也要一个个改吗...
举报 使用道具
5#
HJLing 版主 发表于 2017-3-17 14:15:51 | 只看该作者
liujianyu25571 发表于 2017-3-17 13:12
那要是好几千个文件也要一个个改吗...

可以批量修改文件后缀名 具体方法可以去百度

举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-29 19:55