就是之前我跑了一批关键词,但是后来觉得那些关键词不好,于是全部删除,换了一批关键词跑。然后现在导出的产品信息,根据导出的图片信息,我根本找不到对应的。新跑的关键词图片我都集中到一个文件夹了,根本找不到对应的图片!怎么办?


举报 使用道具
| 回复

共 6 个关于本帖的回复 最后回复于 2016-11-2 14:11

沙发
xandy 论坛元老 发表于 2016-11-2 10:45:44 | 只看该作者
actionvalue是记录关键词的字段,你可以根据actionvalue值对应的图片信息去匹配你导出的图片
举报 使用道具
板凳
优衣布 中级会员 发表于 2016-11-2 10:53:18 | 只看该作者
xandy 发表于 2016-11-2 10:45
actionvalue是记录关键词的字段,你可以根据actionvalue值对应的图片信息去匹配你导出的图片 ...

我现在在旧的关键词图片中,找到对应的图片,怎么才能在数据管理中导出现在关键词在跑的信息呢?



举报 使用道具
地板
Fuller 管理员 发表于 2016-11-2 11:06:41 | 只看该作者
优衣布 发表于 2016-11-2 10:53
我现在在旧的关键词图片中,找到对应的图片,怎么才能在数据管理中导出现在关键词在跑的信息呢?

你是抓取网页内容的时候同时下载了图片?

在抓取结果文件中,凡是下载图片的,都自动产生了一个字段 xxxx_bitmap,表示图片存在什么位置。如果你的图片没有移动的话,这个字段的值就会用来找到存储位置。

如果把图片都集中到一个文件夹了,正确的做法应该同时修改这个字段,确保能够找到存储位置。

移到同一个文件夹有严重问题:万一图片文件名字都是一样的,就互相覆盖了。

这种情况很常见,即使在同一个网页上,有些网页给图片起了一样的名字,所以,DS打数机存图片的时候,给图片名前面自动加了一个编号。用来区分的。但是,你把图片都集中在一起,这个编号也失效了
举报 使用道具
5#
优衣布 中级会员 发表于 2016-11-2 11:18:55 | 只看该作者
Fuller 发表于 2016-11-2 11:06
你是抓取网页内容的时候同时下载了图片?

在抓取结果文件中,凡是下载图片的,都自动产生了一个字段 xxx ...

不是,导出来的图片都是有文件夹,我并没有改文件夹的名称,我只是把所有的图片文件夹汇集到一起了。现在的问题是数据管理导出的是我之前关键词的信息,并不是现在关键词所跑的信息,因为我在之前关键词跑的图片找到对应的了!现在的问题是,我想数据管理中导出现在关键词所跑的!
举报 使用道具
6#
scraper 论坛元老 发表于 2016-11-2 11:28:15 | 只看该作者
那你找到新关键词的采集结果 然后匹配图片
所以你现在是分不清哪些结果是旧关键词 哪些是新关键词?
举报 使用道具
7#
Fuller 管理员 发表于 2016-11-2 14:11:53 | 只看该作者
数据表中有createdate字段,记录采集时间,可以根据这个判断哪些是新的
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-6 02:41