11#
LPG123 初级会员 发表于 2018-5-14 16:38:42 | 只看该作者

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
12#
LPG123 初级会员 发表于 2018-5-14 16:45:36 | 只看该作者
还没有保存
马上
举报 使用道具
13#
LPG123 初级会员 发表于 2018-5-14 16:45:49 | 只看该作者
好了
举报 使用道具
14#
LPG123 初级会员 发表于 2018-5-14 16:46:21 | 只看该作者
描述我做好了,图片的title采集不出来
举报 使用道具
15#
bowieD 金牌会员 发表于 2018-5-14 16:53:09 | 只看该作者
LPG123 发表于 2018-5-14 16:46
描述我做好了,图片的title采集不出来

1、加载进去规则报错了,报错的是产品详情整理箱的内容,给产品详情整理箱的抓取内容重新做一下内容映射

2、图片的title采集,把定位方式改成绝对定位就可以了

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
16#
LPG123 初级会员 发表于 2018-5-14 17:38:07 | 只看该作者
不能用绝对的,这个只是一个产品,我要采集好多产品的
举报 使用道具
17#
bowieD 金牌会员 发表于 2018-5-14 17:49:26 | 只看该作者
LPG123 发表于 2018-5-14 17:38
不能用绝对的,这个只是一个产品,我要采集好多产品的

照着说的修改就可以了
举报 使用道具
18#
LPG123 初级会员 发表于 2018-5-14 22:22:53 | 只看该作者
绝对定位只能够采集本产品的Size和color,不能采集其他的产品,速卖通产品采集3规则
举报 使用道具
19#
Fuller 管理员 发表于 2018-5-15 09:14:14 | 只看该作者
LPG123 发表于 2018-5-14 22:22
绝对定位只能够采集本产品的Size和color,不能采集其他的产品,速卖通产品采集3规则 ...



网页结构方面,有些来自于网站模板,是固定的,可以用来做采集规则,有些内容是每个编辑自己写的,不能用来做采集规则,因为每个网页都会不一样。我认为只有红框那个DIV是这个网站模板中的,其他都是店家自己写的。在这种情况下,如果要自定义xpath,定位到红框中的那个DIV就行了,用XPath把这个DIV中的所有文本提取出来,要么在采集规则中用函数截取内容,要么导入到excel中后,用excel函数截取内容。我倾向于后者,因为excel更灵活。而且这样的采集规则会很简单,适应性很高。也就是说用红框中的那个div做内容映射,把一个商品的所有详情文字都采集下来

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
20#
bowieD 金牌会员 发表于 2018-5-15 09:45:35 | 只看该作者
LPG123 发表于 2018-5-14 22:22
绝对定位只能够采集本产品的Size和color,不能采集其他的产品,速卖通产品采集3规则 ...

采集不了其他产品不是绝对定位的原因,是因为不能产品的网页结构不一样,规则不能适应,需要自定义xpath去给每个抓取字段定位
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 360或火绒等杀毒软件导致GooSeeker爬虫软件
  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反

热门用户

GMT+8, 2025-5-14 16:16