多层级抓取中以评论链接作为第三级主题,如果一些产品没有评价,怎么处理?
举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 2017-5-7 12:15

沙发
Fuller 管理员 发表于 2017-5-7 11:18:19 | 只看该作者
没有评价的网页上一定会有什么标志,比如,一句说明没有评价的话。那么就做一个同主题名的规则,规则编号不同。这个规则专门针对这句话定义一个抓取内容。那么DS打数机运行的时候就能自动选择规则。

你可以把主题名贴出来帮你诊断一下
举报 使用道具
板凳
xiaoshi123 新手上路 发表于 2017-5-7 11:25:41 | 只看该作者
那么就做一个同主题名的规则,规则编号不同。这个怎么操作?
举报 使用道具
地板
xiaoshi123 新手上路 发表于 2017-5-7 11:35:27 | 只看该作者
Fuller 发表于 2017-5-7 11:18
没有评价的网页上一定会有什么标志,比如,一句说明没有评价的话。那么就做一个同主题名的规则,规则编号不 ...

那么就做一个同主题名的规则,规则编号不同。这个怎么操作?
亚马逊枕套1--亚马逊枕套1详情--亚马逊枕套1详情评论  。有些详情里没有评价链接,三级线索爬数据一直显示匹配失败。

举报 使用道具
5#
Fuller 管理员 发表于 2017-5-7 12:15:26 | 只看该作者
xiaoshi123 发表于 2017-5-7 11:35
那么就做一个同主题名的规则,规则编号不同。这个怎么操作?
亚马逊枕套1--亚马逊枕套1详情--亚马逊枕套1 ...



第二个红框里面填写规则编号,比如,规则_1, 规则_2
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-20 20:42