QQ图片20180921153152.png
测试和爬取数据都是出现最后四个详情链接空缺,包括加进去的线索爬取数据都是少最后四个
举报 使用道具
| 回复

共 5 个关于本帖的回复 最后回复于 2018-9-25 14:48

langjunlan 初级会员 发表于 2018-9-21 15:44:45 | 显示全部楼层
主题名:
汽车苏宁列表_0920
举报 使用道具
langjunlan 初级会员 发表于 2018-9-21 15:53:51 | 显示全部楼层
QQ图片20180921154630.png QQ图片20180921154709.png
在写规则测试,关键词能出来,通过打数机采数,关键词有空缺了,两图对比如下,
举报 使用道具
langjunlan 初级会员 发表于 2018-9-21 15:55:16 | 显示全部楼层
QQ图片20180921155155.png
添加的一起跑的线索,店铺名称和关键词都空缺,
不知道原因在哪里,求教
举报 使用道具
Fuller 管理员 发表于 2018-9-21 16:50:00 | 显示全部楼层
把店铺名称和关键词两个抓取内容删除,这样可以大大提高规则的精准度,因为这个整理箱对应的网页块变小了,变精准了。

这两个信息没有必要在规则中采集,因为url中都含有了
举报 使用道具
langjunlan 初级会员 发表于 2018-9-25 14:48:42 | 显示全部楼层
恩,已经可以了
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-28 18:51