我有四级线索
1 采集列表产品(包括链接)
2 进入商品详情页采集详情(模拟点击只看当前商品)
3 采集当前商品好评数等(模拟点击时间顺序)
4 按时间顺序采集评价(设置翻页)
规则1 2都正常,但是3 4都只能采集到第一个链接的商品。
任务名分别是:
崔禾实验1
崔禾实验1二级规则
崔禾实验1三级规则_整体评价抓取
崔禾实验1三级规则_只看当前商品评价

希望老师可以帮忙看看,谢谢!


举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2019-11-5 09:20

Fuller 管理员 发表于 2019-11-4 17:20:04 | 显示全部楼层
我加载了第二级规则,看到用一个翻页方式来选择只看当前商品的评价。那么运行的时候,第三级不能单独运行,运行第二级的时候会自动进入第三级和第四级
举报 使用道具
soo_soo067 初级会员 发表于 2019-11-4 19:40:35 | 显示全部楼层
Fuller 发表于 2019-11-4 17:20
我加载了第二级规则,看到用一个翻页方式来选择只看当前商品的评价。那么运行的时候,第三级不能单独运行, ...

对的,是这样的。可只有第一个链接能够自动运行第三第四级。有没有什么解决办法呢?
举报 使用道具
Fuller 管理员 发表于 2019-11-5 09:20:25 | 显示全部楼层
soo_soo067 发表于 2019-11-4 19:40
对的,是这样的。可只有第一个链接能够自动运行第三第四级。有没有什么解决办法呢?
...

我测试了一下,有些链接会采集失败,你在第三级和第四级上,给抓取内容尽量做上定位标志映射,提高规则的适应性,参考这个教程:https://www.gooseeker.com/doc/article-344-1.html
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 10:15