1、采集URL地址,为后续采集建立线索(产品页URL)
2、根据线索,采集产品信息
我现在要采集产品评论,这个线索怎么来?是做第三层么?


举报 使用道具
| 回复

共 5 个关于本帖的回复 最后回复于 2016-12-5 22:20

沙发
quyixuan 金牌会员 发表于 2016-12-5 15:13:05 | 只看该作者
评论有独立网址就再做一个下级线索 没有就做模拟点击
举报 使用道具
板凳
七月等 中级会员 发表于 2016-12-5 15:13:22 | 只看该作者
quyixuan 发表于 2016-12-5 15:13
评论有独立网址就再做一个下级线索 没有就做模拟点击

没有独立网址
如果做模拟点击,是不是要把评论和产品信息放到一起?


举报 使用道具
地板
quyixuan 金牌会员 发表于 2016-12-5 15:13:40 | 只看该作者
本帖最后由 quyixuan 于 2016-12-5 15:17 编辑
七月等 发表于 2016-12-5 15:13
没有独立网址
如果做模拟点击,是不是要把评论和产品信息放到一起?

去看模拟点击的教程
http://www.gooseeker.com/doc/article-234-1.html

举报 使用道具
5#
Fuller 管理员 发表于 2016-12-5 22:18:45 | 只看该作者
quyixuan 发表于 2016-12-5 15:13
去看模拟点击的教程
http://www.gooseeker.com/doc/article-234-1.html

用连续动作采集评论这个方案是不合适的,连续动作里面的点击是为了连续地点击很多次,而这个只需要点击一次。这个模式是一个很典型的固定模式,有个专门的教程《模拟点击切换另一个标签窗口采集数据》,专门讲怎样采集商品评论
举报 使用道具
6#
Fuller 管理员 发表于 2016-12-5 22:20:08 | 只看该作者
还可以参看这个帖子《三级规则采集天猫的商品评论
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-29 16:35