做了两级规则,第一级在淘宝宝贝详情页上点击“累计评价”,然后进入第二级抓取评价内容,但是,第二级不生成结果文件
举报 使用道具
| 回复

共 2 个关于本帖的回复 最后回复于 2018-4-2 08:52

沙发
Fuller 管理员 发表于 2016-3-17 21:37:25 | 只看该作者
主要是在第一级上,点击“累计评价”没有点准

看上图,篮框内,没有勾选“完全匹配”,这个做法是对的。


但是,少了一步,要把红框所示的文字前后的空格都删除,一个网页上可能有10个空格,也可能是6个空格,你是看不清楚的,只要网页上与规则中的空格数量对不上,就匹配不到。既然不用“完全匹配”,那么只保留最关键的标志就行了,把前后空格都删除。


再点查看按钮,得到的xpath就不会像红框中的那么怪异了

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
板凳
maomao 论坛元老 发表于 2018-4-2 08:52:42 | 只看该作者
现在采集淘宝评论,用Gooseeker数据DIY,更方便快捷,输入商品网址,就可以采集了。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • gooseeker分词工具的命名实体识别和词形还
  • 怎样设置LDA模型的超参数alpha(α)和beta(
  • LDA主题分析模型到底是什么?
  • top2vec话题发现原理和使用方法
  • 将文本聚类和LDA分析模块安装在数据盘上的

热门用户

GMT+8, 2026-4-30 11:49