31#
Healerxy 中级会员 发表于 2017-9-17 14:24:14 | 只看该作者
Fuller 发表于 2017-9-17 11:55
以前是这样的,等一段时间会变好,不过我好久没有爬京东评论了,现在不知道怎样。Python这些方法没有试过 ...

根据您以前的经验大概要等多久呢?
最近有个项目急需这些数据
举报 使用道具
32#
bowieD 金牌会员 发表于 2017-9-18 09:57:08 | 只看该作者
你的第一级规则京东零食_详情,不要同时映射两个页面下的内容。
举报 使用道具
33#
Healerxy 中级会员 发表于 2017-9-18 11:40:40 | 只看该作者
bowieD 发表于 2017-9-18 09:57
你的第一级规则京东零食_详情,不要同时映射两个页面下的内容。

什么意思?
举报 使用道具
34#
bowieD 金牌会员 发表于 2017-9-18 12:11:39 | 只看该作者
你还需要做一个一级规则去模拟点击“商品评价”,因为页面加载进去默认是在"商品介绍"页面.
举报 使用道具
35#
Healerxy 中级会员 发表于 2017-9-18 13:37:09 | 只看该作者
bowieD 发表于 2017-9-18 12:11
你还需要做一个一级规则去模拟点击“商品评价”,因为页面加载进去默认是在"商品介绍"页面. ...

屏幕滚动到下面就会自动加载出商品评价啊,还需要模拟点击吗?
举报 使用道具
36#
bowieD 金牌会员 发表于 2017-9-18 14:14:26 | 只看该作者
那就不需要了
举报 使用道具
37#
Healerxy 中级会员 发表于 2017-9-18 15:35:25 | 只看该作者

所以您知道爬取评论最多只有100页是什么原因吗?
举报 使用道具
38#
bowieD 金牌会员 发表于 2017-9-18 15:53:22 | 只看该作者
规则是没有问题的,这个网页的评论一共就只有一百页。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 怎样让GooSeeker分词工具使用宋体画词云图
  • 使用BERTopic时遇到的c-TF-IDF是什么?
  • gooseeker分词工具的命名实体识别和词形还
  • 怎样设置LDA模型的超参数alpha(α)和beta(
  • LDA主题分析模型到底是什么?

热门用户

GMT+8, 2026-5-31 01:54