想请问一下,快捷采集可以采集携程选定星级的酒店评论吗?

举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 2020-4-29 15:55

沙发
Fuller 管理员 发表于 2020-4-29 12:25:41 | 只看该作者
在快捷采集里面的规则,通常都不做特殊的筛选。尤其像筛选星级,即使自己做规则,用规则筛选,也不要这样做。比如,翻页采集的时候,假设到第三页,符合星级要求的一条数据都没有,而第四页或者后面的页上都符合要求的。但是,到了第三页,因为符合要求的数据,翻页就中断了。

所以,正确的做法是:把各种星级的内容都采集下来,然后过滤掉不要的。

这个采集一般要分两级:
第一级:把所有星级的酒店网址都采集下来,包括星级这个值。然后把结果导出到excel中,通过排序,把符合星级的网址拷贝出来,添加到第二级
第二级:负责采集评论
举报 使用道具
板凳
蓝霄子Bob 初级会员 发表于 2020-4-29 14:12:36 | 只看该作者
Fuller 发表于 2020-4-29 12:25
在快捷采集里面的规则,通常都不做特殊的筛选。尤其像筛选星级,即使自己做规则,用规则筛选,也不要这样做 ...

好的,太感谢了。
举报 使用道具
地板
蓝霄子Bob 初级会员 发表于 2020-4-29 15:54:11 | 只看该作者
那评论里不同出游类型可以用快捷采集吗?
举报 使用道具
5#
lan_1985 金牌会员 发表于 2020-4-29 15:55:56 | 只看该作者
蓝霄子Bob 发表于 2020-4-29 15:54
那评论里不同出游类型可以用快捷采集吗?

可以爬出来后,下载数据后再筛选的




本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 360或火绒等杀毒软件导致GooSeeker爬虫软件
  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反

热门用户

GMT+8, 2025-5-5 01:32