携程网实际搜索到酒店数量为一万三千多,但爬取得到的数据仅有一千二百多个,两者相差巨大,该如何解决这个问题。 图片有显示

92081761137754_.pic.jpg (167.43 KB, 下载次数: 143)

92081761137754_.pic.jpg

92091761137906_.pic.jpg (626.81 KB, 下载次数: 151)

92091761137906_.pic.jpg
举报 使用道具
| 回复

共 5 个关于本帖的回复 最后回复于 2025-10-24 21:50

沙发
Fuller 管理员 发表于 2025-10-22 21:46:37 | 只看该作者
虽然显示的数量是13090,但是向下滚屏到1000左右的时候,网页就不会显示更多酒店了。这是Ctrip网站本身的限制。
举报 使用道具
板凳
xiaolan913 高级会员 发表于 2025-10-23 21:12:12 | 只看该作者
Fuller 发表于 2025-10-22 21:46
虽然显示的数量是13090,但是向下滚屏到1000左右的时候,网页就不会显示更多酒店了。这是Ctrip网站本身的限 ...

那上海就可以爬到3000+的酒店数呢?是每个城市列表限制数量不一样吗?
举报 使用道具
地板
Fuller 管理员 发表于 2025-10-23 21:23:05 | 只看该作者
去重后有多少?一般是一个范围,采集的时候,可以观察一下。
而且一直这样访问ctrip,能显示的数量会越来越少。
举报 使用道具
5#
xiaolan913 高级会员 发表于 2025-10-24 16:11:17 | 只看该作者
Fuller 发表于 2025-10-23 21:23
去重后有多少?一般是一个范围,采集的时候,可以观察一下。
而且一直这样访问ctrip,能显示的数量会越来越 ...

北京去重1000上海去重3000,范围这么大吗?
举报 使用道具
6#
Fuller 管理员 发表于 2025-10-24 21:50:36 | 只看该作者
不同的城市可能数目不太一样。采集的时候观察一下,网页上显示没有更多酒店了,采集就结束了。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • GooSeeker分词软件的tf-idf算法和特征词选
  • 边表格式和矩阵格式的共词矩阵表有什么区别
  • GooSeeker分词、情感分析和文本分析平台简
  • 聚类分析和主题分析中的特征选择参数的设置
  • 为集搜客分词和情感分析扩展模块安装情感分

热门用户

GMT+8, 2026-3-11 09:28