1521#
Fuller 管理员 发表于 5 天前 | 只看该作者
L_PBF33 发表于 2026-3-17 19:24
好的,我只有最后一个问题,最多可以采集多少页?

对页数没有限制,看网页上有多少页。据我们的观察,对超话网页来说,几十页之后,网页上的内容大多是重复的。你可以手工翻一翻微博网页,查证一下。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 将文本聚类和LDA分析模块安装在数据盘上的
  • GooSeeker分词软件的tf-idf算法和特征词选
  • 边表格式和矩阵格式的共词矩阵表有什么区别
  • GooSeeker分词、情感分析和文本分析平台简
  • 聚类分析和主题分析中的特征选择参数的设置

热门用户

GMT+8, 2026-3-23 11:23