集搜客GooSeeker网络爬虫

标题: 微博内容分词后建立LDA主题模型 [打印本页]

作者: Fuller    时间: 2024-7-16 10:23
标题: 微博内容分词后建立LDA主题模型
本Jupyter Notebook使用GooSeeker分词和文本分析软件生成的分词效果表,对数据进行基本处理后,调用Gensim库做LDA分析。

点击下载notebook源代码:[attach]16222[/attach]

第二版于2021-10-16发布,增加了清洗空数据的步骤:[attach]16223[/attach]





欢迎光临 集搜客GooSeeker网络爬虫 (https://www.gooseeker.com/doc/) Powered by Discuz! X3.2