集搜客GooSeeker网络爬虫
标题:
微博内容分词后建立LDA主题模型
[打印本页]
作者:
Fuller
时间:
2024-7-16 10:23
标题:
微博内容分词后建立LDA主题模型
本Jupyter Notebook使用
GooSeeker分词和文本分析软件
生成的分词效果表,对数据进行基本处理后,调用Gensim库做LDA分析。
点击下载notebook源代码:[attach]16222[/attach]
第二版于2021-10-16发布,增加了清洗空数据的步骤:[attach]16223[/attach]
欢迎光临 集搜客GooSeeker网络爬虫 (https://www.gooseeker.com/doc/)
Powered by Discuz! X3.2