微博内容分词和选词后建立LDA主题模型

Fuller 于 2024-7-16 10:28 发表 [复制链接] [只看楼主] [打印] [上一主题] [下一主题]

在《微博内容分词后怎样用JupyterNotebook做LDA主题模型分析》那篇notebook中，我们以微博上甘肃马拉松事件相关的微博实验了怎样用Python做LDA主题分析。最后观察分析出来的主题似乎不太容易分辨。本Jupyter Notebook想做一个对比实验，先使用GooSeeker分词和文本分析软件的选词功能，手工选择含义比较明确的词，然后导出选词匹配表。这相当于人工做了降维，对比主题分析的效果，效果肯定是有的，但是怎样手工选词效果最好，还需要实验观察，本文末尾做了一些总结和思考。

点击下载notebook源代码：

本帖子中包含更多资源

您需要登录才可以下载或查看，没有帐号？立即注册

x

转播

支持

反对

举报使用道具

| 回复

共 0 个关于本帖的回复最后回复于 2024-7-16 10:28

返回列表

精彩推荐

在什么情况下使用弹窗模式和回退功能？
爬网址做层级采集——以当当商品爬虫为例
网络爬虫采集列表数据
UMAP的min_dist参数有什么作用？
UMAP的n_neighbors参数有什么作用？

微博内容分词和选词后建立LDA主题模型

本帖子中包含更多资源

共 0 个关于本帖的回复最后回复于 2024-7-16 10:28

推荐板块

精彩推荐

热门话题

热门用户

	B Color Image Link Quote Code Smilies 高级模式您需要登录后才可以回帖登录 \| 立即注册回帖并转播回帖后跳转到最后一页

微博内容分词和选词后建立LDA主题模型

本帖子中包含更多资源

共 0 个关于本帖的回复 最后回复于 2024-7-16 10:28

推荐板块

精彩推荐

热门话题

热门用户

共 0 个关于本帖的回复最后回复于 2024-7-16 10:28