我是用微博采集工具箱中的微博关键词采集工具,用集搜客增强版网络爬虫软件运行采集任务,采集最近1周的微博关键词搜索“英国疫情”,一下子得到了几万条数据。面对这么多数据,怎样做一个快速地分析,了解相关话题有哪些
举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 2020-12-23 22:58

Fuller 管理员 发表于 2020-12-23 18:39:52 | 显示全部楼层
1,如下图,进入分词工具,导入要分析的数据
进入分词工具20201223183238.png

2,选词,可以重点选名词,把排在前面的词选出来,在每页上可以勾“全选”,这样还快,选300以内就够了
选词20201223183334.png

3,生成网络图
生成网络图20201223183415.png

放大看大图
看大图20201223183445.png

4,观察关键词之间的关系,通过这个图可以看到大概的话题关系,可以用来提示你该重点去研究的话题方向。如果有不合适的词,可以到选词那里删除,重新生成话题关系图
举报 使用道具
Fuller 管理员 发表于 2020-12-23 19:51:51 | 显示全部楼层
词云20201223195032.png

看词云图,可以一下子抓取重点话题
举报 使用道具
Dave希泽 初级会员 发表于 2020-12-23 20:08:36 | 显示全部楼层
上面那个词云是怎么来的呀,写论文正需要
举报 使用道具
Fuller 管理员 发表于 2020-12-23 22:58:49 | 显示全部楼层
Dave希泽 发表于 2020-12-23 20:08
上面那个词云是怎么来的呀,写论文正需要

在选词界面上有一个生成词云图的按钮

选词20201223225756.png
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 22:35