标题:疫情牵动人心,情感支柱几何?——微博情感极性分析
摘要:2020年伊始,新型肺炎疫情给神州大地带来了一场意想不到的风暴,亿万民众都在牵挂与盼望中度过了一个不平凡的假期,我们试图利用微博文本,从情感极性分析的角度看一看这场风暴中普普通通的每一个平凡人在怎么面对这场挑战。
原文链接:https://mp.weixin.qq.com/s/Z6q9v4MsuY3pcQOn0y6D0w

2020-07-27-01.png

举报 使用道具
| 回复

共 2 个关于本帖的回复 最后回复于 2020-7-27 10:35

内容分析应用 金牌会员 发表于 2020-7-27 09:30:02 | 显示全部楼层
原文中关于数据来源的说明:本研究的相关数据均来源与网络,图的数据均选自丁香医生的疫情网站,课题组众多同学对微博数据进行人工标注。
举报 使用道具
Fuller 管理员 发表于 2020-7-27 10:35:31 | 显示全部楼层
内容分析应用 发表于 2020-7-27 09:30
原文中关于数据来源的说明:本研究的相关数据均来源与网络,图的数据均选自丁香医生的疫情网站,课题组众多 ...

上面提到的“数据标注”,另一种更亲民的叫法就是“筛选词语”,参看集搜客分词和文本分析软件的讲解:https://www.gooseeker.com/res/softdetail_13.html

就是人工找出来特征词,属于特征工程的一项内容。特征工程是一项很重要的工作,同时也是很花费人力物力的工作,虽然有一些基于机器学习的方法做这个工作,但是最精确和高效的方法是人工做。

尤其在内容分析领域,样本量是经过精选的,或者基于科学采样得到的,内容分析的重点是解读文本传达的含义,这跟大数据文本挖掘是有区别的。这种场景下,集搜客分词和文本分析软件是最适合的
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-28 21:48