在内容分析中,测量包括计数意义单元出现次数,如特定的单词、短语、内容类目和主题。
举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 2020-8-10 11:23

沙发
数据分析小白edu 初级会员 发表于 2020-8-10 10:56:24 | 只看该作者
测量有两个标准方法:
1,使用百分比(或比例)变换以控制文档长度
2,同等计数每个单词或其他意义单位的出现次数
举报 使用道具
板凳
Fuller 管理员 发表于 2020-8-10 11:04:35 | 只看该作者
用集搜客分词和文本分析软件,导入文本内容,导出来就是词频表,如果分析单位是词,对词的测量就能一下子自动完成。集搜客分析软件入口:https://www.gooseeker.com/res/softdetail_13.html
举报 使用道具
地板
数据分析小白edu 初级会员 发表于 2020-8-10 11:05:15 | 只看该作者
使用百分比测量需要注意的四个问题:
1,百分比或比例取值范围有限,且是渐近的,因此所得的测量不是线性的(例如,从5%增加到10%不等于从60%增加到65%)。
2,统计学家已经表明,百分比的均值和方差不是独立的。因此,当比例用作方差分析设计的因变量时,统计学家建议对之进行反正弦函数平方根变换,以保证均值和方差的独立性。
3,不同策略的测量可能银行不同的理论假设。例如,百分比分布可能与一下假设不相符:对世俗主题而非神圣主题的关注随时间而线性增加。
4,分析人员使用的许多统计方法都有对数据分布的前提假设,百分比分布很可能会违背这些假设。例如内容分析数据不太可能是单变量或多变量正态分布。
举报 使用道具
5#
数据分析小白edu 初级会员 发表于 2020-8-10 11:23:52 | 只看该作者
同等计数出现次数。同等计数每个给定语义单位的出现次数的标准化做法会产生两个不同的问题。
1,归入某一既定类目中的每个单词可能不会以同等程度反映该类目。
2,与开头对某一类目或主题的提及相比,后续的提及可能需要更多的努力
内容分析中的策略程序基于语义上等价的文本单位(例如单词、词义、短语、议题或主题)的频次技术,称为类目内涵等价。
类目内涵等价的文本单位除了具有明确的或基本的含义之外,还表示或暗示某些确定的含义观念等。例如,奖金和津贴都会归入同一类目下,因为它们具有共同的含义,即经济事务。

举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-26 07:27