快捷导航
目前我正在尝试使用新闻传播领域的理论方法来分析一些典型媒体上的特定主题,我发现集搜客分词和文本分析软件很好用。在做新闻内容分析的时候,我冒出来一个想法,是不是能在集搜客分析软件的协助下,快速理清楚围绕某个知识点的相关知识,快速定位学习目标。所以,我就选了这么一个题目:在知乎上大家讨论拉斯韦尔的时候都是在说什么 ,想试试用集搜客分词软件是否能协助我快速理出来要进一步学习的知识点

举报 使用道具
| 回复

共 7 个关于本帖的回复 最后回复于 2020-3-2 16:38

Fuller 管理员 发表于 2020-2-24 19:35:17 | 显示全部楼层
要实现你说的目标,首先要获得数据,需要做这些步骤:

第一步:使用 知乎_关键词搜索结果列表 这个快捷采集工具采集含有“拉斯韦尔”这个词的问答

第二步:要对数据做一些简单的过滤,比如,重复内容过滤,excel列的合并,比如,把多个含有文本信息的列合成一个列,放在一个表头列名是“正文”的列中

这个帖子讲解了过滤知乎采集结果的重复数据,因为知乎网页是个瀑布流的,越往下滚动网页越长,前面采集的都是重复的,所以要过滤,参看《采集知乎问答数据以后有哪些处理步骤
举报 使用道具
ym 版主 发表于 2020-2-26 19:16:32 | 显示全部楼层
本帖最后由 ym 于 2020-2-26 19:57 编辑

用拉斯韦尔在知乎上搜索到的问题或专栏文章数据,我会分别对标题、回答内容做内容分析,看看大家通常会讨论哪些内容。首先对其标题做内容分析,具体步骤如下:
1、通过文本分词和分类检索平台,导入标题数据,在分词里筛选出高词频的词语,部分词语没有切分出来,所以需要手工添加补充
QQ截图20200226181747.png

完成选词后,我们可以生成词云图,看到话题的关键词分布情况,而拉斯韦尔作为传播学奠基人之一,讨论他的主要关键词明显与传播学、理论模式、学习传播学等密不可分。
QQ截图20200226174759.png

其次,通过共词分析生成社会网络关系图,如下。可以看到网络图的中心点依然是传播学。
QQ截图20200226182703.png

下载共词矩阵表,可以看到关联较多的词语有哪些、什么、拉斯韦尔、新闻学等。
QQ截图20200226183613.png

具体看看“传播学”关联的词语,主要是与学术代表、学科、模式、学习等相关。
QQ截图20200226174857.png

具体看看“哪些”关联的词语,主要是与比较、评价、学习的词语相关。
QQ截图20200226175157.png

具体看看“拉斯韦尔”关联的词语,主要是与学术代表人物、传播学模式等相关。
QQ截图20200226175411.png

2、选词后,下载选词结果表,并且结合原标题数据,设计分类结构,把整理好的分类结构表导入到“分类管理”中,然后启动分类匹配。
QQ截图20200226181611.png

匹配完成后,在“分类检索”菜单->”关注“里导出分类的匹配结果表,利用excel的数据透视功能,我们可以看到主要讨论类型的占比情况,在”传播学“类别下,主要讨论的是学习方面的内容,在”目的“类别下,主要讨论的是知识介绍的内容。
QQ截图20200226195649.png

而”提问词“类别下,”哪些“、”什么“、“如何”是最常用的提问词。
QQ截图20200226191010.png



举报 使用道具
ym 版主 发表于 2020-2-28 19:30:23 | 显示全部楼层
本帖最后由 ym 于 2020-3-3 09:27 编辑

在知乎上搜索“拉斯韦尔”的回答内容,对回答内容做过滤、去重等处理后一共有1203条数据,通过文本分类和检索平台的“分词选词”或者是“分类检索”来观察与拉斯韦尔相关的词语,整理出来并且分类,然后利用“分类管理”功能,可以把整理好的分类和对应的标签与原数据进行匹配关联。这里的分类主要是根据谈及拉斯韦尔的相关话题,各个话题是由哪些关键词进行区分。
QQ截图20200228192937.png

导出分类的匹配结果表,通过数据透视表,以序号作为行、主题作为列,匹配结果为1表示原数据与主题有对应关系,这样可以看到每条原数据对应的话题有哪些,以及每个话题被提及的数量是多少。
图片2.png

对上面的透视表做进一步统计,在所有回答里有提及拉斯韦尔的回答数是65,占比约为5%。
QQ截图20200303092439.png

其中提及拉斯韦尔时的话题点各有不同,具体可以分为谈论传播学名人、5W传播模式、大众传播、政治、引用著作、三功能说、内容分析法这几类相关话题。

把有无提及拉斯韦尔作为话题的分界线,我们可以统计到各个话题里提及到拉斯韦尔、没有提及到拉斯韦尔的数量分布以及占比情况,如下图。

从下图知道,谈论传播学名人时提及拉斯韦尔的次数是最多的,在拉斯韦尔的贡献中,5W模式是被提及次数最多的。而每当谈论5W模式、拉斯韦尔的著作、三功能说、内容分析法,同时提及拉斯韦尔的比例高达90%以上;拉斯韦尔作为政治学家,这次搜集到关于政治的回答数量有190个,但是提及拉斯韦尔的比例只有14.41%。
图片4.png

在拉斯韦尔的著作中,提及最多的著作是《世界大战中的宣传技巧》,其次是《传播在社会中的结构与功能》。
图片5.png


举报 使用道具
微舆情 高级会员 发表于 2020-3-2 09:04:05 | 显示全部楼层
ym 发表于 2020-2-26 19:16
用拉斯韦尔在知乎上搜索到的问题或专栏文章数据,我会分别对标题、回答内容做内容分析,看看大家通常会讨论 ...

20200302-01.png
文中有这幅图和类似的几幅图, 这个图是用集搜客分词工具中的功能生成的? 还是用其他工具生成的?

举报 使用道具
Fuller 管理员 发表于 2020-3-2 09:30:25 | 显示全部楼层
微舆情 发表于 2020-3-2 09:04
文中有这幅图和类似的几幅图, 这个图是用集搜客分词工具中的功能生成的? 还是用其他工具生成的?

...

这个不是集搜客分词软件生成的,我也想知道答主是用什么软件做的,我在想是否要把这种图形也引入到集搜客分词软件中来
举报 使用道具
ym 版主 发表于 2020-3-2 16:09:32 | 显示全部楼层
Fuller 发表于 2020-3-2 09:30
这个不是集搜客分词软件生成的,我也想知道答主是用什么软件做的,我在想是否要把这种图形也引入到集搜客 ...

这就是用集搜客分词软件生成的社会网络关系图,把鼠标悬浮在关键词上,就可以看到与该关键词有共现关系的其他词语,这是一个无向网络图,灰色的数据标签就是该关键词的点关联度,即该词与其他词的连线数量。 QQ截图20200226174857.png



举报 使用道具
Fuller 管理员 发表于 2020-3-2 16:38:17 | 显示全部楼层
ym 发表于 2020-3-2 16:09
这就是用集搜客分词软件生成的社会网络关系图,把鼠标悬浮在关键词上,就可以看到与该关键词有共现关系的 ...

只几天没有用,集搜客分词软件功能就升级了,功能更加强大了
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 关于食品安全的美国联邦法规文件的网络爬虫
  • 怎样更有效率地搜索互联网和整理知识—使用
  • 阿里巴巴外包询价网站用集搜客网络爬虫能采
  • 在限定论域的时候,为什么“任何一个”表示
  • 数理逻辑是讲什么的?

热门用户

GMT+8, 2020-4-8 14:08