摘要:现在全球都在抗击新型冠状病毒肺炎,新闻媒体实时发布疫情新闻,人们时刻关注疫情发展情况。本文基于微博平台,以"新冠肺炎最新动态"、"疫情"、"新冠疫苗"作为关键字,采用爬虫软件爬取微博平台关于新冠疫情近期博文数据。在Python平台对文本数据进行预处理,删除无意义字符,用Jieba库进行精确分词,统计词频并排序,将词频较高的前800个词语用WordCloud生成词云。结果表明,近期微博网民的情绪受到境外疫情影响,对疫情形势的关注度较高。
关键词:新冠肺炎疫情;新浪微博;分词;词云;
原文链接:
https://kns.cnki.net/kcms/detail ... J7MKrLCkQ%25mmd2F6c
我在知网上看到这篇论文,但是我不会编程,想知道集搜客软件可以实现从微博数据采集→分词→词频排序→生成词云图的数据处理链条吗?
|
共 6 个关于本帖的回复 最后回复于 2021-8-27 11:26