NLP文本情感分析入门

2019-10-15 10:48| 发布者: ym| 查看: 12586| 评论: 0

摘要: 自然语言处理NLP的一个应用就是情感分析Sentiment Analysis,它在社交内容的分析以及电商评论反馈分析中,都占有很高的分析价值,下面给大家整理了情感分析的入门框架。 1.分析目的 对文本的观点、喜好、情感倾向进 ...

【注意】如果寻找分词和文本分析软件,为了完成内容分析和其他文本研究任务,直接使用集搜客分词和文本分析软件就可以了。本文是为了讲解集搜客分词和文本分析的实现原理,是给产品设计者和开发者看的。


自然语言处理NLP的一个应用就是情感分析Sentiment Analysis,它在社交内容的分析以及电商评论反馈分析中,都占有很高的分析价值,下面给大家整理了情感分析的入门框架。

1.分析目的

对文本的观点、喜好、情感倾向进行分类:

(1)按情感倾向 / 极性划分;比如分为正面、负面、中性情感。

(2)按情感程度深浅划分;比如分为热爱、喜欢、一般、不喜欢、厌恶。

(3)按情感类别来划分;比如新闻分类。

通过分析研究对象的情感分布,可了解舆情,辅助商业预测、决策。


2.分析粒度

2.1.文档级

为观点型文档标记整体的情感倾向/极性

2.2.语句级

对文档内单独的语句,标记其主观分类 / 极性分类

通常会把句子分为积极、中立或消极3类

2.3.实体特征层面 aspect level

判断语句在实体特征层面的情感倾向

需要找到实体的特征 / 属性、情感词


3.分析方法

3.1.基于情感词典

根据已构建的情感词典,对待分析文本进行文本处理,抽取情感词,计算该文本的情感倾向。

分类效果取决于情感词典的完善性。

一般流程

(1)构建情感词典

情感词

程度词(非必须)

否定词:反转情感倾向

确定情感词、程度词的评分机制,以及否定词的反转机制

(2)对文本进行分词,匹配情感词典

(3)根据评分和反转机制,通过合适的算法,计算出文本的情感得分

3.2.基于机器学习

通过算法模型获取特征词,形成文本和词的矩阵,再利用机器学习/深度学习等方法进行分。

分类效果取决于训练文本的选择以及正确的情感标注。

一般流程

(1)选一部分语料,标记出情感分类

(2)对语料进行分词,通过合适的模型算法转换成词向量,获取特征词

(3)搭建模型,对数据进行训练和测试,调整稳定后形成分类器

(4)用分类器对新语料进行分类


4.发展趋势

多模态情感分析

把文本+语音+图像作为输入,都转成空间向量做分析。


参考资料:

https://www.zhihu.com/question/20162965/answer/94478394

https://zhuanlan.zhihu.com/p/33325977

https://www.zhihu.com/question/20700012/answer/23452462

https://blog.csdn.net/u010899985/article/details/81390600


鲜花

握手

雷人

路过

鸡蛋

相关阅读

最新评论

GMT+8, 2024-12-3 10:53