集搜客GooSeeker网络爬虫

标题: 集搜客情感分析的正面得分和负面得分是怎么算的? [打印本页]

作者: 我赢啦    时间: 2021-5-5 14:14
标题: 集搜客情感分析的正面得分和负面得分是怎么算的?
集搜客的正面得分和负面得分是怎么算的?

作者: Fuller    时间: 2021-5-5 16:45
根据正面词、负面词、程度词、否定词出现的数量打分
作者: cathy202003    时间: 2021-9-3 23:45
Fuller 发表于 2021-5-5 16:45
根据正面词、负面词、程度词、否定词出现的数量打分

请问,我正面词有7个,程度词有1一个,正面句子有3个,为啥正面得分是14?
[attach]14835[/attach]

作者: Fuller    时间: 2021-9-4 09:19
cathy202003 发表于 2021-9-3 23:45
请问,我正面词有7个,程度词有1一个,正面句子有3个,为啥正面得分是14?

...

情感分析以后可以导出两张表:1,句子表;2,文章表

一篇文章的总得分是句子得分的和,我看你这个表像是文章表,那么为什么总分是14,要看每个句子表得分是多少

作者: pitiwai    时间: 2021-12-29 22:48
Fuller 发表于 2021-9-4 09:19
情感分析以后可以导出两张表:1,句子表;2,文章表

一篇文章的总得分是句子得分的和,我看你这个表像是 ...

您好,情感分析中正面得分和负面得分的具体计算公式是什么呀

作者: Fuller    时间: 2021-12-29 23:28
pitiwai 发表于 2021-12-29 22:48
您好,情感分析中正面得分和负面得分的具体计算公式是什么呀

在词典中,正面词的分数是正值,负面词的分数是负值,程度词的分数相当于对得分乘以一个倍数,否定词能把一个句子的得分值取反。
每个句子的评分 = (正面词得分 + 负面词得分) * 程度词的分数,如果含有否定词,那么就把得分取反。


整个正文的得分就是每个句子得分的和

作者: qianqing0930    时间: 2022-5-11 23:32
Fuller 发表于 2021-12-29 23:28
在词典中,正面词的分数是正值,负面词的分数是负值,程度词的分数相当于对得分乘以一个倍数,否定词能把 ...

请问一个句子中如果出现了多个程度词,且程度词的赋值不同,那按照这个公式,程度词的分值是多个数值之和还是取最高的那个分值?

作者: Fuller    时间: 2022-5-11 23:34
qianqing0930 发表于 2022-5-11 23:32
请问一个句子中如果出现了多个程度词,且程度词的赋值不同,那按照这个公式,程度词的分值是多个数值之和 ...

如果出现多个程度词,就会计算多次。程度词用来把结果放大一些倍数的,多个程度词就会一个接一个进行放大

作者: qianqing0930    时间: 2022-5-11 23:49
Fuller 发表于 2022-5-11 23:34
如果出现多个程度词,就会计算多次。程度词用来把结果放大一些倍数的,多个程度词就会一个接一个进行放大 ...

[attach]15486[/attach]

我这里还有两个问题要咨询您一下:

请您看一下“跳伞没有蹦极可怕”这句话,就一句话,我的正负面词赋值是+-1,“极”赋值4,“可”赋值3,否定词赋值-1,

①但是得分却是-3,等于两个程度词只检索到了一个,而且只是情感词前后的一个,请问这是算法就这么设置的吗?还是常规失误?(因为我发现有很多赋值都是这种情况)
②另外,我有一个负面情感词,一个程度词,按所说的规则一个程度词难道不应该情感取反,也就是-(-1)就是1吗,为什么结果是负数?

麻烦您了~

作者: Fuller    时间: 2022-5-12 09:04
qianqing0930 发表于 2022-5-11 23:49
我这里还有两个问题要咨询您一下:

请您看一下“跳伞没有蹦极可怕”这句话,就一句话,我的正负面词赋 ...

我单独测试 跳伞没有蹦极可怕 这一个句子,我得到的结果竟然跟你的不一样,你加了自己的情感词吗?

作者: Fuller    时间: 2022-5-12 09:06
但是我测试得到的结果也是不正确的,可能是否定词引起的,我已经把这个问题转给开发人员去检测了
作者: Fuller    时间: 2022-5-13 16:28
重要:本贴下面的帖子,凡是发布时间比本贴早的,说的算法都失效了。为了提高情感分析的准确度,集搜客的情感分析算法进行了全面的升级,计算方法变了,请看《集搜客分词软件情感分析算法升级通知


作者: qianqing0930    时间: 2022-5-14 16:21
Fuller 发表于 2022-5-12 09:04
我单独测试 跳伞没有蹦极可怕 这一个句子,我得到的结果竟然跟你的不一样,你加了自己的情感词吗?
...

是的,我自己加了情感词、程度词和否定词,这句话识别出来的是:负面词“怕”-1,程度词“极”+4“可”+3,否定词“没有”-1

作者: Fuller    时间: 2022-5-14 16:59
qianqing0930 发表于 2022-5-14 16:21
是的,我自己加了情感词、程度词和否定词,这句话识别出来的是:负面词“怕”-1,程度词“极”+4“可”+3 ...

今天上午版本升级了,重新建立一个情感分析任务试试效果怎么样

作者: Fuller    时间: 2022-5-14 17:02
qianqing0930 发表于 2022-5-14 16:21
是的,我自己加了情感词、程度词和否定词,这句话识别出来的是:负面词“怕”-1,程度词“极”+4“可”+3 ...

你那样加程度词不太合理。本来应该是这样“可怕”是情感词,词典里已经有了,“蹦极”是一个名字,不应该把“极”当成程度词,“没有”是否定词,词典里也有了。要分析这句话,不用自己加词

作者: qianqing0930    时间: 2022-5-14 17:05
Fuller 发表于 2022-5-14 16:59
今天上午版本升级了,重新建立一个情感分析任务试试效果怎么样

嗯嗯好的,我再重新试一下。我之前是因为要分析很多文本,就找的比较经典的情感词典补充的,后来看结果检查的时候才发现有问题。





欢迎光临 集搜客GooSeeker网络爬虫 (https://www.gooseeker.com/doc/) Powered by Discuz! X3.2