|
很抱歉目前没法给你明确的建议,因为统计课上学到的知识现在还记住的已经不多了,我只记得卡方是在统计推断那一部分学的,一年年过去了,只记得一些描述性统计方法,统计推断都忘光了。接下来我会专门去复习一下。
处理关键词有很多方法,我觉得可以用其他方法达到目的,统计学方法更加严密,但是机器学习方法更加灵活自由,不见得结果不准确。比如,先用TextRank抽取最重要的关键词,然后利用Word2Vec算出来的词向量求某个词的距离最近的词;我估计也可以先用word2vec求出词向量,然后用k-means之类的聚类算法把词聚一下。
|
|
共 3 个关于本帖的回复 最后回复于 2021-9-23 09:33