1. 名词解释 SBERT是Sentence-BERT的简写,是专门用于生成“句子向量”的模型。这个向量可用于以下计算:
而BERT是Bidirectional Encoder Representations from Transformers的缩写,其含义是:基于 Transformer 的双向文本表示模型。 所谓Bidirectional(双向),表示模型在理解一个词时会同时看左边和右边的上下文 2. SBERT在BERTopic中的位置 BERTopic主要做下面的计算,可以看到SBERT是第一个大步骤
3. SBERT和BERT的重要区别 SBERT将每个文档生成向量。而BERT的原始设计目的不是为了生成文档向量,而是做“句子对”任务的,例如,句子相似度(STS)、自然语言推理(NLI),输入是一对句子,输出是相似度或者判断“是不是下一句”等。 |