简介
大型语言模型非常出色。虽然它们最出名的是其令人印象深刻的文本生成能力,但它们的功能远不止于此。例如,它们可以用来生成高效的文本向量表示,即所谓的“嵌入”。正如我们将看到的,向量提供了一种非常自然的文本处理方式。例如,如果将任何两个给定的句子视为纯粹的标记序列,那么判断它们是否同义几乎是不可能的。祝你好运,别再硬编码了。
向量可以存在于稠密的高维空间中,并且与文本描述的抽象概念的含义非常相似,它们可以相近或相距遥远——并且跨越多个维度。因此,两个向量之间的差异可以用距离和角度等几何概念来巧妙地描述。
推荐文章