Embedding向量表示

Embedding 是把文本、图片、代码等对象映射成向量的技术。向量可以表达语义相似性，因此常用于语义检索、推荐、聚类、去重和 RAG。

# 1. 什么是 Embedding

文本：“如何重置密码”
  -> Embedding 模型
  -> [0.12, -0.08, 0.33, ...]

向量中的每个数字本身不需要人工解释，重要的是向量之间的距离或相似度能反映语义关系。

如果两个文本语义相近，它们的向量距离通常也更近。

“怎么修改登录密码”
“如何重置账号密码”
      距离近

“数据库索引怎么优化”
      距离远

这让系统可以不完全依赖关键词匹配，而是按语义找到相关内容。

在实际系统中，具体使用哪种相似度要和 Embedding 模型、向量库索引方式保持一致。

文档
  -> 清洗
  -> 切分 Chunk
  -> Embedding
  -> 存入向量库

用户问题
  -> Embedding
  -> 向量检索
  -> 返回相似 Chunk

Q：Embedding 向量能还原原文吗？

A：通常不能直接还原。Embedding 主要表达语义位置，不是加密后的原文。

Q：向量维度越高越好吗？

A：不一定。维度影响表达能力、存储和检索成本。关键是模型是否适合任务。

Q：RAG 一定要用向量检索吗？

A：不一定。很多场景需要关键词、结构化过滤和向量检索结合，效果比单一向量检索更稳定。

上次更新: 2026/06/25, 17:53:09