文档菜单
文档首页
/
MongoDB Compass
/ /

创建 Atlas Vector Search 索引

本页内容

  • 关于此任务
  • 步骤
  • 示例
  • 结果
  • 了解更多

版本1.42.1.

您可以使用Atlas Vector Search 索引 通过MongoDB Compass。这些索引允许您索引向量数据 以及 其他数据类型,从而便于对索引字段进行语义搜索。Atlas Vector Search 索引通过识别最相似的向量来索引向量数据。索引通过计算查询向量和索引中存储的向量之间的距离来确定相似度。

要创建一个 Atlas Search 索引,您的部署必须符合以下情况之一

  • 托管在 MongoDB Atlas 上,并且拥有 M10 或更高版本的 Atlas 集群层级。

  • 使用 Atlas CLI。 设置的本地部署。

此外,您的部署必须运行 MongoDB 版本 7.0 或更高版本。

1

索引 选项卡,点击创建 按钮,然后点击 搜索索引

2
3

选择 向量搜索

4

您必须最初提供以下默认向量搜索索引配置。您可以在以后修改这些配置。

字段
类型
描述
type
string
可读的标签,用于标识索引类型。值必须是 vector 才能在索引字段上执行向量搜索。如果省略,则默认为 search,它只支持全文搜索。
path
string
要索引的字段名称。
numDimensions
int
向量维度数,Atlas Search 在索引和查询时强制执行。此值不能大于 4096。
similarity
string

用于搜索最接近的K个邻居的向量相似度函数。从以下函数中选择

函数
描述
euclidean
一个测量向量端点之间距离的函数。此函数允许您根据不同的维度测量相似度。
cosine

一个基于向量之间角度测量相似度的函数。此函数允许您测量不受幅度缩放的相似度。

您不能与余弦函数使用零范数的向量。为了测量余弦相似度,我们建议您对向量进行归一化,并使用点积。

点积
一个与余弦函数类似但考虑了向量大小的函数。此函数允许您根据角度和大小来高效地测量相似度。要使用点积,您必须在索引时间和查询时间将向量归一化到单位长度。
5

以下示例定义使用 sample_mflix.embedded_movies 集合并将 plot_embedding 字段索引以创建 Atlas 向量搜索索引。

{
"fields": [ {
"type": "vector",
"path": "plot_embedding",
"numDimensions": 1536,
"similarity": "euclidean"
} ]
}

要查看您创建的索引的状态,请转到 索引 选项卡,并将右上角的开关设置为 搜索索引

状态 列指示索引的状态。当状态为 就绪 时,您的索引即可使用。

有关搜索索引状态的更多信息,请参阅 Atlas 搜索索引状态。

返回

Atlas Search 索引