文本搜索
MongoDB支持对文档中的字符串内容执行文本搜索的查询操作。要执行文本搜索,MongoDB使用文本索引和$text
查询操作符。有关文本搜索的更多信息,请参阅服务器手册中的文本搜索。
驱动程序提供了Filters.text()
辅助方法,以简化文本搜索查询过滤器的创建。
先决条件
您必须设置以下组件才能运行本指南中的代码示例
一个由来自文档资产GitHub中的
restaurants.json
文件填充的test.restaurants
集合。以下导入语句
import com.mongodb.client.MongoClients; import com.mongodb.client.MongoClient; import com.mongodb.client.MongoCollection; import com.mongodb.client.MongoDatabase; import com.mongodb.client.model.Indexes; import com.mongodb.client.model.Filters; import com.mongodb.client.model.Sorts; import com.mongodb.client.model.TextSearchOptions; import com.mongodb.client.model.Projections; import org.bson.Document;
重要
本指南使用Subscriber
实现,这些实现已在快速入门指南
中描述。快速入门指南.
连接到MongoDB部署
首先,连接到MongoDB部署并声明和定义MongoDatabase
和MongoCollection
实例。
以下代码连接到运行在本地主机localhost
上的独立MongoDB部署,端口为27017
。然后,它定义了database
变量来引用test
数据库和collection
变量来引用restaurants
集合
MongoClient mongoClient = MongoClients.create(); MongoDatabase database = mongoClient.getDatabase("test"); MongoCollection<Document> collection = database.getCollection("restaurants");
要了解更多关于连接到MongoDB部署的信息,请参阅连接到MongoDB教程。
创建文本索引
要创建文本索引,请使用Indexes.text()
静态辅助函数创建文本索引的规范,并将规范传递给MongoCollection.createIndex()
方法以创建索引。
以下示例为restaurants
集合中的name
字段创建文本索引
MongoCollection<Document> collection = database.getCollection("restaurants"); collection.createIndex(Indexes.text("name")).subscribe(new PrintToStringSubscriber<String>());
执行文本搜索
要执行文本搜索,请使用Filters.text()
辅助方法指定文本搜索查询过滤器。
例如,以下代码在name
字段上执行文本搜索,以匹配字符串"bakery"
或"coffee"
collection .countDocuments(Filters.text("bakery coffee")) .subscribe(new PrintSubscriber<Long>("Text search matches: %s"));
文本分数
对于每个匹配的文档,文本搜索会分配一个分数,表示文档与指定的文本搜索查询过滤器的相关性。要按分数返回和排序,请在投影文档中使用$meta
运算符和排序表达式
collection.find(Filters.text("bakery cafe")) .projection(Projections.metaTextScore("score")) .sort(Sorts.metaTextScore("score")) .subscribe(new PrintDocumentSubscriber());
指定文本搜索选项
辅助函数 Filters.text()
可以接受各种文本搜索选项。驱动程序提供了 TextSearchOptions
类来指定这些选项。
例如,以下文本搜索在搜索单词 "cafe"
时指定了文本搜索语言选项。
collection.countDocuments( Filters.text("cafe", new TextSearchOptions().language("english")) ).subscribe(new PrintSubscriber<Long>("Text search matches (english): %s"));
要了解更多关于文本搜索的信息,请参阅 MongoDB 服务器手册中的以下章节