聚合构建器
概述
在本指南中,您可以学习如何使用 Laravel 集成聚合构建器执行聚合操作和构建管道。聚合构建器允许您使用类型安全的语法来构建 MongoDB 聚合管道。
聚合管道是一个数据处理管道,它按顺序对 MongoDB 数据库中的数据进行转换和计算,然后将结果输出为新的文档或文档集。
聚合管道由 聚合阶段 组成。聚合阶段使用操作符处理输入数据,并生成下一个阶段作为其输入的数据。
Laravel MongoDB 聚合构建器允许您构建聚合阶段和聚合管道。以下部分展示了如何使用聚合构建器创建聚合管道的阶段示例
提示
聚合构建器功能仅适用于 Laravel MongoDB 4.3 及以后的版本。有关在不使用聚合构建器的情况下运行聚合的更多信息,请参阅查询构建器指南中的聚合
添加聚合构建器依赖
聚合构建器是 mongodb/builder 包的一部分。您必须将此包作为依赖项添加到项目中才能使用它。运行以下命令将聚合构建器依赖项添加到您的应用程序
composer require mongodb/builder:^0.2
安装完成后,请验证composer.json 文件中是否包含以下行在 require 对象中
"mongodb/builder": "^0.2",
创建聚合管道
要启动聚合管道,请调用 Model::aggregate() 方法。然后,按照您希望它们运行的顺序链接聚合阶段方法。
聚合构建器包括以下命名空间,您可以将它们导入以构建聚合阶段
MongoDB\Builder\AccumulatorMongoDB\Builder\ExpressionMongoDB\Builder\QueryMongoDB\Builder\Type
提示
要了解更多关于构建器类的信息,请参阅 mongodb/mongodb-php-builder GitHub 仓库。
本节包含以下示例,展示了如何使用常见的聚合阶段以及如何组合阶段来构建聚合管道
要了解有关 MongoDB 聚合运算符的更多信息,请参阅服务器手册中的 聚合阶段。
示例文档
以下示例在由 User 模型表示的集合上运行聚合管道。您可以通过运行以下 insert() 方法添加示例数据
User::insert([ ['name' => 'Alda Gröndal', 'occupation' => 'engineer', 'birthday' => new UTCDateTime(new DateTimeImmutable('2002-01-01'))], ['name' => 'Francois Soma', 'occupation' => 'engineer', 'birthday' => new UTCDateTime(new DateTimeImmutable('1998-02-02'))], ['name' => 'Janet Doe', 'occupation' => 'designer', 'birthday' => new UTCDateTime(new DateTimeImmutable('1987-03-03'))], ['name' => 'Eliud Nkosana', 'occupation' => 'engineer', 'birthday' => new UTCDateTime(new DateTimeImmutable('1984-04-04'))], ['name' => 'Bran Steafan', 'occupation' => 'engineer', 'birthday' => new UTCDateTime(new DateTimeImmutable('1998-05-05'))], ['name' => 'Ellis Lee', 'occupation' => 'designer', 'birthday' => new UTCDateTime(new DateTimeImmutable('1996-06-06'))], ]);
匹配阶段示例
您可以将 match() 方法链接到您的聚合管道以指定查询过滤器。如果您省略此阶段,则 aggregate() 方法会输出模型集合中对应以下阶段的全部文档。
此聚合阶段通常放在第一位,以便通过使用可用索引来检索数据,并减少后续阶段处理的数据量。
提示
如果您省略 match() 方法,聚合管道将在其他聚合阶段之前匹配模型集合中所有对应的文档。
本例通过使用 MongoDB\Builder\Query 构建器构建一个查询过滤器,用于构建 匹配 聚合阶段的查询。匹配阶段包括以下标准
使用
Query::or()函数匹配查询过滤器之一的结果使用
Query::query()和Query::eq()函数匹配包含具有值为"designer"的occupation字段的文档使用
Query::query()和Query::eq()函数匹配包含具有值为"Eliud Nkosana"的name字段的文档
点击查看输出 按钮以查看运行代码后返回的文档
$pipeline = User::aggregate() ->match(Query::or( Query::query(occupation: Query::eq('designer')), Query::query(name: Query::eq('Eliud Nkosana')), )); $result = $pipeline->get();
[ { "_id": ..., "name": "Janet Doe", "occupation": "designer", "birthday": { "$date": { "$numberLong": "541728000000" } } }, { "_id": ..., "name": "Eliud Nkosana", "occupation": "engineer", "birthday": { "$date": { "$numberLong": "449884800000" } } }, { "_id": ..., "name": "Ellis Lee", "occupation": "designer", "birthday": { "$date": { "$numberLong": "834019200000" } } } ]
提示
Query::or() 函数对应于 MongoDB 查询操作符 $or。有关此操作符的更多信息,请参阅服务器手册中的 $or。
小组赛示例
您可以将 group() 方法链接到聚合管道中,通过执行计算并根据公共字段值对数据进行分组来修改数据结构。
此聚合阶段通常放置在匹配阶段之后,以减少后续阶段处理的数据。
本例使用 MongoDB\Builder\Expression 构造函数来在 group 聚合阶段中定义分组键。分组阶段指定以下分组行为
将分组键的值(由
_id字段表示)设置为Expression构造函数定义的字段值通过调用
Expression::fieldPath()函数引用occupation字段中的文档值
单击 查看输出 按钮以查看运行代码返回的文档
$pipeline = User::aggregate() ->group(_id: Expression::fieldPath('occupation')); $result = $pipeline->get();
[ { "_id": "engineer" }, { "_id": "designer" } ]
提示
此示例阶段执行与 distinct() 查询构建器方法类似的任务。有关 distinct() 方法的更多信息,请参阅 检索不同字段值 用例示例。
排序阶段示例
您可以将 sort() 方法链接到聚合管道中,以指定文档的输出顺序。
您可以将此聚合阶段添加到管道的任何位置。它通常放置在group阶段之后,因为它可能依赖于分组数据。我们建议尽可能晚地将排序阶段放置在管道中,以限制其处理的数据。
要指定排序,将字段值设置为Sort::Asc枚举进行升序排序,或设置为Sort::Desc枚举进行降序排序。
此示例显示了一个sort()聚合管道阶段,该阶段按name字段进行排序,以Sort::Desc排序,对应于逆字母顺序。点击查看输出按钮以查看运行代码返回的文档
$pipeline = User::aggregate() ->sort(name: Sort::Desc); $result = $pipeline->get();
[ { "_id": ..., "name": "Janet Doe", "occupation": "designer", "birthday": { "$date": { "$numberLong": "541728000000" } } }, { "_id": ..., "name": "Francois Soma", "occupation": "engineer", "birthday": { "$date": { "$numberLong": "886377600000" } } }, { "_id": ..., "name": "Ellis Lee", "occupation": "designer", "birthday": { "$date": { "$numberLong": "834019200000" } } }, { "_id": ..., "name": "Eliud Nkosana", "occupation": "engineer", "birthday": { "$date": { "$numberLong": "449884800000" } } }, { "_id": ..., "name": "Bran Steafan", "occupation": "engineer", "birthday": { "$date": { "$numberLong": "894326400000" } } }, { "_id": ..., "name": "Alda Gröndal", "occupation": "engineer", "birthday": { "$date": { "$numberLong": "1009843200000" } } } ]
投影阶段示例
您可以将project()方法链接到您的聚合管道中,以指定此阶段要显示的文档的字段。
要指定要包含的字段,传递字段名和真值,例如1或true。所有其他字段都将从输出中省略。
或者,要指定要排除的字段,传递每个字段名和假值,例如0或false。所有其他字段都包含在输出中。
提示
当您指定要包含的字段时,默认包含_id字段。要排除_id字段,请明确在投影阶段排除它。
此示例显示了如何使用project()方法聚合阶段仅包含name字段,并排除所有其他字段。点击查看输出按钮以查看运行代码返回的数据
$pipeline = User::aggregate() ->project(_id: 0, name: 1); $result = $pipeline->get();
[ { "name": "Alda Gröndal" }, { "name": "Francois Soma" }, { "name": "Janet Doe" }, { "name": "Eliud Nkosana" }, { "name": "Bran Steafan" }, { "name": "Ellis Lee" } ]
聚合管道示例
此聚合管道示例连接多个阶段。每个阶段都运行在每个前一个阶段的输出上。在本例中,阶段按顺序执行以下操作:
将
birth_year字段添加到文档中,并将其值设置为从birthday字段提取的年份。按
occupation字段的值对文档进行分组,并使用Accumulator::avg()函数计算每个组的birth_year的平均值。将计算结果分配给birth_year_avg字段。按组键字段升序排序文档。
从组键字段的值创建
profession字段,包括birth_year_avg字段,并省略_id字段。
单击 查看输出 按钮,查看运行代码返回的数据
$pipeline = User::aggregate() ->addFields( birth_year: Expression::year( Expression::dateFieldPath('birthday'), ), ) ->group( _id: Expression::fieldPath('occupation'), birth_year_avg: Accumulator::avg(Expression::numberFieldPath('birth_year')), ) ->sort(_id: Sort::Asc) ->project(profession: Expression::fieldPath('_id'), birth_year_avg: 1, _id: 0);
[ { "birth_year_avg": 1991.5, "profession": "designer" }, { "birth_year_avg": 1995.5, "profession": "engineer" } ]
注意
由于此管道省略了 match() 阶段,因此初始阶段的输入是集合中的所有文档。
创建自定义运算符工厂
当使用聚合构建器创建聚合管道时,您可以在 自定义运算符工厂 中定义操作或阶段。自定义运算符工厂是一个返回聚合管道表达式或阶段的函数。您可以创建这些函数以提高代码的可读性和复用性。
本示例展示了如何创建和使用自定义运算符工厂,该工厂返回从指定日期字段提取年份的表达式。
以下函数接受包含日期的字段名称,并返回一个从日期中提取年份的表达式
public function yearFromField(string $dateFieldName): YearOperator { return Expression::year( Expression::dateFieldPath($dateFieldName), ); }
以下聚合管道包括以下阶段
addFields(),该函数调用自定义运算符工厂函数从birthday字段提取年份并将其分配给birth_year字段project(),其输出仅包含name和birth_year字段
单击 查看输出 按钮,查看运行代码返回的数据
$pipeline = User::aggregate() ->addFields(birth_year: $this->yearFromField('birthday')) ->project(_id: 0, name: 1, birth_year: 1);
[ { "name": "Alda Gröndal", "birth_year": 2002 }, { "name": "Francois Soma", "birth_year": 1998 }, { "name": "Janet Doe", "birth_year": 1987 }, { "name": "Eliud Nkosana", "birth_year": 1984 }, { "name": "Bran Steafan", "birth_year": 1998 }, { "name": "Ellis Lee", "birth_year": 1996 } ]