聚合主要用于计算数据,类似sql中的sum()、avg()
语法:
db.集合名称.aggregate([{管道:{表达式}}])
stu准备的数据:
db.stu.insertMany([
{ name: "gj",gender:true, age: 18},
{ name: "gj1",gender:true, age: 28},
{ name: "hr",gender:false, age: 18},
{ name: "hr1",gender:false, age: 28}
])
1.1 管道
管道在Unix和Linux中一般用于将当前命令的输出结果作为下一个命令的输入。
ps ajx | grep mongo
在mongodb中,管道具有同样的作用,文档处理完毕后,通过管道进行下一次处理。
常用管道:
$group:将集合中的文档分组,可用于统计结果。
$match:用于过滤数据,只输出符合条件的文档。$match使用MongoDB的标准查询操作。
$project:修改输入文档的结构。可以用来重命名、增加或删除域,也可以用于创建计算结果以及嵌套文档。
$sort:将输入文档排序后输出。
$limit:用来限制MongoDB聚合管道返回的文档数。
$skip:在聚合管道中跳过指定数量的文档,并返回余下的文档。
$unwind:将文档中的某一个数组类型字段拆分成多条,每条包含数组中的一个值。
$geoNear:输出接近某一地理位置的有序文档。
1.2 表达式
处理输入文档并输出。
语法:
表达式:"$列名"
常用表达式:
$sum:计算总和,$sum:同count表示计数
$avg:计算平均值
$min:获取最小值
$max:获取最大值
$push:在结果文档中插入一个数组中,数组内容为选中字段
$first:根据资源文档的排序获取第一个文档数据
$last:根据资源文档的排序获取最后一个文档数据
1.3 $group
将集合中的文档分组,可用于统计结果。
_id表示分组的依据,使用某个字段的格式为‘$字段’
实例:
统计男生、女生的总人数:
db.stu.aggregate([
{$group:{_id:"gender",counter:{$sum:1}}}
])
统计学生性别及学生姓名:
db.stu.aggregate([
{$group:{_id:"gender",counter:{$push:"$name"}}}
])
使用$$ROOT可以将文档内容加入到结果集的数组中:
db.stu.aggregate([
{$group:{_id:"gender",name:{$push:"$$ROOT"}}}
])
将集合中所有文档分为一组。
求学生总人数、平均年龄:
db.stu.aggregate([
{$group:{_id:null,counter:{$sum:1},avgAge:{$avg:"$age"}}}
])
1.4 $match
用于过滤数据,只输出符合条件的文档。
使用MongoDB的标准查询操作。
实例:
查询年龄大于20的学生:
db.stu.aggregate([
{$match:{age:{$gt:20}}}
])
查询年龄大于20的男生、女生人数。
db.stu.aggregate([
{$match:{age:{$gt:20}}},
{$group:{_id:"$gender",counter:{$sum:1}}}
])
1.5 $project
修改输入文档的结构,如重命名、增加、删除字段、创建计算结果。
实例:
查询学生的姓名、年龄。
db.stu.aggregate([
{$project:{_id:0,name:1,age:1}}
])
查询男生、女生人数,输出人数。
db.stu.aggregate([
{$group:{_id:"$gender",counter:{$sum:1}}},
{$project:{_id:0,counter:1}}
])
1.6 $sort
将输入文档排序后输出。
实例:
查询学生学习,按年龄升序。
db.stu.aggregate([
{$sort:{age:1}}
])
查询男生、女生人数,按人数降序。
db.stu.aggregate([
{$group:{_id:"$gender",counter:{$sum:1}}},
{$sort:{counter:-1}}
])
1.7 $limit
限制聚合管道返回的文档数。
查询2条学生信息。
db.stu.aggregate([
{$limit:2}
])
1.8 $skip
跳过指定数量的文档,并返回余下的文档。
查询从第3条开始的学生信息。
db.stu.aggregate([
{$skip:2}
])
统计男生、女生人数,按人数升序,取第二条数据。
db.stu.aggregate([
{$group:{_id:"$gender",counter:{$sum:1}}},
{$sort:{counter:1}},
{$skip:1},
{$limit:1}
])
注意顺序:先写skip,再写limit。
1.9 $unwind
将文档中的某一个数组类型字段拆分成多条,每条包含数组中的一个值。
语法1:
对某字段值进行拆分。
db.集合名称.aggregate([{$unwind:"$字段名称"}])
构造数据:
db.t2.insert({_id:1,title:"t-shirt",size:["M","L","S"]})
查询:
db.t2.aggregate([{$unwind:"$size"}])
语法2:
对某字段值进行拆分。
处理空数组、非数组、无字段、null情况。
db.集合名称.aggregate([{
$unwind:{
path:"$字段名称",
preserveNullAndEmptyArrays: #防止数据丢失
} ])
构造数据:
db.t3.insert([
{_id:1,"item":"a",size:["M","L","S"]},
{_id:2,"item":"b",size:[]},
{_id:3,"item":"c",size:"M"},
{_id:4,"item":"d"},
{_id:5,"item":"e",size:null}
])
使用语法1查询:
db.t3.aggregate([{$unwind:"$size"}])
使用语法2查询 :
db.t3.aggregate([
{$unwind:{path:"$size",preserveNullAndEmptyArrays:true}}
])