和数据库一样group经常常使用于统计。MongoDB的group还有非常多限制,如:返回结果集不能超过16M, group操作不会处理超过10000个唯一键。好像还不能利用索引[不非常确定]。
Group大约须要一下几个參数。1.key:用来分组文档的字段。
和keyf两者必须有一个
2.keyf:能够接受一个javascript函数。用来动态的确定分组文档的字段。和key两者必须有一个 3.initial:reduce中使用变量的初始化 4.reduce:运行的reduce函数。函数须要返回值。
5.cond:运行过滤的条件。 6.finallize:在reduce运行完毕,结果集返回之前对结果集终于运行的函数。可选的。以下介绍一个实例:
先插入測试数据:
for(var i=1; i<20; i++){var num=i%6;db.test.insert({_id:i,name:"user_"+i,age:num});}
1.普通分组查询
db.test.group({ key:{age:true}, initial:{num:0}, $reduce:function(doc,prev){ prev.num++ } }); db.runCommand({group:{ns:"test",key:{age:true},initial:{num:0},$reduce:function(doc,prev){prev.num++}}});
2.筛选后再分组
db.test.group({key:{age:true},initial:{num:0},$reduce:function(doc,prev){prev.num++},condition:{age:{$gt:2}}}); db.runCommand({group:{ns:"test",key:{age:true},initial:{num:0},$reduce:function(doc,prev){prev.num++},condition:{age:{$gt:2}}}});
3、普通的$where查询:
db.test.find({$where:function(){return this.age>2;}});
group联合$where查询
db.test.group({key:{age:true},initial:{num:0},$reduce:function(doc,prev){prev.num++},condition:{$where:function(){return this.age>2;}}});
4、使用函数返回值分组
//注意,$keyf指定的函数一定要返回一个对象
db.test.group({$keyf:function(doc){return {age:doc.age};},initial:{num:0},$reduce:function(doc,prev){prev.num++}}); db.runCommand({group:{ns:"test",$keyf:function(doc){return {age:doc.age};},initial:{num:0},$reduce:function(doc,prev){prev.num++}}});
5.使用终结器
db.test.group({$keyf:function(doc){return {age:doc.age};},initial:{num:0},$reduce:function(doc,prev){prev.num++},finalize: function(doc){ doc.count=doc.num;delete doc.num; }}); db.runCommand({group:{ns:"test",$keyf:function(doc){return {age:doc.age};},initial:{num:0},$reduce:function(doc,prev){prev.num++},finalize: function(doc){ doc.count=doc.num;delete doc.num; }}});
有关MapReduce
//首先插入測试数据
for(var i=1;i<21;i++){db.test.insert({_id:i,name:'mm'+i});}//进行mapreducedb.runCommand({mapreduce:'test',map:function(){emit(this.name.substr(0,3),this);},reduce:function(key,vals){return vals[0];}, //注意:vals是一个Object对象而不是数组out:'wq'});注意:
1.mapreduce是依据map函数里调用的emit函数的第一个參数来进行分组的 2.仅当依据分组键分组后一个键匹配多个文档,才会将key和文档集合交由reduce函数处理。
比如:
db.runCommand({mapreduce:'test',map:function(){emit(this.name.substr(0,3),this);},reduce:function(key,vals){return 'wq';},out:'wq'});
运行mapreduce命令后,再查看wq表数据:
db.wq.find(){ "_id" : "mm1", "value" : "wq" }{ "_id" : "mm2", "value" : "wq" }{ "_id" : "mm3", "value" : { "_id" : 3, "name" : "mm3" } }{ "_id" : "mm4", "value" : { "_id" : 4, "name" : "mm4" } }{ "_id" : "mm5", "value" : { "_id" : 5, "name" : "mm5" } }{ "_id" : "mm6", "value" : { "_id" : 6, "name" : "mm6" } }{ "_id" : "mm7", "value" : { "_id" : 7, "name" : "mm7" } }{ "_id" : "mm8", "value" : { "_id" : 8, "name" : "mm8" } }{ "_id" : "mm9", "value" : { "_id" : 9, "name" : "mm9" } }