文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

MongoDB-Map&Reduce

2024-04-02 19:55

关注

模拟大数据搜索场景--‐何旭东

请使用脚本插入本次课程中的Map&Reduce举例的学生表到1000w条文档。字段

保持不变。

使用Map&Reduce 计算出10<age<20 的每班学生的个数。

请提交Map&Reduce 程序,已经对应的计算结果。

>

db.users.count();

10000000

>

db.users.find();

{

"_id"

:

ObjectId("55ca9ae785b177a46da9494f"),

"classid"

:

1,

"age"

:

37,

"name"

:

"name0"

}

{

"_id"

:

ObjectId("55ca9ae785b177a46da94950"),

"classid"

:

1,

"age"

:

12,

"name"

:

"name1"

}

{

"_id"

:

ObjectId("55ca9ae785b177a46da94951"),

"classid"

:

1,

"age"

:

31,

"name"

:

"name2"

}

{

"_id"

:

ObjectId("55ca9ae785b177a46da94952"),

"classid"

:

2,

"age"

:

27,

"name"

:

"name3"

}

脚本创建模拟数据:

for (var i=1;

i<10000000;i++){ db.users.save({classid:Math.ceil(Math.random()*(2)),age:Math.cei

l(Math.random()*(38-8)+8),name:"name"+i}) };

Map 函数 Map 函数必须调用emit(key,value)返回键值对。使用this 返回当前待

处理的文档。

> mapf = function(){emit(this.classid, 1)}

function (){emit(this.classid, 1)}

Reduce 函数

Reduce 函数接收的参数类似Group 效果,已经按照健聚合过一次

将Map 返回的键值序列组合成{key, [value1,value2,value3,....,valuen]}传递给

Reduce,Reduce 函数对values 统计

> reducef=function (key, values) {

... var count = 0;

... values.forEach(function (v) {count += v;}); return count;

... }

function (key, values) {

var count = 0;

values.forEach(function (v) {count += v;}); return count;

}

Options 更多的控制细节

> res = db.runCommand({ mapreduce:"users", map:mapf, reduce:reducef,

out:"users_res",

finalize:ff,

query:{age:{$lt:10}}

...

});

{

"result"

:

"users_res",

"timeMillis"

:

6251,

"counts"

:

{

"input"

:

333716,

"emit"

:

333716,

"reduce"

:

6676,

"output"

:

2

},

"ok"

:

1

}

>

结果:

>

db.users_res.find();

{

"_id"

:

1,

"value"

:

{

"classid"

:

1,

"count"

:

167142

}

}

{

"_id"

:

2,

"value"

:

{

"classid"

:

2,

"count"

:

166574

}

}

1 班小于10 岁的有167142 人。2 班小于10 岁的有166574 人。

继续统计小于20 岁以下,每个班学生的个数:

> res = db.runCommand({ mapreduce:"users", map:mapf, reduce:reducef,

out:"users_2res", finalize:ff, query:{age:{$lt:20}}

... ... });

{

"result" : "users_2res",

"timeMillis" : 23247,

"counts" : {

"input" : 3666243,

"emit" : 3666243,

"reduce" : 73326,

"output" : 2

},

"ok" : 1

}

> db.users_2res.find();

{ "_id" : 1, "value" : { "classid" : 1, "count" : 1832306 } }

{ "_id" : 2, "value" : { "classid" : 2, "count" : 1833937 } }

1 班小于20 岁的有1832306 人。2 班小于20 岁的有1833937 人。


阅读原文内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-数据库
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯