短信预约-IT技能免费直播动态提醒

短信预约提醒成功

Mapreduce分布式并行编程

2022-11-13 14:25

关注

目录

1.什么是并行计算
2.现在mapreduce能做什么？

map：映射
reduce：做比较，工作整合，上下游
有些操作放在map、reduce里面都可以

1.project(投射）map完成
2.filter（过滤）map完成
3.key(汇集）

数据SQL:

oss和hive的区别？

1. 搭建各类环境
2. 搭建、配置zookeeper
3. 启动zookeeper
4. 安装配置java
5. 主从节点格式化
6. 启动集群
7. 安装Scala
8. 启动spark集群
9. jps查看已经启动的

实验部分：

1.什么是并行计算

传统并行计算：共享同一个数据，通过锁来控制数据的读写，难度大，容易导致死锁，拓展性差。但是是实时的，细颗粒度计算，计算密集型

Mapreduce：对机器的要求低，拓展性难，便宜，拓展性强，批处理场景，非实时，数据密集型（傻大）

map:分配工作任务给不同的人，并让其完成工作（工作相互独立，不互相为上下环节）

reduce：把不同的结果集合并再加上分布式

2.现在mapreduce能做什么？

map：映射

1.如小写字母变成大写字母 map

2.把年龄小于16岁的都去掉 map

3.把美元变成人民币 y=x∗6.3y=x * 6.3y=x∗6.3 map

4.地址库的一个翻译：省市县 map

5.（只要是一些处理数据相关的，都应当是在map上）

reduce：做比较，工作整合，上下游

1.统计年薪最高的人（一个组）key

2.按照男女计算平均年龄（俩个组）key

3.排序 reduce

有些操作放在map、reduce里面都可以

a-------->a----->A

map--------- reduce ×

前提：尽量要减少数据的流动，reduce阶段数据越少越好，能在map做就在map做掉

数据SQL:

Select name ,age,gender from people where id =3

1.project(投射）map完成

Select name ,age,gender

2.filter（过滤）map完成

id=3

3.key(汇集）

如：Select avg(age),gender from peoplemap:age,gender ---project
key:gender(F,M) //分为man和female

reduce:按照key进行汇集 F(25,38,23),M(45,23)

reduce：avg

如：Select max(age),gender from people这里和上面差不多，但是就没有key了放在同一个地方

oss和hive的区别？

在文件系统上

实验部分：

1. 搭建各类环境

为了模拟真实情况,我这里搭建了分布式的hadoop集群,分别有三台机器。一台做master，一台做slave。

2. 搭建、配置zookeeper

3. 启动zookeeper

/usr/zookeeper/zookeeper-3.4.10/bin/zkServer.sh start

4. 安装配置java

5. 主从节点格式化

6. 启动集群

/usr/hadoop/hadoop-2.7.3/sbin/start-all.sh

7. 安装Scala

8. 启动spark集群

/usr/spark/spark-2.4.0-bin-hadoop2.7/sbin/start-all.sh

9. jps查看已经启动的

以上就是Mapreduce分布式并行编程的详细内容，更多关于Mapreduce分布式的资料请关注编程网其它相关文章！

阅读原文内容投诉

免责声明：

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的，并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据，供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

历年真题答案解析
备考技巧名师总结
高频考点精准押题

资料下载
历年真题

2024上半年软考中级软件测评师考试基础知识真题
193.9 KB下载数265
2024上半年软考中级软件设计师考试基础知识真题
191.63 KB下载数245
2023下半年-系统集成项目管理工程师-真题考点汇总（完整版）
143.91 KB下载数1148
2023年下半年系统集成项目管理工程师第一、二、三批次真题考点整理(考友回忆版)
183.71 KB下载数642
2023年上半年软考中级《系统集成项目管理工程师》-基础知识-考试真题及答案
644.84 KB下载数2756

2024年上半年信息系统项目管理师第二批次真题及答案解析（完整版）
难度 813人已做
查看
【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析
难度 354人已做
查看
【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析
难度 318人已做
查看
2024年上半年软考高项第一、二批次真题考点汇总（完整版）
难度 435人已做
查看
2024年上半年系统架构设计师考试综合知识真题
难度 224人已做
查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机

Mapreduce分布式并行编程

后端开发2022-11-13

怎么在Redis上对Java执行分布式MapReduce

后端开发2023-06-05

Golang 函数在分布式系统中的并行编程

Golang 函数在分布式系统中的并行编程

后端开发2024-04-19

C++ 元编程在分布式系统和并行编程中的潜力如何？

C++ 元编程在分布式系统和并行编程中的潜力如何？

后端开发2024-05-21

Python 并行分布式框架 Celer

后端开发2023-01-31

C++ 函数如何支持分布式并发编程？

C++ 函数如何支持分布式并发编程？

后端开发2024-04-26

如何使用 ASP 进行分布式编程？教程来了！

后端开发2023-08-07

Golang编程并发工具库MapReduce使用实践

后端开发2024-04-02

PHP 并发编程，如何应对分布式系统挑战？

后端开发2023-06-16

你知道如何用 ASP 进行分布式编程吗？

后端开发2023-08-07

如何在分布式系统中使用ASP.NET进行编程？

后端开发2023-10-22

PHP并发编程之路：如何实现分布式文件处理？

后端开发2023-09-22

分布式函数能否成为PHP并发编程的新趋势？

后端开发2023-10-06

分布式编程的挑战：Python 异步编程的实现方式

后端开发2023-10-14

Go 语言分布式编程教程：让你的程序规模化运行！

后端开发2023-08-26

Python真的适合分布式编程吗？

后端开发2023-09-14

C#并行编程之PLINQ(并行LINQ)

后端开发2024-04-02

如何用Python编写分布式程序并实现重定向功能？

后端开发2023-07-09

从零开始学习 PHP 并发编程与分布式系统设计

后端开发2023-06-16

PHP并发编程有多难？如何实现分布式实时交互？

PHP并发编程有多难？如何实现分布式实时交互？

后端开发2023-11-01

位置：首页-资讯-后端开发

咦！没有更多了？去看看其它编程学习网内容吧