文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

hadoop3.3集群搭建方法

2023-06-19 12:22

关注

本篇内容介绍了“hadoop3.3集群搭建方法”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!

分布式服务器集群上存储海量数据并运行分布式分析应用的开源框架,其核心部件是HDFS与MapReduce

概念

服务 fsimage:元数据镜像文件(文件系统的目录树。) edits:元数据的操作日志(针对文件系统做的修改操作记录) NameNode 处理客户端的读写请求;配置副本策略;保存HDFS的元数据信息,比如命名空间信息,块信息等。当它运行的时候,这些信息是存在内存(保存的fsimage+edits)中的。但是这些信息也可以持久化到磁盘上 SecondaryNameNode 是专门做NameNode 中edits 文件向fsimage 合并数据,然后再发给namenode,防止edits过大的一种解决方案 NodeManager管理一个YARN集群中的每一个节点。比如监视资源使用情况( CPU,内存,硬盘,网络),跟踪节点健康等。 ResourceManager是Yarn集群主控节点,负责协调和管理整个集群(所有NodeManager)的资源 DataNode:负责存储client发来的数据块block;执行数据块的读写操作。 热备份:b是a的热备份,如果a坏掉。那么b马上运行代替a的工作。 冷备份:b是a的冷备份,如果a坏掉。那么b不能马上代替a工作。但是b上存储a的一些信息,减少a坏掉之后的损失。

集群

环境:

本文使用的3.3新版本搭建集群(一主两从)

192.168.41.128   server1192.168.41.129   server2192.168.41.130   server3
#禁用selinux/etc/selinux/config #配置免密登录 ssh-keygen  ssh-copy-id -i .ssh/id_rsa.pub root@server2 ssh-copy-id -i .ssh/id_rsa.pub root@server3
  1. 安装jdk 略..

  2. 下载解压: tar zxvf hadoop-3.3.0.tar.gz

  3. 配置 详细查阅:http://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-common/ClusterSetup.html

#Administrators should use the etc/hadoop/hadoop-env.sh and optionally the etc/hadoop/mapred-env.sh and etc/hadoop/yarn-env.sh scripts to do site-specific customization of the Hadoop daemons’ process environment.官网原话,意思要指定JAVA_HOMEexport JAVA_HOME=/usr/java/jdk1.8.0_241-amd64#etc/hadoop/core-site.xml <configuration>  <property>    <name>fs.defaultFS</name>    <value>hdfs://server1:9000</value>  </property> <property>  <name>hadoop.tmp.dir</name>  <value>/opt/hadoop-3.3.0/tmp</value> </property> #etc/hadoop/hdfs-site.xml,指定数据的副本数,小于等于从节点数 <property>    <name>dfs.replication</name>    <value>2</value>  </property> <property>    <name>dfs.namenode.secondary.http-address</name>    <value>server1:50090</value>  </property>#etc/hadoop/yarn-site.xml,yarn配置资源管理器,提供统一的资源管理和调度<property>    <name>yarn.nodemanager.aux-services</name>    <value>mapreduce_shuffle</value>  </property> <property>    <name>yarn.resourcemanager.hostname</name>    <value>server1</value>  </property>#etc/hadoop/mapred-site.xml,mapreduce的执行引擎<configuration>  <property>    <name>mapreduce.framework.name</name>    <value>yarn</value>  </property></configuration>
  1. 初始化hdfs: bin/hdfs namenode -format

  2. 修改执行角色

#sbin/start-dfs.sh,sbin/stop-dfs.shHDFS_DATANODE_USER=rootHDFS_DATANODE_SECURE_USER=hdfsHDFS_NAMENODE_USER=rootHDFS_SECONDARYNAMENODE_USER=root#sbin/start-yarn.sh,sbin/stop-yarn.shYARN_RESOURCEMANAGER_USER=rootHADOOP_SECURE_DN_USER=yarnYARN_NODEMANAGER_USER=root
  1. 配置从节点 etc/hadoop/works,修改对应主机

  2. 启动 sbin/start-all.sh

  3. 访问 http://192.168.41.128:9870/ 即主机+端口可以访问显示如下说明成功了 hadoop3.3集群搭建方法

“hadoop3.3集群搭建方法”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注编程网网站,小编将为大家输出更多高质量的实用文章!

阅读原文内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯