Hadoop的核心组件包括以下几个:
-
Hadoop Distributed File System(HDFS):Hadoop分布式文件系统,用于存储大规模数据集。
-
MapReduce:Hadoop的计算模型,用于并行处理大规模数据集。
-
YARN(Yet Another Resource Negotiator):资源管理器,用于分配集群中的资源给各个应用程序。
-
Hadoop Common:包含Hadoop的公共工具类、库和文件。
-
Hadoop Ozone:分布式对象存储系统,用于存储大规模数据集。
Hadoop的主要功能包括存储和处理大规模数据集,提供高可靠性和高可扩展性的数据处理能力,支持并行计算和分布式存储等功能。