- 博客(3)
- 资源 (5)
- 收藏
- 关注
原创 Hadoop三大组件之——HDFS概述
HDFS的概述HDFS产生背景HDFS(Hadoop Distributed File System 分布式文件系统),源自于Goole于2003年10月发表的GFS论文,是GFS的克隆版,具有如下特点:(1)易于扩展的分布式文件系统(2)运行在大量的普通廉价机器上(3)为大量用户提供性能不错的文件存取服务HDFS优点(1)高容错性:数据自动保存多个副本(一般默认三个),副本丢失后,...
2019-04-09 09:19:51 1645
原创 Hadoop简介
Hadoop简介什么是HadoopHadoop产生背景Hadoop在大数据、云计算中的位置和关系Hadoop的五大守护进程Hadoop生态圈重要组件什么是HadoopHadoop是Apache旗下的一套开源软件平台。Hadoop提供的功能有:利用服务器集群,根据用户自定义的业务逻辑,对海量数据进行分布式处理。Hadoop的核心组件有:HDFS:分布式文件系统YARN:运算资源调度系...
2019-04-04 09:14:13 439
原创 Hadoop完全分布式搭建
Hadoop是一个由Apache基金会所开发的分布式系统基础架构。 用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。 Hadoop实现了一个分布式系统(Hadoop Distributed File System),简称HDFS。HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬...
2019-04-03 19:55:21 287
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人