- 博客(3)
- 收藏
- 关注
原创 分布式计算开源框架Hadoop学习心得3
<br /><br /> <br />图2:HDFS结构示意图<br />上图中展现了整个HDFS三个重要角色:NameNode、DataNode和Client。NameNode可以看作是分布式文件系统中的管理者,主要负责管理文件系统的命名空间、集群配置信息和存储块的复制等。NameNode会将文件系统的Meta-data存储在内存中,这些信息主要包括了文件信息、每一个文件对应的文件块的信息和每一个文件块在DataNode的信息等。DataNode是文件存储的基本单元,它将Block存储在本地文件系统中,保
2010-07-05 10:28:00 477
原创 分布式计算开源框架Hadoop学习心得2
<br />之前一篇,写了不少东西,结果发出来的时候才一点点。。。杯具了,现在只能继续加上去了<br />----------------------------------------------------HLL的分割线--------------------------------------------------------------------<br /> <br /> 任务分解处理以后,那就需要将处理以后的结果再汇总起来,这就是Reduce要做的工作。<br /><br /><br /
2010-07-05 10:27:00 704
原创 分布式计算开源框架Hadoop学习心得之1
<br /> Hadoop是Apache开源组织的一个分布式计算开源框架,在很多大型网站上都已经得到了应用,如亚马逊、Facebook和Yahoo等等。对于我来说,最近的一个使用点就是服务集成平台的日志分析。服务集成平台的日志量将会很大,而这也正好符合了分布式计算的适用场景(日志分析和索引建立就是两大应用场景)。<br /> 当前没有正式确定使用,所以也是自己业余摸索,后续所写的相关内容,都是一个新手的学习过程,出现错误请大家指正。<br />什么是Hadoop?<br /> Hadoop
2010-07-05 10:21:00 669 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人