- 博客(2)
- 资源 (19)
- 收藏
- 关注
转载 Hadoop简单案例WordCount运行详解(转)
1、MapReduce理论简介 1.1 MapReduce编程模型 MapReduce采用"分而治之"的思想,把对大规模数据集的操作,分发给一个主节点管理下的各个分节点共同完成,然后通过整合各个节点的中间结果,得到最终结果。简单地说,MapReduce就是"任务的分解与结果的汇总"。 在Hadoop中,用于执行MapReduce任务的机器角色有两个:一个是JobTracker;
2013-05-08 08:23:51 748
转载 Hadooop集群安装超详细(转)
1、集群部署介绍 1.1 Hadoop简介 Hadoop是Apache软件基金会旗下的一个开源分布式计算平台。以Hadoop分布式文件系统(HDFS,Hadoop Distributed Filesystem)和MapReduce(Google MapReduce的开源实现)为核心的Hadoop为用户提供了系统底层细节透明的分布式基础架构。 对于Had
2013-04-22 09:42:16 1093
RedHat5.1配置yum源
2014-02-28
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人