自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(0)
  • 资源 (2)
  • 收藏
  • 关注

空空如也

hadoop应用开发技术详解代码

hadoop应用开发技术详解书本源代码 第3 4 5 7 8 10 11 12 章; 全书的源代码都在这里了

2015-05-25

Hadoop应用开发实战详解源代码

Hadoop应用开发实战详解源代码  第4章 初识MapReduce   4.1 MapReduce简介     4.1.1 MapReduce要解决什么问题     4.1.2 MapReduce的理论基础     4.1.3 MapReduce的编程模式    4.2 MapReduce的集群行为    4.3 Map/Reduce框架    4.4 样例分析:单词计数     4.4.1 WordCount实例的运行过程     4.4.2 WordCount的源码分析和程序处理过程     4.4.3 MapReduce常用类及其接口    4.5 实例:倒排索引     4.5.1 倒排索引的分析和设计     4.5.2 倒排索引完整源码     4.5.3 运行代码结果    4.6 MapReduce 在日志分析中数据去重案例     4.6.1 什么是数据去重     4.6.2 设计思路     4.6.3 程序代码     4.6.4 代码运行结果    4.7 数据排序实例     4.7.1 实例描述     4.7.2 设计思路     4.7.3 程序代码    4.8 思考与总结   第5章 分布式开源数据库HBase   5.1 HBase简介     5.1.1 HBase逻辑视图     5.1.2 HBase物理存储     5.1.3 子表Region服务器     5.1.4 Hmaster主服务器     5.1.5 元数据表    5.2 HBase的安装配置     5.2.1 HBase单机模式     5.2.2 HBase伪分布模式     5.2.3 HBase完全分布模式    5.3 学生成绩表实例     5.3.1 Shell的基本操作     5.3.2 代码实现     5.3.3 关于中文的处理     5.3.4 常用HBase的 Shell操作    5.4 思考与总结   第6章 MapReduce进阶   6.1 API的配置     6.1.1 一个简单的配置文件     6.1.2 合并多个源文件     6.1.3 可变的扩展    6.2 配置开发环境     6.2.1 配置文件设置     6.2.2 设置用户标识    6.3 复合键值对的使用     6.3.1 小的键值对如何合并成大的键值对     6.3.2 巧用复合键让系统完成排序    6.4 用户定制数据类型     6.4.1 内置数据类型     6.4.2 用户自定义数据类型    6.5 用户定制输入/输出格式     6.5.1 内置数据的输入格式     6.5.2 用户定制数据输入格式与RecordReader     6.5.3 Hadoop内置的数据输出格式     6.5.4 Hadoop内置的数据输出格式与RecordWriter    6.6 用户定制Partitioner和Combiner    6.7 组合式的MapReduce作业     6.7.1 MapReduce作业运行机制     6.7.2 组合式MapReduce计算作业    6.8 DataJoin连接多数据源    6.9 思考与总结   第10章 ZooKeeper开发应用   10.1 ZooKeeper简介     10.1.1 ZooKeeper的设计目标     10.1.2 ZooKeeper主要解决什么问题     10.1.3 ZooKeeper的基本概念和工作原理    10.2 ZooKeeper的安装配置     10.2.1 单机模式     10.2.2 启动并测试ZooKeeper     10.2.3 集群模式    10.3 ZooKeeper提供的接口    10.4 ZooKeeper事件    10.5 ZooKeeper实例     10.5.1 实例1:一个简单的应用——分布式互斥锁     10.5.2 实例2:进程调度系统    10.6 思考与总结  第2篇 Hadoop管理和容错篇  第11章 Hadoop管理   11.1 Hadoop权限管理    11.2 HDFS文件系统管理    11.3 Hadoop维护与管理    11.4 Hadoop常见问题及解决办法    11.5 思考与总结   第12章 Hadoop容错   12.1 Hadoop的可靠性     12.1.1 HDFS中的NameNode单点失效解决方案     12.1.2 HDFS数据块副本机制     12.1.3 HDFS心跳机制     12.1.4 HDFS负载均衡     12.1.5 MapReduce容错    12.2 Hadoop的SecondayNameNode机制     12.2.1 磁盘镜像与日志文件     12.2.2 SecondaryNameNode更新镜像的流程    12.3 Avatar机制     12.3.1 Avatar机制简介     12.3.2 Avatars部署实战    12.4 Hadoop_HBase容错    12.5 思考与总结  第3篇 Hadoop实战篇  第13章 综合实战1:Hadoop中的数据库访问   13.1 DBInputFormat类访问数据库     13.1.1 在DBInputFormat类中包含的内置类     13.1.2 使用DBInputFormat读取数据库表中的记录     13.1.3 使用示例    13.2 使用DBOutputFormat向数据库中写记录    13.3 思考与总结   第14章 综合实战2:一个简单的分布式的Grep   14.1 分析与设计    14.2 实现代码    14.3 运行程序    14.4 思考与总结   第15章 综合实战3:打造一个搜索引擎   15.1 搜索引擎工作原理    15.2 网页搜集与信息提取     15.2.1 设计的主要思想     15.2.2 系统设计目标    15.3 网页信息的提取与存储    15.4 MapReduce的预处理     15.4.1 第一步:源数据过滤     15.4.2 第二步:生成倒排文件     15.4.3 第三步:建立二级索引    15.5 建立Web信息查询服务    15.6 思考与总结   第16章 综合实战4:移动通信信令监测与查询   16.1 分析与设计     16.1.1 CDR数据文件的检测与索引创建任务调度     16.1.2 从HDFS读取数据并创建索引     16.1.3 查询CDR信息    16.2 代码实现     16.2.1 CDR文件检测和索引创建任务程序     16.2.2 读取CDR数据和索引创建处理     16.2.3 CDR查询    16.3 思考与总结  附录A Hadoop命令大全  附录B HDFS命令大全

2015-05-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除