qq_34374243-CSDN博客

空空如也

HBase实战.epub

第一部分 HBase基础第1章 HBase介绍 1.1 数据管理系统：速成 1.1.1 你好，大数据 1.1.2 数据创新 1.1.3 HBase的崛起 1.2 HBase使用场景和成功案例 1.2.1 典型互联网搜索问题：BigTable发明的原因 1.2.2 抓取增量数据 1.2.3 内容服务 1.2.4 信息交换 1.3 你好HBase 1.3.1 快速安装 1.3.2 HBase Shell命令行交互 1.3.3 存储数据 1.4 小结第2章入门 2.1 从头开始 2.1.1 创建表 2.1.2 检查表模式 2.1.3 建立连接 2.1.4 连接管理 2.2 数据操作 2.2.1 存储数据 2.2.2 修改数据 2.2.3 工作机制：HBase写路径 2.2.4 读数据 2.2.5 工作机制：HBase读路径 2.2.6 删除数据 2.2.7 合并：HBase的后台工作 2.2.8 有时间版本的数据 2.2.9 数据模型概括 2.3 数据坐标 2.4 小结 2.5 数据模型 2.5.1 逻辑模型：有序映射的映射集合 2.5.2 物理模型：面向列族 2.6 表扫描 2.6.1 设计用于扫描的表 2.6.2 执行扫描 2.6.3 扫描器缓存 2.6.4 使用过滤器 2.7 原子操作 2.8 ACID语义 2.9 小结第3章分布式的HBase、HDFS和MapReduce 3.1 一个MapReduce的例子 3.1.1 延迟与吞吐量 3.1.2 串行计算吞吐量有限 3.1.3 并行计算提高吞吐量 3.1.4 MapReduce：用布式计算最大化吞吐量 3.2 Hadoop MapReduce概览 3.2.1 MapReduce数据流介绍 3.2.2 MapReduce内部机制 3.3 分布式模式的HBase 3.3.1 切分和分配大表 3.3.2 如何找到region 3.3.3 如何找到-ROOT-表 3.4 HBase和MapReduce 3.4.1 使用HBase作为数据源 3.4.2 使用HBase接收数据 3.4.3 使用HBase共享资源 3.5 信息汇总 3.5.1 编写MapReduce应用 3.5.2 运行MapReduce应用 3.6 大规模条件下的可用性和可靠性 3.6.1 HDFS作为底层存储 3.7 小结第二部分高级概念第4章 HBase表设计 4.1 如何开始模式设计 4.1.1 问题建模 4.1.2 需求定义：提前多做准备工作总是有好处的 4.1.3 均衡分布数据和负载的建模方法 4.1.4 目标数据访问 4.2 反规范化是HBase世界里的词语 4.3 相同表里的混杂数据 4.4 行键设计策略 4.5 IO考虑 4.5.1 为写优化 4.5.2 为读优化 4.5.3 基数和行键结构 4.6 从关系型到非关系型 4.6.1 一些基本概念 4.6.2 嵌套实体 4.6.3 没有映射到的一些东西 4.7 列族高级配置 4.7.1 可配置的数据块大小 4.7.2 数据块缓存 4.7.3 激进缓存 4.7.4 布隆过滤器 4.7.5 生存时间（TTL） 4.7.6 压缩 4.7.7 单元时间版本 4.8 过滤数据 4.8.1 实现一个过滤器 4.8.2 预装过滤器 4.9 小结第5章使用协处理器扩展HBase 5.1 两种协处理器 5.1.1 Observer协处理器 5.1.2 endpoint协处理器 5.2 实现一个observer 5.2.1 修改模式 5.2.2 从HBase开始 5.2.3 安装observer 5.2.4 其他安装选项 5.3 实现一个endpoint 5.3.1 为endpoint定义接口 5.3.2 实现endpoint服务器 5.3.3 实现endpoint客户端 5.3.4 部署endpoint服务器 5.3.5 试运行 5.4 小结第6章其他的HBase客户端选择 6.1 在UNIX里使用HBase Shell脚本 6.1.1 准备HBase Shell 6.1.2 使用UNIX Shell脚本创建表模式 6.2 使用JRuby进行HBase Shell编程 6.2.1 准备HBase Shell 6.2.2 访问TwitBase的users表 6.3 通过REST访问HBase 6.3.1 启动HBase REST服务 6.3.2 访问TwitBase的users表 6.4 通过Python使用HBase Thrift网关 6.4.1 生成Python语言的HBase Thrift客户端库 6.4.2 启动HBase Thrift服务 6.4.3 扫描TwitBaseuser表 6.5 asynchbase：另外一种HBase Java客户端 6.5.1 创建一个asynchbase项目 6.5.2 改变TwitBase的密码策略 6.5.3 试运行 6.6 小结第三部分应用系统实例第7章通过实例学习HBase：OpenTSDB 7.1 OpenTSDB概述 7.1.1 挑战：基础设施监控 7.1.2 数据：时间序列 7.1.3 存储：HBase 7.2 设计一个HBase应用系统 7.2.1 模式设计 7.2.2 应用架构 7.3 实现一个HBase应用系统 7.3.1 存储数据 7.3.2 查询数据 7.4 小结第8章在HBase上查询地理信息系统 8.1 运用地理数据 8.2 设计一个空间索引 8.2.1 从复合行键开始 8.2.2 介绍geohash 8.2.3 理解geohash 8.2.4 在有空间感知特性的行键里使用geohash 8.3 实现最近邻居查询 8.4 把计算工作推往服务器端 8.4.1 基于查询多边形创建一次geohash扫描 8.4.2 区域内查询第一幕：客户端 8.4.3 区域内查询第二幕：WithinFilter 8.5 小结第四部分让HBase运转起来第9章部署HBase 9.1 规划集群 9.1.1 原型集群 9.1.2 小型生产集群（10～20台服务器） 9.1.3 中型生产集群（50台以下服务器） 9.1.4 大型生产集群（超过50台服务器） 9.1.5 Hadoop Master节点 9.1.6 HBase Master 9.1.7 Hadoop DataNode和HBase RegionServer 9.1.8 ZooKeeper 9.1.9 采用云服务怎么样？ 9.2 部署软件 9.2.1 Whirr：在云端部署 9.3 发行版本 9.3.1 使用原生Apache发行版本 9.3.2 使用Cloudera的CDH发行版本 9.4 配置 9.4.1 HBase配置 9.4.2 与HBase有关的Hadoop配置参数 9.4.3 操作系统配置 9.5 管理守护进程 9.6 小结第10章运维 10.1 监控你的集群 10.1.1 HBase如何输出监控指标 10.1.2 收集监控指标和图形展示 10.1.3 HBase输出的监控指标 10.1.4 应用端监控 10.2 HBase集群的性能 10.2.1 性能测试 10.2.2 什么影响了HBase的性能 10.2.3 优化支撑系统 10.2.4 优化HBase 10.3 集群管理 10.3.1 启动和停止HBase 10.3.2 优雅停止和让节点退役 10.3.3 增加节点 10.3.4 滚动重启和升级 10.3.5 bin/hbase和HbaseShell 10.3.6 维护一致性——hbck 10.3.7 查看HFile和HLog 10.3.8 预先拆分表 10.4 备份和复制 10.4.1 集群间复制 10.4.2 使用MapReduce作业进行备份 10.4.3 备份根目录 10.5 小结附录A 探索HBase系统附录B 更多关于HDFS的工作原理

2018-04-17

Akka入门与实战中文版

内容简介本书将尝试帮助入门级、中级以及高级读者理解基本的分布式计算概念，并且展示如何使用 Akka 来构建具备高容错性、可以横向扩展的分布式网络应用程序。Akka 是一个强大的工具集，提供了很多选项，可以对在本地机器上处理或网络远程机器上处理的某项工作进行抽象封装，使之对开发者不可见。本书将介绍各种概念，帮助读者理解网络上各系统进行交互的困难之处，并介绍如何使用 Akka 提供的解决方案来解决这些问题。作者简介 Jason Goodwin 是一个基本上通过自学成才的开发者。他颇具企业家精神，在学校学习商学。不过他从 15 岁起就开始学习编程，并且一直对技术保持着浓厚的兴趣。这对他的职业生涯产生了重要的影响，从商学转向了软件开发。现在他主要从事大规模分布式系统的开发。在业余时间，他喜欢自己原创电子音乐。他在 mDialog 公司第一次接触到 Akka 项目。mDialog 是一家使用 Scala/Akka 的公司，为主流出版商提供视频广告插入软件。这家公司最终被 Google 收购。他同时还是一名很有影响力的“技术控”，将 Akka 引入加拿大一家主要的电信公司，帮助该公司为客户提供容错性更高、响应更及时的软件。除此之外，他还为该公司中的一些团队教授 Akka、函数式以及并发编程等知识。目录第 1 章初识 Actor：Akka 工具集以及 Actor 模型的介绍。第 2 章 Actor 与并发：响应式编程。Actor 与 Future 的使用。第 3 章传递消息：消息传递模式。第 4 章 Actor 的生命周期—处理状态与错误：Actor 生命周期、监督机制、Stash/ Unstash、Become/Unbecome 以及有限自动机。第 5 章纵向扩展：并发编程、Router Group/Pool、Dispatcher、阻塞 I/O 的处理以及 API。第 6 章横向扩展—集群化：集群、CAP 理论以及 Akka Cluster。第 7 章处理邮箱问题：加大邮箱负载、不同邮箱的选择、熔断机制。第 8 章测试与设计：行为说明、领域驱动设计以及 Akka Testkit。第 9 章尾声：其他 Akka 特性。下一步需要学习的知识。

2017-07-16

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

空空如也

HBase实战.epub

Akka入门与实战 中文版

空空如也

Akka入门与实战中文版