- 博客(0)
- 资源 (15)
- 收藏
- 关注
kafka权威指南
1 了解发布和订阅消息模型以及该模型如何被应用在大数据生态系统中
2 学习使用Kafka生产者和消费者来生成消息和读取消息
3 了解Kafka保证可靠性数据传递的模式和场景需求
4 使用Kafka构建数据管道和应用程序的zuijia实践
5 在生产环境中管理Kafka,包括监控、调优和维护
6了解Kafka的关键度量指标
7探索Kafka如何成为流式处理利器
2018-07-28
图解Spark 核心技术与案例实战
本书分为三个部分,共计12章。
第一部分为基础篇(第1~2章),介绍了Spark诞生的背景、演进历程,介绍了Spark生态圈的组成,并详细地介绍如何搭建Spark实战环境,通过该环境不仅可以阅读Spark源代码,而且可以开发Spark应用程序。
第二部分为核心篇(第3~6章),讲解了Spark的编程模型、核心原理、存储原理和运行架构,在核心原理中对Spark通信机制、作业执行原理、调度算法、容错和监控管理等进行了深入的分析,在分析原理和代码的同时结合实例进行演示。
第三部分为组件篇(第7~12章),介绍了Spark的各个组件,包括了Spark SQL的即席查询、Spark Streaming的实时流处理应用、MLbase/MLlib的机器学习、GraphX的图处理、SparkR的数学计算和Alluxio的分布式内存文件系统等。
另外本书后面还包括5个附录:附录A为编译安装Hadoop,附录B为安装MySql数据库,附录C为编译安装Hive,附录D为安装ZooKeeper,附录E为安装Kafka。由于该书篇幅的限制,这些内容在作者的博客可以下载。
2018-07-28
PostgreSQL 9 Administration Cookbook Second Edition
PostgreSQL 9 Administration Cookbook Second Edition
2016-04-20
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人