o000ooo000o-CSDN博客

空空如也

Kafka权威指南

每个应用程序都会产生数据，包括日志消息、度量指标、用户活动记录、响应消息等。如何移动数据，几乎变得与数据本身一样重要。如果你是架构师、开发者或者产品工程师，同时也是Apache Kafka新手，那么这本实践指南将会帮助你成为流式平台上处理实时数据的专家。本书由出身于LinkedIn的Kafka核心作者和一线技术人员共同执笔，详细介绍了如何部署Kafka集群、开发可靠的基于事件驱动的微服务，以及基于Kafka平台构建可伸缩的流式应用程序。通过详尽示例，你将会了解到Kafka的设计原则、可靠性保证、关键API，以及复制协议、控制器和存储层等架构细节。 ● 了解发布和订阅消息模型以及该模型如何被应用在大数据生态系统中 ● 学习使用Kafka生产者和消费者来生成消息和读取消息 ● 了解Kafka保证可靠性数据传递的模式和场景需求 ● 使用Kafka构建数据管道和应用程序的最佳实践 ● 在生产环境中管理Kafka，包括监控、调优和维护 ● 了解Kafka的关键度量指标 ● 探索Kafka如何成为流式处理利器

2018-02-08

大数据架构和算法实现之路：电商系统的技术实战

现在可以上传大点的文件了，不用分割，重新传一次作者: 黄申出版社: 机械工业出版社出版年: 2017-6 装帧: 平装 ISBN: 9787111569695

2018-01-22

图解设计模式

原版连续畅销12年、重印25次！, 194张图表＋ Java示例代码 = 轻松理解GoF的23种设计模式, 《程序员的数学》《数学女孩》作者结城浩又一力作, ◆图文并茂, 194张图表（包括57张UML类图）穿插文中，帮助理解各设计模式, ◆通俗易懂, 用浅显的语言逐一讲解23种设计模式，读完此书会发现GoF书不再晦涩难懂, ◆专业实用, 编写了Java程序代码来实现设计模式，每章附带练习题和答案，用以熟练掌握设计模式, ◆拓展进阶, 必要时对Java语言的功能进行了补充说明，可加深对Java的理解。此外，如果了解C++语言，同样可以轻松理解本书内容, 本书适合以下读者阅读, •对面向对象开发感兴趣的人, •对设计模式感兴趣的人（特别是阅读了GoF书但是觉得难以理解的人）, •所有Java程序员（特别是对抽象类和接口的理解不充分的人）, 本书以浅显易懂的语言逐一说明了GoF的23种设计模式。在讲解过程中，不仅搭配了丰富的图片，而且理论结合实例，用Java语言编写代码实现了设计模式的程序，让程序真正地运行起来，并提供了运用模式解决具体问题的练习题和答案。除此以外，本书在必要时还对Java语言的功能进行补充说明，以加深读者对Java的理解。

2018-01-16

图解Spark 核心技术与案例实战

基于Spark2, 作者: 郭景瞻出版社: 电子工业出版社出版年: 2017-1 页数: 480 定价: 99 装帧: 平装 ISBN: 9787121302367

2018-01-16

深入理解Spark+核心思想与源码分析

作者: 耿嘉安出版社: 机械工业出版社副标题: 核心思想与源码分析原作名: 深入理解SPARK 出版年: 2016-1-1 页数: 469 定价: 99 装帧: 平装 ISBN: 9787111522348

2018-01-16

Spark 技术内幕-深入解析Spark内核架构设计与实现原理

作者: 张安站出版社: 机械工业出版社副标题: 深入解析Spark内核架构设计与实现原理出版年: 2015-9-1 页数: 201 装帧: 平装丛书: 大数据技术丛书 ISBN: 9787111509646

2018-01-16

Spark机器学习模块源码解读

Spark机器学习模块源码解读 Spark机器学习模块源码解读

2018-01-16

Spark机器学习

本书每章都设计了案例研究，以机器学习算法为主线，结合实例探讨了Spark 的实际应用。书中没有让人抓狂的数据公式，而是从准备和正确认识数据开始讲起，全面涵盖了推荐系统、回归、聚类、降维等经典的机器学习算法及其实际应用。

2018-01-16

Spark核心技术与高级应用

作者: 于俊 / 向海 / 代其锋 / 马海平出版社: 机械工业出版社出版年: 2016-1-1 页数: 300 定价: 69.00元装帧: 平装 ISBN: 9787111523543

2018-01-16

人人都是架构师：分布式系统架构落地与瓶颈突破

《人人都是架构师：分布式系统架构落地与瓶颈突破》并没有过多渲染系统架构的理论知识，而是切切实实站在开发一线角度，为各位读者诠释了大型网站在架构演变过程中出现一系列技术难题时的解决方案。《人人都是架构师：分布式系统架构落地与瓶颈突破》首先从分布式服务案例开始介绍，重点为大家讲解了大规模服务化场景下企业应该如何实施服务治理；然后在大流量限流/消峰案例中，笔者为大家讲解了应该如何有效地对流量实施管制，避免大流量对系统产生较大冲击，确保核心业务的稳定运行；接着笔者为大家讲解了分布式配置管理服务；之后的几章，笔者不仅为大家讲解了秒杀、限时抢购场景下热点数据的读/写优化案例，还为大家讲解了数据库实施分库分表改造后所带来的一系列影响的解决方案。, 《人人都是架构师：分布式系统架构落地与瓶颈突破》适用于任何对分布式系统架构感兴趣的架构师、开发人员以及运维人员。相信阅读《人人都是架构师：分布式系统架构落地与瓶颈突破》你将会有知其然和知其所以然的畅快感。

2018-01-16

Spark GraphX实战

《Spark GraphX实战》是一本Spark GraphX入门书籍。前5章为基础内容，即使读者对Spark、GraphX、Scala不熟悉，也能快速上手；后5章为图计算进阶，主要是图算法和机器学习算法的相关内容。专门讲图计算的书很少，《Spark GraphX实战》在第2、3、4章介绍了图的基础知识、GraphX基础知识、GraphX内置的图算法。第6章到第10章，主要介绍了GraphX之外的图算法、机器学习、图工具、GraphX监控和优化、GraphX的能力增强等实用技能。第9章和第10章主要介绍性能调优和监控，主要面向生产环境，有不少可以借鉴的技巧。, 《Spark GraphX实战》面向对图计算感兴趣的读者，旨在帮助读者掌握Spark GraphX的相关知识及其应用。

2018-01-16

增长黑客_创业公司的用户与收入增长秘籍

作者: 范冰出版社: 电子工业出版社副标题: 创业公司的用户与收入增长秘籍出版年: 2015-7-1 页数: 307 定价: CNY 59.00 装帧: 平装 ISBN: 9787121263606

2018-01-15

重构--改善既有代码的设计

重构--改善既有代码的设计,高清电子版作者: [美] Martin Fowler 出版社: 中国电力出版社副标题: 改善既有代码的设计原作名: Refactoring: Improving the Design of Existing Code 出版年: 2003-8-1 页数: 464 定价: 68.00元装帧: 平装 ISBN: 9787508315546

2018-01-15

图解java多线程设计模式

本书通过具体的Java 程序，以浅显易懂的语言逐一说明了多线程和并发处理中常用的12 种设计模式。内容涉及线程的基础知识、线程的启动与终止、线程间的互斥处理与协作、线程的有效应用、线程的数量管理以及性能优化的注意事项等。此外，还介绍了一些多线程编程时容易出现的失误，以及多线程程序的阅读技巧等。在讲解过程中，不仅以图配文，理论结合实例，而且提供了运用模式解决具体问题的练习题和答案，帮助读者加深对多线程和并发处理的理解，并掌握其使用技巧。

2018-01-15

深入理解Java虚拟机：JVM高级特性与最佳实践高清电子版

作者: 周志明出版社: 机械工业出版社副标题: JVM高级特性与最佳实践出版年: 2013-9-1 页数: 433 定价: 79.00元装帧: 平装 ISBN: 9787111421900

2018-01-11

《大数据智能》

作者: 刘知远 / 崔安颀出版社: 电子工业出版社副标题: 互联网时代的机器学习和自然语言处理技术出版年: 2016-1 页数: 232 定价: 49.00元装帧: 平装 ISBN: 9787121276484

2017-12-28

《Spark GraphX实战》

作者: 【美】Michael S. Malak / 【美】Robin East 出版社: 电子工业出版社译者: 时金魁 / 黄光远出版年: 2017-4 页数: 300 定价: 79 装帧: 平装 ISBN: 9787121310430

2017-12-28

Redis开发与运维

本书全面讲解Redis基本功能及其应用，并结合线上开发与运维监控中的实际使用案例，深入分析并总结了实际开发运维中遇到的“陷阱”，以及背后的原因，包含大规模集群开发与管理的场景、应用案例与开发技巧，为高效开发运维提供了大量实际经验和建议。本书不要求读者有任何Redis使用经验,对入门与进阶DevOps的开发者提供有价值的帮助。主要内容包括：Redis的安装配置、API、各种高效功能、客户端、持久化、复制、高可用、内存、哨兵、集群、缓存设计等，Redis高可用集群解决方案，Redis设计和使用中的问题，最后提供了一个开源工具：Redis监控运维云平台CacheCloud。

2017-12-21

亿级流量网站架构核心技术跟开涛学搭建高可用高并发系统 ,张开涛(著)

作者: 张开涛出版社: 电子工业出版社副标题: 跟开涛学搭建高可用高并发系统出版年: 2017-4 页数: 477 定价: 99 装帧: 平装 ISBN: 9787121309540

2017-12-15

大数据架构和算法实现之路：电商系统的技术实战 - 第二部分，需要下载两个部分，解压合并

大数据架构和算法实现之路：电商系统的技术实战 - 第二部分，需要下载两个部分，解压合并作者: 黄申出版社: 机械工业出版社出版年: 2017-6 装帧: 平装 ISBN: 9787111569695

2017-12-06

大数据架构和算法实现之路：电商系统的技术实战 - 第一部分，需要下载两个部分，解压合并

大数据架构和算法实现之路：电商系统的技术实战 - 第一部分，需要下载两个部分，解压合并作者: 黄申出版社: 机械工业出版社出版年: 2017-6 装帧: 平装 ISBN: 9787111569695

2017-12-06

大数据架构商业之路:从业务需求到技术方案 - 第二部分，需要下载两个部分，解压合并

大数据架构商业之路:从业务需求到技术方案 - 第二部分，需要下载两个部分，解压合并作者: [中] 黄申出版社: 机械工业出版社出版年: 2016-5-9 页数: 299 定价: 69.00元装帧: 平装 ISBN: 9787111535287

2017-12-06

大数据架构商业之路:从业务需求到技术方案 - 第一部分，需要下载两个部分，解压合并

大数据架构商业之路:从业务需求到技术方案 - 第一部分，需要下载两个部分，解压合并作者: [中] 黄申出版社: 机械工业出版社出版年: 2016-5-9 页数: 299 定价: 69.00元装帧: 平装 ISBN: 9787111535287

2017-12-06

大数据智能 - 第二部分，需要下载两个部分，解压合并

大数据智能 - 第一部分，需要下载两个部分，解压合并作者: 刘知远 / 崔安颀出版社: 电子工业出版社副标题: 互联网时代的机器学习和自然语言处理技术出版年: 2016-1 页数: 232 定价: 49.00元装帧: 平装 ISBN: 9787121276484

2017-12-06

大数据智能 - 第一部分，需要下载两个部分，解压合并

2017-12-06

Spark技术内幕深入解析Spark内核架构设计与实现原理

Spark技术内幕深入解析Spark内核架构设计与实现原理 Spark技术内幕深入解析Spark内核架构设计与实现原理

2017-12-04

Java 8实战

本书全面介绍了Java 8 这个里程碑版本的新特性，包括Lambdas、流和函数式编程。有了函数式的编程特性，可以让代码更简洁，同时也能自动化地利用多核硬件。全书分四个部分：基础知识、函数式数据处理、高效Java 8 编程和超越Java 8，清晰明了地向读者展现了一幅Java 与时俱进的现代化画卷。

2017-12-04

神经网络与深度学习

随着AlphaGo与李世石大战的落幕，人工智能成为话题焦点。AlphaGo背后的工作原理'深度学习'也跳入大众的视野。什么是深度学习，什么是神经网络，为何一段程序在精密的围棋大赛中可以大获全胜？人工智终将会取代人类智慧吗？, 本书结合日常生活中的寻常小事，生动形象地阐述了神经网络与深度学习的基本概念、原理和实践，案例丰富，深入浅出。对于正在进入人工智能时代的我们，这些内容无疑可以帮助我们更好地理解人工智能的原理，丰富我们对人类自身的认识，并启发我们对人机智能之争更深一层的思考与探索。, 《神经网络与深度学习》是一本介绍神经网络和深度学习算法基本原理及相关实例的书籍，它不是教科书，作者已尽量把公式减少到最少，以适应绝大部分人的阅读基础和知识储备。《神经网络与深度学习》涵盖了神经网络的研究历史、基础原理、深度学习中的自编码器、深度信念网络、卷积神经网络等，这些算法都已在很多行业发挥了价值。, 《神经网络与深度学习》适合有志于从事深度学习行业的，或想了解深度学习到底是什么的，或是有一定机器学习基础的朋友阅读。

2017-11-30

深度学习高清版

这本书对各类读者都有一定用处，但我们主要是为两类受众对象而写的。其中一类受众对象是学习机器学习的大学生（本科或研究生），包括那些已经开始职业生涯的深度学习和人工智能研究者。另一类受众对象是没有机器学习或统计背景但希望能快速地掌握这方面知识并在他们的产品或平台中使用深度学习的软件工程师。深度学习在许多软件领域都已被证明是有用的，包括计算机视觉、语音和音频处理、自然语言处理、机器人技术、生物信息学和化学、电子游戏、搜索引擎、网络广告和金融

2017-11-30

Apache Spark源码剖析

Apache Spark 源码剖析 Apache Spark 源码剖析 Apache Spark 源码剖析

2017-11-21

线性回归logistic回归和一般回归

线性回归、logistic回归和一般回归线性回归、logistic回归和一般回归线性回归、logistic回归和一般回归线性回归、logistic回归和一般回归

2017-11-15

Spring Boot实战

第1章　入门　　1 1.1　Spring风云再起　　1 1.1.1　重新认识Spring　　2 1.1.2　Spring Boot精要　　3 1.1.3　Spring Boot不是什么　　6 1.2　Spring Boot入门　　6 1.2.1　安装Spring Boot CLI　　7 1.2.2　使用Spring Initializr初始化Spring Boot项目　　10 1.3　小结　　18 第2章　开发第一个应用程序　　19 2.1　运用Spring Boot　　19 2.1.1　查看初始化的Spring Boot新项目　　21 2.1.2　Spring Boot项目构建过程解析　　24 2.2　使用起步依赖　　27 2.2.1　指定基于功能的依赖　　28 2.2.2　覆盖起步依赖引入的传递依赖　　29 2.3　使用自动配置　　30 2.3.1　专注于应用程序功能　　31 2.3.2　运行应用程序　　36 2.3.3　刚刚发生了什么　　38 2.4　小结　　41 第3章　自定义配置　　42 3.1　覆盖Spring Boot自动配置　　42 3.1.1　保护应用程序　　43 3.1.2　创建自定义的安全配置　　44 3.1.3　掀开自动配置的神秘面纱　　48 3.2　通过属性文件外置配置　　49 3.2.1　自动配置微调　　50 3.2.2　应用程序Bean的配置外置　　55 3.2.3　使用Profile进行配置　　59 3.3　定制应用程序错误页面　　62 3.4　小结　　64 第4章　测试　　66 4.1　集成测试自动配置　　66 4.2　测试Web应用程序　　68 4.2.1　模拟Spring MVC　　69 4.2.2　测试Web安全　　72 4.3　测试运行中的应用程序　　74 4.3.1　用随机端口启动服务器　　75 4.3.2　使用Selenium测试HTML页面　　76 4.4　小结　　78 第5章　Groovy与Spring Boot CLI　　80 5.1　开发Spring Boot CLI应用程序　　80 5.1.1　设置CLI项目　　81 5.1.2　通过Groovy消除代码噪声　　81 5.1.3　发生了什么　　85 5.2　获取依赖　　86 5.2.1　覆盖默认依赖版本　　87 5.2.2　添加依赖仓库　　88 5.3　用CLI运行测试　　89 5.4　创建可部署的产物　　91 5.5　小结　　91 第6章　在Spring Boot中使用Grails　　93 6.1　使用GORM进行数据持久化　　93 6.2　使用Groovy Server Pages定义视图　　98 6.3　结合Spring Boot与Grails 3　　100 6.3.1　创建新的Grails项目　　100 6.3.2　定义领域模型　　103 6.3.3　开发Grails控制器　　104 6.3.4　创建视图　　105 6.4　小结　　107 第7章　深入Actuator　　108 7.1　揭秘Actuator的端点　　108 7.1.1　查看配置明细　　109 7.1.2　运行时度量　　115 7.1.3　关闭应用程序　　121 7.1.4　获取应用信息　　121 7.2　连接Actuator的远程shell　　122 7.2.1　查看autoconfig报告　　123 7.2.2　列出应用程序的Bean　　124 7.2.3　查看应用程序的度量信息　　124 7.2.4　调用Actuator端点　　125 7.3　通过JMX监控应用程序　　126 7.4　定制Actuator　　128 7.4.1　修改端点ID　　128 7.4.2　启用和禁用端点　　129 7.4.3　添加自定义度量信息　　129 7.4.4　创建自定义跟踪仓库　　132 7.4.5　插入自定义健康指示器　　134 7.5　保护Actuator端点　　136 7.6　小结　　138 第8章　部署Spring Boot应用程序　　139 8.1　衡量多种部署方式　　139 8.2　部署到应用服务器　　140 8.2.1　构建WAR文件　　141 8.2.2　创建生产Profile　　142 8.2.3　开启数据库迁移　　145 8.3　推上云端　　150 8.3.1　部署到Cloud Foundry　　150 8.3.2　部署到Heroku　　153 8.4　小结　　155 附录A　Spring Boot开发者工具　　157 附录B　Spring Boot起步依赖　　163 附录C　配置属性　　169 附录D　Spring Boot依赖　　202

2017-11-08

《大数据之路：阿里巴巴大数据实践》

大数据之路阿里巴巴大数据实践，阿里巴巴大数据实践，高清版

2017-11-07

PaaS实现与运维管理：基于Mesos +Docker+ELK的实战指南第二部分

2017-11-07

Kafka_权威指南

Kafka_权威指南，文字版电子书目录 · · · · · · 序 xiii 前言 xv 第 1 章　初识Kafka 1 1.1　发布与订阅消息系统 1 1.1.1　如何开始 2 1.1.2　独立的队列系统 3 1.2　Kafka登场 4 1.2.1　消息和批次 4 1.2.2　模式 4 1.2.3　主题和分区 5 1.2.4　生产者和消费者 5 1.2.5　broker和集群 6 1.2.6　多集群 7 1.3　为什么选择Kafka 8 1.3.1　多个生产者 8 1.3.2　多个消费者 8 1.3.3　基于磁盘的数据存储 9 1.3.4　伸缩性 9 1.3.5　高性能 9 1.4　数据生态系统 9 1.5　起源故事 11 1.5.1　LinkedIn的问题 11 1.5.2　Kafka的诞生 12 1.5.3　走向开源 12 1.5.4　命名 13 1.6　开始Kafka之旅 13 第 2 章　安装Kafka 14 2.1　要事先行 14 2.1.1　选择操作系统 14 2.1.2　安装Java 14 2.1.3　安装Zookeeper 15 2.2　安装Kafka Broker 17 2.3　broker配置 18 2.3.1　常规配置 18 2.3.2　主题的默认配置 19 2.4　硬件的选择 23 2.4.1　磁盘吞吐量 23 2.4.2　磁盘容量 23 2.4.3　内存 23 2.4.4　网络 24 2.4.5　CPU 24 2.5　云端的Kafka 24 2.6　Kafka集群 24 2.6.1　需要多少个broker 25 2.6.2　broker 配置 25 2.6.3　操作系统调优 26 2.7　生产环境的注意事项 28 2.7.1　垃圾回收器选项 28 2.7.2　数据中心布局 29 2.7.3　共享Zookeeper 29 2.8　总结 30 第 3 章　Kafka生产者——向Kafka写入数据 31 3.1　生产者概览 32 3.2　创建Kafka生产者 33 3.3　发送消息到Kafka 34 3.3.1　同步发送消息 35 3.3.2　异步发送消息 35 3.4　生产者的配置 36 3.5　序列化器 39 3.5.1　自定义序列化器 39 3.5.2　使用Avro序列化 41 3.5.3　在Kafka里使用Avro 42 3.6　分区 45 3.7　旧版的生产者API 46 3.8　总结 47 第 4 章　Kafka消费者——从Kafka读取数据 48 4.1　KafkaConsumer概念 48 4.1.1　消费者和消费者群组 48 4.1.2　消费者群组和分区再均衡 51 4.2　创建Kafka消费者 52 4.3　订阅主题 53 4.4　轮询 53 4.5　消费者的配置 55 4.6　提交和偏移量 57 4.6.1　自动提交 58 4.6.2　提交当前偏移量 59 4.6.3　异步提交 59 4.6.4　同步和异步组合提交 61 4.6.5　提交特定的偏移量 61 4.7　再均衡监听器 62 4.8　从特定偏移量处开始处理记录 64 4.9　如何退出 66 4.10　反序列化器 67 4.11　独立消费者——为什么以及怎样使用没有群组的消费者 71 4.12　旧版的消费者API 71 4.13　总结 72 第 5 章　深入Kafka 73 5.1　集群成员关系 73 5.2　控制器 74 5.3　复制 74 5.4　处理请求 76 5.4.1　生产请求 78 5.4.2　获取请求 78 5.4.3　其他请求 80 5.5　物理存储 81 5.5.1　分区分配 81 5.5.2　文件管理 82 5.5.3　文件格式 83 5.5.4　索引 84 5.5.5　清理 84 5.5.6　清理的工作原理 84 5.5.7　被删除的事件 86 5.5.8　何时会清理主题 86 5.9　总结 86 第 6 章　可靠的数据传递 87 6.1　可靠性保证 87 6.2　复制 88 6.3　broker配置 89 6.3.1　复制系数 89 6.3.2　不完全的首领选举 90 6.3.3　最少同步副本 91 6.4　在可靠的系统里使用生产者 92 6.4.1　发送确认 92 6.4.2　配置生产者的重试参数 93 6.4.3　额外的错误处理 94 6.5　在可靠的系统里使用消费者 94 6.5.1　消费者的可靠性配置 95 6.5.2　显式提交偏移量 95 6.6　验证系统可靠性 97 6.6.1　配置验证 98 6.6.2　应用程序验证 98 6.6.3　在生产环境监控可靠性 99 6.7　总结 100 第 7 章　构建数据管道 101 7.1　构建数据管道时需要考虑的问题 102 7.1.1　及时性 102 7.1.2　可靠性 102 7.1.3　高吞吐量和动态吞吐量 103 7.1.4　数据格式 103 7.1.5　转换 104 7.1.6　安全性 104 7.1.7　故障处理能力 104 7.1.8　耦合性和灵活性 105 7.2　如何在Connect API和客户端API之间作出选择 105 7.3　Kafka Connect 106 7.3.1　运行Connect 106 7.3.2　连接器示例——文件数据源和文件数据池 107 7.3.3　连接器示例——从MySQL到ElasticSearch 109 7.3.4　深入理解Connect 114 7.4　Connect之外的选择 116 7.4.1　用于其他数据存储的摄入框架 116 7.4.2　基于图形界面的ETL工具 117 7.4.3　流式处理框架 117 7.5　总结 117 第 8 章　跨集群数据镜像 118 8.1　跨集群镜像的使用场景 118 8.2　多集群架构 119 8.2.1　跨数据中心通信的一些现实情况 119 8.2.2　Hub和Spoke架构 120 8.2.3　双活架构 121 8.2.4　主备架构 123 8.2.5　延展集群 127 8.3　Kafka的MirrorMaker 128 8.3.1　如何配置 129 8.3.2　在生产环境部署MirrorMaker 130 8.3.3　MirrorMaker调优 132 8.4　其他跨集群镜像方案 134 8.4.1　优步的uReplicator 134 8.4.2　Confluent的Replicator 135 8.5　总结 135 第 9 章　管理Kafka 136 9.1　主题操作 136 9.1.1　创建主题 137 9.1.2　增加分区 138 9.1.3　删除主题 138 9.1.4　列出集群里的所有主题 139 9.1.5　列出主题详细信息 139 9.2　消费者群组 140 9.2.1　列出并描述群组 140 9.2.2　删除群组 142 9.2.3　偏移量管理 142 9.3　动态配置变更 143 9.3.1　覆盖主题的默认配置 143 9.3.2　覆盖客户端的默认配置 145 9.3.3　列出被覆盖的配置 145 9.3.4　移除被覆盖的配置 146 9.4　分区管理 146 9.4.1　首选的首领选举 146 9.4.2　修改分区副本 147 9.4.3　修改复制系数 150 9.4.4　转储日志片段 151 9.4.5　副本验证 152 9.5　消费和生产 153 9.5.1　控制台消费者 153 9.5.2　控制台生产者 155 9.6　客户端ACL 157 9.7　不安全的操作 157 9.7.1　移动集群控制器 157 9.7.2　取消分区重分配 157 9.7.3　移除待删除的主题 158 9.7.4　手动删除主题 158 9.8　总结 159 第 10 章　监控Kafka 160 10.1　度量指标基础 160 10.1.1　度量指标在哪里 160 10.1.2　内部或外部度量 161 10.1.3　应用程序健康检测 161 10.1.4　度量指标的覆盖面 161 10.2　broker的度量指标 162 10.2.1　非同步分区 162 10.2.2　broker度量指标 166 10.2.3　主题和分区的度量指标 173 10.2.4　Java虚拟机监控 174 10.2.5　操作系统监控 175 10.2.6　日志 176 10.3　客户端监控 177 10.3.1　生产者度量指标 177 10.3.2　消费者度量指标 179 10.3.3　配额 181 10.4　延时监控 182 10.5　端到端监控 183 10.6　总结 183 第 11 章　流式处理 184 11.1　什么是流式处理 185 11.2　流式处理的一些概念 186 11.2.1　时间 187 11.2.2　状态 188 11.2.3　流和表的二元性 188 11.2.4　时间窗口 189 11.3　流式处理的设计模式 190 11.3.1　单个事件处理 191 11.3.2　使用本地状态 191 11.3.3　多阶段处理和重分区 193 11.3.4　使用外部查找——流和表的连接 193 11.3.5　流与流的连接 195 11.3.6　乱序的事件 195 11.3.7　重新处理 196 11.4　Streams示例 197 11.4.1　字数统计 197 11.4.2　股票市场统计 199 11.4.3　填充点击事件流 201 11.5　Kafka Streams的架构概览 202 11.5.1　构建拓扑 202 11.5.2　对拓扑进行伸缩 203 11.5.3　从故障中存活下来 205 11.6　流式处理使用场景 205 11.7　如何选择流式处理框架 206 11.8　总结 208 附录A　在其他操作系统上安装Kafka 209 作者介绍 214 封面介绍 214

2019-04-18

Apache Kafka实战

Apache Kafka实战/胡夕著.一北京：电子工业出版社，2018.5 ISBN 978-7-121-33776-5 I.①A..…II.①胡.…Ⅲ.①分布式操作系统Ⅳ.①TP316.4中国版本图书馆CIP数据核字（2018）第037942号

2018-09-19

阿里巴巴与四十大道

内容简介《阿里巴巴与四十大道》，是一本阿里巴巴小二写阿里巴巴公司的书，全书40章，汲取于阿里巴巴公司内部日常生活的点点滴滴，这些细节被作者总结成“四十大道”。这些“道”不是形而上的，时刻反映在小二与小二之间、小二与客户之间、客户与客户之间的感情和关系中。就像溪水静流，流着流着，自然形成了阿里巴巴使命、愿景和价值观。凡而不凡，这是中国的阿里巴巴，也是阿里巴巴的世界。希望本书帮助您了解和感受一个真实的阿里巴巴。

2018-09-14

不止代码

这本书凝聚了阿里技术人的经验结晶，值得放在你的案头，常看常新。你想到的、未曾预料的职业发展困惑，都能在此找到答案。

2018-09-04

Python数据科学手册(PDF)

译者序 xiii 前言 xv 第1 章　IPython：超越Python 1 1.1　shell还是Notebook 1 1.1.1　启动IPython shell 2 1.1.2　启动Jupyter Notebook 2 1.2　IPython的帮助和文档 3 1.2.1　用符号? 获取文档 3 1.2.2　通过符号?? 获取源代码 4 1.2.3　用Tab补全的方式探索模块 5 1.3　IPython shell中的快捷键 7 1.3.1　导航快捷键 7 1.3.2　文本输入快捷键 7 1.3.3　命令历史快捷键 8 1.3.4　其他快捷键 9 1.4　IPython魔法命令 9 1.4.1　粘贴代码块：%paste和%cpaste 9 1.4.2　执行外部代码：%run 10 1.4.3　计算代码运行时间：%timeit 11 1.4.4　魔法函数的帮助：?、%magic 和%lsmagic 11 1.5　输入和输出历史 12 1.5.1　IPython的输入和输出对象 12 1.5.2　下划线快捷键和以前的输出 13 1.5.3　禁止输出 13 1.5.4　相关的魔法命令 13 1.6　IPython和shell命令 14 1.6.1　shell快速入门 14 1.6.2　IPython中的shell命令 15 1.6.3　在shell中传入或传出值 15 1.7　与shell相关的魔法命令 16 1.8　错误和调试 17 1.8.1　控制异常：%xmode 17 1.8.2　调试：当阅读轨迹追溯不足以解决问题时 19 1.9　代码的分析和计时 21 1.9.1　代码段计时：%timeit和%time 22 1.9.2　分析整个脚本：%prun 23 1.9.3　用%lprun进行逐行分析 24 1.9.4　用%memit和%mprun进行内存分析 25 1.10　IPython参考资料 26 1.10.1　网络资源 26 1.10.2　相关图书 27 第2 章　NumPy入门 28 2.1　理解Python中的数据类型 29 2.1.1　Python整型不仅仅是一个整型 30 2.1.2　Python列表不仅仅是一个列表 31 2.1.3　Python中的固定类型数组 32 2.1.4　从Python列表创建数组 32 2.1.5　从头创建数组 33 2.1.6　NumPy标准数据类型 34 2.2　NumPy数组基础 35 2.2.1　NumPy数组的属性 36 2.2.2　数组索引：获取单个元素 37 2.2.3　数组切片：获取子数组 38 2.2.4　数组的变形 41 2.2.5　数组拼接和分裂 42 2.3　NumPy数组的计算：通用函数 44 2.3.1　缓慢的循环 44 2.3.2　通用函数介绍 45 2.3.3　探索NumPy的通用函数 46 2.3.4　高级的通用函数特性 49 2.3.5　通用函数：更多的信息 51 2.4　聚合：最小值、最大值和其他值 51 2.4.1　数组值求和 51 2.4.2　最小值和最大值 52 2.4.3　示例：美国总统的身高是多少 54 2.5　数组的计算：广播 55 2.5.1　广播的介绍 55 2.5.2　广播的规则 57 2.5.3　广播的实际应用 60 2.6　比较、掩码和布尔逻辑 61 2.6.1　示例：统计下雨天数 61 2.6.2　和通用函数类似的比较操作 62 2.6.3　操作布尔数组 64 2.6.4　将布尔数组作为掩码 66 2.7　花哨的索引 69 2.7.1　探索花哨的索引 69 2.7.2　组合索引 70 2.7.3　示例：选择随机点 71 2.7.4　用花哨的索引修改值 72 2.7.5　示例：数据区间划分 73 2.8　数组的排序 75 2.8.1　NumPy中的快速排序：np.sort和np.argsort 76 2.8.2　部分排序：分隔 77 2.8.3　示例：K个最近邻 78 2.9　结构化数据：NumPy的结构化数组 81 2.9.1　生成结构化数组 83 2.9.2　更高级的复合类型 84 2.9.3　记录数组：结构化数组的扭转 84 2.9.4　关于Pandas 85 第3 章　Pandas数据处理 86 3.1　安装并使用Pandas 86 3.2　Pandas对象简介 87 3.2.1　Pandas的Series对象 87 3.2.2　Pandas的DataFrame对象 90 3.2.3　Pandas的Index对象 93 3.3　数据取值与选择 95 3.3.1　Series数据选择方法 95 3.3.2　DataFrame数据选择方法 98 3.4　Pandas数值运算方法 102 3.4.1　通用函数：保留索引 102 3.4.2　通用函数：索引对齐 103 3.4.3　通用函数：DataFrame与Series的运算 105 3.5　处理缺失值 106 3.5.1　选择处理缺失值的方法 106 3.5.2　Pandas的缺失值 107 3.5.3　处理缺失值 110 3.6　层级索引 113 3.6.1　多级索引Series 113 3.6.2　多级索引的创建方法 116 3.6.3　多级索引的取值与切片 119 3.6.4　多级索引行列转换 121 3.6.5　多级索引的数据累计方法 124 3.7　合并数据集：Concat与Append操作 125 3.7.1　知识回顾：NumPy数组的合并 126 3.7.2　通过pd.concat实现简易合并 126 3.8　合并数据集：合并与连接 129 3.8.1　关系代数 129 3.8.2　数据连接的类型 130 3.8.3　设置数据合并的键 132 3.8.4　设置数据连接的集合操作规则 134 3.8.5　重复列名：suffixes参数 135 3.8.6　案例：美国各州的统计数据 136 3.9　累计与分组 140 3.9.1　行星数据 140 3.9.2　Pandas的简单累计功能 141 3.9.3　GroupBy：分割、应用和组合 142 3.10　数据透视表 150 3.10.1　演示数据透视表 150 3.10.2　手工制作数据透视表 151 3.10.3　数据透视表语法 151 3.10.4　案例：美国人的生日 153 3.11　向量化字符串操作 157 3.11.1　Pandas字符串操作简介 157 3.11.2　Pandas字符串方法列表 159 3.11.3　案例：食谱数据库 163 3.12　处理时间序列 166 3.12.1　Python的日期与时间工具 166 3.12.2　Pandas时间序列：用时间作索引 169 3.12.3　Pandas时间序列数据结构 170 3.12.4　时间频率与偏移量 172 3.12.5　重新取样、迁移和窗口 173 3.12.6　更多学习资料 178 3.12.7　案例：美国西雅图自行车统计数据的可视化 179 3.13　高性能Pandas：eval()与query() 184 3.13.1　query()与eval()的设计动机：复合代数式 184 3.13.2　用pandas.eval()实现高性能运算 185 3.13.3　用DataFrame.eval()实现列间运算 187 3.13.4　DataFrame.query()方法 188 3.13.5　性能决定使用时机 189 3.14　参考资料 189 第4 章　Matplotlib数据可视化 191 4.1　Matplotlib常用技巧 192 4.1.1　导入Matplotlib 192 4.1.2　设置绘图样式 192 4.1.3　用不用show()？如何显示图形 192 4.1.4　将图形保存为文件 194 4.2　两种画图接口 195 4.2.1　MATLAB风格接口 195 4.2.2　面向对象接口 196 4.3　简易线形图 197 4.3.1　调整图形：线条的颜色与风格 199 4.3.2　调整图形：坐标轴上下限 200 4.3.3　设置图形标签 203 4.4　简易散点图 204 4.4.1　用plt.plot画散点图 205 4.4.2　用plt.scatter画散点图 206 4.4.3　plot与scatter：效率对比 208 4.5　可视化异常处理 208 4.5.1　基本误差线 209 4.5.2　连续误差 210 4.6　密度图与等高线图 211 4.7　频次直方图、数据区间划分和分布密度 215 4.8　配置图例 219 4.8.1　选择图例显示的元素 221 4.8.2　在图例中显示不同尺寸的点 222 4.8.3　同时显示多个图例 223 4.9　配置颜色条 224 4.9.1　配置颜色条 224 4.9.2　案例：手写数字 228 4.10　多子图 230 4.10.1　plt.axes：手动创建子图 230 4.10.2　plt.subplot：简易网格子图 231 4.10.3　plt.subplots：用一行代码创建网格 233 4.10.4　plt.GridSpec：实现更复杂的排列方式 234 4.11　文字与注释 235 4.11.1　案例：节假日对美国出生率的影响 236 4.11.2　坐标变换与文字位置 237 4.11.3　箭头与注释 239 4.12　自定义坐标轴刻度 241 4.12.1　主要刻度与次要刻度 242 4.12.2　隐藏刻度与标签 243 4.12.3　增减刻度数量 244 4.12.4　花哨的刻度格式 245 4.12.5　格式生成器与定位器小结 247 4.13　Matplotlib自定义：配置文件与样式表 248 4.13.1　手动配置图形 248 4.13.2　修改默认配置：rcParams 249 4.13.3　样式表 251 4.14　用Matplotlib画三维图 255 4.14.1　三维数据点与线 256 4.14.2　三维等高线图 256 4.14.3　线框图和曲面图 258 4.14.4　曲面三角剖分 259 4.15　用Basemap可视化地理数据 261 4.15.1　地图投影 263 4.15.2　画一个地图背景 267 4.15.3　在地图上画数据 269 4.15.4　案例：美国加州城市数据 270 4.15.5　案例：地表温度数据 271 4.16　用Seaborn做数据可视化 273 4.16.1　Seaborn与Matplotlib 274 4.16.2　Seaborn图形介绍 275 4.16.3　案例：探索马拉松比赛成绩数据 283 4.17　参考资料 290 4.17.1　Matplotlib资源 290 4.17.2　其他Python画图程序库 290 第5 章　机器学习 291 5.1　什么是机器学习 291 5.1.1　机器学习的分类 292 5.1.2　机器学习应用的定性示例 292 5.1.3　小结 299 5.2　Scikit-Learn简介 300 5.2.1　Scikit-Learn的数据表示 300 5.2.2　Scikit-Learn的评估器API 302 5.2.3　应用：手写数字探索 309 5.2.4　小结 313 5.3　超参数与模型验证 313 5.3.1　什么是模型验证 314 5.3.2　选择最优模型 317 5.3.3　学习曲线 322 5.3.4　验证实践：网格搜索 326 5.3.5　小结 327 5.4　特征工程 327 5.4.1　分类特征 327 5.4.2　文本特征 329 5.4.3　图像特征 330 5.4.4　衍生特征 330 5.4.5　缺失值填充 332 5.4.6　特征管道 332 5.5　专题：朴素贝叶斯分类 333 5.5.1　贝叶斯分类 333 5.5.2　高斯朴素贝叶斯 334 5.5.3　多项式朴素贝叶斯 336 5.5.4　朴素贝叶斯的应用场景 339 5.6　专题：线性回归 340 5.6.1　简单线性回归 340 5.6.2　基函数回归 342 5.6.3　正则化 346 5.6.4　案例：预测自行车流量 349 5.7　专题：支持向量机 353 5.7.1　支持向量机的由来 354 5.7.2　支持向量机：边界最大化 355 5.7.3　案例：人脸识别 363 5.7.4　支持向量机总结 366 5.8　专题：决策树与随机森林 367 5.8.1　随机森林的诱因：决策树 367 5.8.2　评估器集成算法：随机森林 371 5.8.3　随机森林回归 373 5.8.4　案例：用随机森林识别手写数字 374 5.8.5　随机森林总结 376 5.9　专题：主成分分析 376 5.9.1　主成分分析简介 377 5.9.2　用PCA作噪音过滤 383 5.9.3　案例：特征脸 385 5.9.4　主成分分析总结 387 5.10　专题：流形学习 388 5.10.1　流形学习：“HELLO” 388 5.10.2　多维标度法（MDS） 389 5.10.3　将MDS用于流形学习 391 5.10.4　非线性嵌入：当MDS失败时 393 5.10.5　非线性流形：局部线性嵌入 395 5.10.6　关于流形方法的一些思考 396 5.10.7　示例：用Isomap 处理人脸数据 397 5.10.8　示例：手写数字的可视化结构 400 5.11　专题：k-means聚类 402 5.11.1　k-means简介 403 5.11.2　k-means算法：期望最大化 404 5.11.3　案例 409 5.12　专题：高斯混合模型 415 5.12.1　高斯混合模型（GMM）为什么会出现：k-means算法的缺陷 415 5.12.2　一般化E-M：高斯混合模型 417 5.12.3　将GMM用作密度估计 421 5.12.4　示例：用GMM生成新的数据 425 5.13　专题：核密度估计 427 5.13.1　KDE的由来：直方图 428 5.13.2　核密度估计的实际应用 431 5.13.3　示例：球形空间的KDE 433 5.13.4　示例：不是很朴素的贝叶斯 436 5.14　应用：人脸识别管道 439 5.14.1　HOG特征 440 5.14.2　HOG实战：简单人脸识别器 441 5.14.3　注意事项与改进方案 445 5.15　机器学习参考资料 446 5.15.1　Python中的机器学习 446 5.15.2　通用机器学习资源 447 关于作者 448 关于封面 448

2018-04-27

Kafka入门与实践

作者: 牟大恩出版社: 人民邮电出版社出版年: 2017-11-3 页数: 352 定价: 69 装帧: 平装 ISBN: 9787115469571

2018-02-08

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

空空如也

Kafka权威指南

大数据架构和算法实现之路：电商系统的技术实战

图解设计模式

图解Spark 核心技术与案例实战

深入理解Spark+核心思想与源码分析

Spark 技术内幕-深入解析Spark内核架构设计与实现原理

Spark机器学习模块源码解读

Spark机器学习

Spark核心技术与高级应用

人人都是架构师：分布式系统架构落地与瓶颈突破

Spark GraphX实战

增长黑客_创业公司的用户与收入增长秘籍

重构--改善既有代码的设计

图解java多线程设计模式

深入理解Java虚拟机：JVM高级特性与最佳实践 高清电子版

《大数据智能》

《Spark GraphX实战》

Redis开发与运维

亿级流量网站架构核心技术 跟开涛学搭建高可用高并发系统 ,张开涛(著)

大数据架构和算法实现之路：电商系统的技术实战 - 第二部分，需要下载两个部分，解压合并

大数据架构和算法实现之路：电商系统的技术实战 - 第一部分，需要下载两个部分，解压合并

大数据架构商业之路:从业务需求到技术方案 - 第二部分，需要下载两个部分，解压合并

大数据架构商业之路:从业务需求到技术方案 - 第一部分，需要下载两个部分，解压合并

大数据智能 - 第二部分，需要下载两个部分，解压合并

大数据智能 - 第一部分，需要下载两个部分，解压合并

Spark技术内幕深入解析Spark内核架构设计与实现原理

Java 8实战

神经网络与深度学习

深度学习高清版

Apache Spark源码剖析

线性回归logistic回归和一般回归

Spring Boot实战

《大数据之路：阿里巴巴大数据实践》

PaaS实现与运维管理：基于Mesos +Docker+ELK的实战指南 第二部分

Kafka_权威指南

Apache Kafka实战

阿里巴巴与四十大道

不止代码

Python数据科学手册(PDF)

Kafka入门与实践

空空如也

深入理解Java虚拟机：JVM高级特性与最佳实践高清电子版

亿级流量网站架构核心技术跟开涛学搭建高可用高并发系统 ,张开涛(著)

PaaS实现与运维管理：基于Mesos +Docker+ELK的实战指南第二部分