自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(0)
  • 资源 (39)
  • 收藏
  • 关注

空空如也

稀疏矩阵核处理源清单模型操作

大气排放源清单处理模型 Sparse Matrix Operator Kernel Emissions 大气污染源源清单处理模型手册

2020-08-20

大话ORACLERAC part5of8

因为上传文件大小限制,先将整本书分为8个部分,请注意下载! 如果哪个无法打开,请留言! 大话OracleRAC RAC入门指导 第一章,RAC初体验 第二章,什么是RAC集群 第三章,ORACLE CLUSTERWARE 第四章,RAC原理 第五章,ASM初步 第六章,RAC维护工具 第七章,HB和LB 第八章,备份 第九章,恢复 第十章,其他恢复技术 第十一章,RAC和DG 第十二章,RAC和STREAM REPLICATION 第十三章,深入ASM 第十四章,性能与RAC

2013-11-29

大话ORACLERAC part2of8

因为上传文件大小限制,先将整本书分为8个部分,请注意下载! 如果哪个无法打开,请留言! 大话OracleRAC RAC入门指导 第一章,RAC初体验 第二章,什么是RAC集群 第三章,ORACLE CLUSTERWARE 第四章,RAC原理 第五章,ASM初步 第六章,RAC维护工具 第七章,HB和LB 第八章,备份 第九章,恢复 第十章,其他恢复技术 第十一章,RAC和DG 第十二章,RAC和STREAM REPLICATION 第十三章,深入ASM 第十四章,性能与RAC

2013-11-29

大话ORACLERAC part8of8

因为上传文件大小限制,先将整本书分为8个部分,请注意下载! 如果哪个无法打开,请留言! 大话OracleRAC RAC入门指导 第一章,RAC初体验 第二章,什么是RAC集群 第三章,ORACLE CLUSTERWARE 第四章,RAC原理 第五章,ASM初步 第六章,RAC维护工具 第七章,HB和LB 第八章,备份 第九章,恢复 第十章,其他恢复技术 第十一章,RAC和DG 第十二章,RAC和STREAM REPLICATION 第十三章,深入ASM 第十四章,性能与RAC

2013-11-29

大话ORACLERAC part7of8

因为上传文件大小限制,先将整本书分为8个部分,请注意下载! 如果哪个无法打开,请留言! 大话OracleRAC RAC入门指导 第一章,RAC初体验 第二章,什么是RAC集群 第三章,ORACLE CLUSTERWARE 第四章,RAC原理 第五章,ASM初步 第六章,RAC维护工具 第七章,HB和LB 第八章,备份 第九章,恢复 第十章,其他恢复技术 第十一章,RAC和DG 第十二章,RAC和STREAM REPLICATION 第十三章,深入ASM 第十四章,性能与RAC

2013-11-29

大话ORACLERAC part6of8

因为上传文件大小限制,先将整本书分为8个部分,请注意下载! 如果哪个无法打开,请留言! 大话OracleRAC RAC入门指导 第一章,RAC初体验 第二章,什么是RAC集群 第三章,ORACLE CLUSTERWARE 第四章,RAC原理 第五章,ASM初步 第六章,RAC维护工具 第七章,HB和LB 第八章,备份 第九章,恢复 第十章,其他恢复技术 第十一章,RAC和DG 第十二章,RAC和STREAM REPLICATION 第十三章,深入ASM 第十四章,性能与RAC

2013-11-27

大话ORACLERAC part4of8

因为上传文件大小限制,先将整本书分为8个部分,请注意下载! 如果哪个无法打开,请留言! 大话OracleRAC RAC入门指导 第一章,RAC初体验 第二章,什么是RAC集群 第三章,ORACLE CLUSTERWARE 第四章,RAC原理 第五章,ASM初步 第六章,RAC维护工具 第七章,HB和LB 第八章,备份 第九章,恢复 第十章,其他恢复技术 第十一章,RAC和DG 第十二章,RAC和STREAM REPLICATION 第十三章,深入ASM 第十四章,性能与RAC

2013-11-27

大话ORACLERAC part3of8

因为上传文件大小限制,先将整本书分为8个部分,请注意下载! 如果哪个无法打开,请留言! 大话OracleRAC RAC入门指导 第一章,RAC初体验 第二章,什么是RAC集群 第三章,ORACLE CLUSTERWARE 第四章,RAC原理 第五章,ASM初步 第六章,RAC维护工具 第七章,HB和LB 第八章,备份 第九章,恢复 第十章,其他恢复技术 第十一章,RAC和DG 第十二章,RAC和STREAM REPLICATION 第十三章,深入ASM 第十四章,性能与RAC

2013-11-27

大话ORACLERAC part1of8

因为上传文件大小限制,先将整本书分为8个部分,请注意下载! 如果哪个无法打开,请留言! 大话OracleRAC RAC入门指导 第一章,RAC初体验 第二章,什么是RAC集群 第三章,ORACLE CLUSTERWARE 第四章,RAC原理 第五章,ASM初步 第六章,RAC维护工具 第七章,HB和LB 第八章,备份 第九章,恢复 第十章,其他恢复技术 第十一章,RAC和DG 第十二章,RAC和STREAM REPLICATION 第十三章,深入ASM 第十四章,性能与RAC

2013-11-27

循序渐进DB2.DBA系统管理、运维与应用案例.part2.rar

请合并下载 循序渐进DB2.DBA系统管理、运维与应用案例.part1.rar 循序渐进DB2.DBA系统管理、运维与应用案例.part2.rar

2013-10-27

循序渐进DB2.DBA系统管理、运维与应用案例.part1.rar

请合并下载 循序渐进DB2.DBA系统管理、运维与应用案例.part1.rar 循序渐进DB2.DBA系统管理、运维与应用案例.part2.rar

2013-10-27

[深入解析Oracle.DBA入门进阶与诊断案例].盖国强.扫描版.part2.rar (下)

请一起解压 [深入解析Oracle.DBA入门进阶与诊断案例].盖国强.扫描版.part1.rar (上) [深入解析Oracle.DBA入门进阶与诊断案例].盖国强.扫描版.part2.rar (下)

2013-10-27

[深入解析Oracle.DBA入门进阶与诊断案例].盖国强.扫描版.pdf(上)

请一起下载 [深入解析Oracle.DBA入门进阶与诊断案例].盖国强.扫描版.pdf(上) [深入解析Oracle.DBA入门进阶与诊断案例].盖国强.扫描版.pdf(下) 并解压

2013-10-27

数据仓库(原书中文第四版PDF).rar

目录 译者序 审、译者简介 前言 第1章 决策支持系统的发展 1 1.1 演化 1 1.2 直接存取存储设备的产生 2 1.3 个人计算机/第四代编程语言技术 3 1.4 进入抽取程序 3 1.5 蜘蛛网 4 1.6 自然演化体系结构的问题 5 1.6.1 数据缺乏可信性 5 1.6.2 生产率问题 8 1.6.3 从数据到信息 10 1.6.4 方法的变迁 11 1.7 体系结构设计环境 12 1.7.1 体系结构设计环境的层次 13 1.7.2 集成 14 1.8 用户是谁 15 1.9 开发生命周期 15 1.10 硬件利用模式 16 1.11 建立重建工程的舞台 16 1.12 监控数据仓库环境 17 1.13 小结 19 第2章 数据仓库环境 20 2.1 数据仓库的结构 22 2.2 面向主题 23 2.3 第1天到第n天的现象 26 2.4 粒度 28 2.4.1 粒度的一个例子 29 2.4.2 粒度的双重级别 31 2.5 分割问题 34 2.6 样本数据库 34 2.7 数据分割 35 2.8 数据仓库中的数据组织 37 2.9 数据仓库—标准手册 41 2.10 审计和数据仓库 41 2.11 成本合理性 41 2.12 清理仓库数据 42 2.13 报表和体系结构设计环境 42 2.14 机遇性的操作型窗口 43 2.15 小结 44 第3章 设计数据仓库 45 3.1 从操作型数据开始 45 3.2 数据/过程模型和体系结构设计环境 49 3.3 数据仓库和数据模型 50 3.3.1 数据模型 52 3.3.2 中间层数据模型 54 3.3.3 物理数据模型 58 3.4 数据模型和反复开发 59 3.5 规范化/反规范化 60 3.6 数据仓库中的快照 65 3.7 元数据 66 3.8 数据仓库中的管理参照表 66 3.9 数据周期 67 3.10 转换和集成的复杂性 70 3.11 触发数据仓库记录 71 3.11.1 事件 72 3.11.2 快照的构成 72 3.11.3 一些例子 72 3.12 简要记录 73 3.13 管理大量数据 74 3.14 创建多个简要记录 75 3.15 从数据仓库环境到操作型环境 75 3.16 正常处理 75 3.17 数据仓库数据的直接访问 76 3.18 数据仓库数据的间接访问 76 3.18.1 航空公司的佣金计算系统 76 3.18.2 零售个性化系统 78 3.18.3 信用审核 80 3.19 数据仓库数据的间接利用 82 3.20 星型连接 83 3.21 小结 86 第4章 数据仓库中的粒度 87 4.1 粗略估算 87 4.2 粒度划分过程的输入 88 4.3 双重或单一的粒度? 88 4.4 确定粒度的级别 89 4.5 一些反馈循环技巧 90 4.6 粒度的级别—以银行环境为例 90 4.7 小结 95 第5章 数据仓库和技术 96 5.1 管理大量数据 96 5.2 管理多介质 97 5.3 索引/监视数据 97 5.4 多种技术的接口 97 5.5 程序员/设计者对数据存放位置的控制 98 5.6 数据的并行存储/管理 99 5.7 元数据管理 99 5.8 语言接口 99 5.9 数据的高效装入 99 5.10 高效索引的利用 100 5.11 数据压缩 101 5.12 复合键码 101 5.13 变长数据 101 5.14 加锁管理 102 5.15 单独索引处理 102 5.16 快速恢复 102 5.17 其他的技术特征 102 5.18 DBMS类型和数据仓库 102 5.19 改变DBMS技术 104 5.20 多维DBMS和数据仓库 104 5.21 双重粒度级 109 5.22 数据仓库环境中的元数据 109 5.23 上下文和内容 111 5.24 上下文信息的三种类型 111 5.25 捕获和管理上下文信息 113 5.26 刷新数据仓库 113 5.27 小结 114 第6章 分布式数据仓库 116 6.1 引言 116 6.2 局部数据仓库 118 6.3 全局数据仓库 119 6.4 互斥数据 121 6.5 冗余 123 6.6 全局数据存取 124 6.7 分布式环境下其他考虑因素 126 6.8 管理多个开发项目 127 6.9 开发项目的性质 127 6.10 分布式数据仓库 130 6.10.1 在分布的地理位置间协调开发 131 6.10.2 企业数据分布式模型 132 6.10.3 分布式数据仓库中的元数据 134 6.11 在多种层次上建造数据仓库 134 6.12 多个小组建立当前细节级 136 6.12.1 不同层不同需求 138 6.12.2 其他类型的细节数据 140 6.12.3 元数据 142 6.13 公用细节数据采用多种平台 142 6.14 小结 143 第7章 高级管理人员信息系统 和数据仓库 144 7.1 一个简单例子 144 7.2 向下探察分析 146 7.3 支持向下探察处理 147 7.4 作为EIS基础的数据仓库 149 7.5 到哪里取数据 149 7.6 事件映射 152 7.7 细节数据和EIS 153 7.8 在EIS中只保存汇总数据 154 7.9 小结 154 第8章 外部数据/非结构化数据与 数据仓库 155 8.1 数据仓库中的外部数据/非结构化数据 157 8.2 元数据和外部数据 158 8.3 存储外部数据/非结构化数据 159 8.4 外部数据/非结构化数据的不同 组成部分 160 8.5 建模与外部数据/非结构化数据 160 8.6 间接报告 161 8.7 外部数据归档 161 8.8 内部数据与外部数据的比较 161 8.9 小结 162 第9章 迁移到体系结构设计环境 163 9.1 一种迁移方案 163 9.2 反馈循环 167 9.3 策略方面的考虑 168 9.4 方法和迁移 171 9.5 一种数据驱动的开发方法 171 9.6 数据驱动的方法 172 9.7 系统开发生命周期 172 9.8 一个哲学上的考虑 172 9.9 操作型开发/DSS开发 173 9.10 小结 173 第10章 数据仓库的设计复查要目 174 10.1 进行设计复查所涉及的问题 175 10.1.1 谁负责设计复查 175 10.1.2 有哪些议事日程 175 10.1.3 结果 175 10.1.4 复查管理 175 10.1.5 典型的数据仓库设计复查 176 10.2 小结 185 附录 186 技术词汇 215 参考文献 222

2013-10-27

最小的linux系统 tiny core linux

Tiny Core Linux 是一份很小(10 MB)的最低限度Linux桌面。最新版本基于Linux 3.x内核、Busybox、Tiny X、FLTK图形用户界面、JWM窗口管理器,全部运行在内存中。它并非一份完整的桌面,也不完整支持所有的硬件;它只代表能引导进入一份最小X窗口桌面 所需的核心内容,典型情况下可包含对有线网络的访问。这份最小桌面可以通过从在线软件仓库安装额外应用软件来进行扩展。

2013-10-27

Oracle_Database_9i10g11g编程艺术深入数据库体系结构.rar(上)

Oracle_Database_9i10g11g编程艺术深入数据库体系结构.part1.rar Oracle_Database_9i10g11g编程艺术深入数据库体系结构.part2.rar合并下载

2013-10-19

SQL性能调优(全) ORACLE

ORACLE性能调优 开发DBA进阶文档

2013-10-19

python手册(Python Tutorial)双语版

译者:刘鑫(march.liu AT gmail DOT com) 由:limodou转(limodou AT gmail DOT com) CHM 文件制作:Colin.Wang 前言 Front Matter Contents 1. 开胃菜 Whetting Your Appetite 2. 使用Python解释器 Using the Python Interpreter 2.1 调用解释器 Invoking the Interpreter 2.1.1 参数传递 Argument Passing 2.1.2 交互模式 Interactive Mode 2.2 解释器及其环境 The Interpreter and Its Environment 2.2.1 错误处理 Error Handling 2.2.2 执行Python脚本 Executable Python Scripts 2.2.3 源程序编码 Source Code Encoding 2.2.4 交互式环境的启动文件 The Interactive Startup File 3. Python简介 An Informal Introduction to Python 3.1 将Python当作计算器使用 Using Python as a Calculator 3.1.1 数值 Numbers 3.1.2 字符串 Strings 3.1.3 Unicode 字符串 Unicode Strings 3.1.4 链表 Lists 3.2 开始编程 First Steps Towards Programming 4. 深入流程控制 More Control Flow Tools 4.1 if 语句 if Statements 4.2 for 语句 for Statements 4.3 range() 函数 The range() Function 4.4 break 和 continue 语句, 以及 循环中的 else 子句 break and continue Statements, and else Clauses on Loops 4.5 pass 语句 pass Statements 4.6 Defining Functions 4.7 深入函数定义 More on Defining Functions 4.7.1 参数默认值 Default Argument Values 4.7.2 关键字参数 Keyword Arguments 4.7.3 可变参数表 Arbitrary Argument Lists 4.7.4 参数列表的分拆 Unpacking Argument Lists 4.7.5 Lambda 形式 Lambda Forms 4.7.6 文档字符串 Documentation Strings 5. 数据结构 Data Structures 5.1 深入链表 More on Lists 5.1.1 把链表当作堆栈使用 Using Lists as Stacks 5.1.2 把链表当作队列使用 Using Lists as Queues 5.1.3 函数化编程工具 Functional Programming Tools 5.1.4 链表推导式 List Comprehensions 5.2 del 语句 5.3 元组(Tuples)和序列(Sequences )Tuples and Sequences 5.4 Dictionaries 字典 5.5 循环技巧 Looping Techniques 5.6 深入条件控制 More on Conditions 5.7 比较序列和其它类型 Comparing Sequences and Other Types 6. 模块 Modules 6.1 深入模块 More on Modules 6.1.1 模块搜索路径 The Module Search Path 6.1.2 “编译”Python文件 ``Compiled'' Python files 6.2 标准模块 Standard Modules 6.3 dir() 函数 dir() Function 6.4 包 Packages 6.4.1 以 * 方式加载包 Importing * From a Package 6.4.2 内置包(Intra-package)参考 Intra-package References 6.4.3 多重路径中的包 Packages in Multiple Directories 7. 输入和输出 Input and Output 7.1 设计输出格式 Fancier Output Formatting 7.2 读写文件 Reading and Writing Files 7.2.1 文件对象(file object)的方法 Methods of File Objects 7.2.2 pickle 模块 pickle Module 8. 错误和异常 Errors and Exceptions 8.1 异常 Exceptions 8.2 处理异常 Handling Exceptions 8.3 抛出异常 Raising Exceptions 8.4 用户自定义异常 User-defined Exceptions 8.5 定义清理行为 Defining Clean-up Actions 9. 类 Classes 9.1 有关术语的话题 A Word About Terminology 9.2 Python 作用域和命名空间 Python Scopes and Name Spaces 9.3 初识类 A First Look at Classes 9.3.1 类定义语法 Class Definition Syntax 9.3.2 类对象 Class Objects 9.3.3 实例对象 Instance Objects 9.3.4 方法对象 Method Objects 9.4 一些说明 Random Remarks 9.5 继承 Inheritance 9.5.1 多继承 Multiple Inheritance 9.6 私有变量 Private Variables 9.7 补充 Odds and Ends 9.8 异常也是类 Exceptions Are Classes Too 9.9 迭代器 Iterators 9.10 生成器 Generators 10. 标准库概览 Brief Tour of the Standard Library 10.1 操作系统概览 Operating System Interface 10.2 文件通配符 File Wildcards 10.3 命令行参数 Command Line Arguments 10.4 错误输出重定向和程序终止 Error Output Redirection and Program Termination 10.5 字符串正则匹配 String Pattern Matching 10.6 数学 Mathematics 10.7 互联网访问 Internet Access 10.8 日期和时间 Dates and Times 10.9 数据压缩 Data Compression 10.10 性能度量 Performance Measurement 10.11 质量控制 Quality Control 10.12 Batteries Included 11. What Now? A. Interactive Input Editing and History Substitution A.1 Line Editing A.2 History Substitution A.3 Key Bindings A.4 Commentary B. Floating Point Arithmetic: Issues and Limitations B.1 Representation Error C. History and License D. Glossary About this document ...

2013-10-19

Oracle_Database_9i10g11g编程艺术深入数据库体系结构.rar(下)

Oracle_Database_9i10g11g编程艺术深入数据库体系结构.part1.rar Oracle_Database_9i10g11g编程艺术深入数据库体系结构.part2.rar合并下载

2013-10-19

工业大数据白皮书2019

工业大数据产业应用联盟 1 前言............................................................................................................................1 1.1 研究背景........................................................................................................1 1.2 研究目标及意义............................................................................................1 2 工业大数据内涵........................................................................................................3 2.1 工业大数据的定义与边界............................................................................3 2.1.1 工业大数据的定义............................................................................3 2.1.2 工业大数据的边界............................................................................3 2.2 与智能制造的关系........................................................................................4 2.2.1 在智能制造中的应用........................................................................4 2.2.2 在智能制造标准体系中的定位........................................................5 2.3 与工业互联网的关系....................................................................................7 2.3.1 在工业互联网中的应用....................................................................8 2.3.2 在工业互联网标准体系中的定位....................................................9 3 工业大数据产业发展现状......................................................................................10 3.1 政策支撑......................................................................................................10 3.1.1 国际工业大数据战略......................................................................10 3.1.2 国内工业大数据政策......................................................................11 3.2 工业大数据应用参考架构..........................................................................14 3.3 典型应用场景..............................................................................................17 3.3.1 智能化设计......................................................................................18 II 3.3.2 智能化生产......................................................................................19 3.3.3 网络化协同制造..............................................................................21 3.3.4 智能化服务......................................................................................22 3.3.5 个性化定制......................................................................................23 3.4 产业发展分析..............................................................................................24 4 工业大数据关键技术..............................................................................................25 4.1 工业大数据技术架构..................................................................................25 4.2 工业大数据平台..........................................................................................27 4.3 工业大数据采集技术..................................................................................28 4.4 工业大数据存储与管理技术......................................................................29 4.4.1 多源异构数据管理技术..................................................................29 4.4.2 多模态数据集成技术......................................................................31 4.5 工业大数据分析技术..................................................................................32 4.5.1 时序模式分析技术..........................................................................33 4.5.2 工业知识图谱技术..........................................................................34 4.5.3 多源数据融合分析技术..................................................................34 4.6 工业大数据的前沿技术趋势......................................................................35 5 工业大数据管理......................................................................................................36 5.1 数据管理体系..............................................................................................36 5.2 数据资源编目..............................................................................................37 5.2.1 数据资源目录应用架构..................................................................37 5.2.2 数据资源编目..................................................................................38 III 5.3 数据质量管理..............................................................................................39 5.3.1 工业大数据质量问题......................................................................39 5.3.2 工业大数据质量检测方法..............................................................41 5.3.3 工业大数据质量管理......................................................................41 5.4 主数据管理..................................................................................................42 5.4.1 主数据管控体系..............................................................................43 5.4.2 主数据应用管理..............................................................................45 5.5 数据安全管理..............................................................................................46 5.5.1 工业大数据安全问题......................................................................46 5.5.2 工业大数据安全防护技术..............................................................46 5.5.3 工业大数据安全管理机制..............................................................48 6 工业大数据的标准体系..........................................................................................50 6.1 工业大数据标准化工作基础......................................................................50 6.1.1 国际标准化......................................................................................50 6.1.2 国内标准化......................................................................................50 6.2 工业大数据标准体系框架..........................................................................52 6.3 工业大数据标准明细表..............................................................................54 6.4 工业大数据重点标准描述..........................................................................55 7 下一步工作建议......................................................................................................56

2019-04-03

大数据之路-阿里巴巴大数据实践

HW产品配置系统部部长推荐语: 几年前,有人提出“人类正从IT时代走向DT时代”,社会上也不少人著书立说,纷繁解读,大家一时躁动不止。今天,以物联网、云计算、大数据、人工智能等为代表的新技术革命正在渗透着各行各业,并在悄悄的深深的影响、改变着我们的生活。出门不用带钱包,一个手机几乎搞定了一切(扫个二维码),路边买个水果,街边买瓶水等等,我们已悄然走入了DT时代。在这个时代,我们比任何时候都要产生更大规模的数据、我们能收集到更加丰富的数据、并且比任何时候都需要大量数据。数据是什么、如何进行定义,如何进行治理、分析挖掘,让它背后潜藏的巨大价值为我们所用等等,推荐大家有空可以看看这本书,希望能为大家(从事数据管理的人)有所帮助。

2019-03-19

Hadoop权威指南 第四版 原版

第1章 初识Hadoop 1.1 数据!数据! 1.2 数据的存储与分析 1.3 相较于其他系统的优势 1.3.1 关系型数据库管理系统 1.3.2 网格计算 1.3.3 志愿计算 1.4 Hadoop发展简史 1.5 Apache Hadoop和Hadoop生态系统 1.6 Hadoop的发行版本 1.6.1 本书包含的内容 1.6.2 兼容性 第2章 关于MapReduce 2.1 气象数据集 2.2 使用Unix工具来分析数据 2.3 使用Hadoop来分析数据 2.3.1 map和reduce 2.3.2 Java MapReduce 2.4 横向扩展 2.4.1 数据流 2.4.2 combiner函数 2.4.3 运行分布式的MapReduce作业 2.5 Hadoop Streaming 2.5.1 Ruby版本 2.5.2 Python版本 2.6 Hadoop Pipes 第3章 Hadoop分布式文件系统 3.1 HDFS的设计 3.2 HDFS的概念 3.2.1 数据块 3.2.2 namenode和datanode 3.2.3 联邦HDFS 3.2.4 HDFS的高可用性 3.3 命令行接口 3.4 Hadoop文件系统 3.5 Java接口 3.5.1 从Hadoop URL读取数据 3.5.2 通过FileSystem API读取数据 3.5.3 写入数据 3.5.4 目录 3.5.5 查询文件系统 3.5.6 删除数据 3.6 数据流 3.6.1 剖析文件读取 3.6.2 剖析文件写入 3.6.3 一致模型 3.7 通过Flume和Sqoop导入数据 3.8 通过distcp并行复制 3.9 Hadoop存档 3.9.1 使用Hadoop存档工具 3.9.2 不足 第4章 Hadoop的I/O操作 4.1 数据完整性 4.1.1 HDFS的数据完整性 4.1.2 LocalFileSystem 4.1.3 ChecksumFileSystem 4.2 压缩 4.2.1 codec 4.2.2 压缩和输入分片 4.2.3 在MapReduce中使用压缩 4.3 序列化 4.3.1 Writable接口 4.3.2 Writable类 4.3.3 实现定制的Writable集合 4.3 序列化框架 4.4 Avro 4.4.1 Avro数据类型和模式 4.4.2 内存中的序列化和反序列化 4.4.3 Avro数据文件 4.4.4 互操作性 4.4.5 模式的解析 4.4.6 排列顺序 4.4.7 关于Avro MapReduce 4.4.8 使用Avro MapReduce进行排序 4.4.9 其他语言的Avro MapReduce 4.5 基于文件的数据结构 4.5.1 关于SequenceFile 4.5.2 关于MapFile 第5章 MapReduce应用开发 5.1 用于配置的API 5.1.1 资源合并 5.1.2 可变的扩展 5.2 配置开发环境 5.2.1 管理配置 5.2.2 辅助类GenericOptionsParser,Tool和ToolRunner 5.3 用MRUnit来写单元测试 5.3.1 关于Mapper 5.3.2 关于Reducer 5.4 本地运行测试数据 5.4.1 在本地作业运行器上运行作业 5.4.2 测试驱动程序 5.5 在集群上运行 5.5.1 打包作业 5.5.2 启动作业 5.5.3 MapReduce的Web界面 5.5.4 获取结果 5.5.5 作业调试 5.5.6 Hadoop日志 5.5.7 远程调试 5.6 作业调优 5.7 MapReduce的工作流 5.7.1 将问题分解成MapReduce作业 5.7.2 关于JobControl 5.7.3 关于Apache Oozie 第6章 MapReduce的工作机制 6.1 剖析MapReduce作业运行机制 6.1.1 经典的MapReduce (MapReduce 1) 6.1.2 YARN (MapReduce 2) 6.2 失败 6.2.1 经典MapReduce中的失败 6.2.2 YARN中的失败 6.3 作业的调度 6.3.1 公平调度器 6.3.2 容量调度器 6.4 shuffle和排序 6.4.1 map端 6.4.2 reduce端 6.4.3 配置调优 6.5 任务的执行 6.5.1 任务执行环境 6.5.2 推测执行 6.5.3 关于OutputCommitters 6.5.4 任务JVM重用 6.5.5 跳过坏记录 第7章 MapReduce的类型与格式 7.1 MapReduce的类型 7.1.1 默认的MapReduce作业 7.1.2 默认的Streaming作业 7.2 输入格式 7.2.1 输入分片与记录 7.2.2 文本输入 7.2.3 二进制输入 7.2.4 多个输入 7.2.5 数据库输入(和输出) 7.3 输出格式 7.3.1 文本输出 7.3.2 二进制输出 7.3.3 多个输出 7.3.4 延迟输出 7.3.5 数据库输出 第8章 MapReduce的特性 8.1 计数器 8.1.1 内置计数器 8.1.2 用户定义的Java计数器 8.1.3 用户定义的Streaming计数器 8.2 排序 8.2.1 准备 8.2.2 部分排序 8.2.3 全排序 8.2.4 辅助排序 8.3 连接 8.3.1 map端连接 8.3.2 reduce端连接 8.4 边数据分布 8.4.1 利用JobConf来配置作业 8.4.2 分布式缓存 8.5 MapReduce库类 第9章 构建Hadoop集群 9.1 集群规范 9.2 集群的构建和安装 9.2.1 安装Java 9.2.2 创建Hadoop用户 9.2.3 安装Hadoop 9.2.4 测试安装 9.3 SSH配置 9.4 Hadoop配置 9.4.1 配置管理 9.4.2 环境设置 9.4.3 Hadoop守护进程的关键属性 9.4.4 Hadoop守护进程的地址和端口 9.4.5 Hadoop的其他属性 9.4.6 创建用户帐号 9.5 YARN配置 9.5.1 YARN守护进程的重要属性 9.5.2 YARN守护进程的地址和端口 9.6 安全性 9.6.1 Kerberos和Hadoop 9.6.2 委托令牌 9.6.3 其他安全性改进 9.7 利用基准评测程序测试Hadoop集群 9.7.1 Hadoop基准评测程序 9.7.2 用户作业 9.8 云端的Hadoop 第10章 管理Hadoop 10.1 HDFS 10.1.1 永久性数据结构 10.1.2 安全模式 10.1.3 日志审计 10.1.4 工具 10.2 监控 10.2.1 日志 10.2.2 度量 10.2.3 Java管理扩展(JMX) 10.3 维护 10.3.1 日常管理过程 10.3.2 委任和解除节点 10.3.3 升级 第11章 关于Pig 11.1 安装与运行Pig 11.1.1 执行类型 11.1.2 运行Pig程序 11.1.3 Grunt 11.1.4 Pig Latin编辑器 11.2 示例 11.3 与数据库进行比较 11.4 Pig Latin 11.4.1 结构 11.4.2 语句 11.4.3 表达式 11.4.4 类型 11.4.5 模式 11.4.6 函数 11.4.7 宏 11.5 用户自定义函数 11.5.1 过滤UDF 11.5.2 计算UDF 11.5.3 加载UDF 11.6 数据处理操作 11.6.1 数据的加载和存储 11.6.2 数据的过滤 11.6.3 数据的分组与连接 11.6.4 数据的排序 11.6.5 数据的组合和切分 11.7 Pig实战 11.7.1 并行处理 11.7.2 参数代换 第12章 关于Hive 12.1 安装Hive 12.2 示例 12.3 运行Hive 12.3.1 配置Hive 12.3.2 Hive服务 12.3.3 Metastore 12.4 Hive与传统数据库相比 12.4.1 读时模式vs.写时模式 12.4.2 更新、事务和索引 12.5 HiveQL 12.5.1 数据类型 12.5.2 操作与函数 12.6 表 12.6.1 托管表和外部表 12.6.2 分区和桶 12.6.3 存储格式 12.6.4 导入数据 12.6.5 表的修改 12.6.6 表的丢弃 12.7 查询数据 12.7.1 排序和聚集 12.7.2 MapReduce脚本 12.7.3 连接 12.7.4 子查询 12.7.5 视图 12.8 用户定义函数 12.8.1 写UDF 12.8.2 写UDAF 第13章 关于HBase 13.1 HBase基础 13.2 概念 13.3.1 数据模型的"旋风之旅" 13.3.2 实现 13.3 安装 13.4 客户端 13.4.1 Java 13.4.2 Avro、REST和Thrift 13.5 示例 13.5.1 模式

2019-03-19

数学大词典_卷2(共两卷)

数学辞海,数学大词典,数学字典,机器学习基础,程序员数学工具书。 文件较大,分两卷

2019-03-19

数学大词典_卷1(共两卷)

数学辞海,数学大词典,数学字典,程序员数学工具书。 文件较大,分两卷

2019-03-19

Hadoop与ETL技术在视频数据中的应用

Hadoop与ETL技术在视频数据中的应用,Hadoop与ETL技术在视频数据中的应用

2019-03-19

Hadoop- The Definitive Guide, 4th Edition

Hadoop- The Definitive Guide, 4th Edition ——tom white

2019-03-19

PostgreSQL数据库内核分析

前 言 第1章 PostgreSQL系统概述/1 1.1 PostgreSQL简介及发展历程/1 1.2 PostgreSQL的特性/2 1.3 PostgreSQL的应用/3 1.4 PostgreSQL代码结构/3 1.5 安装PostgreSQL/4 1.6 PostgreSQL数据库命令/5 第2章 PostgreSQL的体系结构/7 2.1 系统表/8 2.1.1 主要系统表功能及依赖关系/8 2.1.2 系统视图/14 2.2 数据集簇/15 2.2.1 initdb的使用/17 2.2.2 postgres.bki/17 2.2.3 initdb的执行过程/19 2.2.4 系统数据库/20 2.3 PostgreSQL进程结构/21 2.4 守护进程Postmaster/22 2.4.1 初始化内存上下文/23 2.4.2 配置参数/23 2.4.3 创建监听套接字/28 2.4.4 注册信号处理函数/29 2.4.5 辅助进程启动/31 2.4.6 装载客户端认证文件/32 2.4.7 循环等待客户连接请求/33 2.5 辅助进程/34 2.5.1 SysLogger系统日志进程/34 2.5.2 BgWriter后台写进程/36 2.5.3 WalWriter预写式日志写进程/38 2.5.4 PgArch预写式日志归档进程/40 2.5.5 AutoVacuum系统自动清理进程/41 2.5.6 PgStat统计数据收集进程/44 2.6 服务进程Postgres/47 2.6.1 初始化内存环境/48 2.6.2 配置运行参数和处理客户端传递的GUC参数/48 2.6.3 设置信号处理和信号屏蔽/48 2.6.4 初始化Postgres的运行环境/49 2.6.5 创建内存上下文并设置查询取消跳跃点/50 2.6.6 循环等待处理查询/50 2.6.7 简单查询的执行流程/52 2.7 小结/53 第3章 存储管理/54 3.1 存储管理器的体系结构/54 3.2 外存管理/57 3.2.1 表和元组的组织方式/58 3.2.2 磁盘管理器/60 3.2.3 VFD机制/61 3.2.4 空闲空间映射表/64 3.2.5 可见性映射表/69 3.2.6 大数据存储/69 3.3 内存管理/76 3.3.1 内存上下文概述/77 3.3.2 高速缓存/84 3.3.3 缓冲池管理/94 3.3.4 IPC/102 3.4 表操作与元组操作/106 3.4.1 表操作/106 3.4.2 元组操作/112 3.5 VACUUM机制/115 3.5.1 VACUUM操作/115 3.5.2 Lazy VACUUM/116 3.5.3 Full VACUUM/118 3.6 ResourceOwner资源跟踪/120 3.7 小结/122 第4章 索引/123 4.1 概述/123 4.1.1 索引方式/124 4.1.2 索引类型/125 4.1.3 索引相关系统表/125 4.1.4 索引的操作函数/129 4.2 B-Tree索引/131 4.2.1 B-Tree索引的组织结构/132 4.2.2 B-Tree索引的操作/135 4.3 Hash索引/146 4.3.1 Hash索引的组织结构/147 4.3.2 Hash索引的实现/153 4.4 GiST索引/161 4.4.1 GiST的扩展性/161 4.4.2 GiST索引的组织结构/162 4.4.3 GiST索引的实现/163 4.4.4 GiST索引实例/166 4.5 GIN索引/168 4.5.1 GIN索引的扩展性/168 4.5.2 GIN索引的组织结构/170 4.5.3 GIN索引的操作/172 4.6 TSearch2全文搜索/179 4.6.1 全文索引的创建/180 4.6.2 全文索引的查询/184 4.6.3 查询结果处理/185 4.7 小结/186 第5章 查询编译/187 5.1 概述/187 5.2 查询分析/188 5.2.1 Lex和Yacc简介/189 5.2.2 词法和语法分析/193 5.2.3 语义分析/208 5.3 查询重写/218 5.3.1 规则系统/219 5.3.2 查询重写的处理操作/224 5.4 查询规划/228 5.4.1 总体处理流程/229 5.4.2 预处理/237 5.4.3 生成路径/240 5.4.4 生成可优化的MIN/MAX聚集计划/253 5.4.5 生成普通计划/254 5.4.6 生成完整计划/257 5.4.7 整理计划树/259 5.4.8 实例分析/260 5.5 代价估计/266 5.5.1 代价估算公式/267 5.5.2 选择度/268 5.5.3 单个表的扫描代价/268 5.5.4 两个表的连接代价/268 5.6 PostgreSQL中的遗传算法/268 5.6.1 个体编码方式及种群初始化/269 5.6.2 适应值/270 5.6.3 父体选择策略/270 5.6.4 杂交算子/270 5.6.5 变异算子/275 5.6.6 终止条件/275 5.6.7 基于排列生成路径/276 5.6.8 实例分析/276 5.7 小结/280 第6章 查询执行/282 6.1 查询执行策略/283 6.1.1 可优化语句和数据定义语句/284 6.1.2 四种执行策略/284 6.1.3 策略选择的实现/286 6.1.4 Portal执行的过程/288 6.2 数据定义语句执行/289 6.2.1 数据定义语句执行流程/289 6.2.2 执行实例/290 6.2.3 主要的功能处理器函数/293 6.3 可优化语句执行/293 6.3.1 物理代数与处理模型/294 6.3.2 物理操作符的数据结构/295 6.3.3 执行器的运行/297 6.3.4 执行实例/301 6.4 计划节点/303 6.4.1 控制节点/304 6.4.2 扫描节点/310 6.4.3 物化节点/319 6.4.4 连接节点/328 6.5 其他子功能介绍/334 6.5.1 元组操作/334 6.5.2 表达式计算/337 6.5.3 投影操作/340 6.6 小结/342 第7章 事务处理与并发控制/343 7.1 事务系统简介/343 7.2 事务系统的上层/344 7.2.1 事务块状态/345 7.2.2 事务块操作/346 7.3 事务系统的底层/348 7.3.1 事务状态/348 7.3.2 事务操作函数/350 7.3.3 简单查询事务执行过程实例/352 7.4 事务保存点和子事务/353 7.4.1 保存点实现原理/353 7.4.2 子事务/353 7.5 两阶段提交/354 7.5.1 预提交阶段/354 7.5.2 全局提交阶段/355 7.6 PostgreSQL的并发控制/355 7.7 PostgreSQL中的三种锁/357 7.7.1 SpinLock/357 7.7.2 LWLock/358 7.7.3 RegularLock/360 7.8 锁管理机制/368 7.8.1 表粒度的锁操作/368 7.8.2 页粒度的锁操作/369 7.8.3 元组粒度的锁操作/369 7.8.4 事务粒度的锁操作/369 7.8.5 一般对象的锁操作/369 7.9 死锁处理机制/370 7.9.1 死锁处理相关数据结构/371 7.9.2 死锁处理相关操作/372 7.10 多版本并发控制/373 7.10.1 MVCC相关数据结构/373 7.10.2 MVCC相关操作/375 7.10.3 MVCC与快照/379 7.11 日志管理/380 7.11.1 SLRU缓冲池/381 7.11.2 CLOG日志管理器/386 7.11.3 SUBTRANS日志管理器/390 7.11.4 MULTIXACT日志管理器/392 7.11.5 XLOG日志管理器/394 7.11.6 日志管理器总结/402 7.12 小结/403 第8章 数据库安全/404 8.1 PostgreSQL安全简介/404 8.2 用户标识和认证/405 8.2.1 客户端配置文件/406 8.2.2 认证方法/408 8.2.3 客户端认证/410 8.3 基于角色的权限管理/413 8.3.1 用户和角色/413 8.3.2 角色相关的系统表/415 8.3.3 角色管理/416 8.4 对象访问控制/426 8.4.1 访问控制列表/426 8.4.2 对象权限管理/428 8.4.3 对象权限检查/432 8.5 小结/433

2019-03-19

搜索引擎性能评价

搜索引擎体系结构设计理念与性能评价,体系理念,性能评价方案

2019-03-18

大数据全生命周期剖析(普及版)

大数据全生命周期剖析 PPT 大数据全生命周期剖析 格式为ppt

2019-03-12

esb 资料大全汇总

企业服务总线ESB-解决方案与应用实例ppt IBM ESB, WebSphere ESB and WebSphere Message Broker IBM_ESB_MB企业服务总线系统集成的核心平台 IBMESB总体架构交流

2019-03-12

算法相关书籍

算法(第四版).中文版.图灵程序设计丛书 趣学算法 陈小玉 算法笔记 胡凡 算法导论第三版 中文版 算法导论第三版 英文版 算法导论第三版答案 算法竞赛入门经典(第二版) 算法竞赛入门经典(第二版)习题 算法竞赛入门经典(第二版)源码

2019-03-12

面向程序员的数据挖掘指南(中文版 含代码)

About the book Before you is a tool for learning basic data mining techniques. Most data mining textbooks focus on providing a theoretical foundation for data mining, and as result, may seem notoriously difficult to understand. Don’t get me wrong, the information in those books is extremely important. However, if you are a programmer interested in learning a bit about data mining you might be interested in a beginner’s hands-on guide as a first step. That’s what this book provides. This guide follows a learn-by-doing approach. Instead of passively reading the book, I encourage you to work through the exercises and experiment with the Python code I provide. I hope you will be actively involved in trying out and programming data mining techniques. The textbook is laid out as a series of small steps that build on each other until, by the time you complete the book, you have laid the foundation for understanding data mining techniques.

2017-11-23

kettle 常见问题

一、使用Kettle从mysql向oracle中抽取数据的例子 二、开源ETL工具kettle系列之常见问题 三、开源ETL工具kettle系列之在应用程序中集成 四、开源ETL工具kettle系列之增量更新设计 五、开源ETL工具kettle系列之动态转换 六、开源ETL工具kettle系列之建立缓慢增长维 Kettle的并行、集群和分区 一、多线程 二、多线程的后果 三、用Carte作为子服务器 四、集群转换 五、分区

2017-11-23

架构师图谱

架构师图谱.jpg Java架构师图谱.jpg 微服务架构秘籍.jpg 一致性图谱.jpg 互联网大流量的方法.jpg 安全秘籍.jpg 阿里巴巴常用小框架.jpg 架构方法论图谱.jpg 设计模式秘籍图谱.jpg JVM垃圾回图谱.png Java并发图谱.jpg Java集合图谱.jpg Java集合类图.jpg Java List类图.jpg Java Map类图.jpg Java Set类图.jpg Hadoop技能图谱.jpg 大数据技能图谱.jpg 云计算图谱.jpg 云计算技能图谱.jpg IOS技能图谱.jpg OpenResty技能图谱.jpg 前端技能图谱.jpg 容器技能图谱.jpg 嵌入式开发技能图谱.jpg 开发语言宝典.jpg 移动端测试图谱.jpg 运维技能图谱.jpg

2017-11-23

数据中心数据模型设计方法论

编写这篇文档的目的,是为了回答一系列问题:数据模型是什么?什么样的 模型才是好的模型,评判标准是什么?需要遵循哪些设计原则、设计规范?模型 设计的思路、流程是什么?模型设计应采取哪些设计策略?模型设计完成要产出 哪些成果?数据模型如何管理。 本文将从设计理论、设计思路、主题域划分、数据模型管理等方面作介绍, 帮助莱商银行建立数据模型设计的方法论。

2017-11-23

SQL语句教程.pdf

SQL 指令 SELECT DISTINCT WHERE AND OR IN BETWEEN LIKE ORDER BY 函数 COUNT GROUP BY HAVING ALIAS 表格链接 外部链接 CONCATENATE SUBSTRING TRIM 表格处理 CREATE TABLE CONSTRAINT NOT NULL UNIQUE CHECK 主键 外来键 CREATE VIEW CREATE INDEX ALTER TABLE DROP TABLE TRUNCATE TABLE INSERT INTO UPDATE DELETE FROM 进阶 SQL UNION UNION ALL INTERSECT MINUS 子查询 EXISTS CASE 算排名 算中位数 算总合百分比 算累积总合百分比 SQL 语法 无论您是一位 SQL 的新手,或是一位只是需要对 SQL 复习一下的资料仓储业界老将,您 就来对地方了。这个 SQL 教材网站列出常用的 SQL 指令,包含以下几个部分: ♦ SQL 指令: SQL 如何被用来储存、读取、以及处理数据库之中的资料。 ♦ 表格处理: SQL 如何被用来处理数据库中的表格。 ♦ 进阶 SQL: 介绍 SQL 进阶概念,以及如何用 SQL 来执行一些较复杂的运算。 ♦ SQL 语法: 这一页列出所有在这个教材中被提到的 SQL 语法。 对于每一个指令, 我们将会先列出及解释这个指令的语法, 然后用一个例子来让读者了解这 个指令是如何被运用的。当您读完了这个网站的所有教材后,您将对 SQL 的语法会有一个 大致上的了解。另外,您将能够正确地运用 SQL 来由数据库中获取信息。笔者本身的经验 是,虽然要对 SQL 有很透彻的了解并不是一朝一夕可以完成的,可是要对 SQL 有个基本 的了解并不难。希望在看完这个网站后,您也会有同样的想法。

2014-09-03

Oracle锁和阻塞原理解析.pdf

Oracle锁和阻塞原理解析.pdf 了解锁和阻塞是 oracle troubleshooting 必备的技能;在说锁和阻塞之前,我们先了解下 并发(concurrency)和并行(parallel)。并发意思是在数据库中有超过两个以上用户对同样的数 据做修改,而并行的意思就是将一个任务分成很多小的任务,让每一个小任务同时执行,最 后将结果汇总到一起。

2014-09-03

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除