- 博客(5)
- 资源 (1)
- 收藏
- 关注
转载 如何将 MapReduce 转化为 Spark
MapReduce VS Spark目前的大数据处理可以分为以下三个类型:复杂的批量数据处理(batch data processing),通常的时间跨度在数十分钟到数小时之间;基于历史数据的交互式查询(interactive query),通常的时间跨度在数十秒到数分钟之间;基于实时数据流的数据处理(streaming data processin
2018-05-14 15:47:50 443
转载 设计模式
一、设计模式 设计模式根据使用类型可以分为三种: ● 创建型:简单工厂模式(并不是23种设计模式之一)、工厂方法模式、抽象工厂模式、单例模式、生成器模式(建造者模式)、原型模式 ● 结构型:适配器模式、桥接模式、组合器模式、装饰器模式、门面模式(外观模式)、亨元模式和代理模式 ● 行为型:命令模式、解释器模式、迭代器模式、中介者模式、备忘录模式、观察者模式、状态模式、策略模式、...
2018-05-14 15:44:52 167
转载 Hive实现时间拉链功能
背景:在数据仓库的数据模型设计过程中,经常会遇到如下的业务需求:1. 表的数据量很大,大几千万或上亿;2. 表中的部分字段会被update更新操作,如用户的上级领导,产品的描述信息,订单的状态等等;3. 需要查看某一个时间点或者时间段的历史快照信息,比如,查看某一个订单在历史某一个时间点的状态;4. 变化的比例和频率不是很大,比如,总共有8000万的用户,每天新增和发生变化
2017-06-08 09:28:53 1164
转载 Oracle分区索引--本地索引和全局索引比较
本文基于Oracle 10gR2分区索引分为本地(local index)索引和全局索引(global index)。其中本地索引又可以分为有前缀(prefix)的索引和无前缀(nonprefix)的索引。而全局索引目前只支持有前缀的索引。B树索引和位图索引都可以分区,但是HASH索引不可以被分区。位图索引必须是本地索引。下面就介绍本地索引以及全局索引各自的特点来说明区别;
2014-10-11 14:39:28 2376
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人