自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 资源 (2)
  • 收藏
  • 关注

原创 Spark Stage 的划分

想了解Shuffle 的处理流程,首先要了解Spark是如何划分Stage的。下面,让我们看看 Spark 是如何根据RDD 的依赖关系来划分Stage。      首先 我们必须要理解 Spark 中RDD的依赖关系.            1.Rdd的依赖关系:           Rdd的依赖有两种:                1.宽依赖(Wide Dependency)

2016-07-15 17:23:09 6184 1

原创 Spark Shuffle 详解(1)

版本:1.6.2 不管是hadoop中map/reduce还是spark中各种算子,shuffle过程都是其中核心过程,shuffle的设计是否高效,基本确定了整个计算过程是否高效。 设计难点在于shuffle过程涉及到大数据的IO操作(包括本地临时文件IO和网络IO),以及可能存在的cpu密集型排序计算操作。 在spark1.6.2版本,spark针对大型数据有三种shuffle 机制,

2016-07-15 11:46:54 2689 1

华为Lnux学习资料

华为Lnux学习资料,Linux的一个文档

2013-12-24

青鸟租房系统

青鸟租房系统,ACCP北大青鸟课程设计,ACCP6.0的项目实践

2013-11-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除