自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 hive 中的case when嵌套与if用法实战

1. 用法一览if(条件表达式,结果1,结果2)相当于三目运算符,当条件表达式的结果为true时返回结果1,false时返回结果2。注意: if后面的表达式类型可以不一样-- 此表达式结果返回: 'hello' 「string类型」select if(100 > 50 , 'hello',-100) as res from dual ;-- 此表达式结果返回: ...

2019-08-25 21:14:02 11035

原创 Hql 中join原理浅谈

join的原理hive 执行引擎会将Hql的代码翻译为一个一个的map-「shuffle」-reduce 操作,所以实际上join操作都是基于一个或者多个的mr操作。对于连续的多表join来说,如果多张表join时使用同一列「字段」作为关联了解,那么这些join则会被翻译成一个reduce任务,否则将会被翻译为多个redude任务。eg1「会被翻译成一个reduce」:-- 由于...

2019-08-11 15:02:38 858

原创 【Hive】中拉链表使用场景

拉链表的基本操作步骤: 1. 初始化一次全量数据到历史拉链表中【只做一次操作就好】2. 历史拉链表与每日的日增量数据做merge操作3.关闭拉链的时间窗口 拉链表的常用使用场景 缓慢变化维(Slowly Changing Dimensions) 业务场景: 公司内部,员工的职级会随着时间的变化发生缓慢的变化,例如: 升职...

2019-07-27 17:17:07 1966 2

原创 python 获取某一节点下的子孙节点「适用于父子层级组织架构」

读取hive数据处理父子层级架构准备原材料hive中表的数据如下:读取hive中的数据,转化为List主程序逻辑如下:要获取某一个节点的所有子孙节点,需要将读取到的节点数据构造为树状结构构造树状结构的步骤如下:1. 构造节点元素类由于树状结构的每一个节点都需要有当前节点、父节点、以及直接子节点这三个核心元素,因此节点元素类如下:class Org: """ ...

2019-07-14 16:39:51 4135 4

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除