自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

转载 Hive UDTF开发指南

Hive UDTF开发指南  在这篇文章中,我们将深入了解用户定义表函数(UDTF),该函数的实现是通过继承org.apache.Hadoop.hive.ql.udf.generic.GenericUDTF这个抽象通用类,UDTF相对UDF更为复杂,但是通过它,我们读入一个数据域,输出多行多列,而UDF只能输出单行单列。 代码文章中所有的代码可以

2017-12-13 11:32:53 234

转载 hive中UDTF编写和使用(转)

hive中UDTF编写和使用(转)1. UDTF介绍UDTF(User-Defined Table-Generating Functions) 用来解决 输入一行输出多行(On-to-many maping) 的需求。 2. 编写自己需要的UDTF继承org.apache.hadoop.hive.ql.udf.generic.GenericUDTF,实现initiali

2017-12-13 11:29:54 246

转载 Hive-UDAF开发指南

refer to:http://www.cnblogs.com/ggjucheng/archive/2013/02/01/2888051.html介绍hive的用户自定义聚合函数(UDAF)是一个很好的功能,集成了先进的数据处理。hive有两种UDAF:简单和通用。顾名思义,简单的UDAF,写的相当简单的,但因为使用Java反射导致性能损失,而且有些特性不能使用,如可变长度参数

2017-12-13 10:27:57 226

翻译 hadoop理论知识

一、6层架构1、数据源 DataSource生产线上的数据2、数据仓库 dataMars ---Hbase Hive其中一部分数据是我们感兴趣或者需要的,通过ETL过程,放到特定的数据库中。3、数据探索|分析 data exploration 对数据进行指标分析(简单粗略的加工):平均 最小 最大 方差 或者SQL进行查询等目标跟手段都比较清晰4、数据挖掘 data

2017-12-06 10:57:24 298

翻译 hbase基础知识

什么情况下需要使用hbase成熟的数据分析主题,查询模式已经确定且不轻易改变;                 ---查询语句一变化,hbase的结构会发生翻天覆地的变化传统的数据库已经无法承受负荷,高速插入,大量读取;适合海量的,但同时也是简单的操作(key-value);hbase迎接挑战:天生面向时间查询(以时间戳存储)基于行健的查询异常快速,特别是最近的

2017-12-06 10:47:38 156

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除