- 博客(2)
- 收藏
- 关注
转载 Pig
Pig由两部分组成: 表达数据流的语言,称为Pig Latin 运行Pig Latin程序的执行环境。目前有两种环境:在单个JVM本地执行和在Hadoop集群上分布执行 Pig是一种用于探索大型数据集的脚本语言。 FOREACH 处理每一行生成派生行,并用一个GENERATE子句在每一个派生行中定义字段。 与数据库比较: Pig Latin是一种数据
2016-10-08 14:39:12 202
转载 Hive与hbase的区别
Hive是为了简化编写MapReduce程序而生的,使用MapReduce做过数据分析的人都知道,很多分析程序除业务逻辑不同外,程序流程基本一样。在这种情况下,就需要Hive这样的用戶编程接口。Hive本身不存储和计算数据,它完全依赖于HDFS和MapReduce,Hive中的表纯逻辑,就是些表的定义等,也就是表的元数据。使用SQL实现Hive是因为SQL大家都熟悉,转换成本低,类似作用的Pig就
2016-10-08 14:13:36 206
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人