自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 资源 (2)
  • 问答 (1)
  • 收藏
  • 关注

原创 编译spark源码使sparksql支持hive(cdh的)

一:首先设置maven的内存export MAVEN_OPTS="-Xmx2g -XX:MaxPermSize=512M -XX:ReservedCodeCacheSize=512m"二:在spark的目录下执行该命令(cd spark-1.3.0)mvn -Pyarn -Dhadoop.version=2.6.0-cdh5.4.1 -Phive -Phive-thriftserver

2016-08-31 14:37:22 1089

原创 Scala变量

Scala变量变量和常量的声明class ValTest {}object ValTest extends App{ val a = "Hello world" //常量的值一旦声明初始化,不能改变 a = "ldjalda" /** * scala可以进行类型的推断 * var 声明的变量可以改变值 * Scala声明的变量必须进行初始化这点和

2016-08-31 14:34:36 351

原创 phoenix hbase 安装 eclipse 测试

环境介绍:  hadoop版本:hadoop-2.5.2-src.tar.gz  hbase版本:hbase-0.98.8-hadoop2-bin.tar.gz  phoenix版本:phoenix-4.3.1-bin.tar.gz**hadoop、hbase环境搭建(省略哦)** (在vm中装了三台centos,三个节点的hadoop集群,hbase也是三个节点,

2016-02-15 14:32:43 1271

原创 hive调用Linux的shell命令测试

今天在学hive的时候,发现hive在写查询的时候,可以调用Python,shell对结果进行进一步的处理,就写了几个测试的例子,对结果集用Linux命令进行处理,发现还不错建表:CREATE TABLE u_data_new (userid INT,movieid INT,rating INT,weekday INT)ROW FORMAT DELIMITEDF

2015-09-16 22:36:15 3403

统计思维:程序员数学之概率统计

本书采用大量实例介绍了基本的统计分析知识,教你如何用Python编程语言实现各种分析, 乃至画出统计图形。本书提供了绝对实用的配套代码,你可以直接“拿来”对大量数据进行分 析。作者Allen Downey是高校副教授,先后获得麻省理工学院计算机科学硕士和加州大学伯 克利分校计算机科学博士学位。别惊讶,是的!计算机专业的教授写的统计学读本,这才是 这本书最大的亮点。统计学和计算机在本书中紧紧地拥抱在一起,这是多美好的场景。

2018-05-30

利用python进行数据分析中文带书签

《利用Python进行数据分析》讲的是利用Python进行数据控制、处理、整理、分析等方面的具体细节和基本要点。同时,它也是利用Python进行科学计算的实用指南(专门针对数据密集型应用)。   《利用Python进行数据分析》重点介绍了用于高效解决各种数据分析问题的Python语言和库。《利用Python进行数据分析》没有阐述如何利用Python实现具体的分析方法。

2018-05-30

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除