自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 数学分析

数学分析

2017-07-16 10:16:42 1200

原创 机器学习

1.机器学习1.1.概念对于某给定的任务T,在合理的性能度量方案P的前提下,某计算机程序可以自主学习任务T的经验E;随着提供合适、优质、大量的经验E,该程序对于任务T的性能逐步提高。 以下是机器学习的重要对象:任务Task,T, 一个或者多个经验Experience,E性能Performance,P即,随着任务的不断执行,经验的累积会带来计算性能的提升。 机器学习致力于研究如何通过计算的

2017-07-16 10:10:30 349

原创 hive2.0的LLAP特性

hive

2017-04-18 10:48:22 9394

原创 Kylin 的架构和原理

1. Kylin的设计思想1.1 与其他开源大数据框架设计思想的对比 解决大数据不断增长中高速查询的能力。 怎么保证随着数据量的增长,怎么保证在未来的数据查询性能不受影响。 从算法角度讲,现有的大数据框架可分为以下几类: 1.并行计算:mapreduce、spark 2.列式存储:parquet,节省IO 3.(倒排)索引:节省IO 这三种在集群规模不变的情况下,随着数据的无限增长,查

2016-11-06 15:52:09 10267

原创 Maven 入门

Maven 入门

2016-10-30 20:10:07 311

原创 正则表达式

1.15位或18位正则表达式

2016-09-23 12:39:26 243

原创 hive中复杂数据类型的使用

1.Array:数组类型,一系列相同元素组成创建一张student表create table student(sid int,sname string,grade array<float>);数据格式如:{1,'Mark',[78,81.5,90]}beeline>:desc student;+-----------+---------------+----------+--+| col

2016-09-20 09:57:57 683

原创 一些收藏与积累

1.java中的接口与scala中trait的异同 http://kenblog.iteye.com/blog/2203827 2.DSL语言的介绍: http://developer.51cto.com/art/200812/101918.htm 3.动态语言和静态语言的比较 http://www.cnblogs.com/spmxlBlog/archive/2010/06/28/1766

2016-09-11 23:38:18 382

原创 文件格式

1.Office 2007 之后版本的word和excel文件的后缀都加了“x”,这些文件本质上都是xml格式的。可以这两类文件的后缀都改成“.zip”,在解压就得到了很多xml文件。

2016-09-11 22:09:29 654

原创 不同操作系统的换行符

不同操作系统的换行符在文本处理中, CR, LF, CR/LF是不同操作系统上使用的换行符. Dos和windows采用回车+换行CR/LF表示下一行, 而UNIX/Linux采用换行符LF表示下一行, 苹果机(MAC OS系统)则采用回车符CR表示下一行. CR用符号’\r’表示, 十进制ASCII代码是13, 十六进制代码为0x0D; LF使用’\n’符号表示, ASCII代码是1

2016-09-11 21:33:08 985

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除