- 博客(10)
- 收藏
- 关注
原创 机器学习
1.机器学习1.1.概念对于某给定的任务T,在合理的性能度量方案P的前提下,某计算机程序可以自主学习任务T的经验E;随着提供合适、优质、大量的经验E,该程序对于任务T的性能逐步提高。 以下是机器学习的重要对象:任务Task,T, 一个或者多个经验Experience,E性能Performance,P即,随着任务的不断执行,经验的累积会带来计算性能的提升。 机器学习致力于研究如何通过计算的
2017-07-16 10:10:30 349
原创 Kylin 的架构和原理
1. Kylin的设计思想1.1 与其他开源大数据框架设计思想的对比 解决大数据不断增长中高速查询的能力。 怎么保证随着数据量的增长,怎么保证在未来的数据查询性能不受影响。 从算法角度讲,现有的大数据框架可分为以下几类: 1.并行计算:mapreduce、spark 2.列式存储:parquet,节省IO 3.(倒排)索引:节省IO 这三种在集群规模不变的情况下,随着数据的无限增长,查
2016-11-06 15:52:09 10267
原创 hive中复杂数据类型的使用
1.Array:数组类型,一系列相同元素组成创建一张student表create table student(sid int,sname string,grade array<float>);数据格式如:{1,'Mark',[78,81.5,90]}beeline>:desc student;+-----------+---------------+----------+--+| col
2016-09-20 09:57:57 683
原创 一些收藏与积累
1.java中的接口与scala中trait的异同 http://kenblog.iteye.com/blog/2203827 2.DSL语言的介绍: http://developer.51cto.com/art/200812/101918.htm 3.动态语言和静态语言的比较 http://www.cnblogs.com/spmxlBlog/archive/2010/06/28/1766
2016-09-11 23:38:18 382
原创 文件格式
1.Office 2007 之后版本的word和excel文件的后缀都加了“x”,这些文件本质上都是xml格式的。可以这两类文件的后缀都改成“.zip”,在解压就得到了很多xml文件。
2016-09-11 22:09:29 654
原创 不同操作系统的换行符
不同操作系统的换行符在文本处理中, CR, LF, CR/LF是不同操作系统上使用的换行符. Dos和windows采用回车+换行CR/LF表示下一行, 而UNIX/Linux采用换行符LF表示下一行, 苹果机(MAC OS系统)则采用回车符CR表示下一行. CR用符号’\r’表示, 十进制ASCII代码是13, 十六进制代码为0x0D; LF使用’\n’符号表示, ASCII代码是1
2016-09-11 21:33:08 985
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人