自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 资源 (4)
  • 收藏
  • 关注

原创 OLAP-Druid-原理

1 Druid简介 OLAP 又分实时 OLAP 和离线 OLAP。大数据的一些架构,比如常见 Hive + Hadoop,SparkSQL + HDFS,Kylin 等就是离线 OLAP,而一些监控告警系统这种对实时性要求比较高的系统就是实时 OLAP。而Druid属于实时OLAP范畴。1.1特性列式存储。列式存储的优势在于查询的时候可以只返回指定的列的数据,其次同一列数据往往具有很多共性,这带来另一个好处就是存储的时候压缩效果比较好。 可扩展的分布式架构。 并行计算。 数据摄入...

2020-12-14 18:10:10 482

原创 OLAP-Impala-原理

1 Impala理论1.1 Impala简介 Impala由Cloudera公司推出,提供对HDFS、Hbase数据的高性能、低延迟的交互式SQL查询功能,且基于Hive使用内存计算,兼顾数据仓库、具有实时、批处理、多并发等优点,是CDH平台首选的PB级大数据实时查询分析引擎。其部署架构如下:1.2Impala特点基于内存进行计算,能够对PB级数据进行交互式实时查询、分析 无需转换为MR,直接读取HDFS数据 C++编写,LLVM统一编译运行 兼容HiveSQL 具有...

2020-12-14 15:58:21 252

原创 工程师素养

目录1 为什么要写2 工程师的五点要求2.1 对技术的坚信2.2 要站在巨人的肩膀上做创新2.3 最求极致2.4 每天学习2.5 主人翁精神3 工程师的六大意识3.1 时间意识3.2 质量意识3.3 沟通意识3.4 团队意识3.5 进取意识3.6 求实意识1 为什么要写2 工程师的五点要求2.1 对技术的坚信2.2 要站在巨人的肩膀上做创新2.3 最求极致2.4 每天学习2.5 主人翁精神3 工程师的六大意识3.

2020-11-26 10:28:40 364

转载 Python核心知识点整理

Python核心技术点,主要是经过大牛整理,在此只是做资源整合。1 基础概念2 数据类型2.1 字符串2.2列表和元组2.3字典和集合2.4 切片3 条件和循环4 函数5 面向对象6 文件操作7错误和异常...

2020-11-25 17:52:06 459 1

原创 java最核心知识点整理

Java核心知识点整理Java相关的知识点,业界的大牛已经整理的很好,在此只是引用借鉴。目录1 常见面试题2 基础知识点2.1 集合框架2.2 工具类库2.3 单元测试2.4日志3 并发编程3.1 基础知识3.2 并发理论3.3 并发关键字3.4 Lock3.5并发容器3.6线程池3.7原子操作类3.8并发工具3.9并发实践4 常用工具4.1 IDEA4.2 Maven4.3 Git1 常见面试题序号...

2020-11-25 16:33:11 142 1

原创 Elasticsearch 遇到的问题汇总

前段时间一直在研究ES(Elasticsearch简称)集群,故难免会遇到一些问题,现就遇到的问题做下深入的分析和总结。在分析之前我们先对ES集群中涉及到的关键名词进行了解。一 ES集群比较重要名词解释 1)shards shards指的是索引分片的大小,一个大的索引被分为若干个分片后,存储于不同的节点上以构成分布式搜索。分片不一定是越多越好,分片数量要按自己的

2018-03-14 17:37:51 2048

原创 scala学习--可扩展的语言

从名称可知“可扩展的语言”说明scala确实有它的强大之处-可扩展性,故scala应用范围很广,从简单的脚本到构建大型系统。  scala增加的新类型       引入 BigInt类型(从scala.BigInt引入,其实它的来源是java的BigInteger)如下面的例子        def factorial(x:BigInt):BigInt= if(x==0) 1 else

2014-12-19 11:22:24 577

转载 开发中常用到的正则表达式

正则表达式用于字符串处理、表单验证等场合,实用高效。现将一些常用的表达式收集于此,以备不时之需。匹配中文字符的正则表达式: [\u4e00-\u9fa5]评注:匹配中文还真是个头疼的事,有了这个表达式就好办了匹配双字节字符(包括汉字在内):[^\x00-\xff]评注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)匹配空白行的正则表达式:\n\s*\

2014-11-29 14:43:52 254

转载 设计模式之代理模式

代理模式的结构  所谓代理,就是一个人或者机构代表另一个人或者机构采取行动。在一些情况下,一个客户不想或者不能够直接引用一个对象,而代理对象可以在客户端和目标对象之间起到中介的作用。代理模式类图如下:

2014-11-05 15:17:02 222

转载 设计模式之装饰者模式

此模式以一图一概括

2014-11-05 13:58:50 313

转载 依赖倒转原则学习

依赖倒置原则(Dependence Inversion Principle)1、依赖倒置原则的定义    1)上层模块不应该依赖于底层模块,它们都应该依赖于抽象。    2)抽象不应该依赖于细节,细节应该依赖于抽象,要针对接口编程,不要针对实现编程。     Abstractions should not depend upon details,Details should dep

2014-11-04 10:16:59 518

转载 java-开放—封闭原则

我们日常用的手机软件隔上一段时间就会有新的版本

2014-11-04 09:16:02 1568

转载 mapreduce自定义输入

import java.io.IOException;  import java.net.URI;    import javax.xml.soap.Text;    import org.apache.hadoop.conf.Configuration;  import org.apache.hadoop.fs.FileSystem;  import org.apache.hadoop.fs.P

2014-11-03 20:41:47 303

转载 亨元模式学习

在面向对象的程序设计语言看来,一切事务都被描述成对象(Object)。 对象拥有状态(属性)和行为(方法),我们将具有相同行为的对象抽象为类(Class), 类可以被看作只保留行为的对象模板,类可以在运行时被重新赋予状态数据从而形成了对象。 在运行时,对象占用一定的内存空间用来存储状态数据。如果不作特殊的处理, 尽管是由同一个类生成的两个对象,而且这两个对象的的状态数据完 全相同,

2014-11-03 15:06:07 365

屏幕尺子工具

前端开发人员必备,使用方便。网站开发必不可少

2014-09-18

大数据在医疗行业的应用

大数据在医疗行业的趋势,什么是医疗大数据,如何管理利用大数据

2014-07-06

机器学习十大算法cart

机器学习十大算法 分类决策树算法Cart很详细的实例讲解,希望对踏入数据挖掘领域的学子有助

2014-07-06

hadoop入门

hadoop入门,用于初学者

2013-12-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除