自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 资源 (13)
  • 收藏
  • 关注

原创 【Hive从入门到精通之基础篇】Hive的分区表(比较重要,开发必用)

1、何为分区表(1)基本概念:在Hive中,分区表的意思就是相当于在该表对应的文件夹目录下创建子目录来存储不同该表分区字段对应的数据(简单一句话总结就是hive中的分区表就是分目录存储数据,将一个表的所有数据根据业务来切分成一个个小的数据集来存储)。(2)分区表数据的查询通过where关键字来指定分区字段来进行查询,这样可以提高查询的效率。2、分区表的基本操作(1)创建分区表的语法...

2019-09-17 00:06:42 571

原创 【Hive从入门到精通之基础篇】Hive的内部表与外部表区别与使用场景

1、Hive的内部表(管理表)(1)基本概念:在Hive中,默认创建的表都是管理表(内部表),它与表的原始数据息息相关,Hive默认情况下会将管理表的数据存储在由配置参数hive.metastore.warehouse.dir指定的HDFS目录下(/user/hive/warehouse/),当删除管理表时,会删除表的元数据并连同表的原始数据一起删除(所以管理表不适合与其它工具来共享数据)。...

2019-09-16 23:14:33 697

原创 【Flink学习笔记】Flink Local和Standalone模式的安装部署

1、Flink Local模式安装1)安装最新的flink-1.9版本(1)解压安装包tar -zxf flink-1.9.0-bin-scala_2.11.tgz -C /opt/module/(2)由于是单机模式,所以可以不需要进行任何配置直接启动即可(这里我启动1个jobManager服务进程和3个taskManager服务进程)# 执行该脚本会启动flink的1个j...

2019-09-02 16:19:29 980

原创 【Flink学习笔记】Flink DataStream API之Transformation算子小结

1、map算子1)理解:通过对DataStream对象调用其map方法,对数据流中的每一个元素进行转换逻辑操作,最终返回每一个输入元素转换后的结果数据继续封装成一个DataStream对象返回(输入多少个元素,就会返回多少个元素,中间过程可以进行一系列的数据结构转换操作)2)map算子使用入门代码示例(1)java API代码package com.flink.datastrea...

2019-08-31 23:29:26 650

原创 【Hive从入门到精通之基础篇】Hive的数据类型分类

1、基本数据类型1)Hive的基本数据类型对比Java的数据类型Hive的数据类型 Java的数据类型 长度 tinyint byte 1个字节,有符号整数 smalint short 2个字节,有符号整数 int int 4个字节,有符号整数 bigint long 8个字节,有符号整数 boolean ...

2019-08-29 01:07:51 446

原创 【Hive从入门到精通之基础篇】配置通过远程Jdbc方式连接之HiveServer2

1、首先需要配置hive-site.xml文件(1)hive.server2.thrift.port --端口号:10000(2)hive.server2.thrift.bind.host --绑定主机名称为hive安装的那台节点主机名(3)hive.server2.long.polling.timeout -- 超时时间为5000,去掉L<!-- 配置hive serve...

2019-08-29 00:42:05 837

原创 【Hive从入门到精通之基础篇】Hive的基本命令行操作和常用的交互命令

1、Hive的基本命令行操作(1)启动hive默认的命令行客户端bin/hive(2)查看数据库列表show databases;(3)使用默认数据库use default;(4)查看该数据库下有几张表show tables;(5)这里我们可以在default数据库下面创建一张表studentcreate table if not exis...

2019-08-29 00:27:02 482

原创 【Hive从入门到精通之开门篇】Hive的安装配置

1、Hive的来源与介绍1)Hive是由Facebook开源用于解决海量结构化日志的数据统计。2)Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。3)总结一句话,Hive的本质是:将HQL转化成MapReduce程序。4)Hive处理的数据我们一般存储在分布式文件系统HDFS上,由于其执行底层会转换成MapReduce程序,...

2019-08-28 23:35:05 404

原创 一、spring boot从入门到放弃系列之hello world

1、spring boot,总结就是以下三点:①简化了使用spring 框架来开发软件应用的一个框架。②整合了多种技术框架,默认提供了自动化的配置,让开发人员更加专注于业务的实现。③J2EE开发的一站式解决方案。2、环境准备①JDK至少1.7以上;②maven版本3.3以上版本;③IntelliJ IDEA2018.1.3;④spring boot版本1.5.9;3、可以事先配置maven的set...

2018-06-15 09:12:36 133

原创 在IDEA中创建父工程和子模块module

1、右键选择你所创建的空文件夹,然后new,再点击Module2、依次选择maven,这里不要点击“create from archetype”点击next3、填写你想要的GroupId和ArtifactId,然后点击next4、Module name给父工程起个名字,点击next5、删除src目录,当然你也可以留着不用删6、创建一个子模块项目,在父工程上右键点击new Module,依次点击ma...

2018-06-11 18:39:51 58219 10

Clickhouse Meetup 201910(Shanghai Shenzhen).zip

Clickhouse Meetup 201910(Shanghai Shenzhen).zip

2020-07-29

azkaban大数据调度任务.zip

azkaban大数据调度任务.zip

2020-07-29

工作周报总结2019~2020.zip

工作周报总结2019~2020.zip

2020-07-29

截屏工具Snipaste-1.11.3-x64.rar

截屏工具Snipaste-1.11.3-x64安装包,

2020-07-28

metabase.jar

metabase.jar是一个最新版本的BI报表开源框架

2020-07-07

DolphinScheduler1.3.0安装包.rar

DolphinScheduler1.3.0安装包.rar

2020-06-19

MySQL和Oracle的驱动包.rar

MySQL和Oracle的驱动包,

2020-01-17

Grafana-6.5.2.rar

ClickHouse监控工具Grafana-6.5.2,ClickHouse监控工具Grafana-6.5.2,ClickHouse监控工具Grafana-6.5.2

2020-01-08

服务器搭建部署流程.docx

快速上手阿里云云服务器搭建部署教程。。

2019-11-26

关于MySQL和数仓的pdf.rar

关于MySQL和数仓的pdf.rar,脑图和pdf

2019-09-19

redis客户端工具.rar

redis客户端工具.rar压缩包中包含redis-desktop-manager-0.9.3.817.rar、截图工具、百度云下载工具。

2019-08-30

dbeaver和xshell安装包.rar

dbeaver和xshell安装包.rar,dbeaver可以连接多个类型的数据库服务器来操作,xshell连接服务器工具。

2019-08-30

jdk安装包.rar

jdk-8u161-linux-x64.tar.gz安装包,可部署安装在服务器上,开发首选必备。

2019-08-29

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除