自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(23)
  • 资源 (8)
  • 收藏
  • 关注

原创 Vmware更新为16后,原本正常使用的虚拟机网络不通

Vmware更新为16后,原本正常使用的虚拟机网络不通

2022-03-12 12:20:35 2693

原创 reduceByKey提示Cannot resolve overloaded method ‘reduceByKey‘

reduceByKey提示Cannot resolve overloaded method 'reduceByKey'

2022-03-12 12:14:21 3124

原创 oracle limit

写这篇的原因是在给学弟学妹改bug的过程中自己的查漏补缺,以及对初学者问题的总结。【陆续补充】

2021-08-12 15:07:01 20537

原创 ““+null =“null“

背景:写代码时候 想让一个空值 变为一个空字符串代码 结果 @Testpublic void nullAddEmtyString() { String empty = null; if (StringUtils.isEmpty(empty)) System.out.println("空值判断通过"); if(StringUtils.isEmpty(empty+"")) System.out.println("空值加空字.

2021-05-29 19:58:10 525

原创 2021-01-25 LocalDateTime与fastJson,jackson

字符串转对象时:在"yyyy-MM-dd hh:mm:ss"格式下fastJson 可以自动解析LocaclDateTimeJackson 不可以自动解析LocaclDateTime需要@JsonFormat(pattern = "yyyy-MM-dd HH:mm:ss")以及 @com.fasterxml.jackson.databind.annotation.JsonDeserialize(using=MyJsonDeserialize.class)在时间戳格式下:fastJson

2021-01-25 22:00:34 895 1

原创 clickhouse打开文件数过多

某一台服务器 clickhouse启动时 最大打开文件为1024,导致群里经常报错errno: 24, strerror: Too many open files修改 ulimit 值后,需要重启clickhouse服务命令 备注 sudo supervisorctl restart clickhouse_exporter 定期抓取ClickHouse(https://clickhouse.yandex/)统计信息,并通过HTTP导出它们,以用于Promet...

2020-09-21 18:39:05 2039

翻译 Hive3.1.1 特性简述

AbstractApache Hadoop 是使用通常由商品硬件组成的计算机集群对大型数据集进行分布式处理的框架。在过去的几年中,Apache Hadoop 已经成为使用商品硬件进行分布式数据处理的事实平台。 Apache Hive 是使用 Apache Hadoop 进行数据处理的流行 SQL 接口。Hive 将用户提交的 SQL 查询转换为物理运算符树,该树经过优化并转换为 Tez Jobs,然后在 Hadoop 集群上执行。在处理中间结果集方面,Hadoop 中的分布式 SQL 查询处理与传统

2020-09-18 10:09:06 1057 1

转载 Linux 字符串切分

假设有变量 var=http://www.aaa.com/123.htm1. # 号截取,删除左边字符,保留右边字符。echo ${var#*//}其中 var 是变量名,# 号是运算符,*// 表示从左边开始删除第一个 // 号及左边的所有字符即删除 http://结果是 :www.aaa.com/123.htm2. ## 号截取,删除左边字符,保留右边字符。echo ${var##*/}##*/ 表示从左边开始删除最后(最右边)一个 / 号及左边的所有字符即删除

2020-08-25 15:26:51 761

原创 hive 文章总览

整理下写的比较全的hive文章,往后不用到处乱找https://gaofeng.blog.csdn.net/article/details/106891688 《Hive动态分区和分桶》https://gaofeng.blog.csdn.net/article/details/106861350 《Hive基本SQL操作(图文并茂)》https://gaofeng.blog.csdn.net/article/details/106891276 《Hive参数设置和运行方式汇总》https://...

2020-06-22 14:21:01 363

原创 获取YARN中实际执行的sql文本

笔者在此之前一直想找到contains中运行的sql命令,相信有不少小伙伴和笔者有着相同的疑惑。偶然间发现了这个参数,可以借助此参数快速找到sql文件。命令如下: hdfs dfs -cat /ats/XXX/application_156000000000_0000*/*/* \|grep mapreduce.workflow.name \|awk 'BEGIN{RS="\",\""}{$1=$1;print $0}' \|grep mapreduce.workflow.name \

2020-05-08 18:12:41 1147

原创 superset安装采坑

为了写毕业设计安装spuerset 弄到半夜一点多,才算勉强弄好。记录一下就去睡觉。首先在阿里云ecs下尝试安装,阿里云比较坑的一点是他默认给你安装了python2.7,并且有些linux基础组件还必须基于python2.7。要用python3的东西就很不方便 。指路在阿里云CentOS服务器上安装Python3.7并设置为默认Python此时你已经很好的做到python3和pyth...

2020-04-19 03:21:07 1075 1

原创 linux bashrc设置别名,优化长命令输入

工作中有很多经常使用到的命令,扩展开就是一大串。用函数式缩写的形式可以完成快速开发(偷懒)。#hive search 注意 有参数时候必须有路径!hs(){ # ${!#} 获取最后一个参数 output="$*" # 去除最后一个参数 nfdown=`echo $output | awk '{for(i=1;i<=NF-1;i++) printf $i" "......

2020-04-18 19:30:04 404

原创 Unrecognized option: --Xmx5120m

Container exited with a non-zero exit code 1. Error file: prelaunch.err.Last 4096 bytes of prelaunch.err :Last 4096 bytes of stderr :Unrecognized option: --Xmx5120mError: Could not create the Jav...

2020-03-17 12:17:47 1716

原创 jdk1.8 函数式编程与scala函数式编程区别

今天和同事的一番对话,引起了我对java函数式编程和scala函数式编程的思考。我: java (x,y)->(x+y) x,y,的类型必须提前定义好吗?不能说我(int x,long y)->x+y同事:如果你说的是函数式编程在java中的使用 则(x,y)->(x+y)必然是一个函数式接口的唯一的一个抽象方法 那此时x,y的类型一...

2020-01-07 18:59:20 465

转载 Hive 通过关闭CBO (Cost based Optimizer) 来优化特定的SQL执行

Hive 自0.14.0开始,加入了一项”Cost based Optimizer”来对HQL执行计划进行优化,这个功能通过”hive.cbo.enable”来开启。在Hive 1.1.0之后,这个feature是默认开启的,它可以自动优化HQL中多个JOIN的顺序,并选择合适的JOIN算法 Join reordering and join algorithm selection are ...

2019-12-27 10:49:25 620

原创 记一次hadoop增加数据磁盘的过程

前段时间业务老是执行失败,检查资源使用情况后决定在两台节点上启动datandoe。节点配置: 2core, 4G memory,2T(空磁盘) 使用ambari操作服务启动datanode服务时候,启动不起来,排查问题发现是不满足hadoop节点最低要求(注: 与ambari中配置有关!)给节点升配,节点配置 4core ,16G memory ,2T ,ambari中datanode...

2019-12-18 21:20:50 348

原创 hadoop高可用集群实际修复经验,为你的简历添砖加瓦

背景12月03号 梳理集群中的log,并处理相应的ERROR ,完成修改操作后重启集群。重启失败2019-12-04 00:23:30,522 - call['ambari-sudo.sh su hdfs -l -s /bin/bash -c 'curl -s '"'"'http://hostname:50070/jmx?qry=Hadoop:service=NameNode,name...

2019-12-06 10:14:17 443 1

原创 服务正常启动, ambari显示服务 stop

背景:hadoop集群启动后,ambari 显示 spark01 的 hiveserver2 状态为stop排错http://hostname:10002/jmxspark01的hiveserver2正常运行。网上大多数说的是ambari监控时没有服务(如hiveserver2)对应pid文件权限导致访问失败[因为启动时候使用手动启动,用户不同,产生...

2019-12-06 10:05:36 859

转载 hive sql 底层语法解析-格式化

原文章http://whatua.com/2018/12/02/hive-sql-format-with-antlr/当前比较好的sql格式化工具以下在网上搜集了一些比较好的sql格式化工具,各有利弊。但对hive sql 来说目前还没有比较好的工具可以直接拿过来用。1. ApexSQL Refactor SQL formatter https://www.ape...

2019-11-05 19:41:04 2279

原创 BindingException: Parameter 'dataBase' not found. Available parameters are [arg1, arg0, param1, par

这个问题很多人都说: 1参数没写@Param注释 2字段名写错这里添加一个最简单的:看看导包是不是导错了

2019-11-05 15:40:15 653

原创 安装mysql 报错Can't connect to local MySQL server through socket '/var/lib/mysql/mysql.sock' (2)

安装mysql时候报错:Can't connect to local MySQL server through socket '/var/lib/mysql/mysql.sock' (2)网上给的修改方法已经够多了,记得查看你是不是在root用户下进行的操作,如果不是,恭喜找到这篇文章。先切换root再执行操作,一切正常...

2018-05-27 15:30:40 475

原创 hive2.x 安装时候报错org/apache/hadoop/crypto/key/KeyProvider

来历就是自己在用hadoop2.4安装hive2.2的时候,抛出的初始化错误。自己百度了两天的这个异常当然改不掉。然后往下往异常下边找java.lang.RuntimeException: java.lang.NoClassDefFoundError: org/apache/hadoop/crypto/key/KeyProvider这个类不存在,然后就贴到网上搜,搜到这篇文章https://blo...

2018-05-17 20:29:40 6650 4

原创 FileInputFormat.setInputPaths多路径读取规则

FileInputFormat.setInputPaths(job, input1, input2);在读取文件时候,默认先读单个大文件所在的路径(一次性读清该文件下所有文件),后读小文件所在路径。写协同过滤时候,想让setInputPaths方法先读第一个输入路径input1,再读第二个输出路径input2就算把文件位置交换,读取的顺序还是错误public static class myMapp...

2018-05-15 13:33:11 5153 3

集群配置参数生成.zip

hadoop参数推荐工具类,输入节点配置信息,输出相应的hive,yarn,container推荐配置大小。

2019-12-16

hadoop集群以及插件安装

1.hadoop安装2.zookeeper安装3.hbase安装4.hive安装5.sqoop安装6.R安装kafka安装 spark安装 八项安装笔记

2018-10-15

hadoop集群一键启动、关闭

自己写的脚本,一键启动hadoop、hbase、zookeeper(几个zookeepler同时启动)、hive。另有一键关闭集群和一键关机功能

2018-10-15

hadoop3.1配置

hadoop3.1 core-site.xml 、hdfs-site.xml 、mapred-site.xml、yarn-site.xml的配置,亲测可用

2018-10-15

Dev_Cpp_5.11_TDM_GCC_4.9.2_Setup

Dev_Cpp_5.11_TDM_GCC_4.9.2_Setup 最简单好用的c、c++编译软件==============

2018-10-08

window全盘索引文件

windows 环境下对所有文件进行全盘检索,不必记住相应路径。 免安装,支持正则等操作。==============

2018-10-08

hadoop搭建配置文件

hadoop搭建配置文件 hdfs-site.xml core-site.xml mapred-site.xml 等等,本人使用的是2.4版本。内部标签有相应汉语注释

2018-10-08

hadoop2.4-bin-winutils

在windows环境下运行hadoop时必不可少的winutils 下载后将原bin文件覆盖,hadoop3.1测试后亦能用此bin包

2018-10-08

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除