小王是个弟弟-CSDN博客

作者：wjun平台：MacOS版本：Kafka 2.4.1 、Zookeeper 3.6.2一、Zookeeper 配置 SASL若只关注 kafka 的安全认证，不需要配置 Zookeeper 的 SASL，但 kafka 会在 zk 中存储一些必要的信息，因此 zk 的安全认证也会影响到 kafka ????????????1.1 新建 zoo_jaas.conf 文件zoo_jaas.conf文件名、文件所在路径没有特殊要求，一般放置在${ZOOKEEPER_HOME}/conf目录下

2021-07-20 18:12:20 9601 2

原创 hive之事务表

hive 事务表

2021-05-14 14:53:43 3412

原创大数据离线数仓常用组件安装汇总

离线数仓常用大数据组件安装教程，定制化、高可用需求按需配置，该文档仅保证组件正常运行

2021-02-23 15:35:31 670

原创数据结构之栈

数据模拟栈；栈实现计算器

2021-02-05 18:12:07 185 1

原创数据结构之队列

队列

2021-01-28 16:47:47 399 3

原创数据结构之稀疏数组

稀疏数组

2021-01-28 10:37:18 821 1

原创记一次线上MySQL数据归档方案

记一次线上MySQL数据归档方案

2020-12-30 09:54:50 2037

原创基于kettle实现mysql-hive的数据传输（生产环境）

记一次代码被经理毙掉之后被迫使用kettle的经历

2020-12-18 15:27:20 1126

原创 hive打开计算引擎session卡死

平台：H3C DataEngine表现形式：启动hive shell第一次执行走计算流程的sql时，打开计算引擎的session时卡死，可视化查看任务正常提交，就是无法执行。原因解释：无论什么yarn调度器默认都是单队列，H3C使用的是公平调度器，但队列中存在其他正在执行的任务导致队列资源占用达到10%，导致后面的任务需要等待前面的任务走完，卡死的根本原因是安装了spark，导致后台会启动spark session且一直运行，导致之后的任务无法提交。解决方案：配置yarn多队列<?xml .

2020-12-06 23:13:26 1084 11

原创 Hive加载数据报相关权限问题

1.上传文件到linux文件系统[root@node1 mydata]# lltotal 129648-rw-r--r--. 1 root root 120734753 Dec 6 12:53 bigtable.bigtable-rw-r--r--. 1 root root 12018355 Dec 6 12:51 smalltable.smalltable2.加载数据到hive创建表create table bigtable( id int, time string, sess

2020-12-06 22:55:23 2768

大数据安装包最新版下[2020/6/25].zip

hadoop-3.2.1 zookeeper-3.6.1 scala-2.13.2 spark-3.0.0-preview2-bin-hadoop-3.2 jdk-11.0.7 flume-1.9.0 hbase-2.2.5 hive-2.3.7 azkaban-3.90.0 kafka-2.13-2.50 Oozie-5.2.0 sqoop-1.4.7-bin-hadoop-2.6.0 sqoop-1.4.7

2020-06-25

大数据最新安装包上[2020/6/25].zip

2020-06-25

Java基础知识.xmind

javase基础总结思维导图，包含：基础语法、面向对象、集合、常用类、异常、多线程、IO、高级特性、jdk1.8新特性、JVM原理、设计模式

2020-06-24

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人