随心所欲的聚合
2024-02-28 16:18:58
695
告别 hive 繁琐的时间处理
2023-10-31 21:54:56
715
clickhouse 也可以进行优雅删除
2023-08-09 21:33:38
2263
clickhouse极致的查询用户体验
2023-08-01 11:04:25
1272
clickhouse 分布式查询降级为本地查询问题排查
2023-07-27 15:26:22
748
对 Flink Watermark 的粗浅之见
2023-05-15 20:36:15
596
1
使用 sarama 开发 go 的 kafka client
2023-05-06 13:47:17
1844
1
Hadoop 的诞生改变了企业对数据的存储、处理和分析的过程,加速了大数据的发展,受到广泛的应用,给整个行业带来了变革意义的改变;随着云计算时代的到来, 存算分离的架构受到青睐,企业开开始对 Hadoop 的架构进行改造。
2023-03-18 18:06:17
1118
如何快速处理kafka的消息积压
2023-03-01 18:50:52
653
为 Seatunnel 贡献代码必须要了解的细节
2023-02-16 15:51:27
1923
如何构建小而安全的docker镜像
2023-01-29 16:09:40
514
什么是智能指针?智能指针智能在何处?
2022-12-12 15:18:30
889
🎉🎉基于docker一站式hadoop集群管理,使用rust构建hdd客户端管理容器全生命周期
2022-12-01 12:19:38
473
基于 kubeshpere 的 flink on k8s 实践
2022-08-04 18:02:43
4405
5
实现 hiveserver2 用户名密码登录功能
2022-07-21 17:38:42
905
从未有过如此详细的kafka源码解析-生产者篇
2022-07-14 19:10:30
1388
物化视图可在大量节点上很好地扩展,并适用于大型数据集,极大提高查询速率
2022-06-28 11:40:40
6427
2
万字图文,一篇带你入门 NIO,绝对精彩,干货满满
2022-06-26 17:34:08
245
akka for java 入门第一步,通过 akka 模拟 flink 的心跳检测
2022-06-19 18:35:57
1058
拓展kafka删除功能 by timestamp
2022-06-19 12:23:50
1800
flink 是如何计算一个任务的 task slots 消耗,涉及概念:数据流图、算子链、slot共享
2022-05-03 20:04:27
4396
在消费者线程不安全的前提下实现多线程动态增减消费者的订阅
2022-04-17 14:17:24
3954
1
教你实现一个简单的 kafka 异步回调功能
2022-04-17 14:15:26
2815
1
kafka无限重复消费,导致数据严重积压
2022-04-17 14:11:43
2473
1
解析 hive 如何将sql转换为mr任务并对其优化
2022-03-17 11:18:41
2698
解析 hive 如何将 sql 转换为抽象语法树
2022-03-17 11:17:27
3624
解析hive的命令行客户端如何处理sql文
2022-03-17 11:16:44
2764
即席查询之预处理方案的代表
2022-03-17 11:15:01
7972
利用docker搭建一个三节点hadoop集群
2022-03-17 11:13:57
261
docker从入门到实战呀
2022-03-17 11:12:05
887
作者:wjun平台:MacOS版本:Kafka 2.4.1 、Zookeeper 3.6.2一、Zookeeper 配置 SASL若只关注 kafka 的安全认证,不需要配置 Zookeeper 的 SASL,但 kafka 会在 zk 中存储一些必要的信息,因此 zk 的安全认证也会影响到 kafka ????????????1.1 新建 zoo_jaas.conf 文件zoo_jaas.conf文件名、文件所在路径没有特殊要求,一般放置在${ZOOKEEPER_HOME}/conf目录下
2021-07-20 18:12:20
9601
2
hive 事务表
2021-05-14 14:53:43
3412
离线数仓常用大数据组件安装教程,定制化、高可用需求按需配置,该文档仅保证组件正常运行
2021-02-23 15:35:31
670
数据模拟栈;栈实现计算器
2021-02-05 18:12:07
185
1
队列
2021-01-28 16:47:47
399
3
稀疏数组
2021-01-28 10:37:18
821
1
记一次线上MySQL数据归档方案
2020-12-30 09:54:50
2037
记一次代码被经理毙掉之后被迫使用kettle的经历
2020-12-18 15:27:20
1126
平台:H3C DataEngine表现形式:启动hive shell第一次执行走计算流程的sql时,打开计算引擎的session时卡死,可视化查看任务正常提交,就是无法执行。原因解释:无论什么yarn调度器默认都是单队列,H3C使用的是公平调度器,但队列中存在其他正在执行的任务导致队列资源占用达到10%,导致后面的任务需要等待前面的任务走完,卡死的根本原因是安装了spark,导致后台会启动spark session且一直运行,导致之后的任务无法提交。解决方案:配置yarn多队列<?xml .
2020-12-06 23:13:26
1084
11
1.上传文件到linux文件系统[root@node1 mydata]# lltotal 129648-rw-r--r--. 1 root root 120734753 Dec 6 12:53 bigtable.bigtable-rw-r--r--. 1 root root 12018355 Dec 6 12:51 smalltable.smalltable2.加载数据到hive创建表create table bigtable( id int, time string, sess
2020-12-06 22:55:23
2768