自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

EdwardWang_的博客

此间有花开, 不知春与夏

  • 博客(41)
  • 收藏
  • 关注

原创 Flink 1.13 源码解析 目录汇总

基于Flink 1.13 源码解析的 总目录

2022-08-25 20:49:22 1571 1

原创 Flink 1.17 Flink-SQL-Gateway HiveServer2 源码分析

Flink 1.17 Flink-SQL-Gateway HiveServer2

2023-03-30 14:09:33 1008 1

原创 Apache Kafka 漏洞 【CVE-2023-25194】说明及解决建议

Apache Kafka 漏洞 【CVE-2023-25194】说明 及 解决建议

2023-02-10 15:40:14 9596

原创 GitHub问题汇总

github异常处理

2022-10-17 18:02:03 494

原创 Flink 1.13 源码解析——Graph的转化以及ExecutionGraph的构建

Flink 1.13 源码解析——Graph的转化以及ExecutionGraph的构建

2022-10-13 14:40:20 1609

原创 Flink 1.13 源码解析——Graph的转化以及JobGraph的构建

Flink 1.13 源码解析,StreamGraph向JobGraph的转化

2022-10-10 11:02:31 1041

原创 Flink 1.13 源码解析——Graph的转化以及StreamGraph的构建

Flink 1.13 源码解析 Graph的转化以及StreamGraph的构建

2022-09-23 09:27:43 1176

原创 Flink 1.13 源码解析——Flink作业提交流程 下

Flink 1.13 源码解析 JobManager接收RestClient提交的Flink Job

2022-09-07 18:25:43 918

原创 Flink 1.13 源码解析——Flink 作业提交流程 上

Flink 1.13 源码解析 Flink 作业 提交流程

2022-09-07 15:20:48 1771 2

原创 Flink 1.13 源码解析——ResourceManager与TaskManager的心跳交互

Flink 1.13 源码解析 ResourceManager与TaskManager的心跳交互源码分析

2022-08-31 22:56:46 1314 1

原创 Flink 1.13 源码解析——TaskManager启动流程 之 与ResourceManager的注册交互

TaskExecutor 向ResourceManager的注册、心跳、资源汇报流程

2022-08-29 23:09:28 985

原创 Flink 1.13 源码解析——TaskManager启动流程概览

Flink 1.13 源码解析 TaskExecutor启动概述

2022-08-29 20:42:37 1086 3

原创 Flink 1.13 源码解析——TaskManager启动流程 之 初始化TaskExecutor

Flink 1.13 源码解析 TaskManager启动流程 之 初始化TaskExecutor

2022-08-29 13:37:16 1599 6

原创 Flink 1.13 源码解析——JobManager启动流程之Dispatcher启动

Flink 1.13 源码解析 JobManager启动流程 Dispatcher 启动

2022-08-27 12:07:24 915 1

原创 Flink 1.13 源码解析——JobManager启动流程之ResourceManager启动

Flink 1.13 源码分析 ResourceManager启动流程

2022-08-26 23:21:27 1250

原创 Flink 1.13 源码解析——启动脚本解析

Flink 1.13 源码解析 启动脚本分析

2022-08-26 10:23:18 1498 4

原创 Flink 1.13 源码解析——JobManager启动流程 WebMonitorEndpoint启动

Flink 1.13 源码解析 JobManager启动流程的第二章 WebMonitorEndpoint启动,来了解一下WebMonitorEndpoint的功能以及启动流程吧~

2022-08-25 22:46:03 775

原创 Flink 1.13 源码解析——JobManager启动流程概览

Flink 1.13 源码解析之 JobManager启动流程

2022-08-25 20:38:51 1762 2

原创 Flink 1.13 源码解析前导——Akka通信模型

Flink 1.13 源码解析前导之Akka通信模型,通过本章了解Akka是如何使用的

2022-08-25 10:07:34 1295 1

原创 SeaTunnel 2.1.3 任务执行流程源码解析

SeaTunnel源码解析,以作业执行流程为场景驱动来进行源码层面的解析

2022-08-22 09:37:25 2147

原创 Apache Beam 使用指南(四)Beam 读Kafka

Beam 读 Kafka

2022-06-14 11:01:37 242

原创 Apache Beam 使用指南(三)Beam 读写 Mysql

Beam读写Mysql

2022-06-14 10:55:27 492 1

原创 Apache Beam 使用指南(二)Beam 读写 Hdfs

Beam读写Hdfs

2022-06-14 10:47:01 271

原创 Apache Beam 使用指南(一)

一篇入门ApacheBeam,包含代码案例

2022-06-08 10:03:44 2574

原创 Apache Beam 问题汇总

Apache Beam 问题汇总泛型擦除问题Exception in thread "main" java.lang.IllegalStateException: Unable to return a default Coder for ParDo(Anonymous)/ParMultiDo(Anonymous).output [PCollection@577127077]. Correct one of the following root causes: No Coder has been

2022-05-19 13:44:01 300

原创 一篇搞懂大数据Lambda架构及实践

lambda为了解决什么?lambda是什么?lambda的优缺点又是什么?快来这里了解一下

2022-05-11 16:50:19 1771

原创 SparkStreaming(java)读取Kafka(kerberos)写入Hbase(kerberos)

使用SparkStreaming(java)读取开启kerberos的Kafka的数据写入Hbase

2022-04-28 11:21:05 2565

原创 自定义Ranger插件 Zeppelin集成Ranger方案 (非LDAP模式)

目录序:一、Zeppelin权限部分分析1、zeppelin-note权限分析2、zeppelin-shiro权限分析二、shiro权限原理分析及Ranger原理分析1、shiro认证授权原理2、Ranger认证授权原理三、自定义Ranger插件1、编写shiroService2、编写资源json文件3、编写Ranger授权类四、自定义Shiro拦截器(RangerFilter)五、测试序:最近项目需求要用Ranger把Zeppelin管...

2021-04-23 16:02:08 1726 3

原创 Zeppelin-0.9.0同步Apache DS LDAP 方案

目录序:一、Zeppelin0.9.0的安装二、Apache DS Ldap的安装三、Zeppelin集成ApacheDS LDAP1、ApacheDS LDAP部分操作(1)创建新的partition(2)创建用户和用户组,准备做zeppelin的映射2、Zeppelin相关配置序:最近在工作中遇到了Zeppelin要同步Ranger的需求,由于项目中有LDAP组件,省去了改源码做shiro集成ranger的麻烦。项目内部使用的ApacheDS Ldap,在Z.

2021-04-02 17:38:26 450 1

原创 Zeppelin-0.9.0 开启kerberos登陆认证

目录序:一、kerberos及Zeppelin的安装(已安装好的直接跳转第二部分)二、Zeppelin开启Kerberos步骤序:因为工作需求,需要开启Zeppelin的Kerberos认证,在Zeppelin0.9.0之前的版本,需要依赖脚本和LDAP以及修改部分Zeppelin认证部分源码来做到集成Kerberos,在Zeppelin0.9.0版本,官方发布了Zeppelin开启Kerberos的方式,下面记录一下我踩的坑和开启步骤,以便大家少走弯路。一、...

2021-03-25 10:55:21 873

原创 Zookeeper架构及Watcher、选举机制

Zookeeper主要是一个分布式服务协调框架,实现同步服务,配置维护和命名服务等分布式应用,基于对Zab协议(ZooKeeper Atomic Broadcast,zk原子消息广播协议,分布式一致性算法)的实现,能够保证分布式环境中数据的一致性。简单来看,zookeeper=文件系统+通知机制。

2020-06-02 11:06:31 237

原创 一篇搞懂谓词下推

什么是谓词 首先我们要了解什么是谓词。 谓词,用来描述或判定客体性质、特征或者客体之间关系的词项。根据《现代汉语》的定义汉语的谓词包括动词和形容词。 在SQL中,谓词就是返回boolean值即true和false的函数,或是隐式转换为bool的函数。SQL中的谓词主要有 LKIE、BETWEEN、IS NULL、IS NOT NULL、I...

2020-05-07 13:35:44 9199 3

原创 Zeppelin架构原理分析

大纲:zeppelin整体架构分析 zeppelin-Interpreter Zeppelin-note zeppelin-paragraph一、Zeppelin整体架构分析首先上一张官方给出的Zeppelin整体架构图Apache Zeppelin的架构比较简单直观,总共分为3层:Zeppelin 前端 Zeppelin Serv...

2020-05-06 15:37:37 2180

原创 Zeppelin 安装使用

本文大纲:一、什么是Zeppelin二、Zeppelin的安装使用一、什么是Zeppelin Apache Zeppelin是一个让交互式数据分析变得可行的基于网页的开源框架。Zeppelin提供了数据分析、数据可视化等功能,同时支持多种语言,包括 Scala(使用 Apache Spark)、Python(Apache Spark)、SparkSQL、 Hi...

2020-05-06 14:59:53 532

原创 Ooize 串行并行(bundle)定时任务 使用总结(sqoop + shell)

本文包含内容:一、ooize使用sqoop将oracle导入到hdfs二、ooize串行定时任务三、ooize并行定时任务四、遇到的问题 一、ooize使用sqoop将oracle表导入到hdfs此处在ooize的lib文件夹下需要oracle的OJDBC驱动包, 不然会报错workflow.xml文件<workflow-app xmlns="uri:o...

2018-09-11 13:46:08 1199

转载 千万级海量测试数据运算下,Redis VS Couchbase性能对比

原来一直没有发现大块数据小数据量下redis也会非常不稳定出现各种问题, 而且响应时间反应速度也比同环境下hbase差出不少, 文章挺好, 一直没找到分享按钮就直接贴过来了, 原文请点击: http://rdc.hundsun.com/portal/article/761.html ▲测试工具▲系统部署1.集群部署:由于redis采用单线程模型,即一个实例只能使用...

2018-08-28 09:49:45 515

转载 Kubernetes------Docker基础知识

Docker 是世界领先的软件容器平台,所以想要搞懂Docker的概念我们必须先从容器开始说起。一 先从认识容器开始1.1 什么是容器?先来看看容器较为官方的解释一句话概括容器:容器就是将软件打包成标准化单元,以用于开发、交付和部署。容器镜像是轻量的、可执行的独立软件包 ,包含软件运行所需的所有内容:代码、运行时环境、系统工具、系统库和设置。 容器化软件适用于基于Linu...

2018-08-28 09:22:26 225

原创 SparkStreaming 架构及案例实现

一、概述Spark Streaming类似于Apache Storm,用于流式数据的处理。根据其官方文档介绍,Spark Streaming有高吞吐量和容错能力强等特点。Spark Streaming支持的数据输入源很多,例如:Kafka、Flume、Twitter、ZeroMQ和简单的TCP套接字等等。数据输入后可以用Spark的高度抽象原语如:map、reduc...

2018-06-11 21:12:26 2016 1

原创 Hadoop 之分布式资源管理框架YARN

 1, YARN 概述        YARN 是“ Yet Another Resource Negotiator”的简称。在进一步了解 YARN 框架之前我们需要知道,相比较而言, MapReduce 则是 YARN 的一个特例。 YARN 则是 MapReduce 的一个更加通用和高级的框架形式,并在其上增加了更多的功能。例如通过加载分布式执行脚本可以在集群节点上执行独立的脚本任务,并且更多...

2018-05-29 21:30:34 1647

原创 Scala 从入门到入土之 Scala Actor

1, 什么是Scala Actor        Scala中的Actor能够实现并行编程的强大功能,它是基于事件模型的并发机制,Scala是运用消息(message)的发送、接收来实现多线程的。使用Scala能够更容易地实现多线程应用的开发2, 传统java并发编程与Scala Actor编程的区别        对于Java,我们都知道它的多线程实现需要对共享资源(变量、对象等)使用synch...

2018-05-29 19:27:33 1784 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除