eddieVim-CSDN博客

原创 Java多线程、Java虚拟机（JVM）博客合集

因为Java多线程与JVM关系紧密，故将两个部分的内容整理在一起Java多线程java多线程创建方式及线程的生命周期与线程方法Java并发工具包JUCCAS(Compare And Swap)流程及原理java引用类型及ThreadLocal内存泄漏Java并发编程之对象内存布局与锁揭示volatile关键字背后的奥秘——CPU多级缓存与指令重排Java虚拟机（JVM）JVM-类装载子系统java引用类型及ThreadLocal内存泄漏Java并发编程之对象内存布局.

2020-08-06 21:29:30 235

原创三色标记法与垃圾回收器（CMS、G1）

三色标记法是一种垃圾回收法，它可以让JVM不发生或仅短时间发生STW(Stop The World)，从而达到清除JVM内存垃圾的目的。三色标记法-算法思想三色标记法将对象的颜色分为了黑、灰、白，三种颜色。黑色：该对象已经被标记过了，且该对象下的属性也全部都被标记过了。（程序所需要的对象）灰色：该对象已经被标记过了，但该对象下的属性没有全被标记完。（GC需要从此对象中去寻找垃圾）白色：该对象没有被标记过。（对象垃圾）算法流程：从我们main方法的根对象（JVM中称为GC Root）开.

2020-08-02 00:58:36 1006

原创浅析分布式锁实现

分布式锁实现MySQLRedisZooKeeper什么时候需要加锁？资源是共享的资源是互斥的多任务环境为什么需要分布式锁？传统的多线程解决方案为什么适用了？分布式事务，往往都是多个不同的主机并发的，他们的主机上有着不同的JVM环境，Java多线程加锁对象是对对象对类的线程控制，只能阻止同一个JVM内的资源被JVM内的线程同时占用的情况。而不同的JVM需要互斥占用一个外部的资源时，就需要分布式锁的实现了。基于MySQL实现分布式锁实现思路在MySQL中的设置一

2020-07-21 23:46:45 188 1

原创说一说 MySQL的锁机制（行锁、表锁、间隙锁、Next-Key Lock）

锁的操作类型分类读锁：共享锁，多个读操作可以对同一份数据同时进行而不会互相影响。写锁：排他锁，在写操作未完成之前，会阻止其他的写锁与读锁。锁的操作粒度分类表锁：偏向于读，MyiSAM行锁：偏向于写，InnoDBMyiSAM在进行SELECT 操作前，MyiSAM会给涉及到的表加读锁。这个时候其他Session可以正常对未加锁的表进行操作。但是对加了读锁的表，只能对其进行查询（共享锁），对其修改则会阻塞，等待至表解锁后，才会生效。Session1Sessi

2020-06-21 11:22:35 1636

原创说一说关于ZooKeeper与ZAB一致性算法

1. 简述ZAB协议以及Zookeeper?Zookeeper是一个高可用强一致的分布式协调服务，基于ZAB协议实现了一个主从一致的架构模式来保证数据的一致性。 zookeeper = 文件系统 + 通知机制Zookeeper是一个基于主从一致的高可用集群，他的节点主要有几种角色：Leader、Follower、ObserverLeader：一个集群只有一个Leader，负责写数据，处理数据同步的主节点，所有的数据写入必须先通过Leader再广播同步到所有的FollowerFollower：

2020-05-21 21:58:44 279

原创 Kafka日志存储——《深入理解Kafka：核心设计与实践原理》

文件目录布局日志格式演变Kafka消息格式经过了3个版本的变化。v0版本v1版本新增了一个timestamp字段。启用压缩时，多个KV被压缩在value位置：v2版本v2版本使用RecordBatch代替了Message Set，引入可变长整数Varint、ZigZag编码。日志索引Kafka日志索引分为两种：偏移量索引时间戳索引Kafka的索引是以稀疏索引构建的，因为Kafka的日志排列都是有序的（offset有序、时间戳有序），所以可以使用这种索引方式，在空间与时间

2021-05-10 10:01:13 338

原创设计一个应用于分布式系统中的可伸缩性IO模型

设计目标步骤分而治之事件驱动模型Reactor模型基本版多线程版本其他版本目标能够实现优雅地降级，在负载增加的情况下（更多的连接）能够随着系统的资源的增加，持续地提高性能还能满足可用性和性能目标短延迟满足高峰期请求可调整的服务质量分而治之，通常都是实现可伸缩性目标的最好的方法。步骤在一些web服务、分布式存储等一些分布式的项目中，他们都基于这样的一个模型：读取反序列化服务的处理序列化写出但是每一步的资源开销都是不一样的，..

2021-03-29 10:12:36 255

原创 Redis主从同步

Redis分布式模型，在CAP定理中，使用了AP的模型，即保证了可用性与分区容错。Redis采用了BASE最终一致性原理，来保证最终数据的一致，即可以允许出现数据不一致的状态。增量同步Redis使用指令流的方式（类似AOF指令）进行同步信息，主节点一边发送指令至从节点，从节点一遍执行该指令，一边将自己的同步情况（偏移量）反馈给主节点。Redis的指令存放在一个buffer中，buffer是一个环形缓冲区（环形数组），当指令流来不及处理之后，会被后面来的数据进行覆盖，这样就会造成数据的丢失，这时候就会

2021-03-15 20:12:16 186

原创 Redis持久化

因为Redis都是基于内存进行存储的，在突然宕机的情况下，就会造成数据的丢失，所以要开启基于磁盘存储的持久化机制。RDB (Redis DataBase)快照，将Redis里的数据进行一次全量操作，存储到一个文件中去。但是RDB需要对磁盘就行一个大量的IO操作，那么RDB是如何保证在持久化的过程，数据更新的问题呢？使用操作系统中的fork函数fork函数COW（Copy On Write）操作系统克隆出一个Redis的子进程，进行数据的持久化操作。而在这个子进程中，如果原来的数据段都不进行修改

2021-03-15 11:31:29 112

原创关于Redis-IO模型思考——结合秒杀系统说说为什么是「多路复用+单线程」

为什么写这篇文章因为博主最近在实现一个分布式缓存系统，说到分布式缓存系统，不得不去借鉴Redis的一下设计，于是在看了一些关于Redis-IO模型的技术文章与书籍之后，有了这么一个思考，于是写一篇博客来记录一下。我的分布式缓存系统：https://github.com/eddieVim/eddie-cacheRedis的IO模型简单来说，多路复用IO + 单线程就是Redis的IO模型所在，相信大部分读者如果看过Redis的一些介绍都有所印象，不过本文并不是主要为了去介绍多路复用IO与传统的IO有什

2021-03-11 22:58:11 198

原创 redis-scan命令

为什么使用scan？因为在Redis的命令执行是单线程模型的，使用keys指令时，若数据量很大，Redis会对全量数据进行匹配，导致会有几秒钟的阻塞事件，而Scan是通过游标对hash-slot分步进行的，阻塞时间短，适合进行线上生产环境使用。scan特点复杂度虽然也是 O(n)，但是它是通过游标分步进行的，不会阻塞线程;提供 limit 参数，可以控制每次返回结果的最大条数，limit 只是一个 hint，返回的结果可多可少;同 keys 一样，它也提供模式匹配功能;服务器不需要为游标保存状

2021-03-11 19:58:54 220 1

原创简单说说JDK8-Stream

JDK8-Stream我发现，Stream的处理方式是借鉴于大数据的流式处理方式。所以我就简单使用Stream来写一个WordCount程序：先简单说一下下面代码的含义，将一个String[]的内容模拟成文件的一行一行数据，最终我们需要将单词映射为word -> count的形式，进行排序，让相同的word靠在一起，最终即可通过比较相近的元素的word是否相等，相等对count进行相加，即可得到最终的答案。import java.util.Arrays;import java.util.Co

2021-02-23 21:32:05 111

原创简单讲讲HashMap & LinkedHashMap

简单讲讲HashMap & LinkedHashMapHashMapHashMap的结构一个数组 + 链表 or 红黑树为什么是这样的结构呢？哈希表原理就是通过哈希映射，来快速定位到对应的key，所以必须要有一个数组用来承接数据，假设我们用Key的hashcode值对数组的长度进行取余，得到对应的数组下标后，进行存储，下次即可通过同样的方法进行快速查找；但是当我们的数据量很大的时候，难免会发生哈希冲突（虽然Key不同但是存储位置是相同的），解决哈希冲突的方法有很多种，HashMap是使用了

2021-02-23 15:41:49 164

原创 Spark-CombineByKey函数

combineByKeyCombineByKey这一函数过程就是根据Key值，将Value值进行合并的过程。参数解释def combineByKey[C]( createCombiner: V => C, mergeValue: (C, V) => C, mergeCombiners: (C, C) => C): RDD[(K, C)] = {}createCombiner: V => C：如何处理第一个ValuemergeValue

2021-01-30 17:08:43 130

原创大数据开发经典面试题：说一说Yarn、HDFS、MR

Yarn是什么？是Hadoop2之后推出的，用于管理集群中的资源，他有这几个角色：ResourceManager（下文简称RM）NodeManager（下文简称NM）ApplicationMaster（下文简称AppMaster）Container其中RM是整个集群的管理者，所有的资源的使用申请与释放都要向它进行汇报与调度，NM是集群中各个Node结点的管理资源，主要配合RM进行工作。这两者生命周期是从Yarn启动到结束均存在的。AppMaster与Container是对进行某一次任务的资

2021-01-29 11:17:08 337

原创 Disruptor简介及其应用

Disruptor背景Disruptor是英国外汇交易公司LMAX开发的一个高性能队列，研发的初衷是解决内存队列的延迟问题（在性能测试中发现竟然与I/O操作处于同样的数量级）。基于Disruptor开发的系统单线程能支撑每秒600万订单，2010年在QCon演讲后，获得了业界关注。2011年，企业应用软件专家Martin Fowler专门撰写长文介绍。同年它还获得了Oracle官方的Duke大奖。目前，包括Apache Storm、Camel、Log4j 2在内的很多知名项目都应用了Disrup

2021-01-27 15:12:02 882

原创说一说Spark-RDD（一）

RDDA Resilient Distributed Dataset (RDD).一个弹性的分布式数据集合。RDD数据集有5个主要的属性：在RDD的源码内部，有以下注释，理解即可。有分区列表，指RDD这个对象中，是知道各个分区数据在分布式文件系统中的哪个位置。有相同的函数可以用于计算每个切片的数据有该RDD数据集合所依赖的数据集合列表可选的，可以有对Key-Value进行分区操作的分区器（例如：默认是hash值分区）可选的，RDD会更加偏向于数据本地化计算（在每个切片所在的位置进

2021-01-23 21:28:09 157 2

原创初识Scala（二）

初识Scala（二）trait相当于Java的接口，但是Scala可以实现多继承。package pro.eddievim.multi/** * @Author eddieVim * @微信公众号艾迪威姆 / PositiveEddie * @Blog https://blog.csdn.net/weixin_44129784 * @Create 2021/1/17 10:28 * @Discription */trait God { def aSay(): Unit =

2021-01-19 11:20:32 76

原创设计模式之迭代器模式(Iterator)

设计模式之迭代器模式(Iterator)提供一种方法顺序访问一个集合对象中的各个元素,而不暴露该对象的内部表示。迭代器模式在很多场景都有应用，例如链表的遍历操作，就需要用到迭代器。大数据中的迭代处理（避免出现多个中间数据集）等等。这里我们来自己实现ArrayList与LinkedList迭代器，加深对迭代器的理解。MyCollectionpackage pers.eddievim.dp.iterator;import java.util.Iterator;/** * @Author

2021-01-16 23:15:50 120 1

原创 Golang Channel简介

Go ChannelChannel，管道。从它的名字，就可以差不多可以了解到是一个与队列类似的东西。它可以轻松地实现，线程之间的通信，线程之间可以通过它接收和发送数据，达到线程安全的目的。定义初始化channel := make(chan int) // 初始化一个不带缓冲区的channelchannel := make(chan int, 9) // 初始化一个带9个缓冲区的channel有无缓冲区区别？有缓冲区若缓冲区大小为N，线程A发送数据至channel中，若channel中已

2020-12-27 16:22:21 103

原创麻省理工硬核课程分布式系统lab_1解析 MIT6.824 lab_1 MapReduce

这个Lab并不是真的让我们去实现MapReduce的分布式并行框架，而是通过本地开启不同的进程（线程），去模拟集群执行MapReduce程序。课程相关文献建议优先使用官方的相关资料，进行完成课程，本文章仅供参考。MIT 6.824 分布式系统课程官网mit 6.824 Distributed SystemsMIT6.824 分布式系统 MapReduce 实验1mit 6.824 Lab1 MapReduce谷歌MapReduce论文MapReduce Paper源代码作者代码仓.

2020-12-11 17:04:11 839 1

原创从源码级别深挖Zookeeper监听机制

从源码级别深挖Zookeeper监听机制监听机制是Zookeeper的一个重要特性，例如：Zookeeper实现的高可用集群、分布式锁，就利用到了这一特性。在Zookeeper被监听的结点对象/信息发生了改变，就会触发监听机制，通知注册者。注册监听机制创建客户端，创建默认监听器在创建zookeeper客户端实例时，需要下列参数。new ZooKeeper(String connectString, int sessionTimeout, Watcher watcher)三个参数分别的含义

2020-12-03 22:41:20 214 2

原创初识Scala（一）

初识Scalaval 与 varval常量：相当于使用final修饰的变量var用于声明变量object 与 classobjectScala的object就相当于一个单例的对象，即static class修饰Object内的方法是直接可以运行的（不需要new一个对象），所以main方法必须在objectobject允许裸露代码，相当于object将代码放到了static静态代码块中classclass内的方法是必须要创建对象后才能使用的类里允许裸露代码，其字节码

2020-12-03 14:53:45 93

原创初识HBase（HBase数据模型与架构）

HBaseApache HBase™ is the Hadoop database, a distributed, scalable, big data store.Use Apache HBase™ when you need random, realtime read/write access to your Big Data. This project’s goal is the hosting of very large tables – billions of rows X millions

2020-11-27 09:47:55 112

空空如也

空空如也