自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

祁东握力的博客

学习使我快乐~

  • 博客(371)
  • 资源 (5)
  • 问答 (1)
  • 收藏
  • 关注

原创 java AQS 、公平锁、非公平锁

JAVA面试题|AQS详细剖析_aqs面试题-CSDN博客

2024-02-20 20:52:12 108

原创 pgsql 在可重复读级别的情况下,报异常:ERROR: could not serialize access due to concurrent update

第一个事务不论是修改提交或者是删除提交,被阻塞的第二个事务都不能修改、删除或者锁住第一个事务所影响的行。(2)那么第二个事务同样用锁方式(增删改查导致的锁都可以)操作相同数据行的数据,仅仅会被阻塞,不会抛出异常。此时第二个被阻塞的事务只要等第一个事务释放锁之后(事务提交或回滚),就可以继续执行。(1)第一个事务如果是仅仅查询导致的锁(select for update/share),而不是修改的导致的锁。

2023-12-01 10:16:35 824

转载 pgsql 数组的使用

2023-11-20 11:23:23 119

原创 Mybatis puls 查询返回null或者count为0,但通过打印的sql查询有数据

3、打了断点,拿sql到navicat中去查能查到,是因为在另一个事务中读取到是当前事务开始之前的数据(未删除或未修改)。Mybatis puls 查询返回null或者count为0,停在debug断点,通过打印的sql查询却有数据。排查自己代码,当前事务中,在执行查询之前是否有删除或修改操作。如果不是我这个原因导致的,那可能是resultMap或者字段映射对不上之类的比较低级的错误导致的。2、在本事务中,执行查询之前,有对这部分数据进行删除或者修改操作,导致查询不到。

2023-09-20 10:57:18 1186

原创 mybatis plus 更新数据,字段设为null不更新

【代码】mybatis plus 更新数据,字段设为null不更新。

2023-08-07 09:48:44 2455

原创 Swagger注解@ApiModel-value值相同时,文档字段定义新增或者修改时无效(很容易误以为是缓存问题,各种重启清缓存也无效)

多个controller方法,如果有参数或者相应的bean的@ApiModel的value相同,putAll会根据这个@ApiModel的value作为key,最终modelMap相同的key会相互覆盖,只保留其中一个文档定义。描述:因为这个问题导致以为是缓存问题,各种重启服务、清浏览器缓存都还是一样,新增字段就是不在文档中显示。解决方法:@ApiModel的value值改为不一样,然后重启服务即可。看swagger源码,debug追踪。解决方法在最后,时间急的直接看最后把。

2023-06-13 16:17:54 533

原创 Clickhouse VersionedCollapsingMergeTree

当ClickHouse插入数据时,它会按主键对行进行排序。如果Version列不在主键中,ClickHouse将其隐式添加到主键作为最后一个字段并使用它进行排序。当ClickHouse合并数据部分时,它会删除具有相同主键和版本但Sign值不同的。行.行的顺序并不重要。(也就是会删除sign值1和-1这一对的数据)合并算法主要是下面两个。

2023-04-21 17:05:37 132 1

原创 git 设置push和pull默认分支

git branch -u=origin/远程分支名 本地分支名。

2023-04-10 19:12:17 82

原创 java二维码批量生成并打包为zip下载

【代码】java二维码批量生成并打包为zip下载。

2022-10-19 17:00:03 711

转载 spark推测机制及参数设置

推测执行机制 推测任务是指对于一个Stage里面拖后腿的Task,会在其他节点的Executor上再次启动这个task,如果其中一个Task实例运行成功则将这个最先完成的Task的计算结果作为最终结果,同时会干掉其他Executor上运行的实例。spark推测式执行默认是关闭的,可通过spark.speculation属性来开启推测机制的设置--conf spark.speculation=true--conf spark.speculation.interval=100...

2022-03-31 09:53:05 502

原创 elasticsearch 删除某个index的某个字段

一、使用script删除,没成功,不再尝试二、使用reindex方式,成功1、(1)根据旧index建一个新索引(去掉你要删的字段)(2)如果要提高reindex性能,把刷新时间设为-1,副本数为0,等重建完索引再恢复PUT dy-talent-v22/_settings/{ "settings":{ "index":{ "refresh_interval":"-1", "number_of_replicas":"0" } }}

2021-09-10 10:53:10 3425 2

原创 Java HashMap putVal 源码中(n - 1) & hash是什么意思?

1、在保证容量都是2的幂次时,(n - 1) & hash相当于取余操作(这就是HashMap容量都是2次幂的原因了,是一种优化)即:(n - 1) & hash = hash % n2、位运算比取余操作快(大概十倍)

2021-09-03 11:25:09 964

原创 es index切换别名(别名移除与旧index关系,增加与新index的关系)

POST /_aliases{ "actions": [ {"add": {"index": "xhs-brand-v8","alias": "xhs-brand-alias"}}, {"remove": {"index": "xhs-brand-v7","alias": "xhs-brand-alias"}} ]}

2021-09-01 14:03:50 647

原创 es 对已存在的index增加字段schema

增加bring_product_category字段PUT awemes/_mapping/origin{ "origin": { "properties" : { "bring_product_category" : { "properties" : { "big" : { "type" : "keyword" },

2021-09-01 14:01:06 662

原创 es upsert示例(存在则更新,不存在则插入),只更新指定字段,不会影响其他字段

POST xhs-brand-v8/origin/d76a8c2d67c49415ff3d244650dc14813dcb83cc/_update{ "doc":{ "brand_category":"母婴", "brand_trade_type":"母婴用品" }}

2021-09-01 13:59:19 5427

原创 Hbase Scan.setReversed(true) 的坑

1、spark.driver.memoryOverheadspark预留内存,计算公式为Min(executor-memery * 0.1 , 384M)。也就是executor的十分之一,并且最小不小于384M这是一种内存,它负责处理诸如VM开销、内部字符串、其他本机开销等事情。这些都是jvm进程本身所需要的开销,不属于计算task时计算数据的内存。所以一般不用设置。2、spark.memory.offHeap.size(需要与 spark.memory.offHeap.en...

2021-08-03 15:25:39 1531

原创 es 增加字段

PUT xhs-note-v5/_mapping/origin{ "origin":{ "properties":{ "generated_categories":{ "type":"keyword" } } }}

2021-08-03 15:21:36 2877

原创 java 过滤emoji

public class EmojiFilter { public static void main(String[] args) { String s = filterEmoji("为了让自己\uD83D\uDD25就黑露思"); System.out.println(s); } private static boolean isEmojiCharacter(char codePoint) { return (codePoin.

2021-05-14 14:08:29 401

原创 spark write写入数据task failed失败在SaveMode.Append与SaveMode.Overwrite两种模式下的不同表现

1、SaveMode.Appendtask失败重试,并不会删除上一次失败前写入的数据(文件根据分区号命名),重新执行时会继续追加数据。所以会出现数据重复。2、SaveMode.Overwritetask失败重试,会删除该分区上次失败所写入的数据文件,然后创建一个新的数据文件写入数据。所以不会出现数据重复。...

2021-05-06 15:38:27 2382

转载 spark 堆内/外内存

https://blog.csdn.net/pre_tender/article/details/101517789https://blog.csdn.net/lquarius/article/details/106698097

2021-04-20 08:47:23 185

转载 spark scala 闭包序列化 ,即被序列化的函数使用了外部的变量时

参考文章:https://blog.csdn.net/bluishglc/article/details/50945032

2021-04-14 22:31:58 277

原创 spark sortBy与 zipWithIndex原理

一、为什么要看源码了解其原理呢?(可忽略)因为项目中需要做排行榜,也就是需要排序,且给出对应排名。搜索了不少资料,模模糊糊的貌似通过sortBy+zipWithIndex两个算子就能做到。但是就是不敢用。第一:不知道sortBy是怎么做到全局排序的,是否有性能问题,导致不太敢用。因为之前学习hadoop的mapreduce,以及hive,了解到全局排序会把所有数据都shuffle到一个reduce里面进行排序(当然,有优化方案)如果数据量很大,spark也是通过这种方式实现全局排序的话,

2021-04-07 23:14:46 1564

原创 elasticsearch 6根据条件删除文档

条件的写法与查询一样POST xhs-brand-alias/origin/_delete_by_query{ "query": { "match_phrase": { "brand_name": "和解" } }}

2021-03-23 16:18:15 326

原创 spark ui各指标介绍

1、task执行是有三个指标shuffle writer size/Records:当前任务输出的数据量shuffle Spill(Memory):当前任务shuffle所使用的内存shuffle Spill(Disk):当前任务shuffle所使用的磁盘

2021-03-15 15:44:03 1578

转载 spark executor配置多个core,即一个executor同时运行多个task时,每个task能分配的内存是多少

当有多个 Task 同时在 Executor 上执行时, 将会有多个 TaskMemoryManager 共享 MemoryManager 管理的内存。那么 MemoryManager 是怎么分配的呢?答案是每个task任务可以分配到的内存范围是 [1 / (2 * n), 1 / n],其中 n 是正在运行的 Task 个数。因此,多个并发运行的 Task 会使得每个 Task 可以获得的内存变小。注意:TaskMemoryManager是每个task的内存管理器,MemoryManager.

2021-03-01 15:28:19 1239

原创 spark 出现OOM内存溢出问题,但不想调大executor的内存,以当前内存甚至更小内存把任务运行下去的方法

法一:增加单个task的内存使用量增加最大 Heap值,即上图中 M2 的值,使每个 Task 可使用内存增加。降低 Executor 的可用 Core 的数量 N , 使 Executor 中同时运行的任务数减少,在总资源不变的情况下,使每个 Task 获得的内存相对增加。当然,这会使得 Executor 的并行度下降。可以通过调高 spark.executor.instances 参数来申请更多的 executor 实例(或者通过spark.dynamicAllocation.enable.

2021-01-31 21:16:20 588

转载 spark executor出现OOM内存溢出问题解决方案

转载链接:https://blog.csdn.net/wypblog/article/details/104935712/Executor OOM类错误 (错误代码 137、143等)该类错误一般是由于 Heap(M2)已达上限,Task 需要更多的内存,而又得不到足够的内存而导致。因此,解决方案要从增加每个 Task 的内存使用量,满足任务需求 或 降低单个 Task 的内存消耗量,从而使现有内存可以满足任务运行需求两个角度出发。因此有如下解决方案:法一:增加单个task的内存使用量.

2021-01-31 20:51:59 3187

转载 spark executor内存各部分使用计算

转载链接:https://blog.csdn.net/wypblog/article/details/104935712/我们都知道 Spark 能够有效的利用内存并进行分布式计算,其内存管理模块在整个系统中扮演着非常重要的角色。为了更好地利用 Spark,深入地理解其内存管理模型具有非常重要的意义,这有助于我们对 Spark 进行更好的调优;在出现各种内存问题时,能够摸清头脑,找到哪块内存区域出现问题。首先我们知道在执行 Spark 的应用程序时,Spark 集群会启动 Driver 和 E.

2021-01-31 20:49:05 1679 1

转载 Spark性能优化指南

https://blog.csdn.net/lukabruce/article/details/81504220

2021-01-30 23:48:09 165

转载 Spark面对OOM问题的解决方法及优化总结

转载自:https://blog.csdn.net/yhb315279058/article/details/51035631 Spark中的OOM问题不外乎以下两种情况map执行中内存溢出 shuffle后内存溢出 map执行中内存溢出代表了所有map类型的操作,包括:flatMap,filter,mapPatitions等。shuffle后内存溢出的shuffle操作包括join,reduceByKey,repartition等操作。后面先总结一下我对Spark内存模型的理解,...

2021-01-29 09:48:05 621

转载 Spark为什么会出现异常内存溢出?

一、疑问:Spark内存不够的时候,不是会写入硬盘么知乎大佬回答:https://www.zhihu.com/question/634403211、记得某本书上讲到过:非序列化的内存对象大小采集是抽样获取的,因此尽管executor在运行时会计算当前内存使用量.但是这个使用量并非是完全准确的值.这样,在某些特定场景下,就会导致统计值小于实际使用值,然后造成没有往磁盘spill的操作.2、回答就是,处理规模比较大的数据的时候spark的鲁棒性其实还没有那么强,需要用户自己绕过这些坑

2021-01-29 09:47:02 887

原创 elasticsearch 删除索引index指定字段及其所有数据

1、执行后会返回一个taskidPOST xhs-note-v2/origin/_update_by_query?wait_for_completion=false&conflicts=proceed{ "script" : "ctx._source.remove('fans_cities')"}2、使用GET _tasks/taskId查看任务执行状况例如GET _tasks/MaTV75PwT2SRqrth9cSeKw:1371742908...

2021-01-28 18:00:30 2386

转载 elasticsearch 更新修改数据(添加和删除字段等)

本文主要内容:1、脚本更新文档 (1).更新常规字段值 (2).更新数组类型字段值 (3).通过脚本进行一定判断,再执行更新操作2、传递部分文档形式更新文档,可以理解成追加文档 (1).检查noop更新3、upsert更新,即存在更新,不存在另行其他操作4、更新操作支持以下查询字符串参数 5、Java JestClient 更新示例前言:在 Elasticsearch 中 文档是不可改变 的,不能修改它们。 相反,如果想要更新现有的文档,需要重建索引或者进行替.

2021-01-28 17:36:58 16510

原创 矩阵的运算法则

2021-01-24 22:55:54 3111

原创 elasticsearch 查询语法学习(总)(单条件、多条件、排序、分组聚合统计)

1、普通query,单条件https://blog.csdn.net/u014646662/article/details/890107592、query使用bool联合查询,多条件(与 或 非)https://blog.csdn.net/qq_36951116/article/details/112550096这篇文章末尾部分以及https://blog.csdn.net/qq_36951116/article/details/112594223...

2021-01-13 23:15:18 476

原创 elasticsearch bool联合查询的使用should、must、must_not、filter以及should与另外三个并列时无法生效问题

本意上想做到像这个sql一样select * from tablewhere( dynamicType = '201' and viewTime = '2019-10-11' )and( uniqueKey = 'xxx' or uniqueKey = 'zzz' )1、出现问题的写法,在bool下面有must和should同级的两个属性,像下面这样下就会导致should的筛选失效,只有must生效{ "query": { "bool": {...

2021-01-13 21:56:53 5996 3

转载 elasticsearch 6 term、match、match_phrase、multi_match 、bool联合查询、 must、should、must_not

转载自:https://www.cnblogs.com/yjf512/p/4897294.htmles中的查询请求有两种方式,一种是简易版的查询,另外一种是使用JSON完整的请求体,叫做结构化查询(DSL)。由于DSL查询更为直观也更为简易,所以大都使用这种方式。DSL查询是POST过去一个json,由于post的请求是json格式的,所以存在很多灵活性,也有很多形式。这里有一个地方注意的是官方文档里面给的例子的json结构只是一部分,并不是可以直接黏贴复制进去使用的。一般要在外面加个que.

2021-01-12 23:29:14 1169 1

原创 elasticsearch6 聚合查询

一、简单查询+简单聚合(根据某字段分组)1、模拟数据PUT /shirts/_doc/1{ "brand": "gucci", "color": "red", "model": "slim"}PUT /shirts/_doc/2{ "brand": "gucci", "color": "red", "model": "slim"}PUT /shirts/_doc/3{ "brand": "gucci", "color":...

2021-01-12 22:58:51 583 1

原创 k8s kube-flannel.yml文件

---apiVersion: policy/v1beta1kind: PodSecurityPolicymetadata: name: psp.flannel.unprivileged annotations: seccomp.security.alpha.kubernetes.io/allowedProfileNames: docker/default seccomp.security.alpha.kubernetes.io/defaultProfileName: dock.

2021-01-07 21:34:27 767

原创 hbase 清空表

Hbase 清空表,truncate与truncate_preservetruncate会把表分区也清除掉hbase(main)> truncate 'namespace:tableName'truncate_preserve只清除数据hbase(main)> truncate_preserve 'namespace:tableName

2021-01-06 09:20:59 2386

react chrome插件2.3.3

React Developer Tools 2.3.3 Chrome插件 官方版 使用方式,解压成文件建,然后在"扩展程序"打开开发者模式,然后把文件夹拖到chrome就行了

2020-11-16

尚硅谷大数据技术之Kafka.pdf

kafka安装及使用文档。。包含kafka、kafka-eagle

2019-09-22

hadoopHA配置.txt

hadoop的ha配置过程,亲自搭建测试过,hdfs和yarn的HA都完美运行,mapreduce提交到集群中也运行成功。

2019-08-18

hadoop2.x集群搭建.txt(hdfs和yarn貌似正常,但mapreduce 提交job执行失败,请看我的另一个资源,另一个搭建是成功的)

hadoop 搭建过程

2019-07-06

hadoop2.x集群搭建(1.0).txt

hadoop集群搭建过程

2019-07-03

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除