自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

zhijun666

hadppy

  • 博客(20)
  • 收藏
  • 关注

原创 sql练习

我有两张表,一张是用户和卡的IDMapping表(客户ID,卡号),另一张是客户近一个月的消费明细表(卡号,交易金额,交易时间等),现在需要取出最近3笔消费都大于500的客户,给到业务发送短信,请问sql怎么写?先把大于消费500的客户筛选出来,然后按照用户分组(group by),最后count(*)>=3,是这个意思吗?select uid, rank over(parition by uid, order shijina desc ) num from xxxx wher

2021-06-07 15:50:33 251

转载 Redis详解 - SpringBoot整合Redis,RedisTemplate和注解两种方式的使用

本文主要讲 Redis 的使用,如何与 SpringBoot 项目整合,如何使用注解方式和 RedisTemplate 方式实现缓存。最后会给一个用 Redis 实现分布式锁,用在秒杀系统中的案例。 更多 Redis 的实际运用场景请关注开源项目 coderiver 项目地址:h...

2021-05-10 15:34:18 308

转载 Kudu+Impala介绍

转自:http://www.360doc.com/content/18/0913/16/59691344_786386910.shtml Kudu+Impala介绍 概述 Kudu和Impala均是Cloudera贡献给Apache基金会的顶级项目。Kudu作为底层存储,在支持高并发低延迟kv查询的同时,还保持良好的Scan性能,该特性使得其理论上能够同时兼顾OLTP类和OLAP类查询。Impala作为老牌的...

2021-05-10 15:27:03 554

转载 spark动态资源调度

背景一般在使用Spark的的时候通过 spark-submit.sh 配置 num-executors 显示的指定executor的个数。然后AppMaster会向资源调度框架如yarn申请资源,每个executor在yarn中以Container的形式存在。无论executor是否执行任务,都会占用相应的资源,直到应用结束后释放。很显然要是有一种方式,可以动态的申请executor,不用的时候释放掉,那么集群的资源利用率会更高。其实Flink就是这样做的,在Flink中资源都是以slot来动态申请,但是也

2021-04-09 16:29:24 850

转载 缓存无底洞问题

作者:carlosfu一、背景  1. 什么是缓存无底洞问题:Facebook的工作人员反应2010年已达到3000个memcached节点,储存数千G的缓存。他们发现一个问题–memcached的连接效率下降了,于是添加memcached节点,添加完之后,并没有好转。称为“无底洞”现象2. 缓存无底洞产生的原因:键值数据库或者缓存系统,由于通常采用hash函数将key映射到对应的实例,造成key的分布与业务无关,但是由于数据量、访问量的需求,需要使用分布式后(...

2020-12-31 15:56:48 186

原创 各大厂大数据实践

大厂大数据架构https://mp.weixin.qq.com/s?__biz=MzA5MTc0NTMwNQ%3D%3D&chksm=887dc9e5bf0a40f38f398a7b2e621f6b3cf0c9a7b00891d019b4c4ed3a3436e8bf12b24a89b0&idx=1&mid=2650723475&scene=21&sn=2e3cef8d192783bea42b29d1f1f066b8#wechat_redirect数据中台概念ht

2020-12-23 18:17:53 129

转载 面试时如何优雅地自我介绍?

1.题记 有读者提问:如何在面试当中做一个最好的自我介绍? 结合了一下自己面试以及面试别人(模拟面试)的一些经验,简单总结了几点,供大家参考。 2.为什么要自我介绍 在面试官要求自我介绍后,有些同学会觉得信息都在简历上,于是就简单粗暴地说:“面试官好,我叫阿客,我的信心简历上都有,我就不赘述了...了...了...”。 咳咳,面试的时候就这么狂,你是要上天啊...也许有的读者...

2020-12-23 18:07:33 119

转载 redis面试题带答案

文章目录 概述什么是RedisRedis有哪些优缺点为什么要用 Redis /为什么要用缓存为什么要用 Redis 而不用 map/guava 做缓存?Redis为什么这么快 数据类型Redis有哪些数据类型Redis的应用场景 持久化什么是Redis持久化?Re...

2020-12-23 17:58:57 331

转载 2020年 ZooKeeper 最新面试题都在这里(附答案)

先来看看题目 ZooKeeper 是什么? ZooKeeper 提供了什么? Zookeeper 文件系统 Zookeeper 怎么保证主从节点的状态同步? 四种类型的数据节点 Znode Zookeeper Watcher 机制 -- 数据变更通知 客户端注册 Watcher 实现 服务端处理 Watcher 实现 客户端回调...

2020-12-23 17:53:59 638

转载 Kafka面试知识点深度剖析

Kafka面试知识点深度剖析 过往记忆 2020-09-09 09:00:00 163 ...

2020-12-23 17:49:43 166

转载 大数据面试题带答案

版本更新时间更新内容v1.02020-07-01新建v1.12020-07-18朋友面试大数据工程师提供的关于架构及数仓方面的题目(智云健康)v1.22020-08-08朋友面试数据专家提供的数据驱动,spark及flink方面面试题(华为,阿里,小影,拼便宜)v1.32020-08-22朋友面试数据开发提供的关于hive及数仓方面的题目(美团)v1.42020-09-06老徐提供蚂蚁阿里微店面试题(数仓方向...

2020-12-23 17:04:58 1470

转载 flink 的用途

flink 的用途         Flink为流处理器开辟了新的用武之地,它使流处理架构变得完整。它的一大优势便是,使应用程序的构建过程符合自然规律。为了了解Flink的用途及用法,我们来看一看令它具有多用途的几个核心特点,特别是它如何保障数据的正确性。        1 不同类型的正确性,Flink如何正确地进行流处理...

2020-12-18 16:40:07 2339 2

原创 yarn任务执行慢

之前执行一个spark作业,设置的的executor-memory为4G,num-executors为5 ,executor-cores为6之后,查看saprkui界面中的executors只有两个executor加一个driver, 之后考虑可能是内存不够,设置的的executor-memory为2G,num-executors为6 ,executor-cores为4,查看saprkui界面中的executors有三个executor加一个driver, 快了十分钟 看看yarn中的资源情况看看

2020-12-18 11:00:13 1164 1

原创 spark算子总结

RDD创建操作1)从集合创建RDDparallelizemakeRDD2)从外部存储创建RDDtextFile从hdfs文件创建从本地文件创建从其他HDFS文件格式创建hadoopFilesequenceFileobjectFilenewAPIHadoopFile从Hadoop接口API创建hadoopRDDnewAPIHadoopRDD比如:从HBase创建RDDRDD基本转换操作:1)map、flatMap、distinct2)coalesce、repartitio

2020-12-18 09:34:20 91

转载 实时需求功能开发,两表实时增量同步——datax

现在需要mysql几张表实时同步到一个地方,考虑到增量、性能问题,做出以下重要文档。       某几张表实时同步 实时需求开发 一、技术组件调研 1.sqoop方式 无法实时 2.flume方式。 可以参考文章: https://blog.csdn.net/wzy0623/article/details/73650053 方案优缺点   &n...

2020-12-17 17:48:07 1914

原创 kafka数据的顺序问题

Kafka如何保证消息的顺序性https://blog.csdn.net/qianshangding0708/article/details/103360193https://www.cnblogs.com/sunsky303/p/9511839.htmlKafka 自定义指定消息partition策略规则及DefaultPartitioner源码分析https://www.cnblogs.com/jakaBlog/p/11956940.html...

2020-12-15 15:24:12 280

原创 面试大数据实习生

自己被问的问题您这个专业是什么?学了什么scala中match case了解吗了解jvm调优吗大表如何join大表用几句话描述你的项目在项目中遇到哪些问题你是如何解决的遇到过哪些内存异常问题对于streaming对kafka消费,那些core和内存有需要调节的地方吗对于hive的优化了解吗hive和mysql对sql语句有什么区别map算子和faltmap算子的区别foreach和foreachpa...

2020-12-10 17:46:56 163

原创 脚本启动关闭zk、kafka

脚本启动关闭zk、kafka#! /bin/bashcase $1 in"start"){ for i in Master Slave1 Slave2 dossh $i "/usr/local/zk/bin/zkServer.sh start" done};;"stop"){ for i in Master Slave1 Slave2 do ssh $i "/usr/local/zk

2020-12-10 17:34:49 85

原创 收集的大神的博客

收集的大神的博客关于大数据方面:http://lxw1234.com/https://www.iteblog.com/关于java方面:https://www.pdai.tech/

2020-12-10 13:40:55 182

原创 表单提交

我的第一个博客功能快捷键撤销:Ctrl/Command + Z重做:Ctrl/Command + Y加粗:Ctrl/Command + B斜体:Ctrl/Command + I标题:Ctrl/Command + Shift + H无序列表:Ctrl/Command + Shift + U有序列表:Ctrl/Command + Shift + O检查列表:Ctrl/Command ...

2018-12-27 08:51:27 139

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除