自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 问答 (1)
  • 收藏
  • 关注

原创 Flink SQL 批处理使用HOP详解

Flink SQL 批处理使用HOP详解介绍Flink SQL中分组窗口函数中有一个HOP(time_attr, hop interval 滑动间隔, fixed duration 窗口时间),适合的场景基本是每隔多长时间统计一次某个时间段内的指标,例如,统计每个用户过去1分钟(窗口时间)的单击次数,每30秒(滑动间隔)更新1次。在流式计算中比较容易理解,但是批处理使用这个函数就会让人摸不着头脑。下面通过一个例子来解释。表结构及数据SQL INSERT INTO print SEL

2021-03-26 17:47:05 3816 1

原创 集群未知网络问题

提交了一个SparkStreaming程序,经常出现如下的错误:ERROR TransportResponseHandler: Still have 5 requests outstanding when connection from hadoop006/172.33.2.6:55862 is closedWARN YarnSchedulerBackend$YarnSchedulerE...

2018-12-03 15:44:44 2531 1

翻译 Flume conf文件

Flume官网的Source介绍spooldirThis source will watch the specified directory for new files, and will parse events out of new files as they appear.After a given file has been fully read into the channe...

2018-11-15 17:54:27 764

原创 Spark中foreachRDD、foreachPartition和foreach解读

foreachRDD、foreachPartition和foreach的不同之处主要在于它们的作用范围不同,foreachRDD作用于DStream中每一个时间间隔的RDD,foreachPartition作用于每一个时间间隔的RDD中的每一个partition,foreach作用于每一个时间间隔的RDD中的每一个元素。 在Spark 官网中,foreachRDD被划分到Output Op...

2018-11-13 18:00:02 23179 9

转载 Kafka JMX

Kafka官网的JMX MBEAN列表:MonitorCommon monitoring metrics for producer/consumer/connect/streamsCommon Per-broker metrics for producer/consumer/connect/streamsProducer monitoringProducer Sender Me...

2018-11-09 16:57:04 296

翻译 Redis配置

Redis的配置有两种方式,编辑redis.conf,或者通过CONFIG SET CONFIG_NAME CONFIG_VALUE命令。redis.conf内容如下:# Redis configuration file example# Note on units: when memory size is needed, it is possible to specify# it ...

2018-11-08 13:52:51 192

翻译 认识Redis

Redis is an open source (BSD licensed), in-memory data structure store, used as a database, cache and message broker. It supports data structures such as strings, hashes, lists, sets, sorted sets with...

2018-11-08 09:41:28 165

原创 Java实现延时的方法

1、使用Timer类        Timer类的schedule方法可以按照时间计划执行程序。public static void main(String[] args) { Timer timer = new Timer(); TimerTask timerTask = new MyTimerTask(); timer.schedule(timerTask,...

2018-11-07 22:28:17 21558 3

转载 Spark基础知识

Spark为什么比Hadoop快?1、Spark基于内存    Spark默认情况下将处理过程中的数据保存在内存中,而Hadoop的计算结果每次都保存到磁盘,增加了I/O读写的时间。这也导致在迭代计算时Spark速度愈发快于Hadoop。2、Spark基于DAG    Spark的执行任务事先已经通过DAG规划,任务管理更加精细化。3、移动计算而非移动数据    RDD的partit...

2018-11-07 22:24:42 488

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除