自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 资源 (9)
  • 收藏
  • 关注

原创 Doris、StarRocks 压测对比

1、在多表查询下,仅在一个场景下Doris速度逊于StarRocks ,大部分场景是Doris优于StarRocks的。2、在单表查询下,StarRocks 在部分场景下优于Doris,但是二次查询,二者不分伯仲。3、在cpu和内存的事使用上,doris会比starrocks多吃1.5倍的资源。使用doris-master\tools\ssb-tools下的压测脚本。4、本次测试,未调优二者的参数,开箱起服务,直接测试的,部署架构一致。创建表:./create-ssb-tables.sh。

2024-03-01 14:26:11 1585 2

原创 Elasticsearch 利用juicefs使用s3存储

juicefs对象存储elasticsearch中的使用

2023-06-08 09:59:03 538

原创 juicefs安装

juicefs对象存储的使用

2023-06-08 09:51:38 283

原创 Spark 3.3.0安装

Spark 3.3.0安装

2022-12-05 15:12:19 1994

翻译 Hadoop 应用

Hadoop Modules(Hadoop 模块)Hadoop Distributed File System (HDFS): A distributed file system that provides high-throughput access to application data. Hdfs:一种分布式文件系统,提供对应用程序数据的高吞吐量访问的分布式文件系统。 Hadoop YARN: A framework for job scheduling and cluster resourc

2021-03-14 23:03:19 471 1

原创 Hadoop 格式化format namenode 后,ambari端启动datanode节点无法正常启动处理

问题描述:hadoop namenode -format hdfs重新格式化之后,重新启动后,一直无法启动。在datanode上的报错日志如下,可以看出id不一致 2021-01-09 16:34:09,920 ERROR namenode.NameNode (NameNode.java:main(1759)) - Failed to start namenode. org.apache.hadoop.hdfs.server.common.IncorrectVersionExcep

2021-03-13 23:53:34 595 1

原创 DataNode因主机配置问题,ambari端启动异常

问题1: 2021-02-05 15:16:45,544 ERROR datanode.DataNode (DataNode.java:secureMain(2692)) - Exception in secureMain java.io.IOException: Login failure for dn/[email protected] from keytab /etc/security/keytabs/dn.service.keytab: javax.security.auth.l..

2021-03-12 23:43:52 544 1

原创 Yarn 服务启动后,一段时间后停止,再起再停

项目场景: 最近在一套hadoop新集群的时候,搭完集群后,发现nodemanager不够用,遂添加了一个nodemanager节点,可是添加完之后,启动nodemanage后,一段时间又掉了。问题描述: 2019-04-03 16:51:06,517 INFO org.apache.hadoop.yarn.server.nodemanager.NodeManager: registered UNIX signal handlers for [TERM, HUP...

2021-03-12 23:16:45 1286

原创 Hadoop 3.x安装部署详细手顺

一、准备工作 Ambari、HDP版本介绍 Ambari 2.7.3仅支持HDP-3.1.0,HDP-3.0.1,HDP-3.0.0使用以下URL确定对每个产品版本的支持https://supportmatrix.hortonworks.com/,以及下载报告 工具包下载 ambari-2.7.3.0:http://public-repo-1.hortonworks.com/ambari/centos7/2.x/updates/2.7.3.0/ambari-2.7.3.0-c

2021-03-09 23:59:04 3049 6

原创 Hadoop Web控制台添加身份验证

我们在安装完hadoop 2.x 版本之后,默认情况下,可以通过 http://ip:50070/dfshealth.html访问hdfs页面,查看namenode和datanode状态,以及hdfs的相关文件等。但是这存在安全隐患,可能导致我们的文件信息的泄露,如果我们在页面里面添加个认证机制,只有验证之后的用户才可以进入页面里操作。下面介绍一个既安全又好用的配置方案。既然这是一个web界面,那就可以从为web项目添加用户校验入手,而不是为hadoop提供用户校验入手。1、...

2021-03-08 00:25:23 5397 16

原创 Hbase跨集群数据同步验证

环境信息 集群 主机名称 IP地址 HDFS HBASE zookeeper kerberos A集群 pthadoop01.dcs.com 192.168.98.37 namenode journalnode datanode hmster...

2021-03-08 00:10:17 3719 4

原创 Hbase读写缓存优化

我们在hbase使用过程,经常遇到hbase慢问题,我们在生产中也是遇到这个,尤其是大量业务袭来的时候,数据量一上来,hbase读写慢问题非常明显。很多时候,是通过日志和监控观察某个节点压力大,重启对应的region server,这样可以短时解决hbase慢过程中region server服务夯死的问题,但是重启后,本地化率降低,查询还是变慢,出现了夯死、重启、本地化率低的死循环。于是我们分析hbase读写缓存情况,发现有可以改善的地方。首先我们调整了datanode的jvm, ...

2021-03-06 23:49:20 1009 1

原创 Hadoop的资源隔离

Hadoop的资源隔离背景 最近在接入oss域的hadoop集群中发现,当接入的集群的用户较多跑MR相关的spark、hive等服务时,如果不做资源的管理与规划,那么整个Yarn的资源很容易被某一个用户提交的Application占满,其它任务只能等待,这种当然很不合理,我们希望每个业务都有属于自己的特定资源来运行MapReduce任务,这里我们通过Hadoop中提供的公...

2021-03-06 23:31:33 829 3

原创 Hbase表跨集群迁移手册

Hbase表跨集群迁移手册将旧集群的namespaceA下的表移到新集群的namespaceB下面1、检查新、旧集群的hdfs、hbase是否正常(1)使用命令:hbase hbck #查看hbasemeta表情况,确认0个,说明hdfs中的数据和hbase表中的meta表是对应的。(2)使用hdfs dfsadmin –report查看集群中的hdfs是否有block异常查看无异常以后,继续前进。。。2、将旧集群文件数据复制至新集群(1)前面确认好两...

2021-02-25 16:21:33 377 1

hbase-hbck2-1.2.0,支持hbase[2.0.3, 2.0.5,2.1.1, 2.2.0, 3.0.0]版本

hbase 2.x以后取消了hbase hbck,需要使用hbase hbck2,我编译的这个版本可以支持hbase[2.0.3, 2.0.5, 2.1.1, 2.2.0, 3.0.0],具体怎么使用,可以参考 https://bbs.huaweicloud.com/blogs/353333,或者留言问我哈。

2022-11-22

hive-jdbc-uber-2-6-5-0-292到处要积分,我这里不要积分,下吧

下包,整活

2022-07-21

jdk-1.8-windows(4)

主要是存着备份,我把包分成了四份,大家也可以下载。

2018-09-13

jdk-1.7-windows(3)

主要是存着备份,我把包分成了四份,大家也可以下载。

2018-09-13

jdk-1.8-linux(2)

主要是存着备份,我把包分成了四份,大家也可以下载。

2018-09-13

jdk-1.7-linux(1)

主要是存着备份,我把包分成了四份,大家也可以下载。

2018-09-13

hadoop hbase 全jar包

里面包含了所有hbase用到的所有jar包,希望能够帮到正在学习hbase开发的小伙伴

2018-05-21

spring的相关库文件

这是我一直在用的关于spring的所有jar包,我不能保证所有的包都有,但小项目啥的是足够了。

2018-01-23

Mysql构造百万条测试数据

很多企业都有很多数据,存取都比较麻烦,所以需要对mysql进行优化,

2018-01-08

RabbitMQ在CentOS上安装

这个是我用的文档很好用,里面的东西对于初学者来说是完全够了,希望对爱好学习的朋友有帮助。

2018-01-08

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除