自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(20)
  • 资源 (1)
  • 收藏
  • 关注

原创 关于如何运用《分布式系统稳定性建设指南》建设稳定性的一般方法

SRE建设、分布式稳定性建设指南

2023-01-07 18:09:19 235

原创 FinOps与成本优化资料整理

2020年之前[1] CSDN《数据中心效率普遍低下 CPU利用率仅为6%》.CSDN.2012-11-24:https://blog.csdn.net/libin_1/article/details/8220341总结:1.麦肯锡2008年的这份报告得出结论,数据中心服务器的利用率仅为6%[2] 高效运维《数据中心日均 CPU 利用率 45% 的运行之道–阿里巴巴规模化混部技术演进》.高效运维.2018-10-11:https://blog.csdn.net/weixin_34351321/arti

2022-05-12 15:24:12 1283

原创 一个运维眼中对API网关的认识

API网关的知识 它是什么 API Application Programming Interface;\n应用程序接口,理解为一个功能,方法。 网关 是转发其他服务器通信数据的服务器,\n接收从客户端发送来的请求时,它就\n像自己拥有资源的源服务器一样对请\n求进行处理。 API网关定义 网关的角色是作为一个 API 架构,\n用来保护、增强和控制对于 API 服务的访问 简介 API 网关是一个处于应用程序或服务(提供 \nREST API 接口服务)之前的系.

2021-04-11 11:59:00 443 4

原创 《SRE实战手册》总结 (基础篇 06-10)

知识框架图,包含了课程的核心知识,和自己的实践感受。它是为了让我们更好的传播知识,更便捷的在组织内应用,如果要了解更详细的内容,建议还是看赵老师的课程。下面展示一些 内联代码片。SRE实战手册 总结 (实践篇 06-10) 《06 | 故障发现:如何建设On-Call机制?》 故障处理的关键环节 MTTR流程图 MTTR各环节所占时长(IBM) 分布式系统的实际情况,时长占比 处理故障的目的 提升每个MTTR环节的效率,缩短整个

2020-10-31 11:18:18 2549 4

原创 《SRE实战手册》总结 (基础篇 01-05)

知识框架图,是为了让我们更好的传播知识,更便捷的在组织内应用,如果要了解更详细的内容,建议还是看赵老师的课程。

2020-10-26 19:59:42 2861

原创 I/O性能知识总结(一)

近期在看I/O优化方面的内容,涉及内容很多,先总结一部分逐步实践,然后再去总结余下部分;下图是对I/O相关知识的总结;用于当I/O出现异常时,定位到原因;水平有限,欢迎你能提供更多信息;...

2020-10-03 22:38:00 206

原创 运维的工匠精神

说明工匠精神,几年前就听到过这个词汇,那时我以为是在说手艺高超的手工艺人。从来没想到它会和运维产生联系。第一次看到工匠精神和运维产生联系是在《技术运营》这本书中看到的,但也仅是撩撩略过。在其后的运维工作中,我的所思所想驱动着我在工作中不断的实践,这种不断实践带来的感受更进一步的促进了实践。这种驱动我不断实践的精神驱动力,我总结为运维的工匠精神。背景在运维的日常工作中,总是会掺杂着很多历史技术债务带来的问题,又或是随着业务的发展,配套的工具,产品未能及时迭代,导致使用过程中频繁被阻断,怨声连连。下列是经

2020-05-17 16:27:42 1244

原创 如何发现新的项目

背景《SRE生存指南》提供了一些发现新项目的方法,其中提到的一些方法我个人也曾实践过,分享我的实践过程。另外在这个之前我自己也有总结过一些,作为一名SRE该如何发现新项目去实施,算是作为对本书的扩展。欢迎补充。首先解释下项目:在PMP体系中,项目被解释具有一次性,独特性的特性,根据产出类型可以是成果/服务或产品。方法《SRE生存指南》提供了一些找到新项目灵感的来源,总结如下:修复一些让...

2020-04-12 19:03:21 524

原创 关于SRE问题的一些思考

背景最近在看赵成老师的SRE实战手册课程,开篇中有一张关于SRE的问题清单,个人觉得可以引发强烈的思考,特意取出放在这里,有些我提供了自己的看法,未答复的问题,欢迎读者在评论中解答。问题清单问题与答复1.SRE到底是什么?到底能帮我们解决什么问题?SRE(Site Reliability Engineer)网站可靠性工程师,为企业站点解决稳定性的问题,非稳定性表现例如:站点响应速度慢,...

2020-03-31 22:44:44 1838 2

原创 面对每天过万的告警量,该如何进行优化?

面对这样的问题,也许很多运维会从监控角度入手,做告警聚合,收敛等。但今天我们从监控系统运营的角度入手,逐步优化告警。业务背景每天告警数量过万,包含故障和恢复通知SRE想要优化告警,却不知道从哪里下手是好是该优化系统?还是应用?还是监控项?阈值等?费劲一番周折,优化取得成果,成果该如何展示,汇报?陷阱在这样的业务背景下,如果遇到告警则处理告警,不去思考解决这些问题,往往就会掉入陷阱...

2020-03-21 00:07:51 1631

原创 mysql导出到txt,再从txt导入

背景最近在做运维有关的数据分析,需要从一个A表中读取数据,但A表缺少很多关键字段,需要新增字段并补充内容后才能进行下一步分析,但是我对A表无管理权限。于是我的思路是:从A表读取一部分数据到txt,在另一个数据库实例中创建一个B表(B表字段在A表基础上增加了6个),将得到的txt导入到B表;就这样一个简单的需求,中途遇到很多坎儿,才猛然发现对数据库的维护早已久疏阵仗了。过程1.从a表导出到tx...

2020-03-06 00:04:39 501

原创 PMP体系 - - - - - - 项目整合管理(十大知识领域01)

2020-01-22 11:55:07 249

原创 如何提高DevOps交付效率

背景 在企业实施DevOps过程中,交付多种资源时,有时需要走多个流程(工单),非常低效。我们需要一种方法论来找到现有流程中存在的低效率,并且度量它,解决它,提升交付速度。用于识别低效流程的方法论叫做价值流图。价值流图 价值流图是一种精益管理办法,针对如何将产品或服务交付给客户全过程的一系列事件,分析其当前状态并设计其未来状态。...

2020-01-03 21:43:09 587

原创 运维体系 ------ 技术运营

技术运营体系前言 运维的思考? 运维如何成为公司核心竞争力? 运维的新价值 关注用户价值,思考运维能够为用户做什么? 协助业务发展,改进产品或服务概述 诞生背景 技术运营诞生于腾讯大规模业务 技术支持与产品运营 过程中逐步演进而产生的 是什么 技术运营以企业产品或业务投入产出比为核心关注点,并围绕此关注点开展一系列\n的解决方案。技术运营的目的是为了优化企业资...

2020-01-03 21:26:47 2664 2

原创 评估DevOps产品方案的方法论

背景 在DevOps落地过程中,会以一个又一个的运维工具(运维产品)进行落地;每一个运维产品在立项之前都会经过组织评审,评审的目的在于确定相关利益者在正确的时间做正确的事。对运维产品的评审可以使用商业模式画布模型进行全方位的评估。可以帮助组织做出明确的决策。商业模式画布 商业模式画布内容客户细分:组织所服务的客户群体\n识别服务对象,才能有针对性解决需求价值主张:解决不同客户群体各种问...

2020-01-03 21:21:50 341

原创 技术运营体系

`112223334`

2019-12-29 20:56:23 3883 2

原创 关于httpDNS的理解

背景昨天看到httpDNS这个词,出于好奇今天搜索了下,发现好多文章存在缺陷,没能说明httpDNS到底是个什么东西,所以特意写下这篇文章。参考https://blog.csdn.net/ai2000ai/article/details/83009174概念解释local DNS:表示的我们本地网卡配置的DNS,一般为地区性DNS,例如北京市DNS,天津市DNS;也表示DNS运营商,如p...

2019-11-09 11:51:42 1304

原创 愿岁月不负天地,此生辽阔高远

愿岁月不负天地,此生辽阔高远,出自《自由在高处》,当初在这本书中读到这句话时,感觉非常美。并让我联想到自己的工作来理解这句话:愿岁月不负天地,我将天地理解为我们的工作职责,工作内容或生活点滴,做事等;岁月便是时间。在过往的任何一段时间内,我们都应当全力以赴的做好自己的事,每一刻都认真的活着,珍惜时间;只有如此, 在将来的某一段时间内,我们才会感激那个过往的自己,曾经是多么认真的工作过;因为当初全...

2019-10-14 23:11:52 2786

原创 关于开展运维工作的方法总结

1.经验借鉴:包括但不限于其他公司推出的运维理念,最佳实践,同行公众号,其他部门,书籍;2.行业标准:参考行业标准进行运维建设,例如DevOps能力成熟度模型,AIOPS白皮书,ITILv4,ISO 20000 这些标准,都可以为运维建设提供指导意见;3.跨行业学习:参考类似行业的标准,工作模式,结合实际情况,将其它行业标准,理念,改良实践;4.深耕工作细节:深度思考,在细微处,模糊处,有抱...

2019-10-10 21:53:00 917

原创 go安装sqlit3失败,缺少gcc

错误:exec: “gcc”: executable file not found in %PATH%背景:go安装sqlit3失败,缺少gccgo get github.com/mattn/go-sqlite3exec: "gcc": executable file not found in %PATH%解决参考:https://www.cnblogs.com/zsy/p/5958...

2019-08-25 16:28:20 2339

x86_64-8.1.0-release-posix-seh-rt_v6-rev0-.zip

x86_64-8.1.0-release-posix-seh-rt_v6-rev0.7z 刚下载的,热乎乎的呢! 解决exec: "gcc": executable file not found in %PATH% 问题; 参考:https://www.cnblogs.com/zsy/p/5958170.html

2019-08-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除