- 博客(308)
- 资源 (32)
- 收藏
- 关注
原创 【DevOps】使用Filebeat收集华为云cce containerd日志
通过 Kubernetes 的 Container Runtime Interface (CRI),kubelet 可以直接与 containerd 进行通信,无需经过 Docker 的 shim 层,简化了调用链路,降低了潜在的故障点,从而提高系统的稳定性和安全性。总结来说,从 Docker 迁移到 containerd,特别是在 Kubernetes 集群环境下,可以得到更高的性能、更好的资源利用率、更强的稳定性以及更简洁的架构,这些优势对于大规模生产环境尤其重要。如上图,真正存放容器路径的位置是在。
2024-04-01 14:21:15 117
原创 【HPA】华为云CCE根据Prometheus Adapter 自定义custom和external业务指标,实现业务Pod自动扩缩容(更新:2024.4.1)
到目前为止,我们准备好了Exporter、Prometheus、Adapter,接下来是最关键的一步,也是核心步骤,我们把他们串一起从上面原理图分析,可以得到下面的图。
2024-04-01 09:34:01 180
原创 【问题记录】kubernetes hpa数据时有时无
监控数据的采集是Prometheus的核心功能,定期抓取的数据会被存储在本地TSDB(Time Series Database)中,供后续查询、可视化和告警使用。总结来说,这段配置决定了Prometheus服务器每5分钟(evaluation_interval 和 scrape_interval 都为 5m)执行一次规则评估和数据抓取,并在每次数据抓取时最多等待30秒(scrape_timeout 为 30s)获取目标的监控数据。这样配置的话,全局抓取的数据时间间隔都会变,抓紧自定义指标,可使用单独的。
2024-03-26 17:16:38 594
原创 【问题记录】Istio与Prometheus冲突问题,“GET /metrics HTTP/1.1“ 503 UF upstream_reset_before_response_started{rem
使用istio官网提供的安装方式,默认会安装loki、kiali、prometheus、grafana,如果自己再搭建一个prometheus,会出现冲突。此时,istio代理的服务没有出现以上错误请求,具体原因还在查找中。删除了添加这种pod的注释,改为手动添加。
2024-03-26 17:00:48 151
原创 【问题记录】自定义Prometheus exporter收集数据,Prometheus显示收集到数据,grafana未显示数据出来
3、自定义指标最小时间是ms级别,所有需配置下Prometheus的采集率为一秒一次(应该配置成毫秒的,目前Prometheus不支持)使用golang编写Prometheus exporter,获取指定API Url返回值中的data值,把它做为自定义指标。在grafana中获取不到Prometheus的Graph界面的值,即根据 PromQL 的查询结果。这个问题其实很简单,默认数据间隔是15s,我们只需要把时间间隔改成1s即可。
2024-03-19 15:03:20 261
原创 【问题记录】zookeeper集群一节点无法启动,报“Unable to load database on disk”
2、删除datalog目录version-2目录。1、删除data目录下的version-2目录。
2024-01-30 15:43:10 42
原创 Kubernetes安装Seata1.8.0(注册到Nacos,连接外置数据库)
Seata 是一款开源的分布式事务解决方案,致力于提供高性能和简单易用的分布式事务服务。Seata 将为用户提供了 AT、TCC、SAGA 和 XA 事务模式,为用户打造一站式的分布式解决方案。seata1.8.0官方介绍。
2024-01-29 16:51:05 428
原创 【日志】Loki简介
Grafana Loki 是一个开源的云原生日志聚合和分析系统,由 Grafana Labs 开发并维护。Loki 专注于为大规模的日志处理提供经济高效且易于管理的解决方案,尤其适用于微服务架构以及容器化和分布式环境。综上所述,Grafana Loki 旨在简化日志管理,并通过其创新的设计,为企业提供了在现代云环境中处理日志的一种高效且经济的方式。
2024-01-12 14:01:14 105
原创 【Istio】安装Istio1.20.1
set values.pilot.env.PILOT_ENABLE_ALPHA_GATEWAY_API=true: Gateway API 配置内部网格(东西)流量,即不仅是 Ingress(南北)流量。更多:https://istio.io/latest/zh/docs/tasks/traffic-management/request-routing/配置组合,它包含了适合测试的一系列功能集。如果您的平台提供了自定义配置组合,比如 Openshift,在下面命令中替换。
2024-01-05 15:47:02 479
原创 【日志】Loki+Alertmanager日志告警
设置Loki的日志告警,我们必须借助其他相关服务,Promtail打标签用于过滤日志,Alertmanager用于告警目前为止,Loki并没有打印日志周围几行日志的能力,我们只能打印第一行日志发送告警,大体思路是先截取自己想要的日志把他们打成不同的标签,Alertmanager告警模板定义标签的值发送出去。
2023-12-29 10:49:22 647
原创 【日志】Loki日志多行显示
修改完成后,重启Promtail服务,再去Grafana查看日志,已经变成多行显示。文章我们搭建了Alertmanager和Loki,接下来我们来实现日志并行显示。我们是需要修改Promtail服务的配置文件即可。
2023-12-29 10:07:49 855
原创 【日志】安装Prometheus/Loki+Alertmanager+Grafana并实现监控告警
添加监控规则内容是在Prometheus服务中添加的,使用helm部署的Prometheus添加监控规则很简单,正如上面提到的监控规则配置文件configmap,我们只需要修改该文件即可。这个正则表达式的目的是在一段文本中找到包含 "INFO"、"WARN" 或 "ERROR" 的部分,并将这些部分标记为名为 "level" 的捕获组。第二个规则比较好实现,比较创建一个nginx服务,名称:scpo-nginx,副本数2,然后把服务副本数调成1,看看Prometheus和Alertmanager的变化。
2023-12-29 09:37:36 406
原创 【问题记录】Rancher:Post “https://rancher-webhook.cattle-system.svc:443/v1/webhook/validation/namespaces?
第一个Rancher接管华为云CCE集群后,没有解绑后第二个Rancher接入华为云CCE集群遇到了问题,cattle-system命名空间删除不掉,用edit把命名空间spec清空无效,使用。把8001改成kubectl proxy 得到的接口,我这里是8001。删除annotations的finalizers字段。重新删除cattle-system命名空间。2、把命名空间导成json文件。1、开启proxy到本地。
2023-12-28 15:59:38 435
原创 【云原生】华为云踩坑日志(更新于2023.12.10)
CCE 默认拉取 SWR 镜像仓库走内网,但是 SWR 是没有内网地址的,这是他们在内部实现,用户看不到,所以速度快慢取决于华为云相关处理组件。6、CCE 产品有一些界面上做好的功能,但是实际还未对用户开放。9、华为云产品API文档如果按照文档操作的,报403,401等各种问题,不要再找原因了,是他们的API文档部分更新慢,直接提工单让他们提供下最新的API接口文档。2、CCE 涉及到的产品,有的需要查看产品怎么才能被 CCE 使用,两头都得顾,比如SFS产品,必须先创建终端节点,这个必须手动操作。
2023-12-18 16:05:18 863
原创 【日志】Prometheus/Loki+Alertmanager+Grafana监控告警
参考文章:匹配写法:https://blog.ossq.cn/2674.html。
2023-12-12 15:42:17 184
原创 【DevOps】Jenkins:配置jenkins 流水线/多分支流水线任务构建成功通知企业微信@相关人(二)
实现了企业微信通知,但仅仅是Jenkins构建后通知,如果在K8s侧配置了就绪检测和滚动更新,那构建完成并不能代表服务已经发布完成,本篇文章我们就来解决这个问题。以上,输入命名空间和deployment名称,查询该服务不可用的副本数,如果不等于0,将每3秒循环一次查询,并返回。在Jenkinsfile流水线中,新增一个stage,将要发布更新的服务变量。最后,这一步将一直检测服务是否更新完成,直到不可用副本数为0为止。,如果等于0,将终止循环,并返回。接收传参,即之后我们可以使用。和所在的命名空间变量。
2023-12-04 14:31:17 439
原创 【问题记录】Jenkins构建服务时,报org.yaml.snakeyaml.constructor.SafeConstructor: method ‘void <init>()‘ not found
这种问题一般出现在迁移Jenkins服务或者还原Jenkins服务后,这是因为Jenkins默认情况下会帮助我们把版本过低的plugin自动升级。查看在具体报错信息,与SnakeYAML相关,我们就可以去查下这个插件是否正常。比如目前安装的SnakeYAML版本是最高的,可更换下插件的版本试试。
2023-11-21 14:36:08 1160
原创 【日志】搭建Loki2.6并接入Grafana9.5
Loki是一个水平可扩展,高可用性,多租户的日志聚合系统,受到Prometheus的启发。它的设计非常经济高效且易于操作,因为它不会为日志内容编制索引,而是为每个日志流编制一组标签。官方介绍说到:Like Prometheus, but for logs.不对日志进行全文索引。通过存储压缩的非结构化日志和仅索引元数据,Loki操作更简单,运行更便宜。索引和组使用与Prometheus已使用的相同标签记录流,使您可以使用与Prometheus已使用的相同标签在指标和日志之间无缝切换。
2023-10-24 10:13:41 199
原创 修改Grafana自动刷新时间为1s
仪表盘设置了1s自动刷新,但是Grafana默认的刷新时间最低是5s,我们需要修改下Grafana的配置文件。重启服务后,再在仪表盘中设置1s自动刷新就可以了。
2023-10-11 17:11:25 1448
原创 【云原生】配置Kubernetes CronJob自动备份Clickhouse数据库(单机版)
上面yaml会每天0点40分运行 clickhouse-backup create命令,备份的数据默认存放在 容器的 /var/lib/clickhouse/backup/,映射到了pvc cronjob-clickhouse-backup中。测试、开发环境:每天0点40分执行全库备份操作,备份文件通过StorageClass SFS存储类存放云产品 sfs卷中。
2023-09-28 11:14:15 1709
原创 【云原生】配置Kubernetes CronJob自动备份MySQL数据库(单机版)
测试、开发环境:每天0点40分执行全库备份操作,备份文件通过StorageClass SFS存储类存放云产品AWS sfs卷中。
2023-09-28 11:09:54 1018
原创 【云原生】3分钟快速在Kubernetes1.25部署Prometheus2.42+Grafana9.5.1+Alertmanager0.25
Prometheus-operator帮助我们快速创建Prometheus+Grafana+Alertmanager等服务,而kube-prometheus更加完整的帮助我们搭建全套监控体系,这包括部署多个 Prometheus 和 Alertmanager 实例, 指标导出器,例如用于收集节点指标node_exporter,将prometheus链接到各种 指标终结点,以及用于通知群集中潜在问题的示例警报规则。
2023-08-18 19:26:26 1169 1
原创 安装android SDK,指定sdk版本
注意:如果使用Dockerfile构建镜像的话,镜像内部首次安装sdk包会让我们输入一次。省掉,然后使用docker commit命令重新打包镜像,以避免无法输入。确定,建议先使用docker run跑一下镜像预安装一个sdk包,把。把上一步下载的zip包解压到此目录。文件)移动到当前目录下新创建的。目录中,创建一个名为。导致安装sdk不成功。
2023-07-20 18:50:13 512
原创 【云原生】在DACS沙箱内配置Telepresence工具(社区版限制5人连接)
解决:需要高权限配置的kubeconfig文件刷下windows配置,再使用低权限配置文件1、在沙箱外更换config文件内容clusters:cluster:users:user:contexts:context:2、沙箱外重刷网络3、替换原config文件内容clusters:cluster:users:user:contexts:context:4、重启沙箱,再次连接K8s集群网络之后在沙箱外使用命令连接K8s集群网络即可,沙箱内就可以使用了。
2023-07-09 17:44:12 1012
原创 【云原生】在AWS平台EKS使用Helm安装ElasticSearch7.17.3+Filebeat7.17.3+Kibana7.17.3
核心服务:elasticsearch+filebeat+kibana所有服务版本:7.17.3。
2023-07-09 17:33:14 1061
原创 【云原生】AWS云平台,在EKS1.25使用Helm搭建Harbor2.6.2(EFS持久化卷,ALB负载均衡)
随着兼容 OCI 规范的 Helm Chart 在社区上被更广泛地接受,Helm Chart 能以 Artifact 的形式在 Harbor 中存储和管理,不再依赖 ChartMuseum,从 v2.6.0 开始弃用 Chartmuseum,并在 v2.8.0 中开始删除。早AWS云平台的EKS容器产品上,使用Helm方式安装Harbor服务,数据持久化在EFS产品,使用AWS ALB Load Balancer 做Ingress,通过绑定IP方式暴露EKS上的服务。4)安装指定版本的harbor。
2023-07-09 11:18:16 1130
原创 【云原生】在AWS平台EKS1.25,Helm安装Nexus3.20.1
chart的版本和nexus的版本有些差异,准备安装的版本是3.20.1,对应的是chart版本是1.23.1、1.23.0、1.22.0、1.21.4等,这里就安装chart最新的1.23.1版本。第一种:默认会创建一个nodeport类型的svc,可以通过节点ip:nodeport方式访问。第二种:使用kube-forward将服务映射本地访问。安装前检查下有没有开启持久化卷。添加helm chart源。指定在inf命名空间下安装。
2023-07-09 11:09:19 914
原创 【云原生】安装AWS NLB Load Balancer Controller1.8(4层负载)
AWS 的ALB不支持规则重写,所以需要使用nginx ingress绑定AWS的NLB来实现NLB的优势:所有命名空间可以共用一个NLB。
2023-07-08 22:36:34 1364
原创 【云原生】安装AWS ALB Load Balancer Controller2.5(7层负载)
安装AWS ALB Load Balancer Controller2.5
2023-07-08 22:35:33 2247
原创 【云原生】AWS EKS1.25配置StorageClass-EFS存储类
存储类 | Kubernetes卷插件支持AWS EBS、NFS等,我们需要改用EFS产品,在Github有人创建了EFS的插件。
2023-07-08 22:17:54 1305
表白网页,一定要看下面描述的文档,有制作好的容器镜像,可以直接使用
2023-03-10
表白网页,使用前一定要看下描述里的文档文档哈,感谢大佬支持,专栏19元
2023-03-10
表白网站,使用前请看下描述中的博客啊
2023-03-10
devops演示文件,相关博客:https://blog.csdn.net/zhanremo3062/article/detai
2022-12-04
sonarqube7.9中文插件包 sonar-l10n-zh-plugin-1.26.jar
2022-07-09
vfstp-web相关包
2022-02-24
基于golang开发的vsftp-web服务
2022-02-24
生成阿里云ecs主机监控报表go语言源码
2022-01-29
posman9.6.1中文包.zip
2021-12-30
vsftp2.0.tar
2021-05-24
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人