自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Man_In_The_Night的博客

记录学习中的各种问题以及自己的理解,供以后温故以及分享一下,错误之处,希望批评指正,以免误导更多人。如有侵权,请联系删除。谢谢!

  • 博客(228)
  • 资源 (1)
  • 收藏
  • 关注

原创 Ubuntu16 永久修改 DNS

环境: ubuntu16.04操作步骤:1、修改 /etc/resolv.confnameserver 114.114.114.114nameserver 114.114.114.114options timeout:1options attempts:32、安装 resolveconfapt install resolveconf3、修改配置文件 /etc/resolvconf/resolv.conf.d/head# Dynamic resolv.conf(5) file for

2021-09-10 20:02:45 988

原创 记一次 proxy 导致的端口访问失败

背景:infra 交付了一批服务器,部署好服务后,发现所有服务器端口 curl 不可环境: 服务器 IP 192.168.1.1, 内部网络问题详情:1、服务器部署了 node_exporter, 端口 9100. lsof 和 netstat -nlp 均显示 9100 端口启用,防火墙未开启访问 curl 192.168.1.1:9100/metrics 没有结果访问 curl 127.0.0.1:9100 /metrics 没有结果2、安装 apache2 apt install apa

2021-09-10 19:48:50 1904

原创 使用 node-exporter textfile 收集文件中的 metrics

背景 : 本来打算使用 process-exporter 来监控 airflow celery worker 进程的,但是当 airflow worker 并发数量达到 2000 时,process-exporter metrics 延时会达到 5min 以上,prometheus 拉取 metrics 会 timeout。打算使用 ps 命令写 worker 进程数到文件中,然后使用 node-exporter 来 export 文件中的 metrics。环境:ubuntu 16.04, node-ex

2021-09-10 19:36:39 2062

原创 Ubuntu20 安装 python2 的 pip

Ubuntu20 安装 pip2环境:ubuntu20, python2.7.181、配置 pip.conf(如果网络 ok,这一步省略)root@myserver:~# cat /etc/pip.conf # BEGIN ANSIBLE MANAGED BLOCK[global]# END ANSIBLE MANAGED BLOCKindex-url = https://pypi.tuna.tsinghua.edu.cn/simpletrusted-host = pypi.tuna.tsi

2021-09-10 19:20:45 1167

原创 Ubuntu20 普通用户使用 crontab

环境:Ubuntu20.04问题:ubuntu20 普通用户默认没有开启 crontab 权限,所以会报以下错误hadoop@myserver:~$ crontab -e/etc/cron.allow: Permission deniedYou (hadoop) are not allowed to use this program (crontab)See crontab(1) for more information解决方法:1、添加 allow 权限root@myserver:~

2021-09-10 19:12:47 2633

原创 win10 vscode 设置 Python 虚拟环境

环境: win10, vscode 1.15.1,vscode python 插件, python 3.6.81、创建虚拟环境 testpython -m venv test2、使用 ctrl + shift + p 打开搜索,输入 python interpreter,选择 python select interpreter

2021-07-13 00:21:57 404 1

原创 win10 更新后指纹不能使用

2021年7月12日更新windows后,指纹使用后报错“抱歉,出现问题,关闭windows hello,然后尝试再次运行安装程序”。解决方法:使用官方推荐方法 https://answers.microsoft.com/zh-hans/windows/forum/all/%E6%9B%B4%E6%96%B0win10%E5%90%8E%E6%8C%87%E7%BA%B9/7fc55349-7234-4fd0-a3c1-04fcf20e2aaa1、找到控制面板-管理工具-服务,并找到Windows Bi

2021-07-12 22:13:46 6891 2

原创 linux 查看用户使用的进程或线程数量

$ ps h -Led -o user | sort | uniq -c | sort -nr 2155 cloudera-scm 1949 root 1037 hdfs 786 hbase 541 hive 315 yarn 269 hadoop 233 oozie 229 mysql 147 mapred 140 hue 107 sentry 105 zookeeper 102 httpfs

2021-04-22 21:13:05 2543

原创 Megacli 常用命令

环境: ubuntu 16.04,megalic 8.07.14,服务器 raid 卡 "LSI Logic / Symbios Logic MegaRAID SAS-3 3108“1、查看 raid 卡命令lspci -knn | grep "RAID bus controller"2、常用 megacli 命令megacli -LdPdInfo -aALL # 查看所有逻辑盘、物理盘信息MegaCli -LDInfo -Lall -aALL # 查看所有逻辑盘信息megacli -LDIn

2021-04-16 20:57:56 1239

原创 Megacli 定位磁盘

背景: 磁盘 /dev/sdb 重做 raid0,需要先定位 sdb 对应的物理盘,然后使用 raid 工具重做 raid。环境:环境: ubuntu 16.04,megalic 8.07.14,服务器 raid 卡 “LSI Logic / Symbios Logic MegaRAID SAS-3 3108”1、查看 raid 卡命令lspci -knn | grep "RAID bus controller"2、查看 /dev/sdb 对应的逻辑盘# ll /dev/disk/by-path

2021-04-16 20:55:45 969

原创 os x 安装指定版本的 ansible

环境:mac os x 10.15.7默认 python2.7.16, 但是没有安装 pip2,只有 pip3。使用 pip3 安装的 ansibe 使用会报错(具体原因还不是很理解)解决方法:先安装 pip2,再用 pip2 安装 ansible1、安装 pip2$sudo easy_install pip2、安装 ansible$pip install -y ansible==2.7.53、测试$ansible localhost -m ping...

2021-01-18 20:21:18 458

原创 ceph 笔记整理

ceph 查看、修改 crushmap直接通过 ceph 命令1、创建对应的rootceph osd crush add-bucket ssd rootceph osd crush add-bucket sas root2、创建对应的hostceph osd crush add-bucket node-4-sata hostceph osd crush add-bucket node-5-sata hostceph osd crush add-bucket node-4-ssd hostc

2020-12-31 16:49:41 378

原创 ceph 查找 rbd image 存储位置

环境:centos7.6, ceph luminiousceph 同时提供对象存储、块存储、文件存储三种接口,但本质上都是对象存储,也就是说一个rbd image 实际上包含了多个对象(默认情况下是 iamge_size/4M)查看 pg 对应的 osdceph pg dumpceph pg map 3.5d查看 pool 中的 image[root@ansible002 ~]# rbd list k8skubernetes-dynamic-pvc-0f4455a2-f96a-11e9-9

2020-12-31 16:46:14 880

原创 openstack 删除一个 loadbalancer

环境:centos7.6, openstack rockybashboard 直接删除会报错,需要依次删除 healthmonitor、listener、pool、loadbalancer neutron lbaas-healthmonitor-list neutron lbaas-healthmonitor-delete neutron lbaas-listener-list neutron lbaas-listener-delete neutron lbaas-pool-list neu

2020-12-31 16:36:47 261

原创 ceph osd 磁盘损坏处理

(一) 从 ceph 删除该 osd1、登陆 ceph mon 节点,查看坏掉的 osd2、mon 上执行 out osd.xceph osd out osd.x3、从 crush map 中删除 osd.x,防止它再接受数据ceph osd crush remove osd.xceph auth del osd.xceph osd rm osd.x[root@bakmtr01 ~]# ceph -s cluster: id: 0e38e7c6-a704-41

2020-12-30 16:23:30 2249

原创 ceph rgw 开启 usage 日志

环境:centos7.6 、ceph luminious1、修改配置文件 ceph.conf,增加 rgw enable usage log =true[root@bakmtr01 ~]# cat /etc/ceph/ceph.conf [client.rgw.bakmtr01]host = bakmtr01keyring = /var/lib/ceph/radosgw/ceph-rgw.bakmtr01/keyringlog file = /var/log/ceph/ceph-rgw-bakm

2020-12-30 16:18:00 1431

原创 openstack设置实例的帐号密码

环境:openstack rocky,centos7.6 镜像“项目”–“实例”–“创建实例”–“配置”–“选择文件”文件内容如下:#!/bin/bash#change passwordpasswd root<<EOFhao@123hao@123EOF#allow ssh password login and no use dnssed -i 's/PasswordAuthentication no/PasswordAuthentication yes/g' /etc/ssh

2020-12-29 15:01:35 1944

原创 python 多进程上传下载 ceph 对象存储

centos7.6,python 2.7.5,ceph luminious1、多线程上传脚本# !/bin/python# -*- encoding:utf-8 -*-endpoint_url = "http://192.168.1.10:6780";access_key = "xxx"secret_key = "xxx"# bucket name in ossdefault_bucketname = "lalala"class S3Operate(object): def _

2020-12-29 14:54:11 715 4

原创 jenkins 使用 k8s 动态创建 jenkins slave pod

环境:centos7.6 、Docker version 19.03.5、Jenkins 2.249.3(jackson = 2.11.2、docker plugin = 1.2.1)、 kubernetes cli plugin 1.9.0、kubernetes plugin 1.27.7 主要思想: 使用 kubenetes cli plugin 配置一个动态的 pod jenkins jnlp slave,pod 中包含 mvn、docker、kubectl 等容器。创建多分支流水线,Jenkins

2020-12-28 11:47:57 2770

原创 jenkins cicd k8s 多分支流水线构建

环境:centos7.6 、Docker version 19.03.5、Jenkins 2.249.3(jackson = 2.11.2、docker plugin = 1.2.1)主要思想: 使用 docker plugin 配置一个动态的docker jenkins jnlp slave,该镜像中包含 mvn、git、docker、kubectl 等命令。创建多分支流水线,Jenkinsfile 使用前面配置好的 jenkins slave。在该 jenkins slave 中执行 maven 构建

2020-12-26 16:11:06 622

原创 jenkins 制作包含 maven 等命令的 jnlp slave镜像

环境: centos7, docker 19.03.5, vm 192.168.116.6Dockerfile 内容如下FROM centos:7.6.1810ENV TIMEZONE=Asia/Shanghai \ LANG=zh_CN.UTF-8COPY CentOS-Base.repo /etc/yum.repos.d/CentOS-Base.repoCOPY docker-ce.repo /etc/yum.repos.d/docker-ce.repoRUN mkdir -p

2020-12-26 14:24:13 964

原创 jenkins 使用 docker plugin 连接 k8s

环境:centos7.6 、Docker version 19.03.5、Jenkins 2.249.3(jackson = 2.11.2、docker plugin = 1.2.1)1、安装 kubernetes cli 插件,否则会报错java.lang.NoSuchMethodError: No such DSL method 'withKubeConfig' found among steps [approveReceivedEvent,...2、配置 docker“系统管理”–“节点管理

2020-12-25 10:44:05 634

原创 jenkins docker 添加 volume 报错

环境:centos7.6 、Docker version 19.03.5、Jenkins 2.249.3本文原本使用的是 jenkins 2.263.1 ,但是 docker jenkins slave 在使用 volume 时一直报错 node offline查看 jenkins 日志:Cannot construct instance of com.github.dockerjava.api.model.Volume (although at least one Creator exists):

2020-12-24 20:20:20 353 1

原创 自定义 jenkins jnlp-slave 镜像

环境:centos7.6 、Docker version 19.03.5、Jenkins 2.263.1、jenkins url 172.28.31.214:8080完整 github 项目 1、从 https://repo.jenkins-ci.org/public/org/jenkins-ci/main/remoting 下载对应版本的 remoting.jar,重命名为 slave.jar, 此处使用 https://repo.jenkins-ci.org/public/org/jenkins-c

2020-12-23 14:20:49 2158

原创 jenkins添加 docker 静态节点

官方的镜像 jenkins/jnlp-slave 镜像使用方法:参考文章不过官方镜像 jenkins/jnlp-slave 只适合添加 docker 静态节点,不适合 docker 动态节点,否则会报错。Still waiting to schedule task All nodes of label ‘jenkins-slave’ are offline 、Cannot construct instance of com.github.dockerjava.api.model.Volume (al

2020-12-23 13:58:09 1321

原创 jenkins 使用 docker 作为动态代理节点

环境: centos7,jenkins 使用 docker 构建,参考. docker 19.03.5, vm 192.168.116.6jenkins 需要安装 docker 插件1、配置 docker hostsvm 192.168.116.6 设置 docker hosts[root@k8s-noed02 ~]# cat /etc/docker/daemon.json { "bip": "192.167.1.1/24", "hosts": [ "unix:///var/ru

2020-12-23 10:12:45 1449 3

原创 使用 git 上传项目到 github/gitlab 仓库

环境:git version 1.8.3.1,centos 7.61、在 gitlab 上新建项目 xxx2、push 项目到远程仓库,以 gitlab 为例。github 的话需要将 git@gitlaburl:ccount/xxx.git 替换为 https://github.com/ccount/xxx.git设置全局参数git config --global user.name "youraccount"git config --global user.email "youremail"

2020-12-22 14:07:18 164

原创 centos7 安装指定版本的 mariadb

环境:centos7.61、配置mariadb源[root@bdcplmslave03 ~]# cat /etc/yum.repos.d/mariadb.repo[mariadb]name = MariaDBbaseurl = https://mirrors.ustc.edu.cn/mariadb/yum/5.5/centos7-amd64/gpgkey= https://mirrors.ustc.edu.cn/mariadb/yum/RPM-GPG-KEY-MariaDBgpgcheck

2020-12-17 11:46:24 960

原创 jenkins 添加 vm 节点

环境: centos7,vm ip 192.168.116.6,docker-ce 18.09.61、部署 jenkinsmkdir jenkins_homedocker run -d -v jenkins_home:/var/jenkins_home -p 8080:8080 -p 50000:50000 jenkins/jenkins:lts如果出现日志报错:touch: cannot touch ‘/var/jenkins_home/copy_reference_file.log’:

2020-12-17 11:31:04 333

原创 openstack 删除计算节点

停止计算节点服务,此时该节点上的 vm 还能使用[root@k8s01 ~]# nova service-list | grep cmp38| aeebc762-6bf8-49be-8809-e779658f0411 | nova-compute | cmp38 | nova | enabled | up | 2020-09-18T11:26:24.000000 | - | False |[root@k8s01 ~]# nova

2020-12-15 14:17:01 1179

原创 openstack router 在网络节点间迁移

gtw03 节点挂掉,导致该 L3 agent 上的 router router3 失联,导致连接该 router 的 vm 失联目的:将 router3 迁移到 gtw021、查看 router[root@k8s01 ~]# neutron router-list2、查看 router 对应的 L3 agent host[root@k8s01 ~]# neutron l3-agent-list-hosting-router router3neutron CLI is deprecated a

2020-12-15 14:16:13 498

原创 openstack 创建 ha router

创建新 router,设置为 ha,设置外部网关openstack router create --ha router2openstack router set router2 --external-gateway network21如果是修改已经在使用的 router,需要先关闭 router(这时该 router 下面的 vm 会断开与外部的联系),再修改[root@k8s01 ~]# openstack router set myrouter --disable[root@k8s01

2020-12-15 14:15:18 300

原创 DevOps 小组运维管理手册

参考《unix/linux 系统管理技术手册》组织需求维护一份开放任务的列表给自己的任务排列出优先级,并分配资源向用户和企业沟通任务状态监视计算环境,包括安全监视跟踪新出现的技术拓展 IT 人员的技能帮助遵守规章制度编写文档,记录可重复性的过程,可复用的 ansible 脚本最好及时将自己的文档更新到 gitlab,维护好 devopshandbook运维手册评测针对协商目标的进展情况,并报告状态指定容灾规划,并且做好准备要有足够的灵活性,在让用户高兴的同时也能足够遵守纪律,进而

2020-11-27 16:52:33 717

原创 kubeflow 删除用户对应的 namespace

环境: kubeflow 1.1.0, 操作系统 centos7.6kubeflow 使用 dex 提供的认证,可以配置 ldap,默认每个用户登录后,都会创建一个 namespace。有时候管理,需要删除某个用户。从 dex 或者 ldap 删除用户数据,并不会删除对应的 namespace,即使删除了 namespace,kubernetes 也会重新创建该 namespace。从 dex 或者 ldap 中删除用户后,可以执行下面命令删除 namespacekubectl get profil

2020-11-27 09:09:28 666

原创 nginx 限制 ip 访问

环境 centos7.6、 nginx 1.16.1背景:nginx 服务器已经配置好了公网 ip 和 域名证书(公网 ip 对我来说是透明的,没有管理权限,所以只好在 nginx 服务器上做 ip 限制)未修改之前,登录日志的 remote_addr 总是为 192.12.182.3,猜测这个为 公网 ip 对应的内网 ip。现在操作只允许公网 ip 120.231.12.24 和 192.12.182.3 访问。安装 nginx 请看这里[root@ansible002 ~]# cat /etc

2020-11-24 16:59:14 602

原创 centos7 安装 nodejs

环境: centos7.6、 node-v14.15.1centos7 yum 源中的 nodejs 版本6.17.1 太旧,所以需要自己安装1、下载 nodejs 二进制安装包,nodejs 官网太卡,所以从淘宝镜像下载2、解压文件到 /usr/local/lib/nodejs# mkdir -p /usr/local/lib/nodejs# tar -zxvf node-v14.15.1-linux-64.tar.gz -C /usr/local/lib/nodejs 3、设置环境变量/

2020-11-20 11:11:11 278

原创 docker error while loading shared libraries

环境: centos7.6 、docker 19.03在使用 docker build 后,执行 docker run ,容器起不来,报错 error while loading shared libraries: libprotobuf.so.9,镜像中已经有 libprotobuf.so.9,怀疑是环境变量问题导致。解决方法直接跳到第 8 步1、docker build# docker build -t data:18 .Dockerfile 大致如下,192.168.7.17/energ

2020-11-20 08:49:57 3873 1

原创 nginx 自定义 404、50x 错误页面

环境 centos7.6、 nginx 1.16.11、安装 nginx,需要配置 epel 源(略)yum install -y nginx2、启动 nginxsystemctl start nginxsystemctl enable nginx3、配置 nginx 反向代理 http://10.2.1.16。开通 nginx 服务器访问 10.2.1.16 端口权限(略)这里配置 worker_processes 4,一般根 cpu 核数一致worker_connections 1

2020-11-05 16:42:48 1589

原创 kubernetes部署 rook ceph

环境: centos7.6, kubernetes 1.15.3, rook 1.3.4部署 rook ceph1、部署 rook ceph官网下载 rook、解压后, cd rook-1.3.4/cluster/examples/kubernetes/ceph部署 crdkb apply -f common.yaml部署 operatorkb apply -f operator.yaml修改 cluster.yaml,主要修改 useAllNodes: false,useAllDevi

2020-11-04 18:56:27 692

原创 istio 部署

环境:kubernetes v1.11.5,istio 1.3.2,centos7安装部署1、 github 下载 istio1.3.2 版本,解压到 istio-1.3.22、创建 namespace istio-system[root@k8s01 istio-1.3.2]# kb create ns istio-system3、创建 crd[root@k8s01 istio-1.3.2]# helm template install/kubernetes/helm/istio-init/

2020-10-29 13:37:15 560

chromedriver

What this is really doing is just grabbing a particular "blessed" (by this module) version of ChromeDriver. As new versions are released and vetted, this module will be updated accordingly. The package has been set up to fetch and run ChromeDriver for MacOS (darwin), Linux based platforms (as identified by nodejs), and Windows. If you spot any platform weirdnesses, let us know or send a patch.

2017-09-07

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除