Fix on Zayn's Blog

Nexus3 PyPI 私服 Blob Storage 异常修复记录

yangzun@treesir.pub (Zayn) — Thu, 22 Jul 2021 15:38:00 +0800

问题描述
#

在 DevOps 集成环境的测试环境中，发现多条 Pipeline 持续处于构建超时状态。初步排查以为是依赖版本兼容性问题导致 pip 无法找到合适版本，与开发团队联合排查后发现：开发环境正常，测试环境异常，且使用相同的代码和 Dockerfile 文件，排除了版本相关问题。具体错误表现如下：

检查 Nexus3 私服日志

docker logs -f --tail 100 nexus3

记录一次，因误删容器导致的容器恢复过程

yangzun@treesir.pub (Zayn) — Thu, 14 Jan 2021 20:09:58 +0800

环境说明
#

因在日常维护过程中升级了docker的版本 ，碰到了一个 docker 的一个 bug, 导致 docker 服务无法正常启动。在恢复 docker 服务的过程中把 /var/lib/docker/containers 下的所有文件给 清空 了，清空后 docker 服务可以正常运行，但发现原来的服务中还存留着一个还在使用的 cmdb 系统也被我跟着删除了，是之前的前辈部署的。好在自己有 做备份 的习惯，现记录一下被删除容器的恢复过程。

Kubernetes 集群控制平面组件频繁重启问题排查记录

yangzun@treesir.pub (Zayn) — Fri, 18 Dec 2020 16:24:43 +0800

环境说明
#

Kubernetes 版本：v1.19.6
操作系统：CentOS 7.9.2009

问题现象
#

最近在使用 Kubernetes 集群时，发现集群响应变慢。排查发现 Master 节点中 controller-manager 及 scheduler 组件频繁重启。

Fix on Zayn's Blog

Nexus3 PyPI 私服 Blob Storage 异常修复记录

问题描述 #

记录一次，因误删容器导致的容器恢复过程

环境说明 #

Kubernetes 集群控制平面组件频繁重启问题排查记录

环境说明 #

问题现象 #

问题描述
#

环境说明
#

环境说明
#

问题现象
#