<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Fix on Zayn's Blog</title><link>https://blog.treesir.pub/tags/fix/</link><description>Recent content in Fix on Zayn's Blog</description><generator>Hugo -- gohugo.io</generator><language>zh-cn</language><managingEditor>yangzun@treesir.pub (Zayn)</managingEditor><webMaster>yangzun@treesir.pub (Zayn)</webMaster><copyright>2021-2026 Zayn</copyright><lastBuildDate>Thu, 22 Jul 2021 15:38:00 +0800</lastBuildDate><atom:link href="https://blog.treesir.pub/tags/fix/index.xml" rel="self" type="application/rss+xml"/><item><title>Nexus3 PyPI 私服 Blob Storage 异常修复记录</title><link>https://blog.treesir.pub/posts/nexus3-pypi-blob-storage-fix/</link><pubDate>Thu, 22 Jul 2021 15:38:00 +0800</pubDate><author>yangzun@treesir.pub (Zayn)</author><guid>https://blog.treesir.pub/posts/nexus3-pypi-blob-storage-fix/</guid><description>&lt;h2 class="relative group">问题描述
&lt;div id="问题描述" class="anchor">&lt;/div>
&lt;span
class="absolute top-0 w-6 transition-opacity opacity-0 ltr:-left-6 rtl:-right-6 not-prose group-hover:opacity-100">
&lt;a class="group-hover:text-primary-300 dark:group-hover:text-neutral-700 !no-underline" href="#%e9%97%ae%e9%a2%98%e6%8f%8f%e8%bf%b0" aria-label="锚点">#&lt;/a>
&lt;/span>
&lt;/h2>
&lt;p>在 DevOps 集成环境的测试环境中，发现多条 Pipeline 持续处于构建超时状态。初步排查以为是依赖版本兼容性问题导致 pip 无法找到合适版本，与开发团队联合排查后发现：开发环境正常，测试环境异常，且使用相同的代码和 Dockerfile 文件，排除了版本相关问题。具体错误表现如下：&lt;/p>
&lt;p>
&lt;figure>
&lt;img class="my-0 rounded-md" loading="lazy" alt="image-20210721170700491" src="https://cdn.treesir.pub/img/image-20210721170700491.png">
&lt;/figure>
&lt;/p>
&lt;p>&lt;strong>检查 Nexus3 私服日志&lt;/strong>&lt;/p>
&lt;div class="highlight">&lt;pre tabindex="0" class="chroma">&lt;code class="language-bash" data-lang="bash">&lt;span class="line">&lt;span class="cl">docker logs -f --tail &lt;span class="m">100&lt;/span> nexus3
&lt;/span>&lt;/span>&lt;/code>&lt;/pre>&lt;/div>&lt;p>
&lt;figure>
&lt;img class="my-0 rounded-md" loading="lazy" alt="image-20210721171037634" src="https://cdn.treesir.pub/img/image-20210721171037634.png">
&lt;/figure>
&lt;/p></description></item><item><title>记录一次，因误删容器导致的容器恢复过程</title><link>https://blog.treesir.pub/posts/delete-container-reset/</link><pubDate>Thu, 14 Jan 2021 20:09:58 +0800</pubDate><author>yangzun@treesir.pub (Zayn)</author><guid>https://blog.treesir.pub/posts/delete-container-reset/</guid><description>&lt;h2 class="relative group">环境说明
&lt;div id="环境说明" class="anchor">&lt;/div>
&lt;span
class="absolute top-0 w-6 transition-opacity opacity-0 ltr:-left-6 rtl:-right-6 not-prose group-hover:opacity-100">
&lt;a class="group-hover:text-primary-300 dark:group-hover:text-neutral-700 !no-underline" href="#%e7%8e%af%e5%a2%83%e8%af%b4%e6%98%8e" aria-label="锚点">#&lt;/a>
&lt;/span>
&lt;/h2>
&lt;blockquote>
&lt;p>因在日常维护过程中&lt;code>升级了docker的版本&lt;/code> ，碰到了一个 docker 的一个 &lt;a
href="https://treesir.pub/post/rancher-upgrade-docker"
target="_blank"
>&lt;code>bug&lt;/code>&lt;/a>, 导致 docker 服务无法正常启动。在恢复 docker 服务的过程中把 &lt;code>/var/lib/docker/containers&lt;/code> 下的所有文件给 &lt;code>清空&lt;/code> 了，清空后 docker 服务可以正常运行，但发现原来的服务中还存留着一个还在使用的 &lt;code>cmdb&lt;/code> 系统也被我跟着删除了，是之前的前辈部署的。好在自己有 &lt;code>做备份&lt;/code> 的习惯，现记录一下被删除容器的恢复过程。&lt;/p></description></item><item><title>Kubernetes 集群控制平面组件频繁重启问题排查记录</title><link>https://blog.treesir.pub/posts/flannel-exclusion-records/</link><pubDate>Fri, 18 Dec 2020 16:24:43 +0800</pubDate><author>yangzun@treesir.pub (Zayn)</author><guid>https://blog.treesir.pub/posts/flannel-exclusion-records/</guid><description>&lt;h2 class="relative group">环境说明
&lt;div id="环境说明" class="anchor">&lt;/div>
&lt;span
class="absolute top-0 w-6 transition-opacity opacity-0 ltr:-left-6 rtl:-right-6 not-prose group-hover:opacity-100">
&lt;a class="group-hover:text-primary-300 dark:group-hover:text-neutral-700 !no-underline" href="#%e7%8e%af%e5%a2%83%e8%af%b4%e6%98%8e" aria-label="锚点">#&lt;/a>
&lt;/span>
&lt;/h2>
&lt;ul>
&lt;li>&lt;strong>Kubernetes 版本&lt;/strong>：v1.19.6&lt;/li>
&lt;li>&lt;strong>操作系统&lt;/strong>：CentOS 7.9.2009&lt;/li>
&lt;/ul>
&lt;h2 class="relative group">问题现象
&lt;div id="问题现象" class="anchor">&lt;/div>
&lt;span
class="absolute top-0 w-6 transition-opacity opacity-0 ltr:-left-6 rtl:-right-6 not-prose group-hover:opacity-100">
&lt;a class="group-hover:text-primary-300 dark:group-hover:text-neutral-700 !no-underline" href="#%e9%97%ae%e9%a2%98%e7%8e%b0%e8%b1%a1" aria-label="锚点">#&lt;/a>
&lt;/span>
&lt;/h2>
&lt;p>最近在使用 Kubernetes 集群时，发现集群响应变慢。排查发现 Master 节点中 &lt;code>controller-manager&lt;/code> 及 &lt;code>scheduler&lt;/code> 组件频繁重启。&lt;/p></description></item></channel></rss>