Day 27. Zabbix 实际报警案例分享 - 执行绪异常飙高

计画性停电後, Zabbix 一直疯狂跳警报,因为我们有设置只要警报有被触发 Line 群组 就会跳通知,又加上 Zabbix 警报本身会寄信,一天内就跳了七、八个警告 ,这对於每天会收信和清讯息的人简直是悲剧,一开始大家都很紧张,毕竟警报跳得这麽频繁之前也没有发生过类似的情况,感觉主机已经命在旦夕,大家怕得要死轮流去看了主机的状态,但是可能是我们功力不到位的原因之类的,反正就找不到到底是哪边出了问题,过了几天後,就发现诶主机还活着好好的,平安喜乐阿,就这麽放着了。

在这样的情况下被轰炸了一个月,搞得大家都想移除的信件通知,终於有人找出来问题点了,我们有一个 docker container 在里面疯狂重启,我们停止了 container 後,就没有警报了。

内容如有介绍不周的地方,再麻烦大家提点,感激不尽。
同步发表 行云部落格 再麻烦大家多多指教 谢谢
行云者研发基地官网 粉丝专页


<<:  DAY26-EXCEL统计分析:相关分析介绍

>>:  Day30 - Intent传讯息

个人管理 - 时间管理

先谈个人管理是因为管理就是一个见微知着实践。如果自己接到的专案任务都没有办法做好基本的管理工作回报出...

LeetCode解题 Day01

565. Array Nesting https://leetcode.com/problems/a...

JavaScript学习日记 : Day8 - 作用域(Scope)

作用域即函数或变数的可见区域,白话点就是,函数或变数不在这个区域内,就无法获取到。 1. 函数作用域...

Day.1 起点 - 前言 ( Percona Server )

在这30天的文章中分享藉由在工作上学习资料库管理相关的一些心得笔记与一些经验分享和操作纪录,希望能...

Alpine Linux Porting (一点一?)

要作Alpine的新平台porting,其实在有了 aports/script/bootstrap....