Day 18. Zabbix 整合仪表板介绍

Hi 大家今天介绍 Dashboard 的功能,30 天到现在还没有大家介绍说到底是否有警报。

对於这个警报画面大家应该都再熟悉不过了,基本上只要登入就会进到这一页。对於预设的画面,还蛮适合当监控室的,目前是还在服务器管理研究小组管理使用,之後毕竟服务是提供给开发人员,所以会希望开发人员也能知道自己使用的主机状况,达到彼此交流。最後希望在行云者研发基地的萤幕上这麽画面,只要经过的人都可以看一下有甚麽问题。

首先就是有基本的传统时钟。


这框框就会代表 整个 Zabbix 运作的总状态~

  • Zabbix server is running : 补充说明 Web 介面与 Zabbix Server 是可以拆开的唷,所以如果不想用Web 介面可以不用安装,Zabbix 有出 API,所以如果要介接第三方WEB介面做整合也不是太困难唷,比较常听到的是 Grafana。

  • Number of templates 、 Number of hosts (enabled/disabled) : 可以看出我们有多少样板可以用,多少主机监控中。

  • Number of items (enabled/disabled/not supported) : 总共监控多少项目(分成 启动中/关闭的/不支援)。

  • Number of triggers (enabled/disabled [problem/ok]) : 触发器顾名思义就是超过限制的设定值会跳警报统计。

  • Number of users (online) : 几位使用者正在线上。

  • Required server performance, new values per second : 数值更新的频率。

  • Host availability (上) 统计主机状态 Available :表示已连上线数量,Not available :表示曾经连上线目前断线数量,Unknown :表示还没有连上线过。
  • Problems by severity (下) 会依据问题的严重程度分类统计。

这个统计图阿,我们目前运行 Zabbix 版本4.0没有的(很久没更新了 XD),这算是这次铁人赛新发现~

这里就会出现到底是那些有问题啦~

就会先是跳出警报的时间,是哪一台机器,发生什麽问题,持续多久,就会一览无疑。如果已经解决的就会自己消失。这些警报都是套上样板後就会帮我们设定好了,就样就省下很多功夫。

就可以依据这些项目去排查问题了。至於有没有问题就要自己判断喔。像是 Zabbix server Apache: Process is not running 问题,因为我可以正常使用阿,那为什麽会跳错,说不定是误判或是没设定好都是有可能的~

内容如有介绍不周的地方,再麻烦大家提点,感激不尽。
同步发表 行云部落格 再麻烦大家多多指教 谢谢
行云者研发基地官网 粉丝专页


<<:  [第十八天]从0开始的UnityAR手机游戏开发-介绍Animation

>>:  Day18:今天我们来谈一下如何使用ShellPhish工具进行社交工程演练

[Day 30] SQLite 下

delete delete(String table, String whereClause, St...

D26 - 「来互相伤害啊!」:站在 Phaser 的肩膀上

鳕鱼:「再来要设计对战游戏,可以切换场景,人物可以在场地随意移动,发射武器互相攻击,人物会与墙壁、敌...

Day 16. Hashicorp Vault: Upgrade

Hashicorp Vault: Upgrade 升级方式: Vault是binary的档案,所以更...

Day 10 Dart语言-混合及泛型

混合mixins 介绍:mixin是一种可以把自己的方法提供给别的类别使用,却不需要成为其他类别的父...

前端工程师也能开发全端网页:挑战 30 天用 React 加上 Firebase 打造社群网站|Day6 注册登入功能

连续 30 天不中断每天上传一支教学影片,教你如何用 React 加上 Firebase 打造社群...