Day24 Uptime And Heartbeat

今日我们要来学习的重点是Elastic Uptime,Uptime主要是针对你的应用和服务进行监控,在问题影响到使用者前,先行发现并解决问题。

Uptime

Uptime 简单的说就是判断系统的是否还活着。现在的网路服务架构,会随着时间的增加,而规模也会变得越来越复杂,因此 Elastic 推出了Elastic Uptime来对这些服务进行追踪和监控,。

Elastic Uptime是使用 Heartbeat 来进行服务运行的监控,将服务运行的时间监控、日志、指标与追踪数据相结合,来实现各种监控的视觉化图表。透过Heartbeat可以主动进行服务监控,让我们能早点发现问题,并加快故障排除和问题原因分析,进而降低对客户产生负面影响的风险。

在kibana介面中的提供可查看数据的仪表板,可以随着时间去检查服务器的状态,并深入查看任何时间点数据资讯,而且还有支援警报器功能。

https://ithelp.ithome.com.tw/upload/images/20211001/20129762aLY6GRXkTP.png
图片来源

Heartbeat 介绍

Heartbeat是一个轻量级的数据收集器,用来帮我们进行uptime的健康监控,能够透过 HTTP、TCP和 ICMP等方式监控网络端点的状态,并将收集到的状态和讯息回传到Elasticsearch。

ICMP监控主机
ICMP通讯协定就是所谓的Ping,以此来判断目标主机是否会正常回应。

HTTP监控网页
测试Http呼叫web,并藉由Response来判断Web是不是正常运作。

Socket监控网路服务
测试TCP或UDP是否有正常在接听,以此判断服务是否正常运作。

小结

一个可靠的监控功能,对维运人员可以说是一件友好的事情,否则你可能会为了系统是否能正常而进行监控,但这时又听到如果监控也挂了要怎麽辨,这就是一个无解的议题,而且为了监控而监控这不是一个好的解决方式,所以我们就需要一个可信任且可靠的监控系统,来解决大部份监控的问题。

Reference


<<:  [区块链&DAPP介绍 Day24] Dapp 实战 部署第一个 Dapp

>>:  Day 18 服务设计中的个资隐私保护旅程

[Day17] Sorting Band Names without articles

[Day17] Sorting Band Names without articles 文字顺序排列...

[机派X] Day 11 - 让我们拆了这台无人机

引言 今天是机派X系列文章的第十一天。 昨天很寒酸的简介无人机,今天会从单一零件的角度一一将无人机的...

[2021铁人赛 Day25] Web Exploitation Web渗透题目 01

引言 今天我们来解 Web 渗透 ( 渗透测试 ) 的题目, 在这之前,你需要先初步了解 HTTP...

JavaScript Day 21. 陈述式 & 表达式

听说 JavaScript 的这两大类型「陈述式」与「表达式」也是很基本的观念,瞬间我感觉自己从来没...

Day 07 - 导流专家Route 53

来到了第七天,今天让我们来一起看看Route 53吧 Route 53帮那些事情? 有了Route ...