那麽在先前实作中,我们业已将 WordPress 网站建筑在 AWS 环境中(可以详【Day 05】 实作 - 设置初始环境於 AWS 建置个人的 WordPress 网站),那在 AWS 上要怎麽进行服务器效能监控呢?
其实 AWS 业已建立良好的机制可以让使用者来查看目前服务器( EC2 )的情况,我们这两天会一一来介绍并且也会实作如何设定 Alarm 以让客户能及时收到告警并进行後续处理
大家可以先至 AWS console 搜寻 EC2 ,并选取先前的主机的 Status checks
系统状态检查主要针对『服务器所在的 AWS 环境中』是否有异常状况,像是:
网路连线中断
AWS 机房电力中断
实体主机的软件问题
实体主机上会影响网路连线的硬体问题
.
.
.
而关於云端提供所有服务的相关基础设施问题则是由 AWS 负责处理、介入修复的问题,我们使用者只要催促 AWS 赶快修好就好 XD
状态检查会每分钟执行一次,AWS EC2 会传送 ARP 请求封包至网路介面卡 (NIC),以便检查主机的运作状态、监控个别服务器的软件和网路组态,像是:
系统状态检查失败
网路或启动组态不正确
记忆体用尽
档案系统毁损
核心不相容
.
.
.
若发生这类型的异常问题,则需要客户/使用者自行进行修复,故我们应要设定告警机制以防止当发生 Instance status checks fail 的情况时,需要立即通知相关的 IT 人员,明天我们则会来实作设定告警机制的部分
我们可以透过 AWS CloudWatch 来监控主机资源状况,预设情况下,AWS EC2 会每隔 5 分钟将主机资料传送到 CloudWatch,也可以启用详细监控,这样会每隔 1 分钟就会将资料传送到 CloudWatch,而这些资料会保留 15 个月的时间供使用者存取
大家可以点选 AWS console 搜寻 EC2 、选取先前的主机的 Monitoring
可以看到 Console 上业已针对主机 CPU、硬碟的读取写入、网路流量等指标进行资料蒐集并於 console 端以图表呈现其波动(详细指标说明请详[1]),因当某些指标数值突然冲高,可能会导致主机无法承受负载进而服务中断,故我们可以进行设定若指标达到某个百分比/数值时,则触发告警并通知相关同仁进行处理或者设定自动扩展机制以因应突如其然的流量暴增
明天我们则会实作如何设定 AWS 服务器告警机制,明天见啦~
参考&相关来源:
[1] Instance metrics
https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/viewing_metrics_with_cloudwatch.html
>>: 【Day 27】NumPy (4):np.sqrt(), np.square()
API 设计 前面有提到这次实作的系统共有两大资源,分别是:使用者 (user) 与 待办事项 (t...
现在的企业会使用一些管理系统来管理人力等资源,而这些管理系统通常都会有所谓的 权限设计 (Permi...
Google Static Map API 是将网页上需要的地图画面,以静态地图图片的方式显示。 优...
前言 $emit 让我们可以发送出自订的事件,例如: 触发特定的事件(关闭 popup) 或是 子元...
本篇文章同步发表在 HKT 线上教室 部落格,线上影音教学课程已上架至 Udemy 和 Youtu...