基础建设: 系统监控与告警

系统架构

系统监控是维护资源可靠性、可用性与效能的重要环节。

  • 指标计算
    • 即时计算:即时的本地服务指标更新
    • 日志统计:整体资源的指标计算,例如:丛集服务的QPS指标。
      • 离线计算:使用Hive、Spark
      • 串流计算:使用Flink、Storm
  • 监控系统
    • 主动获取:利用Prometheus系统及代理程序主动收集所需监控资料。
    • 被动获取:收集系统日志。
  • 告警系统
    依据触发模式及设置的规则进行即时的告警

计算种类

  • 指标纪录
  • 指标管理
    • 瞬时(Gauges):系统瞬时尖峰负载
    • 计数(Counter)
    • 速率(Meter)
    • 直方(Histograms):资料分布
    • 性能(Timers):QPS、反应时间
  • 指标介面
    • JSON
    • Prometheus
    • Others

监控系统

  • Prometheus:指标资料收集、储存、查询、告警。
  • Service Discovery:提供服务定址功能。
  • Pushgateway:资料主动推送(Pull)介面。
  • AlertManager:告警规则及通知规则操作界面。
  • Grafana:监控仪表板及操作界面。

<<:  Day-2 演算法介绍

>>:  网路设备:路由器

Day30 - 结语、推荐

结语 感谢铁人赛的契机,让我又完成一门课了,虽然是一门基础的课程,但是过程中依然放了不少心力,看那几...

React-router相关

当使用react-router-dom时 由於在v6版本後做了一些改变 本来在import {Has...

Day 51 (Node.js)

1.res.send()和 res.end()的差别 (1)res.write + res.end ...

Day-20 南蛮黑船的再逆袭、引领进入网路世代的 XBOX 360

在上个世代的大战中、虽然 XBOX 的表现基本不算太差、最终来到了 2,400 万部得到第二名、稍胜...

[Day27] JSON

JSON (JavaScript Object Notation) 是一种资料交换格式,内容为属性与...