Day15 Open-Match 监控安装

Open-Match 的基础建构采用了 OpenCensus 所提供的 library,因此可暴露 metrics 提供我们即时监控的需求 ,目前可使用的有以下常见的四种工具:

Install

如果你跟我一样想参照官网指南安装的话,你可能会遭遇一些问题/images/emoticon/emoticon06.gif

YAML 过於老旧

首先是官方提供的 install.yaml 过於老旧,里面部分内容应调整成:

  • Deployment
    原本为

    apiVersion: extensions/v1beta1
    kind: Deployment
    

    调整为

    apiVersion: apps/v1
    kind: Deployment
    
  • PodSecurityPolicy

    原本为

    apiVersion: extensions/v1beta1
    kind: PodSecurityPolicy
    

    调整为

    apiVersion: policy/v1beta1
    kind: PodSecurityPolicy
    

本机资源不足

如果你给予的资源低於笔者的话,你可能无法把整套服务启动,你的 pods 可能会卡在 pending 状态,你需要尽可能给予环境足够的资源,不然可以烧点钱上云/images/emoticon/emoticon07.gif

https://i.imgur.com/CSDW6i0.png

也可以调整部分需要资源,降低整体资源所需要的总额

resources:
    limits:
      cpu: 40m
      memory: 40Mi
    requests:
      cpu: 40m
      memory: 40Mi

It just works

这是笔者调整後有成功运行的 yaml,分别拆成:

执行成功应包含以下内容

NAME                                       TYPE        CLUSTER-IP      EXTERNAL-IP   PORT(S)               AGE
open-match-backend                         ClusterIP   None            <none>        50505/TCP,51505/TCP   43m
open-match-evaluator                       ClusterIP   None            <none>        50508/TCP,51508/TCP   43m
open-match-frontend                        ClusterIP   None            <none>        50504/TCP,51504/TCP   43m
open-match-grafana                         ClusterIP   10.107.156.36   <none>        3000/TCP              43m
open-match-prometheus-alertmanager         ClusterIP   10.97.149.230   <none>        80/TCP                43m
open-match-prometheus-kube-state-metrics   ClusterIP   None            <none>        80/TCP                43m
open-match-prometheus-node-exporter        ClusterIP   None            <none>        9100/TCP              43m
open-match-prometheus-pushgateway          ClusterIP   10.107.39.7     <none>        9091/TCP              43m
open-match-prometheus-server               ClusterIP   10.107.123.16   <none>        80/TCP                43m
open-match-query                           ClusterIP   None            <none>        50503/TCP,51503/TCP   43m
open-match-redis                           ClusterIP   10.100.184.22   <none>        6379/TCP,26379/TCP    43m
open-match-redis-headless                  ClusterIP   None            <none>        6379/TCP,26379/TCP    43m
open-match-redis-metrics                   ClusterIP   10.110.19.23    <none>        9121/TCP              43m
open-match-swaggerui                       ClusterIP   10.109.17.24    <none>        51500/TCP             43m
open-match-synchronizer                    ClusterIP   10.96.78.13     <none>        50506/TCP,51506/TCP   43m

Prometheus

Prometheus 应该要可以接收到,各服务的 metrics

https://i.imgur.com/EGMTdMz.png

Grafana

Grafana 应该要包含,以各服务 metrics 绘成的图表

Match Making
https://i.imgur.com/yCwTH0C.png
gRPC
https://i.imgur.com/neHpnge.png
Go Processes
https://i.imgur.com/oHQ5n0C.png

附注

Jaeger 由於所需要的资源过於庞大,本次不进行安装,jaeger 需要相依在 cassandra 上,光是启用 cassandra 就会吃掉非常多的资源,这对笔者的小笔电来说太奢侈了。而 Stackdriver 的部分你只要在 GCP 上部署就可以直接使用,应该分常简便,这边我也不想再刷卡烧钱了,只能请大家再多试看看罗~


<<:  D15 - 转移资料到TiDB工具介绍(二)

>>:  Day 23 Azure machine learning: training experiment and register model- 以 LSTM 模型为例

尝试的结果

我在网路上查资料时,看到有人写了关於不覆盖有资料的方法,不过档案是txt档的写入,我不知道如果换成x...

人脸辨识的流程--特徵撷取

人脸辨识系统有三个步骤,人脸侦测、特徵撷取、人脸识别。 特徵撷取(Feature extractio...

Day 19 (Xd)

1.制作UI按纽 (影片Xd03 档案Xd02) https://neumorphism.io/#2...

Python 演算法 Day 15 - Imbalanced Data

Chap.II Machine Learning 机器学习 https://yourfreetemp...

自动化测试,让你上班拥有一杯咖啡的时间 | Day 18 - 如何提交表单

此系列文章会同步发文到个人部落格,有兴趣的读者可以前往观看喔。 今天要跟大家分享如何测试提交表单,...