[Day 9] SRE - 自动化

自动化

什麽东西可以自动化?对我而言只要可以列出SOP的事情,都可以实现自动化。

价值

一致性

当不同人遇到同样的事件,处理的方法可能有百百种,但不一定每个人处理的SOP都是最佳化的,而你们可以讨论出最佳化的流程并套用到自动化程序上,让每个人处理此问题都保有一致性。


平台性

平台性可以将错误批量修正,如果你有1000台机器你只能一台一台修正的话,那要修到何时?而有平台性的自动化可以瞬间完成,反覆性的处理工作。


反应快,修复快

如果按照SOP,一步一步慢慢修正问题的话,「人」就可能造成失误,而「人」的处理速度一定不会比自动化的SOP脚本还快,反之能利用自动化来自动处理,并预防问题发生。


超级省时

当call你上线到真正上线处理完问题最快最快可能要3分钟,但只需要自动化的功能或程序需要的时间绝对比你还要快。因此自动化可以帮助消除那些routine job。


案例

自动化的演进过程

  • 没有自动化 -> 人工依照经验反应去执行命令处理
  • 外部维护系统 -> 人工依照经验反应使用外部维护系统
  • 一般自动化的外部维护 -> 自动化使用外部维护系统
  • 内部维护系统 -> 进化成内部维护系统,可能要人工触发或可能不用
  • 不需要依靠任何自动化的系统 -> 系统优化调校後,在系统面上将此问题进行根除

在SRE的世界,尽量避免手动操作,但免不了有些事情还是需要手动。

在写完自动化程序的後续维护流程

  • 定期测试
    为的是有时候怕环境被异动,这些自动化程序就失效了。
  • 定期检视
    有些自动化程序可能相依着商业逻辑,或当时环境,这两个东西可能会随着时间异动,所以还是需要定期去检视一下,自动化程序是否还合宜?

小结

只要能制定出SOP标准的流程,基本上都能写成自动化脚本。 /images/emoticon/emoticon07.gif


<<:  Day 05 : 资料处理 Pandas (1)

>>:  小队快跑 - 提问的智慧?!

# Day25--还不Merge一下?

每当我们在使用git的时候,我们查看每一条之前自己加入的纪录: git log --oneline ...

[Day 28] 永和美食纪录-翻转屋 锅烧意面

前言 铁人赛已经进入最後的倒数阶段,看着版上有许多钻研着专业领域的前辈们陆陆续续地完成挑战,笔者真的...

[Day06] CH04:我已读你的已读——认识 Scanner

今天我们要来实作一道题目,是不是很期待呢? Question:输入两个数字,印出两数字的和 看到「和...

第23天~又是JSON+ListView

又是JSON 开新专案 准备XML档+ListView 放好ID 准备一个TXT档案- 把txt档案...

Html表单元素(DAY6)

我们在上一篇文章中介绍了input的text,Password,button,radio,check...