[Day 14] 关於 SRE 与 SEC 的关系

关於SEC的事情

资料库演练100%备份还原

每年至少两次的资料灾害恢复演练,资料要100%覆盖,要100%可恢复!可以由资深同仁带着比较没经验的同仁,顺便帮助团队其他组员更加有信心。


定期更换帐密

  • 如果是内部系统通常是建议三个月更换一次,但可以用抽签的1~6个月更换也可以。
  • DB类帐号建议每半年换一次。
  • 如果是有在使用git的建议commit搭配GPG -> https://ithelp.ithome.com.tw/articles/10234900

定期检查cpu&mem

  • VM or Node 检查频率要依照波动幅度做调整,幅度越高,频率应该越高
  • Pod cpu or mem的使用率都有持续成长没有降下来的情况,更应该要留意!查看是否有code没写好,没妥善利用好资源。

定期检查硬碟使用率

检查频率要依照硬碟成长幅度做调整,成长幅度越高,频率应该越高,成长幅度高的话也要看一下是不是有东西写坏了...,不是你们写的服务客人反应太热量,不然就是你们写的服务让自己太嗨了,乱写一堆档案也没有妥善处理。


定期确认防火墙规则

防火墙的异动常常因为需求做调整,但也要定期去检视防火墙规则设定是否合宜,是否设定错误,可能会造成资安上的漏洞。


定期检视监控是否运作正常

有时候你以为你设定的监控,是正常的,但它就刚好在某天坏掉,直到系统出现问题,你才惊觉,WTF看似有监控但都是假的!所以我才要提醒你各位,要定期去检视一下你的监控是否运作正常,警报是否能正常触发?适时关怀一下你的监控呗!


定期追踪你所使用的套件

Open Source 常常会有更版,多多少少会修正一些安全性的问题,若你不定期去追踪的话,万一万一你在正式环境上使用的版本是个大漏洞,公司的系统整个就处於高风险的环境之中,甚至可能被零时差攻击!所以良心建议大家,真的要定期追踪一下你所以使用的东西,不管是程序语言或是使用的套件,更甚至是OS的版本...。但是否更新就要你们做好风险评估了,因为有时候急忙的更新上去,那个新修正的版本可能会有更多问题,所以风险管理...真的是一门学问,更新重要的东西前,最好是能在其他环境先测试过一轮比较好,可以看看这篇的做法 -> [Day 5] SRE - 发动事件左移之术,预视未来的机制


最後,在台湾最重要的

定期买乖乖 要注意保存期限啊 XDD

你们会吗?你们都买哪款?/images/emoticon/emoticon34.gif

https://ithelp.ithome.com.tw/upload/images/20210922/20115289pTgxiAaJnn.png


<<:  企业资料通讯 第一周整理

>>:  DAY 10 『 UIAlertController 』Part1

(Day8) 隐含转型 - 转成 Boolean & 宽松相等 vs 严格相等

前言 上一篇介绍了数字型别、字串型别的隐含转型,接下来介绍剩余的隐含转行,剩余隐含转型大约分成以下三...

离职倒数10天:做产品才知道政治敏感不只存在两岸之间

我第一次在微软 release 产品时,学到一件很意外的事是:这世界上政治敏感区域原来不只有台湾跟中...

容器化及容器技术(containerization and container technology)

-虚拟机和容器部署(来源:NIST SP 800-190) 虚拟机器监视器(Hypervisor)...

AlwaysOn 可用性群组 (AOAG) - 心得分享

DBA Bootcamp 下面这张图说明了 SQL Server AlwaysOn 可用性群组 (A...

ASP.NET MVC 从入门到放弃(Day29)-MVC 实作一个web api

在前一天我有提到如何将Web Api 加入 Swagger 今天就来实作一个会员查询资料的POST ...