コード日進月歩

しんくうの技術的な小話、メモ、つれづれ、など

障害対応の緊急時には定時連絡をしよう

要素として忘れがちなので雑記的な

緊急時対応

緊急時には色々バタバタする

  • トラブルの要因を調べる
  • 一時的な防護柵をはるか、根治かの判断
  • 利用側への周知
  • 社内周知

この中でも「社内周知」がかなり大味になる瞬間がある。

社内周知

実際にトラブルシューティングをしているエンジニアはそれどころではなく、一刻も早く問題を特定して、止血作業をせねばならないという気持ちになっている。

そんなときに「周りへの状況報告」まで気が回るほうが稀である。

そのためトラブルシューティングをするときはワンセットで報告者を設けるシーンが多く、その場合に対応している人に適宜ヒアリングしつつ進捗報告を行う。

そのように「社内の通知の進捗報告をする人」を立てるまではやっている場合がおおいが、次に抜けるのが「定時連絡」かなと思っている。

定時連絡の大事さ

一生懸命作業している現場、しかしながらそこに調査に進展がなかったりすると、進捗報告は自然となくなる。進展がないのだからそれはそうなのだけれども、対応している現場の外から見ると、沈黙化している状況に見えてしまう。

そこで大事に鳴ってくるのが「一定タイミングの周知」すなわち「定時連絡」だと思っている。

「状況に進展がない」という状況を伝えるだけでも周りはそれを鑑みて動けるし、実際にどういうことが起きているかを認識することができる。

変化がないことを報告することにかなり意義はあるということなので、その点を頭に留めつつ、障害時の対応フローなどに組み込むようにしたい。

参考リンク