あんまり明文化されないけどみんなやってるよね系シリーズ
サーバサイド開発におけるリリース作業とリリース後重点監視
開発を重ねてきた機能をリリースを迎えるとき、リリース前までにある程度のテスト工程を行ってくるものの、本番で実際にやってみたときに何かが起きることというのはままある。そういうときに異変にすぐに気づく、対処するための方法としてリリース後重点監視がある。
リリース後重点監視とは
今回取り上げるリリース後重点監視とは、主に以下のような事柄をすることで異常検知の精度をあげるための振る舞いのことを指す。
- アプリケーションのログで異常な値や、異常を知らせるログが出力されていないか
- nginxやApacheのログで、20x系ではない50x系のログが出力されていないか
- Nagiosやサーバーリソースの監視ツールが異常な値を出していないか
重点監視をすると嬉しいこと
主に嬉しいポイントは以下のようなこと
- 本番の状態(データや周りの連携サービス)と組み合わせたときに発生するバグを検知することができる
- 本番のアクセスに乗ることでパフォーマンス劣化などをした場合に、その劣化にいち早く気づくことができる
- リリース後すぐに検知ができれば、プロダクトとして大きな損失をする前に切り戻しをするかなどの判断ができるため、対処の選択肢を可能な限り最大化できる