監視について
システムの監視について、思ったことメモ。
システム監視ってのは下記をさしていってます。。
- 外形監視
- 症状監視
人によってポリシーが違うんだろうけど、
気づけば「なんとなく」になってたり、「あのシステムがこうしてたから」になってたりするね。。
わたしは、もともと適当な性格なので前者。。 (゚∀゚;)
すごく昔の記事だけど、結局のところ、考え方って変わらないのだとおもったw
@IT:Webサーバ周辺、これだけおさえれば、落ちても大丈夫?
この記事に沿って書くけど、外形監視と症状監視はこんな感じ↓
外形監視
システムとして提供するサービスが正しく動いているか
症状監視
障害を検知したときに発生している障害がどんなものなのかを特定するために必要な情報収集
外形監視で正しく動いてないことが検知された場合=障害
ってことで、まあ・・・うちの会社で言うと、容赦なしに携帯にメールが飛んでくる。。
でも何故か、pingのチェックでひっかかったものもメールがとんできて、
「もうLBで切り離されてるんだから・・・」とか考えながらも、
なんとなく対応してたり。。。イケテナイ。。
監視の設定を入れてることに意味があるかのようになってしまってることが多いのだけど
きっと私たちのミッションは
- 提供しているサービスが正しく動かなくなったときにいち早く検知すること
- 検知した際に、原因をいち早く見つけ、対応すること
につきるのだと思う。
だから、余分な監視なんて必要ない。
ちゃんと考えたらそんなに難しいものじゃないんだからちゃんとせねば!自分。。。 (ノω<;)
あとはLBのヘルスチェック何でやってるか
- ポート
- ステータスコード
- 文字列
云々。。。
そこも意識しながら、監視の設計をしなきゃですね。。