障害とかで一時的にアラートをミュートにしたら、戻すのを忘れてヒヤリハットしたことはないだろうか。
僕はあります。
こいつを使えば、
- working ステートになっていないホスト
- ミュートしているモニター
を Slack で教えてくれる。
Mackerel のモニターには時間指定でミュートすることが可能だけど、自分がしたとしても他人がそうするとは限らない。
世界最強の威力を誇る、チャンネル自体のミュートは API では拾えないっぽい。
ちなみに僕のヒヤリハットは Orchestrator という MySQL のフェイルオーバーを担うソフトウェアが載ったサーバーをずっとメンテナンスにしていたこと。
このツールを2プロジェクトで導入したらメンテナンス状態のままなやつがちらほら見つかった。
手動で確認してもいいけど、いちいちバックエンドの人にこれってなんでメンテナンスなんだっけって聞くのも面倒ですしね。