Mackerel のロール内異常検知に対する所感
Mackerel のロール内異常検知がやっとリリースされましたね。
早速設定してみましたが、この機能は難しいと感じました。これまでの監視ルールでは CPU の使用率が 70%を超えた場合はワーニング、90%を超えた場合はクリティカルとするという直感的(職人芸?)の設定が出来たと思います。でも、異常検知ではこのようなことが出来ず、センシティビティというものを選択する必要があります。このセンシティビティをどのように設定するべききを考える必要があるのですが、ヘルプページの説明を読んでもよく分からないと感じました。
Sensitivity: sensitive のほうが小さな変化に反応しやすくなります。大きな変化のみアラートを発報したい場合、insensitive を設定してください
過去のデータをもとに sensitive を設定した場合はこういったときにアラートが発生、insensitive を設定した場合はこういったときにアラートが発生するというのが、監視ルールを作成するときに把握できればいいと思います。でも、現状はそのようなことが出来ないため、始めは sensitive で監視ルールを作成して、アラートが発生するけど、サービスへの影響が問題ないと判断することが出来れば、normal や insensitive に変更するのがいいかなと思います。