アラートの通知に関するトラブルシューティングフレームワーク

原文: Alerts Troubleshooting Framework- Notifications

このガイドでは、New Relic Alertsでインシデントの通知を設定し、通知されるべきインシデントが発生したと考えられるのにもかかわらず、通知を受け取れなかった場合のトラブルシューティングについて解説しています。

  1. まず、インシデントへのリンクを確認します。
  2. Warning閾値の違反ではインシデントは開かないため、違反の通知を受けることもできませんので、ご注意ください。
  3. その時点においてインシデントが開いたかどうかを確認します。Alerts & AI UIのIncidentのEventsタブを使用して、違反が開かれたかどうかを確認できます。アラート条件名で検索してみてください。
    1. 違反が開くべき時間に開かれなかった場合、誤ったアラートのトラブルシューティングフレームワークを進めてください。
  4. アラート条件のポリシーで、インシデントのpreferencesが何であるかを確認します。By conditionBy policyになっている場合は、すでにインシデントが開いていて、違反がそれにまとめられた可能性があります。
  5. 通知が送信されるべきだった(違反が独自のインシデントになったか、少なくとも新しいインシデントを開いた)場合、Incidents UIのEventsタブをチェックして、通知の送信に問題がなかったかどうかを確認します。すべてに「NOTIFICATION SENT」と表示されているはずです。
    1. メールが送信されたと表示されている場合は、New Relicのメールがブロックされていないか、メール管理者に確認してください。次にNew Relic Global Technical Support に連絡してください。
  6. アラート通知チャネルのテストでテスト通知の送信を試してください。 Test alert notification channels
  7. 通知チャネルに問題がある場合は、UIに詳細情報を含むメッセージが表示されるはずです。
  8. 通知テストで、一番上のメッセージでresponse: 200として返ってくる場合、New Relicがテスト通知の送信に成功したことを示しています。下のメッセージは、New Relicが通知エンドポイントから受け取った応答です。
  9. webhooksのトラブルシューティング- response: 200と表示された場合、New Relic側でできることはあまりありません。トップメッセージとして200が表示されている場合、New Relicができることはあまりありません。ここでは、webhooks のトラブルシューティングに使用できるいくつかの提案をご紹介します。
    1. Relic Solution: Troubleshooting webhook channels with RequestBin
    2. Relic Solution: All About Webhooks!
    3. Relic Solution: Troubleshooting Alerts Webhook Notification Channel Issues
  10. ここまで来て、まだ通知の送信に問題があるようであれば、New Relic Global Technical Support に連絡してください。その際、何を試し、何を見つけたのか、問題の詳細な説明を必ずご連絡ください。

ソフトウェアエンジニア、インフラエンジニアなど自社開発や自社運用の現場で経験を積んだのち外資系ソフトウェアベンダーでのテクニカルサポートを経て現職。New Relicユーザーだった経験あり。コミュニティでの登壇活動も多く、Microsoft MVPを7年連続受賞中。Microsoft Certified Azure Solutions Architect Expert。得意分野はC#をはじめとするソフトウェア開発、Kubernetes関連技術およびパブリッククラウド。 View posts by .