BT

最新技術を追い求めるデベロッパのための情報コミュニティ

寄稿

Topics

地域を選ぶ

InfoQ ホームページ ニュース Grafana Cloudにインシデントとオンコールの管理ソリューションが追加

Grafana Cloudにインシデントとオンコールの管理ソリューションが追加

原文(投稿日:2022/02/26)へのリンク

Grafanaは、Grafana Cloud製品にインシデント管理とオンコールサポートを追加することを発表した。現在プレビュー中のGrafana Incidentでは、会議スペースが生成され、Slackと統合され、Grafanaダッシュボードから取得した情報を使ってインシデントのタイムラインが構築される。Grafana OnCallでは、接続された監視システムからのオンコールローテーションスケジューリングと通知が提供される。

Grafana Incidentでは、Grafana Cloud内でインシデント管理機能が提供される。これには、Zoom、Slack、Google Meetなどの既存のコラボレーションツールとの統合が含まれる。インシデントが宣言されたときに、Slackチャネル、ズームルーム、Google Docs、Google Meetなどの専用のコミュニケーションスペースを作成できる。統合されたSlackベースのチャットボットにより、SlackからGrafana Incidentとのやり取りができるようになる。インシデントの作成、役割の割り当て、タスクの管理、メモの追加などのタスクができる。

Screenshot of incident view within Grafana Incident

Grafana Incident内のインシデントビューのスクリーンショット (出典: Grafana)

 

チャットボットは、作成されたルーム内の会話を受動的に監視し、インシデントに添付されるURLを抽出する。これには、GitHubのIssue、プルリクエスト、ダッシュボード、その他の外部リンクなどの添付されたURLが含まれる。進行中の会話のコンテキストに基づいて、ボットは進行中の調査に関連する可能性のあるダッシュボードを提案する。

Grafana Incidentは、インシデントのタイムラインビューを自動的に生成する。これにより、チャットボットによって抽出されたコンテキストと埋め込まれたGrafanaグラフがリンクされる。さらに、ツール内のタスクとTODOアイテムを追跡することもできる。

現在一般提供されているGrafana OnCallには、Grafana内にオンコール管理が導入されている。このリリースには、Slack、Telegram、音声、SMSアラートが含まれている。オンコールスケジュールはカレンダー統合を介して作成される。このカレンダー統合は、iCalアドレスを表示するカレンダーソリューションとの統合である。オンコールローテーションは、チームのGrafanaユーザ名を使ってカレンダー内でスケジュールされ、Grafana OnCallに自動的に移植される。

アラート監視システムがGrafana OnCallと統合される場合、アラートに対してアラートグループが作成される。このグループは、ルートとエスカレーションチェーンで定義されたエスカレーションポリシーに基づいて通知を送信する。ルーティングオプションには、IFELSE IFELSEロジックを含めることができ、アラートのタイプに基づいて調整できる。類似したアラートは、アラートノイズを減らすために、自動的にグループ化される。

Grafana OnCall escalation chain interface

Grafana OnCallエスカレーションチェーンインターフェース (クレジット: Grafana)

 

Grafana OnCallには、エスカレーションチェーン、アラートグループ、スケジューリング、統合、発信Webhookの操作ができるAPIが含まれている。たとえば、現在のアラートの一覧表示は次のように実行できる。

curl "{{API_URL}}/api/v1/alerts/" \
  --request GET \
  --header "Authorization: meowmeowmeow" \
  --header "Content-Type: application/json"

GrafanaのシニアエンジニアリングマネージャのMatvey Kukuy氏は、Hacker Newsで、Grafana OnCallはGrafanaのユーザだけのものではないと述べました。

Grafana OnCallのアイデアは、あらゆるソースからのSlack/SMS/Phoneアラートのグループ化、重複排除、ルーティング、配信を支援することです。CloudWatch、DataDog、セルフホストのAlertmanagerからでもよいですし、もちろんGrafanaもです。アラートソースの唯一の要件は、Webhookを生成して送信できるようにすることです。

リリースに対するソーシャルメディアでの反応はまちまちであった。一部のユーザは現在のオンコールとインシデント管理スペースへの追加機能を歓迎したが、markbnjは、カレンダーが出力であり、この場合は入力ではないため、「カレンダー統合を使ってオンコールスケジュールを管理するのは間違ったアプローチ」と感じていた。ユーザkungfufrogは、対応するモバイルアプリケーションがないことが欠点であると感じていた。彼らは、モバイルアプリが「私の電話のDND/音量などに取って代わり、夜に起きて問題に対応できる」ので重要であると述べている。

Grafana OnCallは、Grafana Cloud内で有料サービスとして利用できる。ただし、無料利用枠も提供する。無料利用枠には、統合ごとの上限数のあるアラート、チームアラート、APIキーごとのAPIリクエストが含まれる。Grafana Incidentは現在、無料プランと有料プランの両方でGrafana Cloudのユーザがプレビューで利用できる

作者について

特集コンテンツ一覧

BT