BT

最新技術を追い求めるデベロッパのための情報コミュニティ

寄稿

Topics

地域を選ぶ

InfoQ ホームページ ニュース GremlinがStatus Checksの一般提供を発表

GremlinがStatus Checksの一般提供を発表

カオスエンジニアリングを専門とする組織であるGremlinは、Status Checksの一般提供を先頃発表した。この新機能は自動的に健全でプロダクションでカオス実験を実行する準備ができているシステムを検証する。Status Checksは、PagerDuty、Datadog、New Relic、またはその他の監視ツールのサードパーティツール統合とともに、CI/CDパイプラインとの統合をサポートする。

Gremlinの「主要な側面」の1つは安全である。CTOでありGremlinの共同創設者であるMatthew Fornaciari氏のそれについての話しでは、

"2017年のリリース以来、攻撃がカスタマーエクスペリエンスに悪影響を与える場合に備えて、Gremlinユーザが実験をリアクティブにロールバックすることを簡単にする大きな赤いHALTボタンを作りました。今日、成熟した企業は、CI/CDを使用してより多くの実験を自動化しており、システムの状態をプログラムでチェックし、実験を積極的に停止する方法が必要です。それがStatus Checksです。"

以前、企業はステージング環境で実験を実行して安全性の懸念に取り組み、その後、それらの学習をプロダクションにおける問題に適用していた。ステージング環境がプロダクション環境を正確に反映していない場合があると、このアプローチの価値が低くなる。サードパーティのモニタリングまたはアラートエンドポイントへのAPI呼び出しを行うことで、Status Checksはステータスコード、リクエスト/レスポンス時間、JSONレスポンスボディを評価し、システムの状態に応じてレスポンス (成功または失敗) を提供する。システムが正常な場合、Gremlinはシステムでカオスエンジニアリング実験を実行してから、別のステータスチェックを続行する。

このアプローチについての詳細を、GremlinのカオスエンジニアAna Margarita Medina氏が説明する、"カオスエンジニアリングのポイントは、不要なカオスを追加しないことです。システムのカオスを制御したいのです。" この点をさらに踏まえて、GremlinのプロダクトマネージャーであるMatt Schillerstrom氏は、SD Timesのメールでの説明で、"Gremlinが「カオス」を擁護していないことに注意することは非常に重要です。— カオスエンジニアリングは少し誤解を招く可能性があります。混乱を和らげるために、仮説駆動のテストを推奨します。カオスを防ぐために私たちのシステムをよりよく理解すること。すでにストレスにさらされているインフラストラクチャを攻撃することは、誰にとっても良いことではありません。"

Status Checksは、組織に追加の信頼性と安全性を提供するため、カオス実験を定期的にスケジュールして自動化できる。

世界のトップパフォーマンスのIT組織はカオスエンジニアリングを採用しているが、その慣行をまだ採用していない企業にとって、安全性は依然として大きな懸念事項である。GartnerのシニアプリンシパルアナリストであるJim Scheibmeir氏は、"多くの組織は、プロダクションで実行する実践はあまりにもリスクが高いという態度でカオスエンジニアリングの概念に取り組みます。実際には、カオスエンジニアリングを回避することは、危機エンジニアリングを採用することと同じです。"

この記事に星をつける

おすすめ度
スタイル

BT