Netflixは最近、Chaos Monkey 2.0のソースコードを公開した。このレジリエンスツールの最新リリースは、Spinnakerとイベントトラッキングシステムに完全に統合されて、SSHサポートが削除されている。
Chaos Monkey 2.0は、Netflixがオープンソース化した継続的デリバリープラットフォーム、Spinnakerで設定・実行される。このインテグレーションによって、AWS、Google Cloud、Microsoft Azure、Cloud Foundry上のインスタンスにアクセス可能になる。Spinnakerはデータセンターにサービスがどのようにデプロイされているかに関する情報を提供する。Chaos Monkeyはそれを使って、スケジュール通りにインスタンスを停止させる。
Netflixは、AtlasとChronosにインスタンス停止を報告するよう、Chaos Monkeyを設定している。これによって、インスタンス停止の頻度をトラックして可視化することができる。他のテレメトリー及びイベントトラッキングシステムを使うよう設定することもできる。
インスタンスに接続して、CPU消費の調整やディスクのダウンを可能にしていたSSH機能は、ツールから削除された。これらの失敗モードは「潜行的」でランダムに適用できないと見なされ、別の方法が開発されている。
Chaos Monkeyは、Netflixで使われているGorillaとKongの小さな弟分だ。この2つのレジリエンスツールは、AWSのアベイラビリティーゾーンもしくは全ゾーンにおける障害をシミュレートする。Chaos Monkeyは、データセンターや複数リージョンにおける個別インスタンスを停止させるために、代わりに使われる。Netflixでは、ソフトウェアエンジニアがレジリエンスを念頭にシステムを設計・実装するよう、こうしたツールが使われているという。Chaos Monkeyを動かすにはSpinnakerとMySQLが必要になる。ツールはGoで書かれており、サービスとして動くものではない。代わりに、cron
ジョブでトリガーする。
Rate this Article
- Editor Review
- Chief Editor Action