BT

最新技術を追い求めるデベロッパのための情報コミュニティ

寄稿

Topics

地域を選ぶ

InfoQ ホームページ ニュース AWSの ゾーンオートシフト:インフラの信頼性の最適化

AWSの ゾーンオートシフト:インフラの信頼性の最適化

原文リンク(2024-01-30)

Amazon Route 53 Application Recovery Controllerの新機能であるゾーンオートシフトは、クラウド・プロバイダーによって潜在的な障害が特定されると、アベイラビリティ・ゾーン(AZ)からトラフィックを自動的にシフトである。AZの障害が解決されると、サービスはトラフィックをリダイレクトして戻す。

新しい ゾーンオートシフトは、昨年導入された機能に基づいており、ユーザーが手動またはプログラムでゾーンオートシフトを開始できる。Amazon Route 53 Application Recovery Controllerの一部である ゾーンオートシフト機能により、ユーザーは障害を受けたAZからトラフィックをリダイレクトできる。どちらのオプションも、電源やネットワークの停止を含むAZの障害がアプリケーションやサービスに与える影響を管理し、軽減するのに役立つ。

AWSの主任開発支援者であるSébastien Stormacq氏は、この新機能がクラウドにおいてどのようにレジリエントで信頼性の高いインフラを保証するかを説明する。

アベイラビリティ・ゾーンからトラフィックをシフトさせることは、慎重に準備しなければならない繊細な作業です。私たちは、お客様のアプリケーションの可用性を誤って劣化させることのないよう、一連の安全策を構築しました。第一に、一度に1つ以上のアベイラビリティ・ゾーンからトラフィックをシフトさせないための内部制御を行います。第二に、毎週30分間、お客様のインフラ上でシフトの練習を行います。(第三に、練習中にサーキット・ブレーカーとして機能する2つのAmazon CloudWatchアラームを定義できます。

出典:AWSブログ

顧客はCLI、コンソール、または異なるSDKを使って、クロスゾーン設定が無効になっている場合、Application Load BalancerとNetwork Load Balancerのゾーンオートシフトを有効にできる。

ゾーンオートシフトは、障害が発生したゾーンから移行した後、アプリケーションが残りの各ゾーンで十分な容量を維持しているかどうかをプロアクティブに評価する機能である 練習実行を導入している。顧客は練習実行を構成してゾーンシフトを実行し、ワークロードの容量耐性を検証ができる。

自動練習実行が許可されない時間帯 (ローカルの営業時間など) を定義し、実行の開始を阻止する CloudWatchアラームや、実行中にワークロードの健全性を監視して問題が発生した場合にロールバックするアラームを定義できる。リソース・キャパシティのプリスケーリング、リソースの種類と制限の詳細については、資料を参照して欲しい。

クラウドプロバイダーは、新しいゾーンオートシフトを有効にする前に、まずゾーンシフトによって手動でデプロイの回復力をテストすることを推奨している。Stormacq氏は提案する。

crawl, walk, run方式の適用をお勧めします。まず、手動のゾーンシフトから始め、アプリケーションに自信をつけます。次に、 営業時間外に練習実行を設定したゾーンオートシフトをオンにします。最後に、営業時間内にゾーンシフトの練習を行うようにスケジュールを変更します。イベントを発生させたくないときに、イベントに対するアプリケーションの応答をテストしたいと考えている。

"AZ障害から自動復帰するためにゾーンオートシフトを使用する" re:Inventのセッションが最近YouTubeで公開された。

ゾーンオートシフトは、中国とGovCloudを除くすべての地域で追加料金なしで利用できる。

作者について

この記事に星をつける

おすすめ度
スタイル

BT