InfoQ ホームページ Resilience に関するすべてのコンテンツ
-
カオス試験プラットフォームGremlinに対象サービスの自動ディスカバリ機能が追加
カオスエンジニアリングプラットフォームのGremlinが先頃、自動サービスディスカバリ(automated service discovery)を発表した。ダイナミックな環境内で動作しているサービスを自動的に検出する新機能だ。検出されたサービスはカオス試験のターゲットとして有効になる。APIキーを対象としたロールベースのアクセス制御も追加された。
-
Cheryl Hung氏の2021年クラウドネイティブとDevOpsのトレンド
先頃のDEVOPS Conferenceのキーノートで、Cloud Native Computing Foundation (CNCF) のエコシステム担当副社長であるCheryl Hung氏は、来年のクラウドネイティブトップ10予想を共有した。これには、クロスクラウドサポートの改善、GitOpsとカオスエンジニアリングプラクティスの成長、およびFinOpsの採用の増加が含まれる。
-
Gremlinがカオスエンジニアリングで“うるさい隣人”問題に対応
Gremlimは、'Noisy Neighbors(うるさい隣人)'を隔離して、サービスのスケーラビリティをテストすることに関心のあるDevOpsエンジニアを対象に、同社のChaos Engineeringプラットフォームの改良版をリリースした。Kubernetesでは、クラスタを共有する複数のアプリケーションがリソースを奪い合ってパフォーマンスが低下するという、´Noisy Neighbors'の問題が発生する。
-
Gremlinが"State of Chaos Engineering 2021"レポートをリリース
Gremlinは、コミュニティの調査と独自のプロダクトデータに基いたカオスエンジニアリングに関するレポートを、"State of Chaos Engineering 2021"としてリリースした。おもな調査結果のひとつは、カオスエンジニアリング試験の実施と可用性向上の間に正の相関関係があることだ。
-
3月16日のInfoQ Live: ソフトウェアデリバリーの不確実性を減らす方法を探る
InfoQ Liveはソフトウェアエンジニアとアーキテクトのための1日のバーチャルイベントであり、3月16日に新しいエディションで帰ってくる。今回は、ソフトウェア開発サイクルの不確実性を減らす方法に焦点を当てている。
-
UberがマルチリージョンでのKafkaの災害復旧を実装
先頃のブログ投稿で、Uberのエンジニアは、レプリケーションプラットフォームを使用して、マルチリージョンのKafka展開で大規模な災害復旧を実装する方法を強調している。UberにはApache Kafkaの大規模な展開があり、1日に数兆のメッセージと数ペタバイトのデータを処理する。Uberのエンジニアは、自然災害や人為的災害に直面した時のビジネスの回復力と継続性を提供した。
-
AWSがカオスエンジニアリング・アズ・ア・サービスの提供を発表
AWSは、��オスエンジニアリング・アズ・ア・サービスの次のリリースを発表した。フォールトインジェクションサービス(FIS)は、多数のAWSサービスにわたってフルマネージドのカオス実験を提供する。このサービスには、一般的な実世界のイベントを模倣した中断を生成するビルド済みのテンプレートが含まれている。APIを介してCIパイプラインに統合できる。
-
役割の割り当てとGameDayによるインシデント管理の改善
Bitfield Consultingの主任コンサルタントであるJohn Arundel氏は、インシデントをスムーズかつ迅速に処理する方法についての考えを共有した。彼は、インシデントに対応する各チームメンバーに特定の役割を割り当てることを提案している。レッドチームとブルーチームの演習を活用して、チームが正確かつ迅速に対応できるようにすることもできる。
-
Kubernetesのカオスエンジニアリング: 一般利用可能になった Chaos Mesh v1.0
Chaos Meshチームは、2020年7月にCNCFサンドボックスプロジェクトとして承認された後、Chaos Mesh 1.0の一般提供(GA)を発表した。Chaos Meshは、Kubernetesアプリケーションでカオスエンジニアリング実験を実行するためのツールである。
-
Chaos Conf Q&A - Adrian Cockcroft、Yury Niño Roa両氏に聞く
Chaos Conf 2020を前に、InfoQでは、カオスエンジニアリングコミュニティが関心を持つ話題を探るべく、Adrian Cockcroft、Yury Niño Roa両氏に話を聞くことにした。おもな話題は以下のとおりだ — 心理的安全性を獲得する上で、"game days"の実施には明確なメリットがある。カオスエンジニアリングの将来は、セキュリティの導入と、より大規模な障害モードを想定した試験のスケールアップに向かっている。
-
複雑なソフトウェアプロジェクトをナビゲートし、不確実な時代をリードする - InfoQ Live 9/23
InfoQ Liveには、Red HatのGlobal Transformation Officeでシニアディレクタを務めるJohn Willis氏や、FTでオペレーションとリライアビリティを担当するテクニカルディレクタのSarah Wells氏など、世界クラスの実践家が参加して、ソフトウェアエンジニアリングリーダシップに関する価値ある洞察や実践的アドバイスを提供してくれる。
-
ソフトウェアエンジニアリングリーダーシップによるテクノロジーの提供:近々開催されるInfoQライブイベント
InfoQ Liveは、現代のソフトウェア実務家向けに設計されたインタラクティブな仮想イベントで、9月23日に新しいトピックにフォーカスして開催される。ソフトウェアエンジニアリングのリーダーシップとチームの能力強化によって、テクノロジーを提供する。Sarah Wells氏、John Willis氏(@botchagalupe)、Holly Cummins氏、Sarah Shewell氏などのワールドクラスの実務家と共に、技術プロジェクトのリード、チームデータダイナミクスの分析、不確実なタイミングにおけるチームのリードのベストプラクティスについて深く掘り下げましょう。
-
AWSのオープンソースカオスエンジニアリングライブラリ
AWSエンジニアは先頃、AWSSSMChaosRunnerと呼ばれるPrime Videoでのフォールトインジェクションのテストに使用したオープンソースのカオスエンジニアリングツールについて書いた。チームは、 EC2インスタンスで任意のコマンドを実行できるAWS Systems Managerを使用して構築されたツールを使用してレイテンシー関連の問題を軽減することができた。
-
GremlinがStatus Checksの一般提供を発表
Gremlinは先頃、Status Checksの一般提供を発表した。この新機能は自動的に健全であり、プロダクションでカオス実験を実行する準備ができているシステムを検証する。
-
カオスエンジニアリングとレジリエンスエンジニアリング - メンタルモデル、ツール、試験
先日のInfoQポッドキャストで、Jeliの共同創業者兼CEOのNora Jones氏が、カオスエンジニアリングとレジリエンスエンジニアリングの違いについて説明し、効果的なカオス試験の計画と実行、インシデントから効果的に学ぶ方法についてアドバイスした。