InfoQ ホームページ Operations management に関するすべてのコンテンツ
-
オンラインカジノにおけるCloudflareの突然のサービス変更の影響
先日、あるオンラインカジノのウェブサイトが突然Cloudflareのサービス停止によって深刻な混乱に見舞われた。このカジノのシステム・オペレーション・エンジニアであるRobin Dev氏は、一連の事件についてブログで詳細を説明し、障害の規模やその余波について明らかにした。
-
Google Cloud、"Security Command Center Enterprise"を発表
Google Cloudは、Security Command Center(SSC)Enterpriseの提供を開始した。このソリューションは、企業のセキュリティ運用に対応したプロアクティブなクラウドセキュリティを提供するクラウドリスク管理ソリューションである。このソリューションは、マルチクラウド環境におけるリスクの管理と軽減を支援し、Mandiant社の専門知識によって強化されている。
-
AWSマネジメントコンソールのmyApplications による直感的なアプリケーションリソース管理
AWSは先日、re:Invent conferenceでmyApplicationsの一般提供を発表した。AWS Management ConsoleのmyApplicationsは、顧客がAWS上のアプリケーションのコスト、健全性、セキュリティ体制、パフォーマンスをより効果的に管理、監視するのに役立つ。
-
OpenTelemetryロギングが安定マークされた:KubeCon NAでのMorgan McClean氏
ロギングは今日のアプリケーションに不可欠なコンポーネントだ。OpenTelemetry(OTel)は、ツール、API、SDKのコレクションで構成されるオープンソースのオブザーバビリティフレームワークで、プロジェクト内で利用可能なもう1つの "シグナル "としてロギングを安定させた。他のOTel シグナルには、トレース、メトリクス、バゲージがある。
-
IT運用担当者による課題解決の迅速化とシステム稼働維持をAIで支援する
AIOpsは、ユーザからの直接的なフィードバックを求めずに、履歴データに基いて、より迅速な評価、修復、あるいは実用的な洞察に有用なアルゴリズムをITチームに提供するものだ。AIの支援を受けるIT運用担当者は、スマートに作業し、問題をより早く解決し、システムの機能と運用を維持することにより、従来よりも優れたエンドユーザエクスペリエンスを提供できるようになる。
-
AWSがクラウドリソースを管理するための新しいコンソールホームページをリリース
最近、AWSはAWSマネジメントコンソールのバージョンをリリースした。コンソールのホームページから、顧客は各サービスコンソールにアクセスできる。AWS関連のタスクを実行するために必要な情報にアクセスするための単一の場所が提供される。
-
NGINXコントローラ���アプリケーション配信モジュールによりヘルスチェックとキャッシング構成が改善
NGINXは、NGINX Plusロードバランサー用のコントロールプレーンソリューションであるNGINX Controller Application Delivery Moduleの新しいバージョンをリリースした。新機能には、強化されたワークロードヘルスチェック、キャッシュ構成の改善、インスタンスグループが含まれる。
-
Linkerdに見る、クラウドネイティブインフラストラクチャにおけるRustの採用
Linkerdプロジェクトは先頃、CNCFの卒業プロジェクト(graduated project)になった。他のサービスメッシュプロダクトと異なる、Linkerdの最もユニークな面は、Rustで記述されたLinkerd2-proxyである。Rustを採用したことによって、Linkerdは、他のサービスメッシュソリューションに比較して、極めて高速かつ軽量なものになっている。
-
Ambassador開発者コントロールプレーンが一般的なKubernetesフルライフサイクルツールを統合
Ambassador Labsは、Developer Control Plane(DCP)のリリースを発表した。DCPは、Kubernetesベースのサービスの全ての開発と運用をサポートするツールを統合して提供する。これには、Argo、Telepresence、EnvoyProxyなどの人気のあるCloudNative Computing Foundation(CNCF)ツールが含まれている。
-
Cloudflareが自動化されたTerraform生成ツールを改善
Cloudflareは先頃、cf-terraformingツールの更新バージョンをリリースした。このツールは、既存のCloudflareリソースからTerraform HCLを生成することを合理化する。新しいリリースでは、生成プロセスが簡素化され、ツールの将来性を高めるための変更が導入されている。
-
Consul-Terraform-Syncでネットワーク共通タスクの自動化が可能に
HashiCorpのConsul-Terraform-Sync(CTS)の一般提供が開始された。CTSでは、Consulに追加や削除が可能なサービスの形式で動作するTerraformモジュールとして、タスクを定義することが可能になる。CTSはNetwork Infrastructure Automation(NIA)という、ロードバランサプールやファイアウォールポリシの更新のようなネットワーク"導入後"タスクの自動化に重点を置いたソリューションの一部である。
-
役割の割り当てとGameDayによるインシデント管理の改善
Bitfield Consultingの主任コンサルタントであるJohn Arundel氏は、インシデントをスムーズかつ迅速に処理する方法についての考えを共有した。彼は、インシデントに対応する各チームメンバーに特定の役割を割り当てることを提案している。レッドチームとブルーチームの演習を活用して、チームが正確かつ迅速に対応できるようにすることもできる。
-
AWSが運用ダッシュボードのベストプラクティスガイドを公開
AWSは先頃、運用可視化のためのダッシュボード構築に関わる自社のベストプラクティスを、Amazon Builder's Libraryに追加した。新たなドキュメントには、Amazonに存在するさまざまなタイプのダッシュボードに関する詳細な説明に加えて、ダッシュボードの開発で使用される設計上のベストプラクティスに関する議論が含まれている。
-
Microsoft Azure Well-Architected Framework発表
Microsoftは先頃のブログ投稿で、Azure Well-Architected Frameworkを紹介した。これは、優れた設計のソリューションを構築および提供するのに役立つ一連のAzureアーキテクチャのベストプラクティスを顧客に提供する。
-
障害モードとレジリエントなシステムの構築 - Adrian Cockcroft氏のQCon SFでの講演より
Adrian Cockcroft氏は先頃、障害発生時においても正常に運用できるレジリエントなシステムの構築方法について、自身の考えを公開した。氏は先日のQCon San Franciscoでも、継続的レジリエンスの考え方を備えたシステム構築において望まれる、クラウドのレジリエンスパターンについての私見を述べている。