ハイブリッド企業向けのサービス中心型AIOpsソフトウェア・アズ・ア・サービス(SaaS)プラットフォームであるOpsRampが,新たなトポロジマップ,ITオペレーション用の拡張AI(AIOps)機能,クラウドネイティブなワークロード用の新しい監視機能を発表した。
OpsRamp統合プラットフォームの新リリースでは,現代的なIT運用管理チームのために,Kubernetes監視,インテリジェントな警告ルーティング,トポロジマップを組み合わせている。優れたサービス中心性に加えて,ハイブリッドインフラストラクチャの監視と管理を行うコンテキストを提供することにより,企業内ITチームによるよりインテリジェントなインシデント管理を実現し,優れたカスタマエクスペリエンスの提供を可能にする。
製品管理担当副社長のMahesh Ramachandran氏は,"サービス中心(service-centricity)"を次のように定義する。
サービス中心,あるいはサービスを中心とする観点は,ディジタル運用チームの重点を,要素の管理からビジネスサービスの管理へと移行させます。OpsRampのAIOpsソリューションは,迅速な修復とインシデント対応を通じて,サービスアベイラビリティとパフォーマンスへのニーズに対処すべく開発されました。デバイスやリソースやコンフィギュレーションの集合から,当社が管理性の高さを保証するビジネスサービスの集合体へと,インフラストラクチャ環境のコンテキストを再構築することによって,IT組織を支援します。さらに,従来のIT部門,DevOps,ビジネス部門の目標をひとつの共通のビジョンに統合し一体化します。ITはビジネスと同じようにリソースを扱うようになり,その中核にサービスが置かれるのです。
新リリースには,ハイブリッドおよびマルチクラウドITスタック内の複数レベルのリソース間のトポロジ的関係を検出する,影響の可視化とサービスコンテキスト機能が含まれている。トポロジマップは,ITリソースが相互に,およびエンドユーザの直面するITサービスに与える影響を,インフラストラクチャチームと運用チームが理解するためのものだ。OpsRampのトポロジディスカバリでは,アプリケーションとハイパーバイザも対象とする。アプリケーションのトポロジ機能は,40以上のポピュラーなエンタープライズアプリケーションを検出し,アプリケーションコンポーネントとインフラストラクチャ間のトポロジ的関連を確立する。ハイパーバイザのトポロジは,VMWare vSphereおよびKVM環境内の仮想マシンやハイパーバイザサーバやクラスタと,その関係性を検出する。
OpsRampではサービスマップ機能も拡張されており,ITサービス停止の原因となったリソースを特定し,サービスを再開するための適切なアクションの判断を可能にする,新たなユーザインターフェイスを備えている。今回の新リリースでは警告の関連付け,自動化,修復を行うインテリジェントなイベントエンジンがOpsRampの新機能として導入されている。自動インシデント生成とルーティング,推論モデルのトレーニング強化,頻度に基づく警告のエスカレーションなどが特徴だ。
OpsRampのOpsQでは,過去の警告やインシデントや通知データに基づく警告エスカレーションポリシを使用した,自動インシデント生成とルーティングが可能になった。マシンラーニングによる警告エスカレーションでは,警告のタイプに対するインシデント割当をルーティングするために,特定の学習パターン(担当者グループ,ビジネスへの影響,緊急度,優先度)を使用する。マシンラーニングを用いたOpsRampの推論モデルは,過去の警告データを使用して,一般的な原因によってリンクされる警告の関連付けを行う。ユーザがトレーニングデータを提供して,これらのモデルをさらに強化することも可能だ。この強化によって,通常の運用での頻度は低いが,発生時には重要な意味を持つ警告シーケンスを認識させておくことができる。モデルの強化では,サービス管理にイベントのエスカレーションを実行させるために,リゾルバグループ,カテゴリ,サブカテゴリ,優先度,緊急度,ビジネスへの影響について事前定義したデータを スプレッドシートとして(または提供されているサンプルテンプレートを使って)用意する。作成されたデータはOpsRampのインシデント管理処理と,サードパーティのインシデント管理統合機能に適用される。
今回のリリースでは,警告の頻度や最近発生した警告に基づいて警告をエスカレーションするためのポリシがサポートされている。頻度に基づく警告では,発生頻度の低い警告を除外し,繰り返し発生する警告をエスカレーションすることが可能だ。OpsRampプラットフォームは,マルチクラウド対応のイベント監視機能を提供するとともに,コンテナインフラストラクチャの検出と監視を行う機能を備えることで,最新のマイクロサービスアーキテクチャをサポートする。
新リリースでは,オンプレミスとAzure Kubernete Service,Google Kuberenets Engine,Amazon Elastic Container Service for KubernetesなどのクラウドサービスをまたいだKubernetes環境の検出と監視が可能になった。これにより,サービス全体(各クラスタのノードとコンテナ,ネームスペース別のポッドの内訳)と,Kuberenetesクラスタ毎のリソース動向(CPUやメモリの使用状況)の把握が可能になり,クラスタ,ホスト,ネームスペース,ポッド,コンテナの可用性やパフォーマンスに関連する重要な指標を監視することができる。イベントは,パブリッククラウド内の運用上の問題に関する重要なコミュニケーションメディアであり,マルチクラウド環境下ではシグナルの主な源泉となる。新リリースではAWS Health,ECS,Redshift,Data Migration Services,CloudWatchといった,AWSサービスからのイベントの収集,集約,相関付け,エスカレーションが可能になった。これによってOpsRampは,複数のクラウドアカウントにわたるクラウドイベントの監視,管理,修復を行う単一ポイントとして機能することができる。
この他にも新リリースには,パッチコンプライアンスの検証と代理トランザクション(synthetic transaction),SSL証明書の監視を行うパッチ管理機能や,オープンソースアプリケーションを監視する統合機能,分類とリンクを容易にするナレッジベースの強化などが新たに含まれている。