BT

最新技術を追い求めるデベロッパのための情報コミュニティ

寄稿

Topics

地域を選ぶ

InfoQ ホームページ ニュース SplunkがSignalFx APMの新しいリリースをローンチ

SplunkがSignalFx APMの新しいリリースをローンチ

原文(投稿日:2020/04/30)へのリンク

機械生成されたビッグデータを検索、監視、調査するためのプラットフォームであるSplunkは、アプリケーション監視ツールSignalFx Microservices APM™の新しいリリースをローンチした。新しいリリースでは、NoSample™トレース、オープンスタンダードベースの計測、およびSignalFxとOmnitionからの人工知能 (AI) 主導の指示されたトラブルシューティングを1つのソリューションに組み合わせている。SignalFx Microservices APMは、軽量で、最新のクラウド環境向けに設計された柔軟なデータ収集を目的とするオープンソースのオープンスタンダードベースのインストルメンテーションをサポートする。

Splunkは、コンテナ化されたデータのSignalFx Infrastructure Monitoringの主要機能リリースであるKubernetes Navigatorを使用して、可観測性の提供をさらに拡張した。Kubernetes Navigatorは、AI主導の分析を使用して、トリアージとトラブルシューティングを促進することを目的とした推奨事項を表示する。Kubernetes NavigatorとSplunk EnterpriseまたはSplunk Cloudの間のワークフロー統合は、コンテキストスイッチングを削減し、根本原因分析を加速することを目的とした洞察を提供することを目的としている。

InfoQは、Splunkのアプリケーション管理担当エリアゼネラルマネージャであるKarthik Rau氏に、新しいリリースに関連するいくつかの質問の回答を求めた:

InfoQ: チームは、SignalFxを含むSplunkソリューションをどのように使用して、パブリック/プライベートクラウドおよびマイクロサービスベースの製品に加えて、SAPやメインフレームなどのレガシー、遺産、または大切なアプリケーションやプラットフォームを含むハイブリッド環境で全体像を把握しますか?

Rau氏: 市場を見ると、ワークロードをプライベートクラウドからハイブリッドクラウド、パブリッククラウドに移行する傾向を簡単に特定できます。クラウドネイティブになるジャーニー。マイクロサービスベースのアプリケーションの可観測性にはギャップがあることに気付きました。アプリケーションはモノリスとして構築されなくなったため、従来のアプリケーション監視方法は機能しません。クラウドインフラストラクチャの短期的な性質、数百、場合によっては数千のマイクロサービスの複雑な相互依存性、およびDevOpsチームが1日に複数回コードをリリースするため、問題ははるかに頻繁に発生し、トラブルシューティングと解決がはるかに困難になります。この新しい複雑さにより、顧客に影響を与えるサービスの停止、速度低下、エラーが頻繁に発生します。これらの問題を解決するために、SignalFx Microservices APMで別のアプローチを採用しました。データを100%収集して分析します。これは、問題が検出されなくなることがないことを意味するため、ITおよびDevOpsにとって有益です。データが収集されると、SignalFxはAIとMLの組み合わせを使用して異なる関係を理解し、関連情報を表面に送ります。これにより、開発者は問題の原因を探す時間を短縮し、問題の解決により多くの時間を費やすことができます。

InfoQ: Splunkは、チームが4つの主要なDevOpsメトリック、つまりデプロイメントの頻度、リードタイム (プロダクション環境に展開するためのコードコミット)、MTTR、および変更失敗率をどのように可視化できるように支援できますか?

Rau氏: これには2つの重要な側面があります。1つはアプリケーション配信パイプライン、もう1つはそのライフサイクルの一部としてのプロダクション環境の監視です。Splunk EnterpriseとSplunk Cloudは、アプリケーションライフサイクル分析をすでに提供しています。これにより、エンド to エンドの開発プロセスを可視化し、開発ツールチェーン全体でツールを接続し、コード品質とDevOpsメトリックを可視化します。SignalFx Microservices APMの追加により、オンプレミス、ハイブリッド、またはクラウドアプリケーション向けの業界で最も強力なプロダクション環境の監視およびトラブルシューティングソリューションをDevOpsチームに提供するようになりました。SignalFx Microservices APMのユニークな機能の1つは、トレースを100%収集する機能です。つまり、DevOpsチームは、完全な忠実度と非常に高いレベルの粒度で、ソフトウェアの正確な動作を理解し、デプロイメントの頻度を加速できます。ストリーミング分析エンジンと組み合わせると、顧客はそのようなリリースの影響を数秒で確認できるため、平均検出時間 (MTTD) を最小限に抑え、すぐに行動できます。すべてのトレースデータを組み合わせて推奨事項を自動的に表示する独自のAI駆動のトラブルシューティングにより、DevOpsチームは、MTTRを大幅に削減し、開発者を支援する問題の根本原因をすばやく特定して解決できます。最後に、コードとして監視するアプローチを介して応答を自動化する機能もあります。DevOpsチームがコードの複数バージョンまたはカナリアリリースをデプロイし、リリースごとの影響を追跡し、問題が発生した場合にロールバックを実行できるようにして、変更の失敗率を減らし、エンドユーザに影響を与える前に問題を修正することを目的としています。

InfoQ: Splunkは、チームがバリューストリームのフローを管理するのにどのように役立ちますか?

Rau氏: Splunkは、前述のように、デリバリパイプラインとプロダクション環境を監視することで、エンド to エンドアプリケーション (DevOps) のライフサイクルを管理するのに役立ちます。さらに、インシデント対応および自動化機能により、サポートプラクティス、特にインシデント管理、サービスレベル管理、およびナレッジ管理のためのオープンループおよびクローズドループ機能を提供します。多くの場合、プロダクションアプリケーションの監視はバリューストリームの中で最も弱いリンクであり、レガシーAPMソリューションでは、アプリケーションで実際に何が起こっているのか、およびそれらのアプリケーションでのエンドユーザエクスペリエンスの可視性が制限されます。SignalFx Microservices APMを使用すると、DevOpsチームは、大量のトレースデータを相互に関連付け、理解し、迅速に処理して、アプリケーションの動作を深く理解し、問題を即座に検出し、ユーザが影響を受ける前に問題を迅速に解決できます。Splunkが現在提供している可観測性のレベルは、開発者がトラブルシューティングに費やす時間を減らし、コーディングに費やす時間を増やすことを意味します。

InfoQ: Splunkは、チームが新機能から実現される価値を計算するのに役立ちますか? もしそうなら、どのように?

Rau氏: SignalFxを使用すると、プロダクションアプリケーションに直接結びつくカスタムビジネスメトリックをサポートするため、DevOpsチームとビジネスの利害関係者は、コードの変更がアプリケーションの稼働時間とユーザエクスペリエンス、たとえばリアルタイムでe-コマースアプリケーションで販売された商品の数にどのようにポジティブ (またはネガティブ) に影響を与えるかを確認できます。関連するビジネスデータを追跡し、それをアプリケーションパフォーマンスに関連付け、リアルタイムで行うこの機能は、デジタルイニシアチブ、特に常時オンのオンラインエクスペリエンスを中心に構築されたイニシアチブにとってますます重要になっています。Splunkは最近、データを活用することの経済的影響を定量化するESGに関連した調査をリリースしました。調査によると、企業は、過去12か月間で、運用データに直接起因する2760万ドル (または純利益の9.1%の増加) の最終的な改善を報告しました。

InfoQ: マイクロサービスアーキテクチャが引き起こす可観測性の課題は何ですか? Splunkはそれらをどのように解決しますか?

Rau氏: マイクロサービスには、スケーリング、市場投入までの時間などの点で多くの利点がありますが、独自の課題と高度な複雑さももたらします。マイクロサービスが実行されるインフラストラクチャは通常一時的なものであり、非常に迅速にスピンアップおよびスピンダウンします。また、サービスの個々のインスタンスは急速に拡張され、その数が増えると、サービス間の相互作用もさらに速くなり、データ量が急増し、非常に複雑な相互依存関係が生じます。多くの場合、同じマイクロサービスの複数のバージョンが同時に実行されており、これらのバージョンは1日に数回リリースされることがあります。最後に、DevOpsチームは、各マイクロサービスに最適なツールとフレームワークを見つけようとします。その結果、オープンソースとオープンスタンダードに大きく依存しています。このような環境では、従来のAPMツールは、大量のデータを処理するアプローチがサンプリングに基づき、干し草の山のトラブルシューティングを手で縫うため、問題を見逃し、速度が遅く、サイロ化され、顧客をプロプライエタリのエージェントに閉じ込めます。一方、SignalFx Microservices APMは、マイクロサービス専用に設計されています。すべてのデータを取り込んで分析し、高度なAIとストリーミング分析を使用して数秒でインサイトを得るとともに、共同設立したOpenTelemetryなどのオープンスタンダードを活用して貢献することで、それらがもたらす課題を解決します。

InfoQ: Kubernetes Navigatorが提供するインサイトの例をいくつか挙げてください?

Rau氏: Kubernetes Navigatorは、あらゆるサイズのKubernetes環境を可視化します。Kubernetes Navigatorを使用すると、DevOpsチームは、Kubernetesの大規模な運用に関連する複雑さをナビゲートすることで、パフォーマンスの問題を検出、トリアージ、および解決できます。Kubernetes Navigatorは、DevOpsチームがトラブルシューティングを迅速化するのに役立ち、Kubernetesクラスタの状態を即座に理解する方法を提供します。パフォーマンスの異常の背後にある「理由」を理解するために、Kubernetes NavigatorはAI主導の分析を使用します。これにより、インサイトと推奨事項が自動的に表示され、Kubernetesクラスタ全体で異常を引き起こしている原因がノード、ポッド、コンテナ、ワークロードなどの何かを答えます。そのような例の1つは、ノイズの多い隣人の問題です。アプリケーションワークロードは、共有インフラストラクチャリソース全体でKubernetesによって動的に管理されるコンテナで実行されます。メモリ制限の単純な設定ミスによって引き起こされる可能性のあるノイズの多い隣人は、特定のノードのメモリ消費を増加させ、そのノードの残りのコンテナとアプリケーションワークロードに影響を与える可能性があります。これにより、エンドユーザがアプリケーションを操作するときにパフォーマンスの低下やエラーが発生する可能性があります。Kubernetes Navigatorなしでは、DevOpsチームは個々のノード、ポッド、またはワークロードの調査にかなりの時間を費やしていました。Kubernetes Navigatorは、トリアージとトラブルシューティングの時間を短縮することを目的として、特定のポッドまたはワークロードが異常を引き起こしている可能性があることを提案します。サービスとインフラストラクチャ全体で統一された相関ビューにより、DevOpsチームは、影響を受けているサービスの特定のインスタンスを迅速に特定できます。

InfoQ: プロダクト中心のクラウドおよびマイクロサービスの世界では、インフラストラクチャとアプリケーションの境界線はどこにありますか?

Rau氏: 今日のますますプロダクト中心となる世界で生き残り、繁栄するためには、インフラストラクチャとアプリケーションに等しく焦点を当てる必要があります。エンドユーザとのやり取りは、今日のすべてのビジネスの中核であり、その経験は脆弱です。アプリケーションのロードを長時間待たなければならないエンドユーザは、根本原因がインフラストラクチャにあるのかアプリケーションにあるのかを気にしません。そのため、アプリケーションとインフラストラクチャの両方の統合されたフルスタックビューを持ち、2つを相互に関連付けることができることは非常に重要であり、収益、そして最終的には全体的なブランドロイヤルティに直接影響を与える可能性があります。もう1つの考慮事項は、クラウドインフラストラクチャがソフトウェアで定義され、一時的なものになりつつあるという意味での進化です。開発者は、データセンタでサーバをラックおよびスタックするためにITチームに依存する必要がなくなりました。クラウドプロバイダにアクセスするだけで、マウスボタンを数回クリックするだけで、必要なインフラストラクチャリソースを数分でプロビジョニングできます。また、インフラストラクチャを完全に抽象化するサーバレス機能を使用することもできます。このインフラストラクチャの進化は、イノベーションとソフトウェアの提供を加速するために重要です。

InfoQ: Splunkは、ChatOpsおよびサービスデスクまたはServiceNow、Jira Service Desk、Cherwellなどのインシデント管理ソリューションとどのように統合されますか?

Rau氏: SplunkのVictorOpsインシデント対応システムは、ServiceNowなどのサービスデスクやSlackなどのチャット指向のツールと緊密に統合されています。ServiceNowのインシデントチケットはVictorOpsのインシデントと関連付けられており、チケットのすべての更新とクローズはServiceNowとVictorOpsの間で同期されます。同様に、VictorOpsはSlackと統合されています。インシデントが開かれると、Slackチャネルが開かれ、そのチャネルで発生するチャットがSlackとVictorOpsの間で同期されます。Slackコマンドを使用して、イベントをエスカレーション、スヌーズ、クローズすることもできます。組み合わせると、VictorOpsはServiceNowとSlack間で同期できるため、運用チームと開発者は好みのツールでチャットできますが、VictorOpsはすべてをログに記録します。チームは、インシデントレビュー後のレポートのために人々の間の相互作用をキュレートすることもできます。

InfoQ: Cloud Native Computing Foundation (CNCF) のゴールドメンバーになるとはどういう意味ですか?

Rau氏: 私たちは、オープンソースへのコミットメントを示し、DevOpsコミュニティとの関係を深めるためのゴールドメンバーになりました。Splunkは、数多くのプロジェクトへの提供と貢献により、長年にわたってオープンソースに積極的に関わってきましたが、この取り組みは、SignalFx、OpenTelemetryプロジェクトの創設者であるOmnitionなどの買収によって加速しました。私たち自身のCNCFの貢献には、メンテナと貢献者の両方として、CortexPrometheusEnvoyFluentdなどのプロジェクトが含まれています。最近では、私たちのチームはOpenTelemetryプロジェクトを実現することに焦点を当てており、独自の重量のあるパフォーマンスに影響を与えるエージェントを避けながら、アプリケーションからデータを収集する際の柔軟性を開発者に提供しています。

CNCFのプロジェクトの詳細については、CNCF Cloud Native Interactive Landscapeを確認してください。

この記事に星をつける

おすすめ度
スタイル

BT