InfoQ ホームページ distributed-tracing に関するすべてのコンテンツ
ニュース
RSSフィード-
JaegerとUberのCRISPを使ったマイクロサービスコールのクリティカルパス分析
マイクロサービスベースのシステムでエンドツーエンドの遅延を減らすために最適化する必要のあるサービスを見つけることは課題である。コールグラフが複雑すぎて読み取れない場合があるためだ。Uberはこの問題を解決するために開発されたCRISPと呼ばれるオープンソースツールについて説明した。このツールでは、コールグラフでクリティカルパスを見つける。クリティカルパスによって、最適化することでシステム全体に利益がある操作を特定できる。
-
Datadogがダークローンチ監視のベストプラクティスを公開
Datadogは先頃、ダークローンチ(Dark Launch)に関するベストプラクティスを公開した。そのブログ記事には、ダークローンチと、まざまなメトリクスやダッシュボード、さらには監視のためのベストプラクティスが詳細に説明されている。
-
OpenTelemetryがPythonおよびSwift Tracing API/SDKを1.0に移行
OpenTelemetryは、PythonおよびSwiftの分散トレースAPIとSDKのバージョン1.0をリリースした。どちらにも、OpenTelemetry APIサポート、SDK、一般的なテレメトリ形式へのエクスポーター、入門用資料が含まれている。Pythonリリースは安定版と考えられているが、Swiftリリースはまだベータ版である。
-
OpenTelemetry仕様が1.0に到達、安定性の保証と新たなリリース候補を提供
OpenTelemetry仕様がv1.0.0に到達した。このマイルストンには、安定性の向上と後方互換性の保証に加えて、多くの言語で使用可能なAPIとSDKのリリース候補が含まれている。また、今回のリリースで、トレースAPIとトラッキングSDKが安定版となった。
-
AWSがElasticsearch Serviceに分散トレースを追加
Amazonは、Amazon Elasticsearch ServiceにTrace Analyticsの追加を発表した。Trace Analyticsは、OpenTelemetryをサポートし、サービスに分散トレースを追加する。この新機能は、AWS Distro for OpenTelemetryとも統合される。
-
Lightstepは新しいChange Intelligence機能でトレースとメトリックを結び付ける
Lightstepは、可観測性プラットフォームに多くの改善をリリースした。これらには、OpenTelemetryメトリックのネイティブサポート、新しい基礎となる時系列データベース、およびChange Intelligenceが含まれる。これは、システムメトリックとトレースデータを統合することにより異常なパターンと影響を与える変更を結び付けるようにする新機能だ。
-
Grafanaが分散トレースシステムGrafana Tempoを発表
Grafana Labsは先頃、分散トレースバックエンドであるGrafana Tempoをリリースした。動作に必要となるのは、Amazon S3やGoogle Cloud Storage (GCS) などのオブジェクトストレージだけだ。Grafana Tempoは、既存のロギングシステムと統合して、ログ行のトレースIDからリンクを作成する。
-
Logz.ioが、PrometheusとJaegerをホストし監視プラットフォームを拡張
Logz.ioは先頃、インフラストラクチャ監視製品にPrometheus-as-a-Serviceを追加したことを発表した。このサービスには、Prometheusのメトリックコレクションが、Grafana、ELK、および最近追加されたJaegerを含むLogz.ioプラットフォームに組み込まれている。Logz.ioに含まれるデータ相関機能により、メトリック、トレース、およびログをすべて単一のプラットフォーム内で接続できる。
-
Logz.ioの調査により可観測性の大きな課題が明らかに
Logz.ioが、DevOps業界の年次調査をリリースした。今回の重点は可観測性(observability)である。調査の結果から、DevOpsと可観測性に関するツールのスプロール(sprawl)が問題化していることと、アーキテクチャの複雑化が可観測性のソリューション実装において大きな課題となっていることが明らかになった。今後1年間で、分散トレースを中心とした可観測性への投資が増大するだろう、と同社では予測している。
-
観測可能な分散システムを構築する
今日のシステムはますます複雑化している。ネットワーク上に分散し、ダイナミックにスケーリングするマイクロサービスでは、さまざまな方法で障害が発生するため、その予測は必ずしも可能ではない。可観測性(observability)を重視することにより、それまでは考えたこともなかった、システムに対する疑問を持つことが可能になる。この目的に使用可能なツールとしては、メトリクス、トレース、構造化および相関化ログなどがある。