Lightstepは、可観測性プラットフォームに多くの改善をリリースした。これらには、OpenTelemetryメトリックのネイティブサポート、新しい基礎となる時系列データベース、およびChange Intelligenceが含まれる。これは、システムメトリックとトレースデータを統合することにより異常なパターンと影響を与える変更を結び付けるようにする新機能だ。
OpenTelemetryは、テレメトリデータを生成、キャプチャ、および収集するためのオープンソース、ベンダーニュートラルのツール、API、およびSDKのコレクションを提供するCloud Native Computing Foundationのサンドボックスプロジェクトだ。このリリースでは、LightstepはOpenTelemetry Metricsをネイティブでサポートするようになった。メトリックAPIは、生の測定値の処理をサポートし、通常、これらの測定値の継続的な要約を生成することを目的としている。この統合は、Lightstepの無料のコミュニティ版でも利用できる。
このリリースでは、基礎となる新しい時系列データベース (TDSB) も導入されている。このデータベースは、GoogleのMonarchシステムの作成に携わったのと同じ人々の何人かによって構築された。Monarchとは異なり、LightstepのTLDB (Lightstep Database) は、監視データをメモリに保存することに完全には依存していない。この変更により、各データポイントへのタッチ数を最小限に抑えることができる。彼らは、テレメトリワークロードの書き込みが非常に小さい傾向があることに注意している。インメモリとオンストレージに最適なデータ構造は異なる傾向があるため、インメモリストレージの必要性を排除することで、データを単一の形式に変換できる。このタッチの最小化は、システムの全体的なコストを削減するのに役立つ。
この再構築により、すべてのアラート機能とダッシュボード機能を強化する統合クエリエンジンになった。Lightstepによって取り込まれたほぼすべてのデータはTLDBに保存され、Lightstep独自の内部アラート、ダッシュボード、およびトレースを提供するために使用されている。
Lightstepは、新しいデータベースの結果として、顕著なパフォーマンス改善を発見した。たとえば、あるユーザ向けワークロードをTLDBに移行すると、CPU使用率が半分になり、メモリ使用量が3分の2になり、ディスクストレージが80%以上削減される。
metricdb
レイテンシの改善 (Credit: Lightstep)
別の実装上の決定は、トレースとメトリックデータの分裂を回避することだった。LightstepのプリンシパルソフトウェアエンジニアのAlex Kehlenbeck氏は、次のように述べている:「コンウェイの法則が機能していることには、ある種の当然の結果があることがわかりました。データがバックエンドでサイロ化されると、製品エクスペリエンスは必然的にその事実を明らかにすることになります」新しいChange Intelligence機能は、システムのインサイトが提供するビュー内のトレースデータとメトリックデータの両方を活用することによる決定の利点を得る。
Lightstepは、Change Intelligenceを使用して、システム内で発生する変更とシステムパフォーマンスの不一致との間の結びつきを提供しようとしている。偏差をクリックして、トレースデータを介して異常につながった可能性のある変更を確認できるようになった。
これは、動作の変化を説明することに焦点を当てたシステム全体の分析を示す新しいビューにつながる。影響を与える可能性のある変更の一覧が、ベースラインパフォーマンスと選択した偏差との比較とともに一覧表示される。
Lightstepコミュニティエディションは無料で入手でき、このリリースの新機能が含まれている。より多くのデータの取り込みと保持が必要なユースケースでは、有料オプションを利用できる。