InfoQ ホームページ observability に関するすべてのコンテンツ
-
ほとんどの企業が毎週障害を経験:The State of Resilience 2025 Report
Cockroach Labsが発表したThe State of Resilience 2025 Reportによると、ほとんどの組織で障害は日常的に発生しており、55%の企業で毎週、14%の企業で毎日障害が発生していると報告している。驚くべきことに調査参加者の100%が障害による収益損失を経験しており、過去12ヶ月間で100万米ドル以上の損失を報告した企業(8%)もあった。
-
PreziのPrometheusからVictoriaMetricsへの道のり
Prezi社のエンジニアリングチームは最近、Prometheusベースの監視システムからVictoriaMetricsへの移行について、コストの最適化、パフォーマンスの向上、アーキテクチャのシンプルさにフォーカスして議論した。この移行により、コストは約30%削減され、重いクエリの完了速度は30秒以上から3-7秒に短縮された。
-
PinterestによるCI可視性向上とビルド安定性強化のためのHoneycomb活用
最近、Pinterest社のMobile BuildsチームはHoneycomb、データ可視化プラットフォームを活用して継続的インテグレーション(CI)プロセスの効率と安定性を向上させた方法について議論した。チームは2021年にHoneycombを導入し、ビルドメトリクスを監視し、トレンドを分析し、パフォーマンスのボトルネックに対処できるようになった。
-
Netflixがレジリエンシー向上のためにサービスレベルで優先順位付き負荷制御を提供開始
Netflixはシステムのレジリエンスをさらに向上させるために優先順位付き負荷制御の実装を個々のサービスレベルに拡張した。このアプローチは、障害分離のために個別クラスターを維持する代わりに、必要な場合にのみ優先度の低いリクエストを制御することでクラウド容量をより効率的に使用する。
-
AWS、Elastic Container Serviceにオブザーバビリティを強化したコンテナインサイトを追加
AWSは最近、Amazon Elastic Container Service (ECS)向けにオブザーバビリティを強化したContainer Insights with Enhanced Observabilityを発表した。これは、以前Amazon Elastic Kubernetes Service (EKS)に導入された同様の機能に沿ったものだ。この新機能は、コンテナ・ワークロードのモニタリングとトラブルシューティングを改善することを目的としている。
-
Prometheus(プロメテウス)3.0は新しいUI、OpenTelemetryのサポートなどをもたらす
人気のオープンソース監視システムPrometheusのバージョン3.0がリリースされた。このツールの7年ぶりのメジャーアップグレードとなる。様々な新機能が追加され、ユーザー・エクスペリエンスの向上とワークフローの合理化を目的とした改良が施されている。
-
OpenTelemetryが継続的プロファイリングを採用、Elasticがエージェントを提供
OpenTelemetryは継続的プロファイリングをテレメトリのコア信号として取り入れたことを発表し、Elasticは継続的プロファイリング・エージェントをOpenTelemetryプロジェクトに寄贈した。
-
Ngrok Traffic Inspectorがネットワーク・トラフィックのオブザーバビリティを提供
ngrok Traffic Inspectorは、APIやサービスに向かうトラフィックのオブザーバビリティを提供し、何が起きているかをよりよく理解し、問題を特定するのに役立つ。今年初めにプレビューされて以来、Traffic Inspectorはユーザーからのフィードバックに基づいて新しい機能を獲得し、ngrokダッシュボードから正式に利用可能になった。
-
AWS、CloudWatch Application SignalsにPythonアプリケーションの自動計測を追加
AWSは、Amazon Cloudwatch アプリケーションシグナル機能にPythonアプリケーションの自動計測をサポートすることを発表した。アプリケーションシグナルは、AWS Distro for OpenTelemetry (ADOT)を使用して、コードを変更することなくPythonアプリケーションの計測を可能にする。アプリケーションシグナルは、サービスレベル目標(SLO)の監視を可能にし、いくつかのAWSのオブザーバビリティとモニタリングツールと連携する。
-
Microsoft AzureがRetinaを発表:クラウドネイティブ・コンテナ・ネットワーキング・オブザーバビリティ・プラットフォーム
Microsoft Azure Container Networkingチームは最近、Retinaというオープンソースプロジェクトを発表した。このクラウドネイティブなコンテナネットワー��ング観測可能プラットフォームによって、DevOpsエンジニアと管理者は、多様な環境にわたるワークロード・トラフィックを可視化、デバッグ、分析できるようになる。
-
エクスペディア、マイクロ・フロントエンドとGraphQL最適化でフライト検索を高速化
エクスペディアは、Webアプリケーションとモバイルアプリケーションに様々な最適化を適用することで、フライト検索を最大52%高速化した(ページ使用可能時間)。これらの改善をサポートするため、同社はアプリケーションのオブザーバビリティを改善した。Expedia FlightsのWebアプリケーションは、柔軟性、再利用性、より優れた最適化を可能にするため、マイクロ・フロントエンド・アーキテクチャ (MFA)に移行された。
-
Uber、GraphQLサブスクリプションとKafkaでマイクロサービスを使用したスケーラブルなチャットを構築
Uberは、WAMPプロトコルを使用して構築されたレガシー・アーキテクチャを、GraphQLサブスクリプションを活用した新しいソリューションに置き換えた。新しいアーキテクチャを構築した主な要因は、信頼性、スケーラビリティ、オブザーバビリティ/デバッグ可能性、そして既存のソリューションを維持するチームの能力を妨げている技術的負債にまつわる課題であった。
-
AIとFinOpsが、2024年のオブザーバビリティ革新を牽引すると予測
最近発表された記事の中で、3つの大手オブザーバビリティ(可観測性)企業が、2024年以降にオブザーバビリティ分野で見られるであろうトレンドについて予測を行っている。これらの寄稿は、AIインテグレーション、FinOps、OpenTelemetry、セキュリティとガバナンスの分野が、これからの1年でオブザーバビリティに大きな影響を与えることを提案している。
-
Grafana v10.3: 可視化、アラート、管理、ログ分析の改善
Grafana 10.3リリースでは、ビジュアライゼーション、インスタンス管理、アラート、ログ分析のための様々な機能強化が導入されている。これらのアップグレードには、メトリックの変更を追跡し、システムの健全性を可視化する機能とともに、データナビゲーションのための改良されたツールチップとズーム機能が含まれる。さらに、アラート組織とログ分析も強化されている。
-
Discord、単一サーバーで100万人以上のオンラインMidJourneyユーザーに拡大
Discordは、応答性の高いユーザー体験を維持しながら、単一サーバーで100万人以上のオンライン・ユーザーにサービスを提供するためにプラットフォームを最適化した。同社は、システム観測可能性とパフォーマンスチューニングに支えられた一連のパフォーマンスとスケーラビリティの改善で、何十億ものメッセージ通知を扇状に流す役割を担うギルドコンポーネントを進化させた。