InfoQ ホームページ MonitoringTools に関するすべてのコンテンツ
-
Stack Overflow のモニタリングシステムの中身
Stack Exchange のアーキテクチャリードである Nick Craver 氏は最近、彼らのモニタリングシステムについて記事を書いた。彼はそのモニタリング戦略の背後にある哲学と動機について議論し、そのツール群、 Bosun、Grafana、Opserverなどについて語った。
-
低コストでシンプルなサイト監視ツール“Checkless” - 開発者とのQ&A
Steve Elliott氏は、Webサイトの稼働時間を監視する簡単で安価な方法を必要としていた。ほとんどの既製ツールは、氏にとって複雑過ぎたり、費用が高過ぎるものだったのだ。pingベースのチェックでサイトの稼働時間を監視するサーバレスツールのChecklessを氏が開発したのは、このような理由からだ。使い方次第で、さまざまな用途に利用することができる。
-
Pinterest、OpenTSDBから独自の時系列データベースに切り替え
2014年以降、Pinterestのエンジニアリングチームは、メトリクスのストアおよびクエリのためのエンジンとしてOpenTSDBを使ってきた。しかし、メトリクスデータ量の増大による様々なパフォーマンス問題のため、彼らは独自の時系列データベースを開発し、OpenTSDBから切り替えた。
-
監視プラットフォームのPrometheusがCNCF(Cloud Native Computing Foundation)から"卒業"
Cloud Native Computing Foundation (CNCF)は8月9日、オープンソースの監視ツールキットであるPrometheusが、インキュベーション段階を卒業したと発表した。プロジェクトがこの評価を達成するためには、その成長状況やドキュメント、組織のガバナンスプロセス、コミュニティに対する持続可能性と協調性のコミットメントなどを示す必要がある。
-
Uberが独自の大規模メトリクスプラットフォームM3をオープンソースとして公開
Uberのエンジニアリングチームは、社内で数年にわたって運用してきたMetricsプラットフォームのM3を、オープンソースとしてリリースした。このプラットフォームは、Graphiteベースのシステムをリプレースするために開発されたもので、クラスタ管理、アグリゲーション、コレクション、ストレージ管理、分散時系列データベース(TSDB)に加えて、独自の問合せ言語であるM3QLを備えたクエリエンジンを提供する。
-
AppDynamicsが欧州向けに新たなSaaSサービスをローンチ
アプリケーションインテリジェンスベンダのAppDynamicsは、Amazon Web Services(AWS)のEU(フランクフルト)リージョン上に展開する、新たな欧州向けSaaS(Software-as-a-Service)サービスをローンチした。
-
Thanos - 無制限ストレージを備えたスケーラブルなPrometheus
ImprobableのエンジニアリングチームがThaosをオープンソースとして公開した。Thaosはクロスクラスタフェデレーション、無制限ストレージ、クラスタを越えたグローバルクエリによって、Prometheusインストレーションの高可用性を実現するコンポーネントセットである。
-
AppDynamicsがビジネストランザクショントレースをSAP環境にまで拡大
アプリケーションのインテリジェンスとパフォーマンス管理に関するベンダで、Cisco傘下のAppDynamicsが、AppDynamics for SAPの提供開始を発表した。新たなABAPコードレベルの監視により、ユーザ向け製品からミッションクリティカルなSAPビジネスアプリケーションまで、コードレベルの洞察からユーザのタップやスワイプやクリックに至るまで、カスタマエクスペリエンスの可視化が可能になる。
-
GoogleのStackdriverモニタリングがKubernetesのデプロイ向けサポートを強化
最近終了したKubeConで、GoogleはKubernetes向けのStackdriverモニタリングのベータ版リリースを発表した。主な機能には、既存のStackdriverダッシュボードの他のメトリックとともに、Kubernetesの統一されたコンテナメトリックとログを一元的に参照できる。また、Prometheusサポートが改善した。
-
SRE(Site Reliability Engineer)の役割とは - Catchpointの調査より
Site Reliability Engineeringとは、ソフトウェアエンジニアリングとITオペレーションを横断するもので、Googleが2003年に開発し、2016年に書籍“Site Reliability Engineering, How Google Runs Production Systems”で詳説したアプローチである。ディジタルエクスペリエンスとインテリジェンスのプロバイダであるCatchpointは、416名のSRE(Site Reliablity Engineer)を対象に、SREの意味の理解を目的とする調査を実施した。
-
オブザーバビリティはテストにどう影響するのか
オブザーバビリティ(observability)は現在のシステム状況を明らかにし、ある種のテストを置き換えることができる。低リスクのアプリケーション分野であれば、オブザーバビリティをテストの代役とすることで、継続的デリバリによる迅速なフィードバックと、短時間の変更リリースが可能になる。
-
MeilleursAgentsでの分散タスク・キューの監視
不動産販売者が不動産のリストを作成して、その不動産の見積もり価格を取得できるようにするウェブサイトであるMeilleursAgentsは、Celeryベースの分散タスクキューの監視方法の詳細を共有した。Python、StatsD、Bucky、Graphite、Grafanaの組み合わせによりパイプラインが形成され、タスクのライフサイクルと実行速度が監視される。
-
MakeMyTripの大規模Eコマースサイト監視方法
オンライン旅行会社であるMakeMyTripが、モニタリングについての考え方を披露し、いくつかの記事を書いている。同社は、オープンソースのツールを使って、ハイブリッドなインフラをスタックをまたがって監視している。
-
CloudFlareのグローバルネットワークをPrometheusで監視する
Matt Bostock氏がSREcon 2017 Europeで行なった講演で、メトリックベースの監視ツールであるPrometheusが、CDNとDNS、およびDDoS対策プロバイダであるCloudFlareの持つ世界規模の分散インフラストラクチャおよびネットワーク監視においてどのように利用されているか、という話題が取り上げられた。
-
NGINXがマイクロサービスプラットフォーム, OpenShift Ingressコントローラ、Service Meshプレビュー版をリリース
NGINX IncがNGINX Application Platformをリリースした。マイクロサービス開発者のための“ワンストップショップ”を目標に、Red Hat OpenShift Container Platformでロードバランシングを実現するためのKubernetes Ingress Controllerソリューションと、Istioメッシュコントロールプレーン用サービスプロキシを含む。