InfoQ ホームページ apm に関するすべてのコンテンツ
-
JVMの比較を目的とする新しいパフォーマンスベンチマーク”Renaissance”
Charles UniversityとOracle Labsは、RenaissanceというJVMパフォーマンスベンチマークをリリースした。現代的な並行ワークロードに重点を置くこのパフォーマンステストでは、主としてHotSpotモードのGraalVMとOpenJDKを比較している。
-
Expo:Walmart LabsでのSpark StreamingとKafkaを使ったリアルタイムA/Bテストとモニタリング
WalmartLabsのエンジニアリングチームは、Expoと呼ばれるリアルタイムのA/Bテストツールを開発した。これは、ユーザエンゲージメントメトリックを収集し分析するものである。Spark Structured Streamingを使用して受信データを処理し、メトリクスをKairosDBに格納する。
-
HashiCorp、レイヤ7オブザーバビリティと集中型コンフィギュレーションを備えたConsul 1.5.0をリリース
Hashicorpは、同社のサービスメッシュアプリケーション兼キーバリューストアである、Consulのバージョン1.5.0をリリースした。今回のリリースは、新たなロードマップ上てリリースされた最初のバージョンであり、EnvoyによるL7オブザーバビリティとロードバランシングのサポート、集中型コンフィギュレーション、信頼済サードパーティアプリケーションのACL認証サポートを含んでいる。
-
Booking.comにおけるGraphiteのスケールアップ
Booking.comのエンジニアリングチームは、小規模クラスタで運用していた同社のGraphiteデプロイメントをスケールアップし、毎秒数百万のメトリック処理を可能にした。スケールアップの過程において、同チームは、Graphiteのコアコンポーネントであるcarbon-relayとcarbon-cache、レンダリングAPIの修正と最適化を実施した。
-
カオスエンジニアリングと可観測性 - Russ Miles氏に聞く
O'Reillyの新しいレポート "Chaos Engineering Observability: Bringing Chaos Experiments into System Observability"では,筆者のRuss Miles氏が,可観測性とカオスエンジニアリングは"密接に関連している"と考える理由が論じられている。エンジニアがカオス試験を実施する場合には,試験の対象とする下位システムに関して多くの問いかけをする必要が生じるはずだ,と氏は主張する。
-
New York Timesエンジニアリングチームによるスケーリング,インシデント管理,コラボレーション
The New York Timesのエンジニアリングチームが、2018年11月の米国中期選挙でのトラフィック増加を背景とした、 スケーリングとインシデント管理への取り組みについての記事を書いている。
-
ElasTestで実現するテスト時の可観測性
分散アプリケーシ��ンでは,非分散アプリケーションで一般的に使用されているデバッグテクニックを使うのは困難である。テスト環境においても運用時のような可観測性を実現すれば,バグの検出が容易になる,とFrancisco Gortázar氏は,European Testing Conference 2019で主張し,可観測性を使って複雑な分散システムのテストと評価を行うツールとして,ElasTestを紹介した。
-
マイクロサービスを始める時にすべきこと - Ben Sigelman氏のQCon Londonでの講演より
Ben Sigelman氏はGoogleに在籍していた数年間,我々が現在マイクロサービスアーキテクチャと呼んでいるものを開発していた。この開発中になされたいくつかの過ちが,今日では業界全体で繰り返されている,というのが氏の意見だ。QCon London 2019で行ったプレゼンテーションの中で氏は,マイクロサービスを始める時,このような過ちを避けるために行うべきことについて説明した。
-
複雑な分散システムをテストする
分散システムの複雑性はコードの中ではなく、サービスや機能の間にある。テストには問題の発見と価値提供のバランスという意味があるのだ – Sarah Wells氏はEuropean Testing Conferenceで、このように説明した。テスタはしばしば、システム動作の最大の理解者である。システムのどこが悪いのかについて優れた仮説を持ち、それを極めて短期間に検証することができるのは彼らなのだ。
-
Coinbaseにおけるメトリクスコレクションとログアグリゲーションの進化
CoinbaseのソフトウェアエンジニアであるLuke Demi氏は、2018年半ばからCoinbaseで実施されてきたモニタリングとロギングの変更に関する記事を書いている。Coinbaseは、ログ分析とメトリクス視覚化という2つの目的を果たすセルフマネージドのElasticsearchクラスタから、メトリクスコレクション用のDatadogとログアグリゲーション用のAWSのマネージドElasticsearchへと移行した。
-
自社開発ソリューションuMonitorとMerisによるUberの可観測性スケールアップ
Uberのインフラストラクチャは,モバイルアプリケーションやインフラストラクチャや内部サービスをサポートする数千のマイクロサービスで構成されている。これらのサービスに高い可観測性(obervability)を提供するため,UberのObservabilityチームは2つの監視ソリューションを構築した。時系列でメトリクスベースの警告を行うuMonitorと,ホストレベルのチェックとメトリクスを扱うNerisである。
-
AmazonがAWSクラウドマップ「クラウドリソースのためのサービスディスカバリ」を発表
最近のブログ記事で、Amazonはクラウドリソースを発見し追跡するAWS Cloud Mapと呼ばれる新しいサービスを紹介した。マイクロサービスアーキテクチャの出現に伴い、これらのアーキテクチャで動的リソースを管理することがますます困難になっている。しかし、AWS Cloud Mapを使用すると、開発者はデータベース、キュー、マイクロサービス、およびその他のクラウドリソースの状態をカスタム名で監視できる。
-
Grafanaが時系列メトリクスにログデータ相関を追加
Grafanaチームは、メトリクスクエリやビジュアライゼーションといったGrafana機能と連携したロギングプラットフォーム、Lokiのαバージョンを発表した。Lokiは、新しいクライアントエージェントpromtailと、ログメタデータのインデックスとストレージのためのサーバーサイドコンポーネントを追加する。
-
Stack Overflow のモニタリングシステムの中身
Stack Exchange のアーキテクチャリードである Nick Craver 氏は最近、彼らのモニタリングシステムについて記事を書いた。彼はそのモニタリング戦略の背後にある哲学と動機について議論し、そのツール群、 Bosun、Grafana、Opserverなどについて語った。
-
低コストでシンプルなサイト監視ツール“Checkless” - 開発者とのQ&A
Steve Elliott氏は、Webサイトの稼働時間を監視する簡単で安価な方法を必要としていた。ほとんどの既製ツールは、氏にとって複雑過ぎたり、費用が高過ぎるものだったのだ。pingベースのチェックでサイトの稼働時間を監視するサーバレスツールのChecklessを氏が開発したのは、このような理由からだ。使い方次第で、さまざまな用途に利用することができる。