InfoQ ホームページ Performance に関するすべてのコンテンツ
-
Booking.comにおけるGraphiteのスケールアップ
Booking.comのエンジニアリングチームは、小規模クラスタで運用していた同社のGraphiteデプロイメントをスケールアップし、毎秒数百万のメトリック処理を可能にした。スケールアップの過程において、同チームは、Graphiteのコアコンポーネントであるcarbon-relayとcarbon-cache、レンダリングAPIの修正と最適化を実施した。
-
Rancher Labs,Kubernetesクラスタ間のネットワークを可能にするSubmarinerをリリース
Rancher Labsは、Kubernetesクラスタ間のネットワーク接続を可能にするオープンソースプロジェクトのSubmarinerを新たにリリースした。このプロジェクトは,Kubernetesクラスタ個々のオーバーレイネットワークを接続して,"マルチクラスタ"を形成するものだ。これにより,クラスタ間の通信や,アプリケーションと分散データストア間の同期が簡単にできるようになる。
-
Spring Boot 2.2が最初のマイルストンリリースに到達,パフォーマンスとメモリ効率が向上
Spring Bootチームは先日、Spring Boot 2.2の最初のマイルストーンリリースとなるv2.2.0 M1をリリースした。パフォーマンスやメモリに関する改善の他、Kubernetesの検出、サードパーティのライブラリ更新などが行われている。さらに今回のリリースでは,140を超える問題が解決されている。また,今回のリリースから。JMXがデフォルトで無効になった。
-
カオスエンジニアリングと可観測性 - Russ Miles氏に聞く
O'Reillyの新しいレポート "Chaos Engineering Observability: Bringing Chaos Experiments into System Observability"では,筆者のRuss Miles氏が,可観測性とカオスエンジニアリングは"密接に関連している"と考える理由が論じられている。エンジニアがカオス試験を実施する場合には,試験の対象とする下位システムに関して多くの問いかけをする必要が生じるはずだ,と氏は主張する。
-
New York Timesエンジニアリングチームによるスケーリング,インシデント管理,コラボレーション
The New York Timesのエンジニアリングチームが、2018年11月の米国中期選挙でのトラフィック増加を背景とした、 スケーリングとインシデント管理への取り組みについての記事を書いている。
-
ElasTestで実現するテスト時の可観測性
分散アプリケーションでは,非分散アプリケーションで一般的に使用されているデバッグテクニックを使うのは困難である。テスト環境においても運用時のような可観測性を実現すれば,バグの検出が容易になる,とFrancisco Gortázar氏は,European Testing Conference 2019で主張し,可観測性を使って複雑な分散システムのテストと評価を行うツールとして,ElasTestを紹介した。
-
マ���クロサービスを始める時にすべきこと - Ben Sigelman氏のQCon Londonでの講演より
Ben Sigelman氏はGoogleに在籍していた数年間,我々が現在マイクロサービスアーキテクチャと呼んでいるものを開発していた。この開発中になされたいくつかの過ちが,今日では業界全体で繰り返されている,というのが氏の意見だ。QCon London 2019で行ったプレゼンテーションの中で氏は,マイクロサービスを始める時,このような過ちを避けるために行うべきことについて説明した。
-
複雑な分散システムをテストする
分散システムの複雑性はコードの中ではなく、サービスや機能の間にある。テストには問題の発見と価値提供のバランスという意味があるのだ – Sarah Wells氏はEuropean Testing Conferenceで、このように説明した。テスタはしばしば、システム動作の最大の理解者である。システムのどこが悪いのかについて優れた仮説を持ち、それを極めて短期間に検証することができるのは彼らなのだ。
-
Orchestrator、Consul、HAProxyを使用したWePayの高可用性MySQLクラスタリング
WePayのエンジニアリングチームが,HAProxy,Consul,Orchestratorで構築された新しい高可用性MySQLクラスタについて語っている。ダウンタイムを30分から40~60秒に短縮することで,それまでのアーキテクチャを改善している。
-
Coinbaseにおけるメトリクスコレクションとログアグリゲーションの進化
CoinbaseのソフトウェアエンジニアであるLuke Demi氏は、2018年半ばからCoinbaseで実施されてきたモニタリングとロギングの変更に関する記事を書いている。Coinbaseは、ログ分析とメトリクス視覚化という2つの目的を果たすセルフマネージドのElasticsearchクラスタから、メトリクスコレクション用のDatadogとログアグリゲーション用のAWSのマネージドElasticsearchへと移行した。
-
自社開発ソリューションuMonitorとMerisによるUberの可観測性スケールアップ
Uberのインフラストラクチャは,モバイルアプリケーションやインフラストラクチャや内部サービスをサポートする数千のマイクロサービスで構成されている。これらのサービスに高い可観測性(obervability)を提供するため,UberのObservabilityチームは2つの監視ソリューションを構築した。時系列でメトリクスベースの警告を行うuMonitorと,ホストレベルのチェックとメトリクスを扱うNerisである。
-
インクリメンタルなアーキテクチャアプローチ
世界中のアプリケーションのほとんどのうち、おそらく90%は、モノリシックなアプローチで動いている。オーバーエンジニアリングを避けるために、私たちはシンプルなアーキテクチャから始めて、必要に応じて進化させなくてはならない、Randy Shoup氏はReactive Summit 2018でこう語った。彼は最近発表したプレゼンテーションで、小さく始まり、やがて大規模でグローバルなインターネット会社に成長した企業での経験について説明した。
-
AmazonがAWSクラウドマップ「クラウドリソースのためのサービスディスカバリ」を発表
最近のブログ記事で、Amazonはクラウドリソースを発見し追跡するAWS Cloud Mapと呼ばれる新しいサービスを紹介した。マイクロサービスアーキテクチャの出現に伴い、これらのアーキテクチャで動的リソースを管理することがますます困難になっている。しかし、AWS Cloud Mapを使用すると、開発者はデータベース、キュー、マイクロサービス、およびその他のクラウドリソースの状態をカスタム名で監視できる。
-
Grafanaが時系列メトリクスにログデータ相関を追加
Grafanaチームは、メトリクスクエリやビジュアライゼーションといったGrafana機能と連携したロギングプラットフォーム、Lokiのαバージョンを発表した。Lokiは、新しいクライアントエージェントpromtailと、ログメタデータのインデックスとストレージのためのサーバーサイドコンポーネントを追加する。
-
Stack Overflow のモニタリングシステムの中身
Stack Exchange のアーキテクチャリードである Nick Craver 氏は最近、彼らのモニタリングシステムについて記事を書いた。彼はそのモニタリング戦略の背後にある哲学と動機について議論し、そのツール群、 Bosun、Grafana、Opserverなどについて語った。