InfoQ ホームページ パフォーマンス&スケーラビリティ に関するすべてのコンテンツ
-
GoogleがA2バーチャルマシンの一般提供を発表
先頃、Googleは、Compute EngineにNVIDIA Ampere A100 Tensor Core GPUに基づくA2バーチャルマシン (VM) の一般提供を発表した。同社によれば、A2 VMにより、顧客はNVIDIA CUDA対応の機械学習 (ML) とハイパフォーマンスコンピューティング (HPC) のスケールアウトおよびスケールアップワークロードを低コストで効率的に実行できるようになる。
-
GitHubのプッシュ障害をほぼゼロにしたProject Cyclop
GitHubは数ヶ月前、時折発生していたプッシュ障害の原因を特定し、修正方法を確認するために、Project Cyclopを立ち上げた。その結果、原因がひとつではないことが明らかになったが、慎重な分析の成果として、GitHubによれば、プッシュトラフィックを最低でも1桁改善する変更がいくつか確認された。
-
MicrosoftがパブリックプレビューでAzure Monitor SQL Insights for Azure SQLを発表
先頃、MicrosoftはパブリックプレビューでAzure Monitor SQL Insights for Azure SQLを発表した。このプレビューにより、顧客はテレメトリの収集、分析、および豊富なカスタム視覚化のための柔軟なキャンバスが得られる。
-
Fastlyでネットワーク自動化
FastlyのTechOps担当のシニアディレクターであるRyan Landry氏は、ネットワークの自動化により、スーパーボウルLIVなどの人気のライブストリーミングイベント中にトラフィックのピークを管理する方法を共有した。ビデオストリームをできるだけエンドユーザの近くで配信するために、Fastlyは米国中の多数のISPに直接接続されており、ライブビデオトラフィックをパートナーとのこれらの直接パスに維持しようとしている。
-
Dropbox、改良型Brotliを使用して同期パフォーマンスを改善
いくつかの一般的なロスレス圧縮アルゴリズムをパフォーマンス分析した結果、Dropboxのエンジニアたちは、GoogleのBrotliエンコーダに少し手を加えることで、自社エンジンの同期パフォーマンス改善に成功した。同社エンジニアのRishabh Jain、Daniel Reiter Horn両氏の主張によれば、この変更により、中央値レイテンシ(median latency)とデータ転送が30パーセント以上改善された。
-
GitHubが2月中に複数回のサービスダウン - その理由は
GitHubはこの2月、同サービスに8時間以上の影響を与えた、複数回に及ぶサービス中断の原因に関する内部調査の完了を発表した。根本的な原因は、予期していなかったデータベースの負荷変動と、データベースの設定上の問題にあった。
-
Google独自のC/C++用メモリアロケータTCMallocがオープンソースとして公開へ
GoogleのTCMallocをCおよびC++の既定のメモリアロケータの置き換えとして使用することで、大規模プログラムでの効率の向上や並列性サポートの改善が実現する、とGoogleは述べている。
-
Dynein - Airbnbの開発した非同期バックグラウンドジョブサービス
Airbnbでは、大量のリソースと処理時間を要するタスクを非同期バックグラウンドジョブを移行することで、スケーラビリティの改善を測っている。ジョブスケジュールシステムは非常に重要なコンポーネントであるため、同チームでは、高度にスケーラブルなスケジューラを備えた分散型遅延ジョブキューサービスとしてDyneinを開発した。今回の記事では同社のAndy Fang氏が、このサービスの設計および開発に関する背景と課題について説明している。
-
Booking.comにおけるGraphiteのスケールアップ
Booking.comのエンジニアリングチームは、小規模クラスタで運用していた同社のGraphiteデプロイメントをスケールアップし、毎秒数百万のメトリック処理を可能にした。スケールアップの過程において、同チームは、Graphiteのコアコンポーネントであるcarbon-relayとcarbon-cache、レンダリングAPIの修正と最適化を実施した。
-
PinterestにおけるApache Kafkaのスケールアップ
Pinterestでは、リアルタイムストリーミングアプリケーションのデータ転送やロギング、監視のためのメトリクスの可視化にApache Kafkaを採用している。AWSにホストされているPinterestのKafkaインストレーションでは、レプリケーションと高可用性のためにMirrorMakerとDoctorKafkaツールが使用されている。
-
Uberのビッグデータプラットフォームが100ペタバイト超の規模に至るまで
Uberのエンジニアリングチームは、同社のビッグデータプラットフォームが、リレーショナルデータベースを使用した旧来のETLジョブから、HadoopとSparkをベースとするものへと発展した状況に関する記事を書いた。スケーラブルな取り込みモデル、標準転送フォーマット、インクリメンタルアップデートのためのカスタムライブラリが、同社プラットフォームの主要なコンポーネントである。
-
Facebookがログストレージ用分散データストアのLogDeviceをオープンソースとして公開
Facebookは、社内使用していた分散ログストレージプロジェクトのLogDeviceを、オープンソースとして公開した。レプリケーションを使用した書き込み機能、堅牢なログストレージ、障害回復機能を提供する。
-
Reactive SummitでMarketoのキャンペーンエンジンをスーパーチャージ
Marketoはマーケティングオートメーションソフトウェアで、毎月20億件以上の顧客が定義したアクションを実行している。MarketoのエンジニアリングチームのApurva Pawar、Daniel Pugliese、Dennis Bronnikov、およびPei-Chiang Maは、Reactive SummitでシステムのコアをAkkaとリアクティブアプローチでどのように書き直したのかを説明した。
-
Coinbaseはどのようにしてスケーリングの問題に対処したか
仮想通貨交換所を運営しているCoinbaseは2017年の仮想通貨ブームで同社のプラットフォームのスケーリングの問題に直面した。エンジニアリングチームはMongoDBのアップグレードと最適化やトラフィックの分離に注力し、将来のためにキャプチャとリプレイのツールを構築した。
-
Hyperledgerにブロックチェーンのパフォーマンス測定ツールCaliperが加わる
3月19日、Hyperledgerは、Technical Steering CommitteeがCaliperをHyperledgerプロジェクトとして受け入れたことを発表した。Hyperledger Caliperはブロックチェーンプロジェクトに対して、さまざまなブロックチェーン実装のパフォーマンス特性を一貫して追跡可能にするベンチマークツールである。