InfoQ ホームページ パフォーマンス&スケーラビリティ に関するすべてのコンテンツ
-
AWS、Well-Architected Frameworkを再編・統合
AWSは、Well-Architected Frameworkの6つの柱すべてに変更を加え、新たなアップデートを発表した。パフォーマンス効率とオペレーショナルエクセレンスの柱は、ベストプラクティスの数を減らすために再構築・統合された。その他の柱では、再利用可能なアーキテクチャパターンに関する推奨事項や手順など、実装ガイダンスが改善されている。
-
DoorDashはどのようにキャッシュをリアーキテクトし、スケーラビリティとパフォーマンスを向上させたか?
DoorDashは、すべてのマイクロサービスで使用していたヘテロ環境(相互接続・連携に保証のないハードウェアやソフトウェアを混在させて利用している状況のこと)のキャッシュシステムを再構築し、汎用的なメカニズムを提供する共通の多層キャッシュを作成した。
-
Contentsquare、通知配信にマイクロサービスとApache Kafkaを起用
Contentsquareは、プラットフォーム内の多くのユースケースで通知機能を必要としていた。そこで同社は、マイクロサービス・アーキテクチャの一部として、複数のサービスにまたがる汎用的なソリューションを作成。この実装で、開発者はオブザーバビリティを改善し、スケーラビリティの課題を克服する必要があった。
-
本番環境におけるLLM最適化のための、Hugging Faceのガイド
大規模言語モデル(LLM)を実運用に導入する場合、2つの大きな課題は、それらが必要とする膨大な量のパラメータと、文脈情報を表現するための非常に長い入力シーケンスを扱う必要性から生じる。 Hugging Faceは、このようなモデルを扱った経験に基づき、これらのハードルに取り組むためのテクニックのリストを文書化した。
-
Cadence1.0:Uberがスケーラブルなワークフロー・オーケストレーション・プラットフォームをリリース
Uberは6年間の開発期間を経て、Cadenceと名付けられたワークフロー・オーケストレーション・プラットフォームのメジャーバージョンをリリースした。Uberや他の企業は、ネイティブのプログラミング言語を使ってステートフルなサービスを大規模に構築するためにCadenceを使用している。チームは、使いやすさ、オブザーバビリティ、効率性の向上を目標に次のリリースに取り組んでいる。
-
AWS、AI/MLおよびHPCワークロード向けAmazon EC2 P5インスタンスの一般提供を開始
AWSはこのほど、AI/MLおよびHPCワークロードで高いパフォーマンスとスケーラビリティを必要とするユーザー向けに、最新のNVIDIA H100 Tensor Core GPUを搭載したAmazon EC2 P5インスタンスの一般提供(GA)を発表した。今回のGAは、先に発表されたインフラストラクチャの開発に続くものである。
-
パフォーマンス向上、コスト最適化するAzure Cosmos DBの新機能
マイクロソフト社がコスト効率を高め、パフォーマンスを向上、順応性を高めたAzure Cosmos DBの新機能を発表した。新しく発表された機能はバースト容量 、階層パーティション・キー、1TBのサーバーレス・コンテナ・ストレージ、プライオリティ・ベースの実行である。
-
Datadog、スケーラブルなデータインジェストアーキテクチャを構築する
原文リンク(2023-06-16)Datadogは、第3世代のログストレージシステムHusky専用のデータインジェストアーキテクチャを開発した。このイベント駆動型アーキテクチャ(EDA) により正確なセマンティクスを実現、マルチテナントプラットフォームのトラフィックのバーストに対応し、妥当なインジェストレイテンシーと許容できる運用コストで対応できる。
-
Slackのリアルタイムメッセージングアーキテクチャ
Slackは最近、世界中で毎日数百万件のリアルタイムメッセージを送信する方法を公開した。同社は、リアルタイムメッセージを大規模に管理するために設計されたPub/Subアーキテクチャについて包括的な洞察を提供している。この記事では、異なるタイムゾーンや地域をまたぐリアルタイムメッセージの配信がもたらす独自の課題と、それを処理するためにSlackのエンジニアがどのようにインフラを設計したかが紹介されている。
-
BBCの新たなサーバーレスプラットフォームによりスケーラビリティとパフォーマンスが向上
新しいWebCoreサーバーレスプラットフォームへの移行から1年後、BBCは、アーキテクチャのメリットを享受し始めた。このアーキテクチャにより、パフォーマンスと運用上の課題を解決するエンジニアの負担を取り除くことができ、顧客に提供する価値に集中できるようになった。
-
NetflixのRENOがデバイス間で一貫したエクスペリエンスを実現する
Netflixは、多種多様なプラットフォームやデバイスにおいて一貫したユーザエクスペリエンスを実現するために、Rapid Event Notification System(RENO)を開発した。RENOは、タイトルの視聴からプロファイル情報の更新に至るまで、ユーザの実行したアクションに対して、従来の要求/応答モデルよりも迅速かつ確実に応答する。
-
.NET 6: スレッドの改善
非同期や並列プログラミングの複雑さを抽象化するために多数のライブラリが存在するが、それでも開発者は、時々、下位のスレッド処理ロジックへの落とし込みが必要になる。.NET6シリーズのAPIの変更に続いて、マルチスレッドのいくつかの新しい効果的な方法を見ていこう。
-
.NETの新パッケージ System.Threading.RateLimiting
レート制限(rate limiting)はWebサーバの問題として広く知られているが、同じような機能が必要になる状況は他にもたくさんある。System.Threading.RateLimitingの導入で、この機能を開発者自ら記述する必要がなくなる。
-
AWSがEC2 Auto Scalingウォームプールをリリース
AWSは最近、EC2 Auto Scaling向けのウォームプールをリリースした。これは、事前に初期化されたインスタンスのプールを維持することで、アプリケーションをスケールアウト(水平スケール)するための時間とコストを削減する。
-
GoogleがA2バーチャルマシンの一般提供を発表
先頃、Googleは、Compute EngineにNVIDIA Ampere A100 Tensor Core GPUに基づくA2バーチャルマシン (VM) の一般提供を発表した。同社によれば、A2 VMにより、顧客はNVIDIA CUDA対応の機械学習 (ML) とハイパフォーマンスコンピューティング (HPC) のスケールアウトおよびスケールアップワークロードを低コストで効率的に実行できるようになる。