InfoQ ホームページパフォーマンス&スケーラビリティに関するすべてのコンテンツ

ニュース

RSSフィード

最新前の記事

設計/アーキテクチャ

AWS、Well-Architected Frameworkを再編・統合

AWSは、Well-Architected Frameworkの6つの柱すべてに変更を加え、新たなアップデートを発表した。パフォーマンス効率とオペレーショナルエクセレンスの柱は、ベストプラクティスの数を減らすために再構築・統合された。その他の柱では、再利用可能なアーキテクチャパターンに関する推奨事項や手順など、実装ガイダンスが改善されている。

Rafal Gancarz 翻訳者 Mitsuru Takatsuki
投稿日 2023年11月20日午前5時30分
設計/アーキテクチャ

DoorDashはどのようにキャッシュをリアーキテクトし、スケーラビリティとパフォーマンスを向上させたか？

DoorDashは、すべてのマイクロサービスで使用していたヘテロ環境（相互接続・連携に保証のないハードウェアやソフトウェアを混在させて利用している状況のこと）のキャッシュシステムを再構築し、汎用的なメカニズムを提供する共通の多層キャッシュを作成した。

Sergio De Simone 翻訳者 Takamasa Sugawara
投稿日 2023年11月17日午前10時30分
設計/アーキテクチャ

Contentsquare、通知配信にマイクロサービスとApache Kafkaを起用

Contentsquareは、プラットフォーム内の多くのユースケースで通知機能を必要としていた。そこで同社は、マイクロサービス・アーキテクチャの一部として、複数のサービスにまたがる汎用的なソリューションを作成。この実装で、開発者はオブザーバビリティを改善し、スケーラビリティの課題を克服する必要があった。

Rafal Gancarz 翻訳者 Mitsuru Takatsuki
投稿日 2023年11月7日午前7時30分
AIと機械学習、データエンジニアリング

本番環境におけるLLM最適化のための、Hugging Faceのガイド

大規模言語モデル(LLM)を実運用に導入する場合、2つの大きな課題は、それらが必要とする膨大な量のパラメータと、文脈情報を表現するための非常に長い入力シーケンスを扱う必要性から生じる。 Hugging Faceは、このようなモデルを扱った経験に基づき、これらのハードルに取り組むためのテクニックのリストを文書化した。

Sergio De Simone 翻訳者 Takashi Kawase
投稿日 2023年10月16日午前5時31分
設計/アーキテクチャ

Cadence1.0：Uberがスケーラブルなワークフロー・オーケストレーション・プラットフォームをリリース

Uberは6年間の開発期間を経て、Cadenceと名付けられたワークフロー・オーケストレーション・プラットフォームのメジャーバージョンをリリースした。Uberや他の企業は、ネイティブのプログラミング言語を使ってステートフルなサービスを大規模に構築するためにCadenceを使用している。チームは、使いやすさ、オブザーバビリティ、効率性の向上を目標に次のリリースに取り組んでいる。

Rafal Gancarz 翻訳者 Naoko Koshimura
投稿日 2023年8月24日午前12時39分
Cloud

AWS、AI/MLおよびHPCワークロード向けAmazon EC2 P5インスタンスの一般提供を開始

AWSはこのほど、AI/MLおよびHPCワークロードで高いパフォーマンスとスケーラビリティを必要とするユーザー向けに、最新のNVIDIA H100 Tensor Core GPUを搭載したAmazon EC2 P5インスタンスの一般提供（GA）を発表した。今回のGAは、先に発表されたインフラストラクチャの開発に続くものである。

Steef-Jan Wiggers 翻訳者 Tomoo Morikawa
投稿日 2023年8月19日午前12時52分
Cloud

パフォーマンス向上、コスト最適化するAzure Cosmos DBの新機能

マイクロソフト社がコスト効率を高め、パフォーマンスを向上、順応性を高めたAzure Cosmos DBの新機能を発表した。新しく発表された機能はバースト容量、階層パーティション・キー、1TBのサーバーレス・コンテナ・ストレージ、プライオリティ・ベースの実行である。

Steef-Jan Wiggers 翻訳者 Tetsuya Hanakawa
投稿日 2023年8月4日午前8時2分
設計/アーキテクチャ

Datadog、スケーラブルなデータインジェストアーキテクチャを構築する

原文リンク(2023-06-16)Datadogは、第3世代のログストレージシステムHusky専用のデータインジェストアーキテクチャを開発した。このイベント駆動型アーキテクチャ(EDA) により正確なセマンティクスを実現、マルチテナントプラットフォームのトラフィックのバーストに対応し、妥当なインジェストレイテンシーと許容できる運用コストで対応できる。

Rafal Gancarz 翻訳者 Tetsuya Hanakawa Ayako Ueno
投稿日 2023年7月12日午前5時43分
設計/アーキテクチャ

Slackのリアルタイムメッセージングアーキテクチャ

Slackは最近、世界中で毎日数百万件のリアルタイムメッセージを送信する方法を公開した。同社は、リアルタイムメッセージを大規模に管理するために設計されたPub/Subアーキテクチャについて包括的な洞察を提供している。この記事では、異なるタイムゾーンや地域をまたぐリアルタイムメッセージの配信がもたらす独自の課題と、それを処理するためにSlackのエンジニアがどのようにインフラを設計したかが紹介されている。

Eran Stiller 翻訳者 Ayako Ueno
投稿日 2023年5月24日午後3時49分
Cloud

BBCの新たなサーバーレスプラットフォームによりスケーラビリティとパフォーマンスが向上

新しいWebCoreサーバーレスプラットフォームへの移行から1年後、BBCは、アーキテクチャのメリットを享受し始めた。このアーキテクチャにより、パフォーマンスと運用上の課題を解決するエンジニアの負担を取り除くことができ、顧客に提供する価値に集中できるようになった。

Sergio De Simone 翻訳者編集部T _
投稿日 2022年4月21日午後9時14分
設計/アーキテクチャ

NetflixのRENOがデバイス間で一貫したエクスペリエンスを実現する

Netflixは、多種多様なプラットフォームやデバイスにおいて一貫したユーザエクスペリエンスを実現するために、Rapid Event Notification System(RENO)を開発した。RENOは、タイトルの視聴からプロファイル情報の更新に至るまで、ユーザの実行したアクションに対して、従来の要求/応答モデルよりも迅速かつ確実に応答する。

Patrick Zhang 翻訳者 h_yoshida _
投稿日 2022年3月22日午後8時38分
.NET

.NET 6: スレッドの改善

非同期や並列プログラミングの複雑さを抽象化するために多数のライブラリが存在するが、それでも開発者は、時々、下位のスレッド処理ロジックへの落とし込みが必要になる。.NET6シリーズのAPIの変更に続いて、マルチスレッドのいくつかの新しい効果的な方法を見ていこう。

Jonathan Allen 翻訳者大田緑
投稿日 2021年11月2日午前5時25分
.NET

.NETの新パッケージ System.Threading.RateLimiting

レート制限(rate limiting)はWebサーバの問題として広く知られているが、同じような機能が必要になる状況は他にもたくさんある。System.Threading.RateLimitingの導入で、この機能を開発者自ら記述する必要がなくなる。

Jonathan Allen 翻訳者 h_yoshida _
投稿日 2021年8月22日午後8時41分
Cloud

AWSがEC2 Auto Scalingウォームプールをリリース

AWSは最近、EC2 Auto Scaling向けのウォームプールをリリースした。これは、事前に初期化されたインスタンスのプールを維持することで、アプリケーションをスケールアウト（水平スケール）するための時間とコストを削減する。

Mostafa Radwan 翻訳者編集部T _
投稿日 2021年6月29日午後8時55分
Cloud

GoogleがA2バーチャルマシンの一般提供を発表

先頃、Googleは、Compute EngineにNVIDIA Ampere A100 Tensor Core GPUに基づくA2バーチャルマシン (VM) の一般提供を発表した。同社によれば、A2 VMにより、顧客はNVIDIA CUDA対応の機械学習 (ML) とハイパフォーマンスコンピューティング (HPC) のスケールアウトおよびスケールアップワークロードを低コストで効率的に実行できるようになる。

Steef-Jan Wiggers 翻訳者 Shoji Shigeki
投稿日 2021年5月20日午後8時11分

Login with:

アカウントをお持ちでない方

ニュース