InfoQ ホームページ Performance に関するすべてのコンテンツ
-
本番環境におけるLLM最適化のための、Hugging Faceのガイド
大規模言語モデル(LLM)を実運用に導入する場合、2つの大きな課題は、それらが必要とする膨大な量のパラメータと、文脈情報を表現するための非常に長い入力シーケンスを扱う必要性から生じる。 Hugging Faceは、このようなモデルを扱った経験に基づき、これらのハードルに取り組むためのテクニックのリストを文書化した。
-
分散PostgreSQLベンチマーク:Azure Cosmos DB、CockroachDB、およびYugabyteDB
マイクロソフト社はこのほど、分散PostgreSQLベンチマークの結果について説明し、Azure Cosmos DB for PostgreSQL、CockroachDB、Yugabyteの処理性能と、価格の効率を比較した。実行の際のトレードオフが異なるため、結果としてはAzure Cosmos DBの方が高い処理能力を示したものの、分散データベースのベンチマークの課題が浮き彫りになった。
-
S3 Glacier Flexible_Retrieval, S3 Batch Operationsにより標準検索が高速化
先日、AWSはS3 Glacier Flexible Retrievalからの標準的な検索をより高速化することを発表した。同社によると、この検索は最大85%高速化され、S3 Batch Operations使用時のStandard検索層に適用される。
-
「Redis 7.2で、拡張性のある検索・自動階層化・トリガー・関数が利用可能に」
Redis Inc.は先日、Redis 7.2正式リリースを発表した。Redis 7.2には自動階層化、ネイティブ・トリガー、およびベクトル類似検索(VSS)など、クエリーや検索シナリオのパフォーマンスを向上させる拡張可能な検索機能のプレビューなどの新機能を含んでいる。
-
Netflixにおける ゼロ・コンフィギュレーション・サービスメッシュの実装。
Netflixはこの投稿で、EnvoyコミュニティとKinvolkと協力して、Lyft が開発したオープンソース プロキシであるEnvoyの新機能を実装した理由について説明している。On-Demand Cluster Discoveryと呼ばれるこの新機能は、Netflixが設定不要のサービスメッシュを実装するのに役立った。
-
Grafana BeylaはeBPFを通じて自動計測によるオブザーバビリティを提供する
Grafanaは、オープンソースのeBPF自動計測ツールであるGrafana Beyla をリリースした。Beylaは、Linux HTTP/SとgRPCサービスの両方のスパン情報とREDメトリクス(Rate-Errors-Duration)をレポートできる。これは、プローブを挿入するためにコードを修正することなく実現される。
-
ハイパフォーマンス・コンピューティング・ワークロードのための新しいGoogle Cloud H3仮想マシンシリーズがプレビューされる
Googleは最近、高性能コンピューティング(HPC)ワークロード向けに設計された新しいH3仮想マシン(VM)シリーズを発表した。同シリーズのVMは、Compute EngineおよびGoogle Kubernetes Engine(GKE)ユーザー向けにパブリックプレビュー版が提供されており、88コア(同時マルチスレッド無効)と352GBのメモリを搭載している。
-
Pinterest、KubernetesとApache Helixで非同期コンピューティング・プラットフォームを刷新
Pinterestは次世代の非同期コンピューティング・プラットフォームであるPacerを開発し、大きくなり過ぎてスケーラビリティと信頼性の課題が生じた旧ソリューションであるPinlaterを置き換えた。新しいアーキテクチャは、ジョブ実行ワーカーのスケジューリングにKubernetes、クラスタ管理にApache Helixを活用している。
-
LinkedIn、マイクロサービス統合にプロトコルバッファを採用し、レイテンシを最大60%削減
LinkedInは、プラットフォーム全体でマイクロサービス間のデータ交換を効率化するためにProtocol Buffersを採用し、オープンソースのRESTフレームワークであるRest.liと統合した。全社的な展開後、レイテンシを最大60%削減し、同時にリソース利用率も向上した。
-
マイクロソフト、Azure Application Gateway for Containersのプレビューを発表
マイクロソフト社は先日、Kubernetesクラスタで実行されるワークロード向けの新しいアプリケーション(レイヤー7)負荷分散および動的トラフィック管理製品であるAzureApplication Gateway for Containersのプレビューを発表した。これはAzureのアプリケーショ���負荷分散ポートフォリオを拡張するもので、Application Gateway製品シリーズの新しい製品だ。
-
AWS、AI/MLおよびHPCワークロード向けAmazon EC2 P5インスタンスの一般提供を開始
AWSはこのほど、AI/MLおよびHPCワークロードで高いパフォーマンスとスケーラビリティを必要とするユーザー向けに、最新のNVIDIA H100 Tensor Core GPUを搭載したAmazon EC2 P5インスタンスの一般提供(GA)を発表した。今回のGAは、先に発表されたインフラストラクチャの開発に続くものである。
-
AmazonがCloudWatch LogsにLive Tailを導入し、ログのリアルタイムな探索を実現
Amazonは、ほぼリアルタイムでログを分析するオプション、CloudWatch Logs Live Tailを発表した。現在AWSコンソールでのみ利用可能なこのインタラクティブなログ分析機能は、開発者がアプリケーションの異常を検出してデバッグするのに役立つ。
-
パフォーマンス向上、コスト最適化するAzure Cosmos DBの新機能
マイクロソフト社がコスト効率を高め、パフォーマンスを向上、順応性を高めたAzure Cosmos DBの新機能を発表した。新しく発表された機能はバースト容量 、階層パーティション・キー、1TBのサーバーレス・コンテナ・ストレージ、プライオリティ・ベースの実行である。
-
Cloudflare(クラウドフレア)、ウェブパフォーマンスの最適化を自動化するスマートヒントを導入
CloudflareはSmart Hintsを導入し、Early HintsとFetch Prioritiesの手動設定を不要にした。Cloudflareのネットワークを活用することで、Smart Hintsは最適化プロセスを合理化し、手動設定を必要とせずにパフォーマンスを改善することを目指している。
-
JDK 21の構造化並行処理:並行プログラミングの飛躍的な進歩
JEP 453「構造化同時実行(プレビュー)」は、JDK 21のTargetedステータスから統合された。以前はインキュベートAPIであったが、この最初のプレビューでは、過去2回のインキュベートからのフィードバックに対応した機能強化が盛り込まれている。JEP 428「構造化同時実行(インキュベーター」(JDK 19で提供)、JEP 437「構造化同時実行(セカンドインキュベーター)」(JDK 20で提供)。現在の提案における唯一の重要な変更は、StructuredTaskScope::fork(...)メソッドがFutureではなくSubtaskを返すということである。これはプレビュー機能である。