InfoQ ホームページ GPU に関するすべてのコンテンツ

ニュース

RSSフィード

最新前の記事

AIと機械学習、データエンジニアリング

Hugging FaceがGPU全体の効率的LLMトレーニングに関するガイドを公開

Hugging FaceがUltra-Scale Playbook: Training LLMs on GPU Clusters、GPU クラスター全体で大規模言語モデル（LLM）をトレーニングする際の方法論と技術について詳細に探究するオープンソースのガイドを公開した。このプレイブックはスループット、GPU利用率、トレーニング効率の最適化に焦点を当て、最大512GPUを使用して実施された4000以上のスケーリング実験に基づいている。大規模モデルトレーニングに取り組む研究者やエンジニアに実践的なガイダンスを提供することを目的としており、再現可能なベンチマーク、実装の詳細、パフォーマンス最適化を提供している。

Daniel Dominguez 翻訳者 Hiroaki.Sugimura
投稿日 2025年3月26日午前1時30分
AIと機械学習、データエンジニアリング

NVIDIAが初のパーソナルAIコンピューター、Arm搭載Project Digitsを発表

200Bパラメータ・モデルを実行可能なNvidia Project Digits は新しいNvidia GB10 Grace Blackwell Superchipを搭載し、AIモデルのファインチューニングと実行を開発者がローカルマシンでできるようにする。3,000ドルからスタートするProject DigitsはAI研究者、データサイエンティスト、学生をターゲットとしており、デスクトップシステムを使ってモデルを作成し、クラウドやデータセンターのインフラストラクチャにデプロイすることを可能にする。

Sergio De Simone 翻訳者 null
投稿日 2025年1月17日午前7時30分
AIと機械学習、データエンジニアリング

Meta社のリアルタイム音声翻訳AIシステムに向けたResearch SuperCluster

Meta社のエンジニアリング部門の最近の記事から、同社がリアルタイム音声翻訳、言語処理、コンピューター・ビジョン、拡張現実 (AR)の進歩に使用されるResearch SuperCluster (RSC)インフラをどのように構築しているかが明らかになった。

Vinod Goje 翻訳者 Kazuki.Shimatani
投稿日 2024年10月26日午後4時23分
Cloud

AWS、NVIDIA H100 Tensor Core GPUを搭載したEC2 P5eインスタンスの一般提供を発表

Amazon Web Services（AWS）は、AI、機械学習、ハイパフォーマンス・コンピューティング（HPC）アプリケーション向けのコンピューティング・インフラを強化するため、NVIDIA H100 Tensor Core GPUを搭載したAmazon EC2 P5eインスタンスを正式にリリースした。

Steef-Jan Wiggers 翻訳者 Takashi Kawase
投稿日 2024年10月18日午前4時30分
AIと機械学習、データエンジニアリング

Meta社、24000基以上のGPUから成るAIインフラ設計を発表

Meta社はこの程、2つの新しいAIコンピューティング・クラスターの設計を発表し、それぞれ24,576基のGPUを搭載している。これらのクラスタはMeta社のGrand Tetonハードウェア・プラットフォームに基づいており、1つのクラスタは現在Meta社の次世代モデルである、"Llama 3"のトレーニングに使用されている。

Anthony Alford 翻訳者 Takamasa Sugawara
投稿日 2024年4月18日午前2時30分
AIと機械学習、データエンジニアリング

NVIDIA、エッジでAIアプリを実行するMetropolis Microservices for Jetsonを発表

NVIDIAは、Nvidia Metropolis MicroservicesクラウドベースのAIソリューションを拡張し、NVIDIA Jetson組み込みプラットフォームで実行できるようにした。

Sergio De Simone 翻訳者 Kumi Yoshikawa
投稿日 2024年3月5日午前12時31分
DevOps

LeftoverLocalsがApple、Qualcomm、AMDのGPUに関するLLMの回答をリークする可能性

セキュリティ企業Trail of Bitsは、Apple、Qualcomm、AMD、Imagination GPUのGPUローカルメモリから悪意ある行為者がデータを復元できる脆弱性を公表した。LeftoverLocalsと名付けられたこの脆弱性は、大規模言語モデル（LLM）や機械学習（ML）モデルなど、GPUを使用するあらゆるアプリケーションに影響を及ぼす。

Sergio De Simone 翻訳者 Takashi Kawase
投稿日 2024年2月7日午前1時31分
AIと機械学習、データエンジニアリング

NVIDIAが次世代AIハードウェアH100 GPUとGrace CPUスーパーチップを発表

最近のGTC会議で、NVIDIAは、AIコンピューティング用の次世代プロセッサを発表した。H100 GPUとGrace CPUスーパーチップである。H100はNVIDIAのHopperアーキテクチャをベースとしており、そこにはAIモデルのトレーニングを高速化するためのTransformer Engineが含まれている。Grace CPUスーパーチップは144個のArmコアを備えており、SPECrate 2017_int_baseベンチマークでNVIDIAの現在のデュアルCPU製品の性能を上回っている。

Anthony Alford 翻訳者編集部T _
投稿日 2022年5月25日午後6時56分
AIと機械学習、データエンジニアリング

3世代のtensorプロセッシングユニットから得られた10の教訓

GoogleのTPUグループが発行した最近のレポートでは、3世代のテンソルプロセッシングユニットの開発から得られた10のポイントが挙げられている。著者はまた、彼らの以前の経験が将来のtensorプロセッシングユニットの開発にどのように影響するかについても議論している。

Sabri Bolkar 翻訳者編集部T _
投稿日 2022年4月27日午後9時39分
Cloud

Microsoftが重いグラフィックス処理向けにNVads A10 V5 Azure VMをプレビュー版で発表

Microsoftは最近、プレビュー版としてNVads A10 v5シリーズを発表した。この仮想マシン（VM）は、NVIDIA A10 GPUとAMD EPYC 74F3V（Milan）CPUを搭載しており、ベース周波数は3.2GHz、オールコアピーク周波数は4.0GHzとなる。

Steef-Jan Wiggers 翻訳者編集部T _
投稿日 2022年4月12日午後8時23分
AIと機械学習、データエンジニアリング

AMDがディープラーニングアクセラレーターInstinct MI200シリーズGPUを発表

AMDは最近のAccelerated Data Center Premiere Keynoteで、MI200アクセラレータシリーズのInstinct MI250xと、それよりもわずかにローエンドのInstinct MI250 GPUを発表した。

Sabri Bolkar 翻訳者編集部T _
投稿日 2021年12月14日午後9時49分
Cloud

AWSがNVIDIA A10G Tensor Core GPUを搭載したEC2インスタンス (G5) が利用可能になったと発表

先ごろ、AWS は、最大8個の NVIDIA A10G Tensor Core GPU を搭載した新しい G5 インスタンスが利用可能になったと発表した。このインスタンスは、第2世代の AMD EPYC プロセッサを搭載している。

Steef-Jan Wiggers 翻訳者 Shoji Shigeki
投稿日 2021年12月9日午後7時30分
Cloud

AmazonはGaudiアクセラレータを搭載したDL1インスタンスをリリース

Amazonは最近、Habana LabsのGaudiアクセラレーターを搭載したEC2 DL1インスタンスの一般向け提供を発表した。新しいインスタンスは、コンピュータービジョン、自然言語処理、自動運転車の認識、推奨エンジンなどのユースケース向けの深層学習モデルのトレーニングに対して、より優れた価格パフォーマンスを提供する。

Renato Losio 翻訳者編集部T _
投稿日 2021年11月16日午前1時0分
AIと機械学習、データエンジニアリング

OpenAIがAI処理最適化のためのPythonベースのプログラミング言語であるTritonをリリース

OpenAIは最新の言語Tritonをリリースした。このオープンソースプログラミング言語によって、研究者はAI処理用に非常に効率的なGPUコードを記述できる。TritonはPythonと互換性があり、ユーザはわずか25行のコードでエキスパート品質の結果を得ることができる。コードは、Tritonのライブラリを使ってPythonで記述し、GPUで実行するためにJITコンパイルされる。

Daniel Dominguez 翻訳者編集部T _
投稿日 2021年9月3日午前5時1分
Cloud

Microsoftは、Azure ND A100 V4クラウドGPUインスタンスの一般向け提供を発表

最近、Microsoftは、NVIDIA A100 Tensor Core GPUを搭載したAzure ND A100 v4 Cloud GPUインスタンスの一般向け提供を発表した。この仮想マシン（VM）は、人工知能（AI）や機械学習（ML）の処理など、高いパフォーマンスが必要で処理負荷が大きい顧客を対象としている。

Steef-Jan Wiggers 翻訳者編集部T _
投稿日 2021年7月26日午後10時20分

Login with:

アカウントをお持ちでない方

ニュース