InfoQ ホームページ Deep+Learning に関するすべてのコンテンツ
-
NVIDIAがAIをトレーニングするデータセットジェネレータDatasetGANを発表
NVIDIAの研究者は、AIビジョンモデルをトレーニングするためのデータセットを作成する注釈付きの合成画像を生成するシステムであるDatasetGANを作成した。DatasetGANは、わずか16の人による注釈付き画像でトレーニングでき、100倍以上の注釈付き画像を必要とする完全な教師ありシステムと同様に機能する。
-
研究者が生物学的に妥当なAIトレーニング方法を公開
オックスフォード大学の研究者チームは、ニューラルネットワークAIモデルをトレーニングするためのバックプロパゲーション(BP)アルゴリズムの代替として、ゼロダイバージェンス推論学習(Z-IL)と呼ばれるアルゴリズムを開発した。Z-ILは、任意のニューラルネットワークでBPの結果を正確に再現することが示されているが、BPとは異なり、脳機能の既知の原則に違反していない。
-
FacebookがZionEXプラットフォームを発表、12兆パラメータのAIモデルのトレーニングを可能に
Facebook AI Research(FAIR)の科学者チームは、独自に開発したAIハードウェアプラットフォームのZionEX上でPyTorchを使ってディープラーニングレコメンデーションモデル(DLRM)をトレーニングするシステムを発表した。このシステムを使って同チームは、最大12Tパラメータを持つモデルのトレーニングにおいて、他のシステムよりも1桁近いトレーニング時間のスピードアップを実現している。
-
オープンソースAIが暴風雨による停電を81%の精度で予測
Aalto大学とフィンランド気象研究所の科学者のチームは、暴風雨による損傷によって引き起こされる停電を予測するためのオープンソースのAIモデルを開発した。このモデルは、15km以内の暴風雨の場所を予測し、変圧器の損傷量を81%の精度で分類できるため、電力会社は停止に備え、停止に対してより迅速に修復することができる。
-
MITがAIベンチマークとなるThreeDWorld Transport Challengeを発表
MITとMIT-IBM Watson AI Labの研究者チームが、ThreeDWorld Transport Challengeを発表した。これは実装されたAIエージェント向けのベンチマークタスクである。課題は、AIエージェントの研究を改善することである。このAIエージェントは、コンピュータービジョンによって誘導されるシミュレートされた移動式ロボットを制御して、オブジェクトを拾い上げ、新しい場所に移動させるものである。
-
Perceiver:複数の入力データ型向けの単一のニューラルネットワークモデル
GoogleのDeepMind社は最近、Perceiverと呼ばれる最先端のディープラーニングモデルをリリースした。これは、人間の脳がマルチモーダルデータを認識するのと同じように、音声から画像までの複数の入力データを受信して処理するものである。Perceiverは、複数の入力データ型、つまり点群、音声、画像を受信して分類できる。
-
MicrosoftがAIトレーニングライブラリのZeRO-3オフロードをリリース
Microsoftは最近、ZeRO-3オフロードをオープンソース化した。これは、非常に大規模な深層学習モデルをトレーニングしつつも、メモリ効率を改善する、DeepSpeed AIトレーニングライブラリの拡張である。ZeRO-3オフロードを使用すると、ユーザは、単一のGPUで最大400億のパラメーター、512のGPUで2兆を超えるパラメーターを使用してモデルをトレーニングできる。
-
Alibaba Announces 10 Billion Parameter Multi-Modal AI M6
AlibabaはMulti-Modality to Multi-Modality Multitask Mega-transformer(M6)と称するAIモデルを開発した。100億のパラメータを持ち、1.9TBのイメージと292GBの中国語テキストで構成されたデータセットを使ってプレトレーニングされている。テキストガイド付きイメージの作成、VQA(Visual Question and Answering、視覚に基づく質疑応答)、イメージ-テキストマッチングなど、いくつかのダウンストリームタスクに合わせたファインチューニングが可能だ。
-
チップ設計用のGoogle Apollo AIが、深層学習のパフォーマンスを25%向上する
Google Researchの科学者は、AIアクセラレータチップの設計を最適化するためのフレームワークであるAPOLLOを発表した。APOLLOは、チップ面積を最小限に抑えながら、深層学習の推論待ち時間を最小限に抑えるチップパラメータを選択するために進化的アルゴリズムを使用する。APOLLOを使用することで、研究者は、ベースラインアルゴリズムによって選択されたものよりも24.6%の高速化を達成する設計を発見した。
-
Google DeepMindのNFNetがディープラーニングを効率化
Amazon Redshiftのユーザは、クロスデータベースクエリを実行し、Redshiftクラスタ間でデータを共有できるようになった。これは、AWSがこれらの拡張機能を一般ユーザ向けにリリースしたことによる。
-
PyTorch 1.8がリリース - 分散トレーニングを強化、AMD ROCmをサポート
Facebookの開発したオープンソースのディープラーニングフレームワークであるPyTorchが、バージョン1.8のリリースを発表した。APIがアップデートされ、分散トレーニングが改善された他、AMDのGPUアクセラレータ用のROCmプラットフォームのサポートが追加されている。ドメイン固有ライブラリであるTorchVision、TorchAudio、TorchTextの新バージョンも同時にリリースされた。
-
スタンフォードがAI Index 2021 年次報告書を発行
スタンフォード大学の人間中心人工知能研究所(HAI)は、AI Index 年次報告書を発表した。今年のレポートの基礎となるデータは、前年に比べて拡張されており、レポートには、AI研究開発に関してCOVID-19パンデミックの影響に関するいくつかの視点が含まれている。
-
GoogleがAutoMLアルゴリズムのModel Searchのソースを公開
Google Researchの研究チームが、ディープラーニングモデル用に設計された自動マシンラーニング(AutoML)プラットフォームのModel Searchを、オープンソースとして公開した。試験ではシステムの作り出したモデルが、人が設計した最高のモデルを、より少ないトレーニング回数とモデルパラメータで能力的に上回る結果が示されている。
-
TensorFlow 3D:自動運転車の3D知覚のためのディープラーニング
Googleは、TensorFlow 3Dをリリースした。これは、TensorFlow機械学習フレームワークに3Dディープラーニング機能を加えるライブラリである。新しいライブラリは、研究者が3Dシーン理解モデルを開発およびデプロイできるようにするツールとリソースを提供する。
-
Facebook、COVID-19患者の経過を予測するAIモデルをオープンソース公開
Facebook AI Research(FAIR)のチームとNew York University(NYU) School of Medicineは共同で、胸部X線を使ってCOVID-19患者の予後予測を行うディープラーニングモデルを開発した。比較調査の結果では、このモデルは人間の放射線科医を上回っており、病院における酸素吸入や集中治療の需要予測を支援するために使用できる。