InfoQ ホームページ Deep+Learning に関するすべてのコンテンツ
-
NLPライブラリのspaCy 3.0にTransformerベースのモデルと分散トレーニングが追加
AIソフトウェアメーカーのExplosionは、オープンソースの自然言語処理(NLP)ライブラリであるspaCyのバージョン3.0を発表した。新しいリリースには、最先端のTransformerベースのパイプラインと17言語用の事前トレーニング済みモデルが含まれている。
-
Googleは兆パラメータのAI言語モデルSwitch Transformerをオープンソース化
Google Brainの研究者は、自然言語処理 (NLP) AIモデルであるSwitch Transformerをオープンソース化した。このモデルは、最大1.6兆のパラメータにスケールアップし、T5 NLPモデルと比較して最大7倍のトレーニング時間を改善し、同等の精度を実現する。
-
OpenAIが画像生成用のGPT-3モデルを発表
OpenAIは、GPT-3に基づいて12BパラメーターAIモデルをトレーニングした。GPT-3では、テキストの説明から画像を生成することができる。説明では、オブジェクトの位置や画像の遠近法など、多くの独立した属性を指定できる。そして、現実の世界には存在しないオブジェクトの組み合わせを合成することもできる。
-
Facebookが多言語音声認識ディープラーニングモデルをオープンソース化
Facebook AI Research(FAIR)はクロスリンガル音声認識(XSLR)、多言語音声認識AIモデルをオープンソース化した。XSLRは53の言語でトレーニングされており、一般的なベンチマークで評価すると、既存のシステムよりも優れている。
-
TensorFlow 2.4がリリース、CUDA 11のサポートとAPIアップデート
TensorFlowプロジェクトは、同ディープラーニングフレームワークのバージョン2.4.0リリースを発表した。CUDA 11とNVIDIAのAmpere GPUアーキテクチャのサポートに加えて、分散トレーニングのための新たなストラテジとプロファイリングツールを備えている。その他のAPIのアップデートには、Kerasでの混合精度演算(mixed-precision)とNumPyフロントエンドが含まれる。
-
GoogleとMicrosoftのAIモデル、言語理解ベンチマークにおいて人間の能力を凌駕
GoogleとMicrosoft、それぞれの研究チームが先頃、SuperGLUEベンチマークで人の基準点より高いスコアを持つ自然言語処理(NLP)AIモデルを開発した。SuperGLUEは、質問応答(question answering)や読解など、いくつかの言語理解(NLU)タスクにおけるモデルのスコアを測定するものだ。
-
DeepMindのAlphaFold2 AIが50年来の生物学の課題を解決
タンパク質構造予測センターはAlphaFold2がタンパク質構造予測の課題を解決したことを発表した。AlphaFold2はDeepMindによって開発されたAIシステムである。AlphaFold2は、グローバル距離テスト(GDT)メトリックで92.4の中央値スコアを達成した。これは、従来の方法との競合と見なされるしきい値を上回っている。
-
マシンラーニングを採用した分子動力学シミュレーションがGorden Bell Prizeを受賞
2020年のAssociation for Computing Machinery(ACM) Gordon Bell Prizeは、米国と中国の機関からの研究者チームによる、"Pushing the limit of molecular dynamics with ab initio accuracy to 100 million atoms with machine learning"と題されたプロジェクトに与えられた。
-
Caltechが偏微分方程式を解くAIをオープンソースとして公開
CaltechのDOLCITグループの研究者たちが、偏微分方程式(partial differential equations、PDE)を解くディープラーニングメソッドのFouries Neural Operator(FNO)をオープンソースとして公開した。FNOは既存の他のディープラーニングテクニックを性能面で凌駕しており、従来のソルバよりも3桁高速に処理することができる。
-
トレンドマイクロ、ユーロポール、UNICRIがAI悪用のレポートを公開
トレンドマイクロ、ユーロポールの欧州サイバー犯罪センター(EC3)、国連地域間犯罪司法研究所(UNICRI)は、AIの現在および将来の犯罪となる悪用に関するレポートを共同で作成した。このレポートには、政策立案者、法執行機関、サイバーセキュリティの専門家向けの一連の準備に関する推奨事項も含まれている。
-
FacebookがゲームプレーAIのReBeLをオープンソースとして公開
Facebook AI Researchは、ポーカーのトッププレイヤを破る実力を備えた、不完全情報ゲーム(imperfect-information game)をプレーする同社の新たなAIであるRecursive Belief-based Learning(ReBeL)の論文を発表した。採用されたアルゴリズムは強化学習と状態空間検索を組み合わせたもので、任意の2プレイヤ型ゼロサムゲームをNash近傍に収束する。Liar's Diceをプレーしてアルゴリズムをトレーニングするためのコードは、オープンソースとして公開されている。
-
MediaPipeがモバイルデバイス向けにホリスティックトラッキングを提供
ホリスティックトラッキングはMediaPipeの新機能であり、モバイルデバイスで体と手のポーズと顔の位置を同時に検出できる。この3つの機能は、以前は個別に利用できた。しかし、現在は単一の高度に最適化されたソリューションに統合されている。
-
GoogleがIoT AI用の新たなCoral APIをリリース
Googleは同社のCoral AIツールキット用のAPIとツールを新たにリリースした。C++とPythonのSDKが機能的に同等になり、メモリ使用効率が向上した他、レーニング済モデルが追加され、モデルパイプラインが一般向け提供(GA)になった。
-
Googleが3Dオブジェクト認識AI向けのObjectronデータセットをリリース
Google ResearchはObjectron Datasetのリリースを発表した。3Dオブジェクト認識用の機械学習データセットである。データセットには、15,000のビデオセグメントとグラウンドトゥルースアノテーション付きの4,000,000の画像が含まれている。また、データを使用してAIモデルをトレーニングするためのツールが含まれている。
-
Spark AI Summit 2020の注目点: Spark 3.0のパフォーマンス改善のイノベーション
初めてオンラインで開催された先頃のSpark AI Summit 2020で、注目点は、Spark SQLの最適化やGPUアクセラレーションなど、Apache Spark 3.0のパフォーマンスを改善するためのイノベーションだった。