InfoQ ホームページ Neural-Networks に関するすべてのコンテンツ

ニュース

RSSフィード

最新前の記事

AIと機械学習、データエンジニアリング

PyTorch 2.5リリースにて、Intel GPUをサポート

PyTorch Foundationは最近、Intel GPUのサポートを含むPyTorchバージョン2.5をリリースした。このリリースには、FlexAttention API、TorchInductor CPUバックエンドの最適化、コンパイル時間を短縮するリージョナルコンパイル機能など、いくつかのパフォーマンス強化も含まれている。全体として、このリリースには PyTorch 2.4 以降の 4095 のコミットが含まれている。

Anthony Alford 翻訳者 Takashi Kawase
投稿日 2024年12月9日午前5時30分
AIと機械学習、データエンジニアリング

Google、ゲームシミュレーションAI「GameNGen」を発表

Googleの研究チームはこのほど、ビデオゲーム「Doom」をシミュレートできる生成AIモデル「GameNGen」に関する論文を発表した。GameNGenは、毎秒20フレーム（FPS）でゲームをシミュレートでき、人間による評価では、実際のゲームよりも好まれる頻度がわずかに低かった。

Anthony Alford 翻訳者 Takashi Kawase
投稿日 2024年10月16日午前8時31分
AIと機械学習、データエンジニアリング

大学の研究者らが新しいタイプの解釈可能なニューラルネットワークを構築

マサチューセッツ工科大学、カリフォルニア工科大学、ノースイースタン大学の研究者が、新しいタイプのニューラルネットワークを作成した、Kolmogorov–Arnold Networks（KAN）である。KANモデルは、物理モデリング・タスクにおいて、より大きなパーセプトロン・ベースのモデルを凌ぐ性能を示し、より解釈しやすい可視化を提供する。

Anthony Alford 翻訳者 Hiroaki.Sugimura
投稿日 2024年9月20日午前6時30分
AIと機械学習、データエンジニアリング

ペンシルバニア大学の研究者がプロセッサ不要の学習回路を開発

ペンシルバニア大学の研究者らが、非線形回帰などのタスクを学習できるニューラルネットワークに似た電気回路を設計した。この回路は低電力レベルで動作し、コンピューターなしで学習できる。

Anthony Alford 翻訳者 Naoko Koshimura
投稿日 2024年8月20日午前12時30分
AIと機械学習、データエンジニアリング

スタンフォード大学による、"2024 AI Index Report"公開：AI規制の成長と生成AI投資

スタンフォード大学の人間中心人工知能研究所（HAI）は、2024年AIインデックス年次報告書を発表した。同レポートは、2022年以降の生成AI投資の8倍増など、AIのトップトレンドを明らかにしている。

Anthony Alford 翻訳者 Takamasa Sugawara
投稿日 2024年7月19日午前1時31分
AIと機械学習、データエンジニアリング

Meta社、効率的な長配列モデリングのためのMEGALODON LLMをオープンソース化

先日、Meta社、南カリフォルニア大学、カーネギーメロン大学、カリフォルニア大学サンディエゴ校の研究者が、無制限の文脈長を持つ大規模言語モデル（LLM）であるMEGALODONのオープンソース化を発表した。MEGALODONは線形複雑度を持ち、様々なベンチマークにおいて同サイズのLlama 2モデルを凌駕している。

Anthony Alford 翻訳者 Naoko Koshimura
投稿日 2024年7月18日午前12時30分
AIと機械学習、データエンジニアリング

Meta社のChameleon AIモデルは、画像・テキスト混合タスクでGPT-4を上回るパフォーマンスを発揮する

Meta社のAI基盤研究(FAIR)チームはこのほど、テキストと画像が混在したコンテンツを理解・生成できる混合モーダルAIモデル「Chameleon」を発表した。人間の審査員によって評価された実験では、Chameleonの生成出力はGPT-4よりも51.6％、Gemini Proよりも60.4％で好まれた。

Anthony Alford 翻訳者 Kumi Yoshikawa
投稿日 2024年7月8日午前9時30分
AIと機械学習、データエンジニアリング

OpenAI、動作のファインチューニングのためのGPTモデル仕様を公開

OpenAIは最近、GPTモデルの動作に関するルールと目的を記述した文書、Model Specを公開した。この仕様書は、データ・ラベラーやAI研究者がモデルをファインチューニングするためのデータを作成する際に使用することを目的としている。

Anthony Alford 翻訳者 Takashi Kawase
投稿日 2024年7月2日午前7時31分
AIと機械学習、データエンジニアリング

Stability AIが3Dモデル生成AI "Stable Video 3D"をリリース

Stability AIはこのほど、1枚の2D画像から3Dメッシュオブジェクトモデルを生成できるAIモデル、"Stable Video 3D"（SV3D）をリリースした。SV3DはStable Video Diffusionモデルに基づいており、3Dオブジェクト生成ベンチマークで最先端の結果を出している。

Anthony Alford 翻訳者 Takamasa Sugawara
投稿日 2024年6月15日午前1時30分
AIと機械学習、データエンジニアリング

OpenAIが新たなファインチューニングAPI機能をリリース

OpenAIは、ファインチューニングAPIの新機能リリースを発表した。この機能により、モデル開発者はファインチューニングプロセスをよりコントロールできるだけでなく、モデルのパフォーマンスをより深く理解しやすくなるだろう。

Anthony Alford 翻訳者 Takashi Kawase
投稿日 2024年6月4日午前6時31分
AIと機械学習、データエンジニアリング

Google、ユーザーインターフェースとインフォグラフィックスを理解するAIモデル「ScreenAI」を育成

Google Researchは先日、インフォグラフィックスとユーザーインターフェースを理解するためのマルチモーダルAIモデル「ScreenAI」を開発した。ScreenAIはPaLIアーキテクチャをベースにしており、いくつもの課題において最先端の性能を記録している。

Anthony Alford 翻訳者 Takamasa Sugawara
投稿日 2024年5月18日午前1時30分
AIと機械学習、データエンジニアリング

Meta社、24000基以上のGPUから成るAIインフラ設計を発表

Meta社はこの程、2つの新しいAIコンピューティング・クラスターの設計を発表し、それぞれ24,576基のGPUを搭載している。これらのクラスタはMeta社のGrand Tetonハードウェア・プラットフォームに基づいており、1つのクラスタは現在Meta社の次世代モデルである、"Llama 3"のトレーニングに使用されている。

Anthony Alford 翻訳者 Takamasa Sugawara
投稿日 2024年4月18日午前2時30分
AIと機械学習、データエンジニアリング

研究者らが、LLMジェイルブレイク攻撃の防御アルゴリズム"SafeDecoding"のオープンソース化を発表

ワシントン大学、ペンシルバニア州立大学、アレンAI研究所の研究者が、大規模言語モデル（LLM）をジェイルブレイク攻撃から守る技術である、"SafeDecoding"のオープンソース化を発表した。SafeDecodingは、大きな計算オーバーヘッドを発生させることなく、ベースラインのジェイルブレイク防御を上回る性能を発揮する。

Anthony Alford 翻訳者 Takamasa Sugawara
投稿日 2024年4月10日午前8時30分
AIと機械学習、データエンジニアリング

RWKVプロジェクト、LLM "Eagle 7B"をオープンソース化

RWKVプロジェクトはこの程、75.2億パラメータの大規模言語モデル（LLM）である、Eagle 7Bをオープンソース化した。Eagle 7Bは、100以上の言語の1.1兆トークンのテキストで学習され、多言語ベンチマークにおいて他の同サイズのモデルを凌駕している。

Anthony Alford 翻訳者 Takamasa Sugawara
投稿日 2024年3月18日午前7時30分
AIと機械学習、データエンジニアリング

Google、2億パラメータのAI予測モデル"TimesFM"を発表

GoogleResearchは、時系列予測を目的とした200MパラメータのTransformerベースの基礎モデルである、TimesFMを発表した。TimesFMは約100Bのデータポイントで学習され、教師あり学習モデルと同等以上のゼロショット予測性能を持つ。

Anthony Alford 翻訳者 Takamasa Sugawara
投稿日 2024年3月7日午前3時30分

Login with:

アカウントをお持ちでない方

ニュース