InfoQ ホームページ 大規模言語モデル に関するすべてのコンテンツ
-
Google社、大規模言語モデル(LLM)自己修正アルゴリズムSCoReを発表
先日、Google DeepMind社の研究者が、強化学習を用いた自己修正(Self-Correction via Reinforcement Learning, 以下 SCoRe)に関する論文を発表した。このSCoReとは、数学やコーディングの問題を解く際の大規模言語モデルによる自己修正能力の向上を図る技術である。SCoReで微調整されたモデルは、ベースラインモデルと比較で、いくつかのベンチマークの性能が向上した。
-
LLMを精製し、そのパフォーマンスを超える:spaCyの創設者がInfoQ DevSummit Munichで語る
InfoQ Dev Summit Munichの第1回目のプレゼンテーションにおいて、Ines Montani氏は、今年の初めにQCon Londonで行ったプレゼンテーションに加え、実際のアプリケーションで最新の最先端モデルを使用し、その知識をより小型で高速なコンポーネントに抽出し、社内で実行・維持できるようにするための実践的なソリューションを聴衆に提供した。
-
Meta社 AIが思考の選好最適化を導入、AIモデルが反応する前に考えることを可能に
Meta FAIR、カリフォルニア大学バークレー校、ニューヨーク大学の研究者たちが、思考の選好最適化(TPO)を発表した。最終的な解答のみに注目する従来のモデルとは異なり、このアプローチでは、LLMがより正確で首尾一貫した解答を生成するために、内部的な思考プロセスを生成し、洗練させることができる。
-
OpenAIがChatGPT検索機能をリリース
OpenAIは最近、ChatGPTがユーザーの質問に答える際にウェブを検索可能にするChatGPT Search機能をリリースした。ChatGPTは、トレーニング時に利用可能な知識に制限されるのではなく、ウェブから最新の情報を取り入れ、その情報源へのリンクを含めることが可能になった。
-
GitHubとGoogle Cloudが連携し、Gemini 1.5 ProをGitHub Copilotに導入
GitHubはGoogle Cloudと提携し、Gemini 1.5 ProモデルをGitHub Copilotに導入し、開発者に最大200万トークンを扱えるAIツールを提供する。Gemini 1.5 Proは、コード生成、分析、最適化などのタスク向けに設計されており、Visual Studio Codeのようなプラットフォームで間もなく利用可能になり、大規模なコードベースを扱う開発者に柔軟性を提供する。
-
Logic Apps Standardのパブリック・プレビューで、生成AIアプリケーションのためのRAGベースの取り込みが可能に
マイクロソフトはこのほど、Logic Apps Standardのドキュメント解析とチャンキングのための組み込みアクションのパブリックプレビューを発表した。これらのアクションは、生成AIアプリケーションのRAG(Retrieval-Augmented Generation)ベースの取り込みを効率化するように設計されている。これらのアクションにより、Logic Appsはローコードで提供するAI機能にさらに投資することになる。
-
PayPal社、Cosmos.AI MLOpsプラットフォームにLLMを利用した生成AIサポートを追加
PayPal社はMLOpsプラットフォームCosmos.AIを拡張し、大規模言語モデル(LLM)を使用したジェネレーティブAIアプリケーションの開発をサポートする。同社は、ベンダー、オープンソース、自己調整LLMへのサポートを取り入れ、検索拡張生成(RAG)、セマンティックキャッシュ、プロンプト管理、オーケストレーション、AIアプリケーションのホスティングに関する機能をリリースした。
-
FirebaseのVertex AI、Gemini搭載モバイルアプリの作成を簡素化する狙い
現在ベータ版として提供されている Vertex AI SDK for Firebaseは、単純なチャットモデルやテキストプロンプトを超えたアプリの作成を可能にする。Googleはこの度、開発者がアプリに組み込むために必要なステップを支援するコラボを公開した。
-
大学の研究者がLLMにおける思考連鎖推論の分析を発表した
プリンストン大学とイェール大学の研究者が、LLMにおけるChain-of-Thought(CoT)推論のケーススタディを発表した。このケーススタディでは、暗記と真の推論の両方の証拠が示された。また、CoTは、プロンプトで与えられた例が正しくない場合でも機能することがわかった。
-
Meta社のリアルタイム音声翻訳AIシステムに向けたResearch SuperCluster
Meta社のエンジニアリング部門の最近の記事から、同社がリアルタイム音声翻訳、言語処理、コンピューター・ビジョン、拡張現実 (AR)の進歩に使用されるResearch SuperCluster (RSC)インフラをどのように構築しているかが明らかになった。
-
中国科学院大学オープンソース・マルチモーダルLLM LLaMA-Omni
中国科学院大学(UCAS)の研究者が最近、音声データとテキストデータの両方で動作するLLM、LLaMA-Omniをオープンソース化した。LLaMA-OmniはMetaのLlama-3.1-8B-InstructLLMをベースにしており、類似のベースラインモデルを凌ぐ性能を持ちながら、少ない学習データと計算量で動作する。
-
Anthropic、AIデータハンドリング強化のためのコンテキスト検索を発表
Anthropicは、AIシステムと広範な知識ベースとの相互作用における重要な進歩であるコンテキスト検索を発表した。この技術は、埋め込みや索引付けの前にテキストチャンクをコンテキスト情報を付加することで、検索拡張生成(RAG)システムにおけるコンテキスト損失の課題に対処する。
-
OpenAIがGPT-4oサポートとAPI拡張を含む.NETライブラリの安定版をリリース
6月のベータ版に続き、OpenAIが、公式.NETライブラリの安定版をリリースした。NuGetパッケージとして利用可能で、GPT-4oやGPT-4o miniのような最新モデルと、OpenAI REST APIの全機能をサポートしている。このリリースには同期および非同期APIの両方、ストリーミングチャット補完機能、そしてAPI一貫性向上のための重要な互換性のない変更が含まれている。開発者はライブラリを拡張し、.NET Standard 2.0をサポートするすべての.NETプラットフ��ーム上で使用できる。
-
AIでKubernetes管理を簡素化するIntuit Engineeringのアプローチ
Intuit社は最近、Generative AI(GenAI)を使用してKubernetesクラスタの監視とデバッグの複雑さを管理した方法について語った。GenAIの実験は、検出、デバッグ、修復のプロセスを合理化するために行われた。
-
マイクロソフト、Promptyをリリース:LLMを.NET開発に統合する新しいVS Code拡張機能
Microsoftは、GPT-4oのような大規模言語モデル(LLM)を.NET開発ワークフローに直接統合するために設計された新しいVisual Studio Code拡張機能「Prompty」をリリースした。この無料ツールは、アプリケーションにAI駆動機能を追加するプロセスを簡素化することを目的としている。公式リリースポストには、Promptyが実際のシナリオでどのように使用できるかを示す実用的な例が含まれている。