InfoQ ホームページ 大規模言語モデル に関するすべてのコンテンツ
-
Hugging Face、オープンソースのロボットReachy 2でロボティクスの民主化を目指す
Hugging Face社は、ヒューマノイドロボットReachy 2を開発したフランスのスタートアップ企業Pollen Robotics社を買収。この買収は、ロボットの設計をオープンソース化し、開発者がそのコードを修正・改良できるようにすることで、ロボティクスをより身近にすることを目的としている。
-
AnthropicがAIの経済的影響に対処するための「Economic Futures Program」を発表
AIの経済的影響に対処するためのイニシアチブである「Economic Futures Program」の開始を発表した。同社によると、AIが世界の労働市場や生産性に与える影響が増大する中、このプログラムは貴重な洞察を提供し、AIの経済的変化を管理するための戦略の開発に寄与することを目指している。このプログラムは、Anthropic社の既存の「Economic Index」を拡充するものであり、実証的な研究やデータに基づく政策の開発、経済測定ツールの拡充に焦点を当てることで、AIが経済において果たす役割の進化をより深く理解することを目指している。
-
グーグル、Android Studio NarwhalでGeminiのエージェントモードを限定公開プレビュー
グーグルは、Gemini in Android StudioのエージェントモードをAndroid Studioの最新カナリア版「Android Studio Narwhalのプレビュー版」で限定公開したと発表した。今回公開となったエージェントモードは、複数ファイルにまたがる複雑な開発作業に特化しているという。
-
Mistral AIがMagistralをリリース、同社初の推論特化型言語モデル
Mistral AIはMagistral、透明性のある多段階推論のために構築された新しいモデルファミリーをリリースした。オープンバージョンとエンタープライズバージョンが利用可能で、構造化されたロジック、多言語出力、追跡可能な意思決定をサポートする。
-
Google LabsがOpalを発表、AIミニアプリ作成用ビジュアルプラットフォーム
Google LabsはOpal、ユーザーが自然言語記述とビジュアルワークフローエディタを通じてAI駆動ミニアプリケーションを作成できる実験的なノーコードツールを発表した。現在パブリックベータ版でアメリカ合衆国でのみ利用可能、Opalはプログラミングスキル不要でAIアプリケーション構築プロセスをシンプル化することを目的としている。
-
Google、オープンソースのクロスプロバイダーLLM評価ツールLMEvalを公開
LMEvalは、AI研究者や開発者が異なる大規模言語モデル(LLM)の性能を比較するのを支援することを目的としている。正確性、マルチモーダル対応、使いやすさを重視して設計されており、安全性やセキュリティの観点から主要なモデルの評価にすでに使用されている。
-
GoogleがGemini CLIをローンチ:開発者用オープンソースターミナルAIエージェント
GoogleはGemini CLI、Gemini 2.5 Proモデルの全機能を開発者ターミナルに直接提供する新しいオープンソースのAIコマンドラインインターフェースをリリースした。柔軟性、透明性、開発者優先のワークフローを重視して設計されており、Gemini CLIは軽量でローカルにアクセス可能なインターフェースを通じて高性能な自然言語AIアシスタンスを提供する。
-
Gemma 3がモバイルAI推論を拡張するための斬新な手法を導入
昨年5月に初期プレビュー版が公開されたGemma 3nが正式に利用可能となった。モバイル優先のオンデバイスAIアプリケーションを対象としており、効率を向上させ、性能を改善するための新しい技術、Per-Layer EmbeddingsやTransformer Nestingといった手法が含まれる。
-
Meta社、AIエージェントを組み合わせた防御のためのLlamaFirewallをオープンソース化
LlamaFirewallは、プロンプトインジェクション、目標の不一致、そして安全でないコード生成からAIエージェントを保護することを目的としたセキュリティフレームワークである。AgentDojoベンチマークで評価された際には、攻撃成功率を90%以上削減する効果を達成した。さらに、開発者は新しいセキュリティガードレールを追加することでLlamaFirewallの動作を更新できる。
-
Docker Desktop 4.43がModel Runnerを拡張、新しいCompose-Kubernetes Bridgeを導入
数か月前のModel Runner導入に続いて、Docker Desktop 4.43はモデル管理の改善とOpenAI互換性の拡大によりその機能を強化した。このリリースではKubernetes構成の生成を簡素化する新しいCompose Bridgeがデビューし、Gordon AIエージェントがアップグレードされた。
-
Docker、エージェント開発向けのComposeを拡張し、クラウドオフロードサポートを統合
Dockerは、新機能を発表した。この新機能により、開発者はDocker Composeを使用してエージェントを定義、構築、実行することが可能になり、エージェント開発プロセスの効率化と反復的なタスクの削減を目指している。また、現在ベータ版として提供されているDocker Offloadは、リモートGPUコンピューティングにモデルの構築と実行をシームレスにオフロードする方法を提供した。
-
GoogleがML KitにGemini Nanoを導入、新しいオンデバイスGenAI APIを提供
ML Kitに最近追加された新しいGenAI APIは、開発者がGemini Nanoを使ってAndroidアプリでオンデバイス推論を可能にし、要約、校正、書き換え、画像説明などの機能をサポートする。
-
HashiCorp、AI統合に向けてTerraform MCP Serverをリリース
HashiCorpはTerraform MCP Server、大規模言語モデルがインフラストラクチャをコードとして扱う際の相互作用を改善するために設計されたModel Context Protocolのオープンソース実装をリリースした。リアルタイムTerraform Registryデータ-モジュールのメタデータ、プロバイダのスキーマ、リソースの定義など-を構造化された形式で公開することで、AIシステムは現在の検証済みの構成パターンに基づいて提案できるようになる。
-
Mistral AI社、ソフトウェアエンジニア向けのオープンソースLLM「Devstral」をリリース
先日、Mistral AI社が、新しいオープンソースのLLM「Devstral」のリリースを発表した。Devstralは、同社とAll Hands AI社の共同開発モデルである。ソフトウェアエンジニアリングにおけるワークフローの自動化を主な用途としており、なかでも、推論に複数のファイルやコンポーネントの横断が必要となる複雑な開発環境でのワークフロー改善に特化している。また、コーディングエージェントフレームワークを活用しており、リポジトリ全体における現実世界のプログラミング課題に取り組むことが可能だ。こうした汎用性により、コード補完機能や関数生成機能などの個別タスクに最適化された他のモデルとの差別化が図られている。
-
OpenAI社、信頼性重視の新モデル『o3-pro』を発表――ユーザーフィードバックは賛否で二極化
OpenAI社が、複雑なタスクでの信頼性や応答の分析力に注力した同社最先端モデルの新バージョンo3-proをリリースした。現時点では、ChatGPTのPro・Teamユーザーに公開されているほか、API経由でも利用が可能である。本モデルが従来の「o1-pro」モデルに置き換わる形でリリース中だ。