InfoQ ホームページ Artificial Intelligence に関するすべてのコンテンツ
-
Android GenAIプロンプトAPI、Gemini Nanoで自然言語リクエストを実現
ML Kit GenAI Prompt APIIがアルファ版で利用可能となり、Android開発者はデバイス上で動作するGemini Nanoに自然言語およびマルチモーダルリクエストを送信できるようになった。このAPIは、初期のGenAIリリースで導入されたテキスト要約や画像説明の機能を拡張するものである。
-
Transformers v5、よりモジュール化され相互運用性の高いコアを導入
Hugging Face社は、Transformers v5の最初のリリース候補を発表した。このリリースは、5年前のv4リリース以来大きく進化してきたTransformersライブラリにとって重要な一歩である。Transformersは、専門的なモデルツールキットからAI開発の主要なリソースへと移行し、現在では1日あたり300万以上のインストール数を記録し、累計で12億以上のインストール数を達成している。
-
QCon AI New York 2025:「AIは機能するが、プルリクエストは機能しない:AIがソフトウェア開発ライフサイクル(SDLC)を破壊する理由とその対策」
CircleCI社の主任エンジニアであるMichael Webster氏は、2025年に初めて開催された「QCon AI New York 2025において、「AI Works, Pull Requests Don’t: How AI Is Breaking the SDLC and What to Do about it(AIは機能するが、プルリクエストは機能しない:AIがSDLCを破壊している現状とその対策)」と題した講演を行った。
-
OpenAI、GPT-5.1モデルを発表。より高速で会話的に
OpenAIは最近、GPT-5モデルのアップグレード版を公開した。GPT-5.1 Instantはデフォルトのチャットモデルであり、指示の理解力が向上している。GPT-5.1 Thinkingは推論モデルであり、より迅速で理解しやすい応答を提供する。GPT-5.1-Codex-Maxはコーディングモデルであり、長時間のタスクを効率的に実行するために圧縮技術を活用するよう訓練されている。
-
Agentica ProjectのオープンソースAIモデルDeepCoderがOpenAIのO1をコードベンチマークで上回る
Agentica ProjectとTogether AIは、Deepseek-R1-Distilled-Qwen-14Bを基盤としたオープンソースAIコードモデルDeepCoder-14B-Previewを公開した。このモデルはLiveCodeBenchで60.6%の合格率を達成し、OpenAIのO1モデルを上回り、O3-miniの性能に匹敵する結果を示した。
-
Claude Sonnet 4.5は、オープンソースの監査ツールPetriによって最も安全なLLM(大規模言語モデル)として評価された。
Claude Sonnet 4.5は、Anthropic社の新しいオープンソースAI監査ツールであるPetri(Parallel Exploration Tool For Risky Interactions)による初期評価において、「リスキーなタスク」において最も優れたパフォーマンスを示したモデルとして浮上した。
-
AnthropicがClaude Codeを拡張、Webおよびモバイルプラットフォームに
AnthropicはAI駆動開発環境Claude Codeの利用可能範囲を拡張し、Webおよびモバイルプラットフォームに対応させた。これまでClaude.aiやAPI統合を通したデスクトップアクセスに限定されていたが、今回の展開により開発者はブラウザやモバイルデバイス上で直接コーディング作業を実行および管理できるようになった。
-
Hugging FaceがmmBERTを発表、対応言語1,800以上の多言語エンコーダー
Hugging FaceはmmBERT、1,833の言語にわたる3兆以上のトークンでトレーニングされた新しい多言語エンコーダーをリリースした。モデルはModernBERTアーキテクチャを基盤としており、多言語理解タスクの長年のベースラインとなっていたXLM-Rを大幅に上回る初のモデルである。
-
AnthropicがClaudeパフォーマンス問題の背後にある3つのインフラストラクチャバグを公開
Anthropicは最近、Claudeモデルの出力品質が数週間にわたり断続的に低下していた原因について、3つの異なるインフラストラクチャのバグが関与していたことを明らかにするポストモーテムを公開した。同社はこれらの問題を解決し、同様の障害を防ぐために内部プロセスを変更していると述べているが、コミュニティは3つのハードウェアプラットフォームでサービス運用することの課題をハイライトしている。
-
LangChainがOpen SWEを発表、オープンソースの非同期コーディングエージェント
LangChainはOpen SWE、クラウド上で動作し、複雑なソフトウェア開発タスクを処理できる完全オープンソースの非同期コーディングエージェントをリリースした。同社はOpen SWEがリアルタイムの「コパイロット」アシスタントから開発者の既存ワークフローに直接統合される、より自律的で長期間稼働するエージェントへのシフトを象徴していると述べている。
-
AnthropicがSkills導入、カスタムClaudeタスク向け
AnthropicはClaudeをモジュール化された再利用可能タスクコンポーネントで拡張できるようにする新機能、Skillsを発表した。各Skillは長文の要約、APIからのデータ取得、ドメイン固有の計算の実行などの会話中に、Claudeが呼び出すことができる自己完結型機能である。
-
Dreamer 4: オフラインデータからの想像力トレーニングで目標達成を学ぶ
Google DeepMindの研究者たちは、環境との直接的な相互作用ではなく、ビデオ映像のみを用いて知能エージェントに複雑で長期的なタスクを解決する方法を教える新しいアプローチを最近発表した。彼らの新しいエージェントDreamer 4は、実際にゲームをプレイすることなく、ビデオで訓練された後にMinecraftでダイヤモンドを採掘する能力を示した。
-
OWASPがAgentic AIにおけるツール誤用を重大な脅威として警告
今年初め、OWASPはAgentic AI - Threats and Mitigationsと呼ばれるAgentic AIセキュリティに関するガイダンスをリリースした。この文書は��の新興技術を安全にデプロイする際のユニークな課題をハイライトし、防御のための緩和策やアーキテクチャパターンを提案している。
-
PayPal社の新たなエージェントツールキットで、MCPでAIフレームワークが決済APIと接続可能に
PayPal社は、モデルコンテキストプロトコル(MCP)を介したPayPal APIスイートとAIフレームワークの接続用のエージェントツールキットを発表した。今回発表となるツールキットで、決済API、請求書API、チャージバックAPI、配送追跡API、カタログ管理API、サブスクリプションAPI、分析機能用のAPIがAIフレームワークから直接利用可能になる。
-
Enterprise EditionにMySQL AI導入
Oracleは最近MySQL AI、MySQL Enterprise Editionでのみ利用可能な新しいAI活用機能群であり、大規模導入における分析やAIワークロード対象としている、を発表した。ベンダーロックインの懸念や最近の内部レイオフを受けて、MySQLコミュニティ全体でポピュラーなCommunity Editionの将来に対する懸念が高まっている。