InfoQ ホームページ generative-ai に関するすべてのコンテンツ
-
Agentica ProjectのオープンソースAIモデルDeepCoderがOpenAIのO1をコードベンチマークで上回る
Agentica ProjectとTogether AIは、Deepseek-R1-Distilled-Qwen-14Bを基盤としたオープンソースAIコードモデルDeepCoder-14B-Previewを公開した。このモデルはLiveCodeBenchで60.6%の合格率を達成し、OpenAIのO1モデルを上回り、O3-miniの性能に匹敵する結果を示した。
-
PayPal社の新たなエージェントツールキットで、MCPでAIフレームワークが決済APIと接続可能に
PayPal社は、モデルコンテキストプロトコル(MCP)を介したPayPal APIスイートとAIフレームワークの接続用のエージェントツールキットを発表した。今回発表となるツールキットで、決済API、請求書API、チャージバックAPI、配送追跡API、カタログ管理API、サブスクリプションAPI、分析機能用のAPIがAIフレームワークから直接利用可能になる。
-
Enterprise EditionにMySQL AI導入
Oracleは最近MySQL AI、MySQL Enterprise Editionでのみ利用可能な新しいAI活用機能群であり、大規模導入における分析やAIワークロード対象としている、を発表した。ベンダーロックインの懸念や最近の内部レイオフを受けて、MySQLコミュニティ全体でポピュラーなCommunity Editionの将来に対する懸念が高まっている。
-
Amazon、AIエージェント開発向けオープンソースSDK「Strands Agents」を公開
Amazon社は、AIエージェント開発をモデル駆動型アプローチで簡素化するオープンソースSDK「Strands Agents」を公開した。このフレームワークは、最小限のコードでプロンプトとツールリストを定義することでエージェントを構築できる。
-
OpenAIのGPT-5がMicrosoft Azure AI Foundryで一般提供開始
MicrosoftとOpenAIは最近、OpenAIのGPT-5モデルスイートが、企業向けAI運用統合プラットフォームであるAzure AI Foundryプラットフォームで一般提供(GA)されたことを発表した。新モデルスイートは特定ワークロードに対応するために設計されており、実世界のアプリケーション向けに最適化されている。
-
Azure AI Foundry Agent Service、プレビューでModel Context Protocolサポートを獲得
マイクロソフトは最近、Azure AI Foundry Agent ServiceにおけるModel Context Protocol (MCP)サポートのプレビューリリースを発表した。5月に一般公開されたこのサービスは人工知能(AI)エージェントの相互運用性を大幅に向上させることを目指している。
-
OpenAI、Stargateプロジェクトで世界のパートナー国にAIインフラを構築へ
OpenAIは、Stargateプロジェクトの一環として「OpenAI for Countries」という新たなイニシアチブを発表した。この取り組みは、民主主義の原則に基づいた各国でのAIインフラ構築を目指している。この拡大計画は、同社が米国でのAIインフラに5000億ドルを投資する初期計画に続くものだ。
-
Amazon QとClaude Codeが開発者CLIをAIで制御可能に
AWSは最近、高度なエージェント機能を備えたAmazon Q Developer用の拡張CLI(コマンドラインインターフェイス)エージェントを発表した。Amazon BedrockとClaude 3.7 Sonnetの推論機能を利用したこのアップグレードにより、開発者はコンテキストを切り替えることなく、ターミナル内で直接AIと作業可能になる。一方、Anthropic社は研究プレビューとしてClaude Codeを発表した。これはターミナルベースのコーディングアシスタントで、開発者はコマンドラインから直接Claudeを操作できる。
-
DeepSeek社、数学定理証明向けLLM「Prover-V2」をオープンソースで公開
DeepSeek社は、Lean 4における数学定理証明に特化した新しいオープンソースの大規模言語モデルDeepSeek-Prover-V2を公開した。このモデルは、同社の基盤モデルであるDeepSeek-V3を活用した再帰的定理証明パイプラインを基盤として構築されている。Lean 4は、Microsoft Researchが開発した最新バージョンのLean定理証明ツールであり、機械による検証が可能な形式的証明を数学者やコンピュータ科学者が記述できる対話型証明支援システムである。
-
OpenAI社がAIエージェントのウェブ検索機能やディープリサーチ機能のベンチマーク評価を実現する「BrowseComp」を発表
SimpleQAをは���めとする従来型のベンチマークは単一事実情報の収集能力評価に特化しており、ブラウジング機能搭載型GPT-4oなどの高速ブラウジング対応モデルの台頭で「飽和状態」に達している。一方、BrowseCompは数十、数百のウェブサイトを行き来しながら、情報を収集精査するエージェントの能力を計測する。 BrowseCompの問題には、端的かつ明確な回答が可能であり、参照型ソリューションとの照合で評価が容易に行える。
-
AWSはWell-Architected Generative AI Lensにおいて責任あるAIを推進
AWSは、生成AIワークロード設計と運用のベストプラクティス提供にフォーカスした、新しいWell-Architected Generative AI Lensの提供を発表した。このLensは、生成AIを使って堅牢かつコスト効率の高いソリューションを提供する責任を持つビジネスリーダー、データサイエンティスト、アーキテクト、エンジニアを対象としている。このドキュメントはクラウドに依存しないベストプラクティス、実装ガイダンス、その他のリソースへのリンクを提供している。
-
アマゾンがNova Act SDKを発表、高度なAIモデルへのアクセスを拡大
アマゾンは、開発者が基盤モデルに容易にアクセスできるように設計されたプラットフォームnova.amazon.comの導入による生成AI機能の拡張を発表した。これには、新たに発表された「Amazon Nova Act」が含まれており、これはウェブブラウザ内でアクションを実行するために特別に訓練されたAIモデルです。
-
OpenAI社、GPT-4oの画像生成機能改善を発表
OpenAI社が、ネイティブ画像生成機能を搭載したGPT-4oの新バージョンをリリースした。。今回のモデルでは、アップロード画像の修正やプロンプト指��による画像生成が可能になったほか、一貫性を保った複数バージョンの画像生成機能や画像内テキスト生成機能が改善されている。
-
VS Code Copilot用GPT-4oコード補完モデルがパブリックプレビューで利用可能に
最近、Visual Studio Code(VS Code)ユーザー向けにGPT-4o Copilotが発表された。このAIモデルはGPT-4o mini基盤の上に構築されており、30以上の広く使用されているプログラミング言語にわたる、275,000以上の高品質なパブリックリポジトリからの広範なトレーニングを含んでいる。強化トレーニングにより、より正確でコンテキストに即したコード提案を提供し、パフォーマンスの向上、開発者の生産性向上、コーディングプロセスを支援することが期待されている。
-
DeepSeek、OpenAIのo1モデルに匹敵する性能を持つDeepSeek-R1 LLMをオープンソース化
DeepSeekは推論能力を向上させるために強化学習(RL)でファインチューニングされたLLM、DeepSeek-R1をオープンソース化した。DeepSeek-R1はMATH-500やSWE-benchを含むいくつかのベンチマークで、OpenAIのo1モデルと同等の結果を達成している。