InfoQ ホームページ プログラミング に関するすべてのコンテンツ
-
Dev Proxy v1.3.0: HARファイル生成、LLM使用状況追跡、強化APIテスト機能
Microsoft 365開発チームはデバッグ、テスト、APIモニタリング改善を目的としたいくつかの新機能を導入したDev Proxy v1.3.0のリリースを発表した。このアップデートには標準化されたネットワークトレースのためのHARファイル生成と、AI関連コストをより明確に把握するためのOpenAI使用状況追跡を含む2つの新しいプラグインが追加され、加えて権限分析、OpenAPI仕様の生成、全体的な安定性の向上も図られている。
-
Agentica ProjectのオープンソースAIモデルDeepCoderがOpenAIのO1をコードベンチマークで上回る
Agentica ProjectとTogether AIは、Deepseek-R1-Distilled-Qwen-14Bを基盤としたオープンソースAIコードモデルDeepCoder-14B-Previewを公開した。このモデルはLiveCodeBenchで60.6%の合格率を達成し、OpenAIのO1モデルを上回り、O3-miniの性能に匹敵する結果を示した。
-
JobRunr 8.0、カーボンアウェアジョブ、Kotlinシリアライゼーション、ダッシュボード通知センターを提供
JobRunr 8.0のリリースにより、Carbon Aware Job Processingが導入された。これは、ジョブをスケジュールする際に開発者のカーボンフットプリントを最適化する新機能だ。他の新機能には、Kotlinシリアライゼーションのサポート、新しいダッシュボード通知センター、新しい@AsyncJobアノテーションが含まれており、ルーチンジョブ作成のボイラープレートを削減する。
-
Claude Sonnet 4.5は、オープンソースの監査ツールPetriによって最も安全なLLM(大規模言語モデル)として評価された。
Claude Sonnet 4.5は、Anthropic社の新しいオープンソースAI監査ツールであるPetri(Parallel Exploration Tool For Risky Interactions)による初期評価において、「リスキーなタスク」において最も優れたパフォーマンスを示したモデルとして浮上した。
-
Instagram、新ランキングフレームワークで通知疲れを軽減し、エンゲージメントを向上
Meta社は、Instagramにおいて新しい機械学習フレームワークを導入した。このフレームワークは多様性アルゴリズムを適用し、繰り返し表示されるコンテンツを減らしながらユーザーエンゲージメントを維持できるものだ。この多様性を意識したランキングシステムは、同じコンテンツ作成者や製品タイプへの過剰な露出を軽減するために、既存のエンゲージメントモデルに乗算ペナルティを導入している。
-
AnthropicがClaude Codeを拡張、Webおよびモバイルプラットフォームに
AnthropicはAI駆動開発環境Claude Codeの利用可能範囲を拡張し、Webおよびモバイルプラットフォームに対応させた。これまでClaude.aiやAPI統合を通したデスクトップアクセスに限定されていたが、今回の展開により開発者はブラウザやモバイルデバイス上で直接コーディング作業を実行および管理できるようになった。
-
OpenJDKニュースまとめ:キー導出、スコープ付き値、コンパクトヘッダー、JFRメソッドタイミングとトレーシング
2025年5月12日の週、OpenJDKエコシステムでは活発な動きが見られた。注目すべきは、2つのJEPがProposed to TargetからTargetedに昇格し、4つのJEPがCandidateからProposed to Targetに昇格したことである。また、1つのJEPがJEP DraftからCandidateステータスに昇格した。これらのうち2つは、それぞれのプレビューラウンドを経て最終化される予定である。
-
Deno 2.5がパーミッションセットおよびテストAPIフックのサポートを提供
Deno、Ryan Dahl氏により開発されたJavaScriptランタイムはバージョン2.5をリリースし、パーミッションセットの追加、新しいテストフック、Websocketの改善などの改良をもたらした。今回のリリースの一環として多くのパフォーマンス改善も行われている。
-
Hugging FaceがmmBERTを発表、対応言語1,800以上の多言語エンコーダー
Hugging FaceはmmBERT、1,833の言語にわたる3兆以上のトークンでトレーニングされた新しい多言語エンコーダーをリリースした。モデルはModernBERTアーキテクチャを基盤としており、多言語理解タスクの長年のベースラインとなっていたXLM-Rを大幅に上回る初のモデルである。
-
AnthropicがClaudeパフォーマンス問題の背後にある3つのインフラストラクチャバグを公開
Anthropicは最近、Claudeモデルの出力品質が数週間にわたり断続的に低下していた原因について、3つの異なるインフラストラクチャのバグが関与していたことを明らかにするポストモーテムを公開した。同社はこれらの問題を解決し、同様の障害を防ぐために内部プロセスを変更していると述べているが、コミュニティは3つのハードウェアプラットフォームでサービス運用することの課題をハイライトしている。
-
LangChainがOpen SWEを発表、オープンソースの非同期コーディングエージェント
LangChainはOpen SWE、クラウド上で動作し、複雑なソフトウェア開発タスクを処理できる完全オープンソースの非同期コーディングエージェントをリリースした。同社はOpen SWEがリアルタイムの「コパイロット」アシスタントから開発者の既存ワークフローに直接統合される、より自律的で長期間稼働するエージェントへのシフトを象徴していると述べている。
-
AnthropicがSkills導入、カスタムClaudeタスク向け
AnthropicはClaudeをモジュール化された再利用可能タスクコンポーネントで拡張できるようにする新機能、Skillsを発表した。各Skillは長文の要約、APIからのデータ取得、ドメイン固有の計算の実行などの会話中に、Claudeが呼び出すことができる自己完結型機能である。
-
GitLabがセルフホスト型GitLab 18 ReleaseにAIコード支援を追加
GitLabはセルフホスト型DevSecOpsプラットフォームのversion 18.0をリリースし、Premiumお���びUltimateティアにわたるAI機能を拡充した。リリースにはAIネイティブ開発ワークフローが含まれており、GitLabはマイクロソフトのGitHub Copilotや他のAI支援コーディングプラットフォームと競合する形となる。これらのAI機能にはコード提案、統合開発環境内でのインテリジェントチャット、自動コード解析が含まれる。
-
Dreamer 4: オフラインデータからの想像力トレーニングで目標達成を学ぶ
Google DeepMindの研究者たちは、環境との直接的な相互作用ではなく、ビデオ映像のみを用いて知能エージェントに複雑で長期的なタスクを解決する方法を教える新しいアプローチを最近発表した。彼らの新しいエージェントDreamer 4は、実際にゲームをプレイすることなく、ビデオで訓練された後にMinecraftでダイヤモンドを採掘する能力を示した。
-
OWASPがAgentic AIにおけるツール誤用を重大な脅威として警告
今年初め、OWASPはAgentic AI - Threats and Mitigationsと呼ばれるAgentic AIセキュリティに関するガイダンスをリリースした。この文書はこの新興技術を安全にデプロイする際のユニークな課題をハイライトし、防御のための緩和策やアーキテクチャパターンを提案している。