InfoQ ホームページ AIと機械学習、データエンジニアリングに関するすべてのコンテンツ

ニュース

RSSフィード

最新前の記事

AIと機械学習、データエンジニアリング

Discord、単一GPUワークフローから共有RayクラスターへのMLプラットフォーム拡張

Discord社は、単一GPUトレーニングの限界に直面した後、機械学習プラットフォームを再構築した方法を詳述した。RayとKubernetesを標準化し、ワンクリックでクラスターを作成できるCLIを導入し、DagsterとKubeRayを通じてワークフローを自動化することで、分散トレーニングを日常的な運用に変更できた。これらの変更により、大規模モデルの毎日の再トレーニングが可能となり、広告ランキングの主要指標で200%の向上を達成した。

Matt Foster 翻訳者 Takashi Kawase
投稿日 2026年2月10日午前12時30分
モバイル

Android GenAIプロンプトAPI、Gemini Nanoで自然言語リクエストを実現

ML Kit GenAI Prompt APIIがアルファ版で利用可能となり、Android開発者はデバイス上で動作するGemini Nanoに自然言語およびマルチモーダルリクエストを送信できるようになった。このAPIは、初期のGenAIリリースで導入されたテキスト要約や画像説明の機能を拡張するものである。

Sergio De Simone 翻訳者 Takashi Kawase
投稿日 2026年2月6日午前12時30分
AIと機械学習、データエンジニアリング

Transformers v5、よりモジュール化され相互運用性の高いコアを導入

Hugging Face社は、Transformers v5の最初のリリース候補を発表した。このリリースは、5年前のv4リリース以来大きく進化してきたTransformersライブラリにとって重要な一歩である。Transformersは、専門的なモデルツールキットからAI開発の主要なリソースへと移行し、現在では1日あたり300万以上のインストール数を記録し、累計で12億以上のインストール数を達成している。

Robert Krzaczyński 翻訳者 Naoko Koshimura
投稿日 2026年1月30日午前12時30分
Java

QCon AI New York 2025：「AIは機能するが、プルリクエストは機能しない：AIがソフトウェア開発ライフサイクル（SDLC）を破壊する理由とその対策」

CircleCI社の主任エンジニアであるMichael Webster氏は、2025年に初めて開催された「QCon AI New York 2025において、「AI Works, Pull Requests Don’t: How AI Is Breaking the SDLC and What to Do about it（AIは機能するが、プルリクエストは機能しない：AIがSDLCを破壊している現状とその対策）」と題した講演を行った。

Michael Redlich 翻訳者 Mitsuru Takatsuki
投稿日 2026年1月28日午前12時30分
AIと機械学習、データエンジニアリング

OpenAI、GPT-5.1モデルを発表。より高速で会話的に

OpenAIは最近、GPT-5モデルのアップグレード版を公開した。GPT-5.1 Instantはデフォルトのチャットモデルであり、指示の理解力が向上している。GPT-5.1 Thinkingは推論モデルであり、より迅速で理解しやすい応答を提供する。GPT-5.1-Codex-Maxはコーディングモデルであり、長時間のタスクを効率的に実行するために圧縮技術を活用するよう訓練されている。

Anthony Alford 翻訳者 Mitsuru Takatsuki
投稿日 2026年1月20日午前12時30分
Cloud

Cloudflare、データプラットフォームをエグレス料金ゼロで導入

Cloudflareは最近、Cloudflare Data Platformのオープンベータ版を発表した。これは、Apache Icebergなどのオープンスタンダードを使用して、分析データテーブルを取り込み、保存し、クエリを実行するためのマネージドソリューションである。

Renato Losio 翻訳者 Naoko Koshimura
投稿日 2026年1月15日午前7時30分
AIと機械学習、データエンジニアリング

Agentica ProjectのオープンソースAIモデルDeepCoderがOpenAIのO1をコードベンチマークで上回る

Agentica ProjectとTogether AIは、Deepseek-R1-Distilled-Qwen-14Bを基盤としたオープンソースAIコードモデルDeepCoder-14B-Previewを公開した。このモデルはLiveCodeBenchで60.6%の合格率を達成し、OpenAIのO1モデルを上回り、O3-miniの性能に匹敵する結果を示した。

Anthony Alford 翻訳者 Takashi Kawase
投稿日 2026年1月15日午前6時30分
AIと機械学習、データエンジニアリング

Claude Sonnet 4.5は、オープンソースの監査ツールPetriによって最も安全なLLM（大規模言語モデル）として評価された。

Claude Sonnet 4.5は、Anthropic社の新しいオープンソースAI監査ツールであるPetri（Parallel Exploration Tool For Risky Interactions）による初期評価において、「リスキーなタスク」において最も優れたパフォーマンスを示したモデルとして浮上した。

Matt Foster 翻訳者 Mitsuru Takatsuki
投稿日 2026年1月15日午前3時30分
設計/アーキテクチャ

Instagram、新ランキングフレームワークで通知疲れを軽減し、エンゲージメントを向上

Meta社は、Instagramにおいて新しい機械学習フレームワークを導入した。このフレームワークは多様性アルゴリズムを適用し、繰り返し表示されるコンテンツを減らしながらユーザーエンゲージメントを維持できるものだ。この多様性を意識したランキングシステムは、同じコンテンツ作成者や製品タイプへの過剰な露出を軽減するために、既存のエンゲージメントモデルに乗算ペナルティを導入している。

Leela Kumili 翻訳者 Takashi Kawase
投稿日 2026年1月15日午前1時30分
AIと機械学習、データエンジニアリング

AnthropicがClaude Code��拡張、Webおよびモバイルプラットフォームに

AnthropicはAI駆動開発環境Claude Codeの利用可能範囲を拡張し、Webおよびモバイルプラットフォームに対応させた。これまでClaude.aiやAPI統合を通したデスクトップアクセスに限定されていたが、今回の展開により開発者はブラウザやモバイルデバイス上で直接コーディング作業を実行および管理できるようになった。

Daniel Dominguez 翻訳者 Hiroaki.Sugimura
投稿日 2025年12月23日午前9時30分
Cloud

Atlassianの400万PostgreSQLデータベース移行：標準的なクラウド戦略が失敗する時

Atlassianは最近、400万のJiraデータベースをAmazon Auroraに移行し、コスト削減とJira Cloudプラットフォームの信頼性向上を目指した。多くのファイルが関与し、マネージドサービスの制約があるため、チームは従来のクラウド移行戦略が実行不可能であったため、プロセスを調整するカスタムツールを開発した。

Renato Losio 翻訳者 Takashi Kawase
投稿日 2025年12月17日午前10時30分
AIと機械学習、データエンジニアリング

Hugging FaceがmmBERTを発表、対応言語1,800以上の多言語エンコーダー

Hugging FaceはmmBERT、1,833の言語にわたる3兆以上のトークンでトレーニングされた新しい多言語エンコーダーをリリースした。モデルはModernBERTアーキテクチャを基盤としており、多言語理解タスクの長年のベースラインとなっていたXLM-Rを大幅に上回る初のモデルである。

Robert Krzaczyński 翻訳者 Hiroaki.Sugimura
投稿日 2025年12月15日午前6時31分
AIと機械学習、データエンジニアリング

AnthropicがClaudeパフォーマンス問題の背後にある3つのインフラストラクチャバグを公開

Anthropicは最近、Claudeモデルの出力品質が数週間にわたり断続的に低下していた原因について、3つの異なるインフラストラクチャのバグが関与していたことを明らかに��るポストモーテムを公開した。同社はこれらの問題を解決し、同様の障害を防ぐために内部プロセスを変更していると述べているが、コミュニティは3つのハードウェアプラットフォームでサービス運用することの課題をハイライトしている。

Renato Losio 翻訳者 Hiroaki.Sugimura
投稿日 2025年12月12日午前3時30分
AIと機械学習、データエンジニアリング

LangChainがOpen SWEを発表、オープンソースの非同期コーディングエージェント

LangChainはOpen SWE、クラウド上で動作し、複雑なソフトウェア開発タスクを処理できる完全オープンソースの非同期コーディングエージェントをリリースした。同社はOpen SWEがリアルタイムの「コパイロット」アシスタントから開発者の既存ワークフローに直接統合される、より自律的で長期間稼働するエージェントへのシフトを象徴していると述べている。

Robert Krzaczyński 翻訳者 Hiroaki.Sugimura
投稿日 2025年12月12日午前2時30分
AIと機械学習、データエンジニアリング

AnthropicがSkills導入、カスタムClaudeタスク向け

AnthropicはClaudeをモジュール化された再利用可能タスクコンポーネントで拡張できるようにする新機能、Skillsを発表した。各Skillは長文の要約、APIからのデータ取得、ドメイン固有の計算の実行などの会話中に、Claudeが呼び出すことができる自己完結型機能である。

Daniel Dominguez 翻訳者 Hiroaki.Sugimura
投稿日 2025年12月9日午前10時30分