InfoQ ホームページ プログラミング に関するすべてのコンテンツ
-
データメッシュ組織の構築
データメッシュ組織は、プロデューサー、コンシューマー、そしてプラットフォームで構成される。Matthias Patzak氏によると、プラットフォームチームの使命は、プロデューサーライフとコンシューマーライフをシンプルで効率的かつストレスフリーにすることだという。データは組織全体で、検出可能で理解しやすく、信頼でき、安全かつ簡単に共有できなければならない。
-
OpenAIがマルチエージェント・オーケストレーションの実験的オープンソース・フレームワーク「Swarm」をリリース
最近実験的なツールとしてリリースされたSwarmは、開発者がルーチンとハンドオフを使用してタスクを実行するために、複数のエージェントを互いに協調させる方法を調査できるようにすることを目的としている。
-
CopilotがOneDriveで利用可能に:効率的な文書管理のためのAI搭載機能
法人ユーザー向けにマイクロソフトはCopilot in OneDriveの提供を開始し、文書管理と生産性を向上させるために設計されたAI搭載ツールでプラットフォームを強化した。この新機能により、ユーザーは要約の作成、文書の比較、情報の取得、コンテンツの作成をより効率的に行えるようになり、手作業に費やした時間を削減できる。
-
大学の研究者がLLMにおける思考連鎖推論の分析を発表した
プリンストン大学とイェール大学の研究者が、LLMにおけるChain-of-Thought(CoT)推論のケーススタディを発表した。このケーススタディでは、暗記と真の推論の両方の証拠が示された。また、CoTは、プロンプトで与えられた例が正しくない場合でも機能することがわかった。
-
新プラットフォームsbomifyがSBOMのソフトウェアインベントリ作成を効率化
ソフトウェア部品表(SBOM)を扱い、配布する際に企業が直面する困難に取り組むために、sbomifyという新しいプラットフォームが発表された。その目的は、業界における規制の要求が高まり続ける中、SBOM手続きの合理化と自動化を図ることにある。
-
Meta社のリアルタイム音声翻訳AIシステムに向けたResearch SuperCluster
Meta社のエンジニアリング部門の最近の記事から、同社がリアルタイム音声翻訳、言語処理、コンピューター・ビジョン、拡張現実 (AR)の進歩に使用されるResearch SuperCluster (RSC)インフラをどのように構築しているかが明らかになった。
-
中国科学院大学オープンソース・マルチモーダルLLM LLaMA-Omni
中国科学院大学(UCAS)の研究者が最近、音声データとテキストデータの両方で動作するLLM、LLaMA-Omniをオープンソース化した。LLaMA-OmniはMetaのLlama-3.1-8B-InstructLLMをベースにしており、類似のベースラインモデルを凌ぐ性能を持ちながら、少ない学習データと計算量で動作する。
-
OpenAI、低遅延音声対話向けのRealtime APIのパブリックベータ版を発表
OpenAIが、Realtime APIのパブリックベータ版を発表した。今回のリリースでは、開発者にアプリ内での低遅延かつマルチモーダルな音声対話が提供される。さらに、音声入力/出力がChat Completions APIで利用可能になり、音声駆動型アプリケーションの選択肢が広がった。初期のフィードバックでは、ChatGPTのアドバンスドボイスモードと同様に、音声オプション数や応答の切断といった制限に関心が集まっている。
-
新しいフレームワークSwift TestingをAppleが発表、プラットフォーム間のSwiftテストを近代化
XCTestがXcodeでテストを作成するための好ましい方法のままである一方で、新しいSwift Testingフレームワークは、Swiftがサポートされている全てのプラットフォームに適用される、テストの定義のための表現力豊かで直感的なAPIを導入しようとしている。フレームワークはまた、パラメトリック化、並列化、分類、テストとバグの関連付けを可能にする。
-
Anthropic、AIデータハンドリング強化のためのコンテキスト検索を発表
Anthropicは、AIシステムと広範な知識ベースとの相互作用における重要な進歩であるコンテキスト検索を発表した。この技術は、埋め込みや索引付けの前��テキストチャンクをコンテキスト情報を付加することで、検索拡張生成(RAG)システムにおけるコンテキスト損失の課題に対処する。
-
-
WS、Graviton4プロセッサを搭載したメモリ最適化EC2 X8gインスタンスをハイメモリワークロード向けに提供開始
AWSは、ハイメモリワークロード向けに設計されたGraviton4搭載メモリ最適化Amazon EC2 X8gインスタンスの提供を開始した。10種類の仮想サイズと2種類のベアメタル構成で利用可能なこれらのインスタンスは、最大3TiBのDDR5メモリと192個のvCPUを提供し、以前のモデルよりもパフォーマンスが大幅に強化されている。
-
Googleが声を復元する音声転送AIを開発
Google Researchチームが、特定の人物の声でテキスト音声変換(TTS)をカスタマイズできるゼロショット音声変換(VT)モデルを開発した。これにより、パーキンソン病やALSなどで声を失った話者が、TTSデバイスを使って元の声を再現できるようになる。このモデルは言語を跨いでも機能する。
-
OpenAIがGPT-4oサポートとAPI拡張を含む.NETライブラリの安定版をリリース
6月のベータ版に続き、OpenAIが、公式.NETライブラリの安定版をリリースした。NuGetパッケージとして利用可能で、GPT-4oやGPT-4o miniのような最新モデルと、OpenAI REST APIの全機能をサポートしている。このリリースには同期および非同期APIの両方、ストリーミングチャット補完機能、そしてAPI一貫性向上のための重要な互換性のない変更が含まれている。開発者はライブラリを拡張し、.NET Standard 2.0をサポートするすべての.NETプラットフォーム上で使用できる。
-
AWS、NVIDIA H100 Tensor Core GPUを搭載したEC2 P5eインスタンスの一般提供を発表
Amazon Web Services(AWS)は、AI、機械学習、ハイパフォーマンス・コンピューティング(HPC)アプリケーション向けのコンピューティング・インフラを強化するため、NVIDIA H100 Tensor Core GPUを搭載したAmazon EC2 P5eインスタンスを正式にリリースした。