InfoQ ホームページ Architecture に関するすべてのコンテンツ
-
マイクロソフトが汎用マルチエージェントシステム Magentic-Oneを発表
マイクロソフトはMagentic-One、Webやファイルベースの環境を含むオープンエンドのタスクを処理するように設計された新汎用マルチエージェントシステムのリリースを発表した。このシステムはソフトウェア開発、データ分析、ウェブナビゲーションなど様々な領域にわたる複雑な多段階タスクを支援し、活動の効率性を向上させることを目的としている。
-
xAIがGrokモデルの新APIサービスを発表
Elon Musk氏のxAIは、開発者がアプリケーションにxAIの大規模言語モデル(LLM)を統合できるようになる、APIサービスのパブリックベータ版をローンチした。
-
Rhymes AIがAriaを発表:開発リソースを備えたオープンソースのマルチモーダルモデル
Rhymes AIは、テキスト、画像、ビデオ、コードを効果的に処理できるオープンソースのマルチモーダルネイティブMoE(Mixture-of-Experts)モデル、Ariaを発表した。ベンチマークテストにおいて、Ariaは他のオープンモデルを凌駕し、GPT-4oやGemini-1.5などの独自モデルに対しても競争力のある性能を示した。さらに、Rhymes AIは、微調整や開発のためのモデルの重み付けやガイダンスを含むコードベースを公開している。
-
マイクロソフト、GraphQL用Fabric APIの一般提供を発表
マイクロソフトはGraphQL用Fabric APIを発表し、データアクセスレイヤーをパブリックプレビューから一般提供(GA)に移行した。このリリースでは、Azure SQLとFabric SQLデータベースのサポート、保存された資格情報認証、詳細な監視ツール、CI/CDワークフローとの統合など、いくつかの機能強化が導入されている。
-
QCon San Francisco 2024 ソフトウェア・アーキテクチャ・トラック - 現在の課題とトレンドをナビゲートする
QCon San Francisco 2024では、ソフトウェアアーキテクチャが中心テーマとなり、現在もっとも大規模で複雑なアーキテクチャを探求するための2つのトラックが設けられている。Netflixでの多様なMLシステムの設計からGitHub Copilotにおける数百万もの完了リクエストの処理に至るまで、大規模な課題に取り組もうとするアーキテクトにインスピレーションと実践的な教訓を提供する シニア・ソフトウェア・プラクティショナーに参加しよう。
-
DevProxy 0.22がAPIの権限チェックを改善
マイクロソフトがAPIシミュレーション用コマンドラインツール、 DevProxyバージョン0.22をリリースした。新バージョンではログ機能が改善され、Azure API Centerなしでの最小権限の検出が可能になった。
-
Mitmproxy 11リリース:HTTP/3の完全サポートとDNSの強化
Mitmproxyはバージョン11をリリースし、トランスペアレントおよびリバースプロキシモードでのHTTP/3のフルサポートを含むいくつかのアップグレードを導入した。HTTP/3の改良と並行して、このリリースはDNS関連の様々な改善、プライバシー機能の強化、最新のウェブプロトコルのハンドリングの改善をもたらす。
-
Cloudflareがスケーラブルでレジリエントなマルチステップアプリケーション構築のためのワークフローを発表
Cloudflareは、現在オープンベータ版となっているCloudflare Workersプラットフォーム上の耐久性のある実行エンジン「Workflows」を発表した。Workflowsを使用することで、開発者はネットワークの不安定さ、サーバーのダウンタイム、コードエラーなどの障害を乗り越えて持続可能なスケーラブルなマルチステップアプリケーションを作成でき、自動的な再試行や状態管理を手動のインフラ管理なしで実現できる。
-
Android 15がタブレット端末にデスクトップと同様のウィンドウUXをもたらす
次期Android 15リリースの最新ベータ2では、開発者向けプレビューとしてタブレット向けのデスクトップウィンドウが導入された。この新機能は、ユーザーが複数のアプリを表示するために作成し、デスクトップコンピューターで行うのと同じようにサイズを変更したり移動したりできる「フリーフォーム・ウィンドウ」の管理を可能にする。
-
RAG(Retrieval-Augmented Generation)を活用したCopilotが、Uberに13,000時間のエンジニアリング���間を節約
Uberは最近、オンコールサポートエンジニアの効率を改善するために設計されたAIを搭載したオンコールコパイロット、Genieを構築した方法を詳述した。GenieはRetrieval-Augmented Generation(RAG)を活用して正確なリアルタイム応答を提供し、インシデント対応のスピードと効果を大幅に向上させる。
-
LLMを精製し、そのパフォーマンスを超える:spaCyの創設者がInfoQ DevSummit Munichで語る
InfoQ Dev Summit Munichの第1回目のプレゼンテーションにおいて、Ines Montani氏は、今年の初めにQCon Londonで行ったプレゼンテーションに加え、実際のアプリケーションで最新の最先端モデルを使用し、その知識をより小型で高速なコンポーネントに抽出し、社内で実行・維持できるようにするための実践的なソリューションを聴衆に提供した。
-
KotlinのHTTPツールキットKtor 3.0がパフォーマンスを向上させ、サーバー送信イベントのサポートを追加
Ktorは、Kotlinの非同期HTTPサーバーおよびクライアントアプリケーションを作成するためのネイティブフレームワークで、バージョン3に達しました。kotlinx-ioが採用され、互換性を破る変更を犠牲にして、パフォーマンスが向上し、Server-Sentイベント、CSFR、ZIPファイルからの静的リソースの提供などのサポートが追加された。
-
Logic Apps Standardのパブリック・プレビューで、生成AIアプリケーションのためのRAGベースの取り込みが可能に
マイクロソフトはこのほど、Logic Apps Standardのドキュメント解析とチャンキングのための組み込みアクションのパブリックプレビューを発表した。これらのアクションは、生成AIアプリケーションのRAG(Retrieval-Augmented Generation)ベースの取り込みを効率化するように設計されている。これらのアクションにより、Logic Appsはローコードで提供するAI機能にさらに投資することになる。
-
EC2もKubernetesも許さない:PostNLでのサーバーレス・オンリーアーキテクチャ構築からの洞察
PostNLは、外注委託のITプロジェクトデリバリーから社内の製品デリバリー能力への移行から得た洞察とガイダンスを共有した。特にサーバーレスサービスに重点を置いたクラウドネイティブ技術を採用することで、同社は運用コストを削減しながら、生産性と市場対応力の大幅な向上を達成した。
-
PayPal社、Cosmos.AI MLOpsプラットフォームにLLMを利用した生成AIサポートを追加
PayPal社はMLOpsプラットフォームCosmos.AIを拡張し、大規模言語モデル(LLM)を使用したジェネレーティブAIアプリケーションの開発をサポートする。同社は、ベンダー、オープンソース、自己調整LLMへのサポートを取り入れ、検索拡張生成(RAG)、セマンティックキャッシュ、プロンプト管理、オーケストレーション、AIアプリケーションのホスティングに関する機能をリリースした。