InfoQ ホームページ ニュース
-
Kubernetes Autoscaler Karpenterが1.0のマイルストーンに到達
Amazon Web Services(AWS)は、オープンソースのKubernetesクラスタオートスケーリングツールであるKarpenterのバージョン1.0をリリースした。このリリースはベータ版からのKarpenterの卒業を示すものであり、安定版APIと複数の新機能が導入されている
-
Uberのバッチ・データ・プラットフォームの拡張:データ・メッシュの原則によるクラウドへの道のり
数ヶ月前、UberはGoogle Cloud Platform(GCP)上でバッチデータ分析と機械学習プラットフォームのクラウドへの移行を開始した。最近のエンジニアリング・ブログへの投稿で、Uberは重要なデータ・メッシュの原則を取り入れたバッチ・データのクラウド移行に関する追加情報を提供した。
-
大学の研究者がLLMにおける思考連鎖推論の分析を発表した
プリンストン大学とイェール大学の研究者が、LLMにおけるChain-of-Thought(CoT)推論のケーススタディを発表した。このケーススタディでは、暗記と真の推論の両方の証拠が示された。また、CoTは、プロンプトで与えられた例が正しくない場合でも機能することがわかった。
-
新プラットフォームsbomifyがSBOMのソフトウェアインベントリ作成を効率化
ソフトウェア部品表(SBOM)を扱い、配布する際に企業が直面する困難に取り組むために、sbomifyという新しいプラットフォームが発表された。その目的は、業界における規制の要求が高まり続ける中、SBOM手続きの合理化と自動化を図ることにある。
-
Meta社のリアルタイム音声翻訳AIシステムに向けたResearch SuperCluster
Meta社のエンジニアリング部門の最近の記事から、同社がリアルタイム音声翻訳、言語処理、コンピューター・ビジョン、拡張現実 (AR)の進歩に使用されるResearch SuperCluster (RSC)インフラをどのように構築しているかが明らかになった。
-
中国科学院大学オープンソース・マルチモーダルLLM LLaMA-Omni
中国科学院大学(UCAS)の研究者が最近、音声データとテキストデータの両方で動作するLLM、LLaMA-Omniをオープンソース化した。LLaMA-OmniはMetaのLlama-3.1-8B-InstructLLMをベースにしており、類似のベースラインモデルを凌ぐ性能を持ちながら、少ない学習データと計算量で動作する。
-
UberがMySQLフリートのメジャーアップグレードを完了、パフォーマンスとセキュリティを強化
Uberは、バージョン5.7から8.0にアップグレードすることで、MySQLフリートデータベースを大幅に改善した。チームは、MySQLの新しいバージョンで改善されたパフォーマンスと同時実行性を利用したかった。また、MySQL 5.7が2023年10月に使用期限を迎えるためだった。この作業には1年以上かかり、3リージョンの19のプロダクションゾーンで2,100以上のクラスタと16,000以上のノードをアップグレードした。
-
OpenAI、低遅延音声対話向けのRealtime APIのパブリックベータ版を発表
OpenAIが、Realtime APIのパブリックベータ版を発表した。今回のリリースでは、開発者にアプリ内での低遅延かつマルチモーダルな音声対話が提供される。さらに、音声入力/出力がChat Completions APIで利用可能になり、音声駆動型アプリケーションの選択肢が広がった。初期のフィードバックでは、ChatGPTのアドバンスドボイスモードと同様に、音声オプション数や応答の切断といった制限に関心が集まっている。
-
新しいフレームワークSwift TestingをAppleが発表、プラットフォーム間のSwiftテストを近代化
XCTestがXcodeでテストを作成するための好ましい方法のままである一方で、新しいSwift Testingフレームワークは、Swiftがサポートされている全てのプラットフォームに適用される、テストの定義のための表現力豊かで直感的なAPIを導入しようとしている。フレームワークはまた、パラメトリック化、並列化、分類、テストとバグの関連付けを可能にする。
-
Anthropic、AIデータハンドリング強化のためのコンテキスト検索を発表
Anthropicは、AIシステムと広範な知識ベースとの相互作用における重要な進歩であるコンテキスト検索を発表した。この技術は、埋め込みや索引付けの前にテキストチャンクをコンテキスト���報を付加することで、検索拡張生成(RAG)システムにおけるコンテキスト損失の課題に対処する。
-
-
AWS、科学的発見を加速する並列Parallel Computing Serviceを発表
Amazon Web Services(AWS)は、複雑な科学計算の処理時間を大幅に短縮することを目的とした新しいAWS Parallel Computing Service(PCS)の一般提供を発表した。
-
Spotifyのダッシュボードポータル:品質とアクセシビリティでデータ主導の意思決定を強化
Spotifyは最近、組織全体のダッシュボードの正確性と一貫性を確保するための標準化されたプラクティスであるダッシュボード品質フレームワークについて説明した。ダッシュボードクオリティフレームワークを利用した社内ダッシュボードポータルでは、ユーザーは組織全体の既存のダッシュボードを簡単に検索できる。
-
NetflixのPushy:スケーラブルなウェブソケット・プラットフォームの進化:1億の同時接続を処理する
Netflixは、同社製品のプッシュ通知や様々なデバイス間の通信をサポートするWebSocketメッセージングプラットフォーム、Pushyの進化の詳細を共有した。Netflixのエンジニアは、プラットフォームのスケーラビリティと信頼性を確保し、新しい機能をサポートするために、Pushyのエコシステム全体で数多くの改善を実施した。
-
WS、Graviton4プロセッサを搭載したメモリ最適化EC2 X8gインスタンスをハイメモリワークロード向けに提供開始
AWSは、ハイメモリワークロード向けに設計されたGraviton4搭載メモリ最適化Amazon EC2 X8gインスタンスの提供を開始した。10種類の仮想サイズと2種類のベアメタル構成で利用可能なこれらのインスタンスは、最大3TiBのDDR5メモリと192個のvCPUを提供し、以前のモデルよりもパフォーマンスが大幅に強化されている。