InfoQ ホームページ ニュース
-
中国科学院大学オープンソース・マルチモーダルLLM LLaMA-Omni
中国科学院大学(UCAS)の研究者が最近、音声データとテキストデータの両方で動作するLLM、LLaMA-Omniをオープンソース化した。LLaMA-OmniはMetaのLlama-3.1-8B-InstructLLMをベースにしており、類似のベースラインモデルを凌ぐ性能を持ちながら、少ない学習データと計算量で動作する。
-
UberがMySQLフリートのメジャーアップグレードを完了、パフォーマンスとセキュリティを強化
Uberは、バージョン5.7から8.0にアップグレードすることで、MySQLフリートデータベースを大幅に改善した。チームは、MySQLの新しいバージョンで改善されたパフォーマンスと同時実行性を利用したかった。また、MySQL 5.7が2023年10月に使用期限を迎えるためだった。この作業には1年以上かかり、3リージョンの19のプロダクションゾーンで2,100以上のクラスタと16,000以上のノードをアップグレードした。
-
OpenAI、低遅延音声対話向けのRealtime APIのパブリックベータ版を発表
OpenAIが、Realtime APIのパブリックベータ版を発表した。今回のリリースでは、開発者にアプリ内での低遅延かつマルチモーダルな音声対話が提供される。さらに、音声入力/出力がChat Completions APIで利用可能になり、音声駆動型アプリケーションの選択肢が広がった。初期のフィードバックでは、ChatGPTのアドバンスドボイスモードと同様に、音声オプション数や応答の切断といった制限に関心が集まっている。
-
新しいフレームワークSwift TestingをAppleが発表、プラットフォーム間のSwiftテストを近代化
XCTestがXcodeでテストを作成するための好ましい方法のままである一方で、新しいSwift Testingフレームワークは、Swiftがサポートされている全てのプラットフォームに適用される、テストの定義のための表現力豊かで直感的なAPIを導入しようとしている。フレームワークはまた、パラメトリック化、並列化、分類、テストとバグの関連付けを可能にする。
-
Anthropic、AIデータハンドリング強化のためのコンテキスト検索を発表
Anthropicは、AIシステムと広範な知識ベースとの相互作用における重要な進歩であるコンテキスト検索を発表した。この技術は、埋め込みや索引付けの前にテキストチャンクをコンテキスト情報を付加することで、検索拡張生成(RAG)システムにおけるコンテキスト損失の課題に対処する。
-
-
AWS、科学的発見を加速する並列Parallel Computing Serviceを発表
Amazon Web Services(AWS)は、複雑な科学計算の処理時間を大幅に短縮することを目的とした新しいAWS Parallel Computing Service(PCS)の一般提供を発表した。
-
Spotifyのダッシュボードポータル:品質とアクセシビリティでデータ主導の意思決定を強化
Spotifyは最近、組織全体のダッシュボードの正確性と一貫性を確保するための標準化されたプラクティスであるダッシュボード品質フレームワークについて説明した。ダッシュボードクオリティフレームワークを利用した社内ダッシュボードポータルでは、ユーザーは組織全体の既存のダッシュボードを簡単に検索できる。
-
NetflixのPushy:スケーラブルなウェブソケット・プラットフォームの進化:1億の同時接続を処理する
Netflixは、同社製品のプッシュ通知や様々なデバイス間の通信をサポートするWebSocketメッセージングプラットフォーム、Pushyの進化の詳細を共有した。Netflixのエンジニアは、プラットフォームのスケーラビリティと信頼性を確保し、新しい機能をサポートするために、Pushyのエコシステム全体で数多くの改善を実施した。
-
WS、Graviton4プロセッサを搭載したメモリ最適化EC2 X8gインスタンスをハイメモリワークロード向けに提供開始
AWSは、ハイメモリワークロード向けに設計されたGraviton4搭載メモリ最適化Amazon EC2 X8gインスタンスの提供を開始した。10種類の仮想サイズと2種類のベアメタル構成で利用可能なこれらのインスタンスは、最大3TiBのDDR5メモリと192個のvCPUを提供し、以前のモデルよりもパフォーマンスが大幅に強化されている。
-
CanvaはどのようにWebRTCでリアルタイム・コラボレーションを拡張したか:WebSocketからシームレスなP2P通信へ
Canvaは最近、コラボレーティブなホワイトボードのためにリアルタイムマウスポインタを実装した方法を共有した。Canvaは、スケーラビリティの向上、待ち時間の短縮、バックエンドの負荷軽減のために、WebRTCベースのソリューションを選択した。WebRTCはピアツーピア通信を使用するため、Canvaは従来のバックエンドベースのWebSocketとRedisソリューションよりもスムーズでパフォーマンスの高いリアルタイム体験をユーザーに提供できる。
-
Googleが声を復元する音声転送AIを開発
Google Researchチームが、特定の人物の声でテキスト音声変換(TTS)をカスタマイズできるゼロショット音声変換(VT)モデルを開発した。これにより、パーキンソン病やALSなどで声を失った話者が、TTSデバイスを使って元の声を再現できるようになる。このモデルは言語を跨いでも機能する。
-
OpenAIがGPT-4oサポートとAPI拡張を含む.NETライブラリの安定版をリリース
6月のベータ版に続き、OpenAIが、公式.NETライブラリの安定版をリリースした。NuGetパッケージとして利用可能で、GPT-4oやGPT-4o miniのような最新モデルと、OpenAI REST APIの全機能をサポートしている。このリリースには同期および非同期APIの両方、ストリーミングチャット補完機能、そしてAPI一貫性向上のための重要な互換性のない変更が含まれている。開発者はライブラリを拡張し、.NET Standard 2.0をサポートするすべての.NETプラットフォーム上で使用できる。
-
Grafana k6リリース:Typescript、ECMAScript、ブラウザテストなどの機能強化
The Grafana k6チームは、オープンソースの負荷テストツールの新バージョンを約2ヶ月ごとにリリースし、新機能とユーザーエクスペリエンスの向上をもたらしている。最近のアップデートでは、特にTypeScriptのサポート、ECMAScriptの互換性、ブラウザテスト、gRPC、メモリ管理、暗号化、テスト結果の保存に関する機能強化など、重要な改善がいくつか導入された。
-
Figma、ECSからKubernetesに移行し、CNCFエコシステムの恩恵とコスト削減を図る
Figmaは、同社のコンピュート・プラットフォームをAWS ECSからKubernetes (EKS)へ、顧客への影響を最小限に抑えながら12ヶ月以内に移行した。同社は、コンテナ化されたワークロードを実行するためにKubernetesの採用を決定したが、これは主にCNCFがサポートする大規模なエコシステムを活用するためだった。さらに、コスト削減、開発者エクスペリエンスの向上、回復力の強化を追求したことも、この移行を決定づけた。