InfoQ ホームページ ニュース
-
NVIDIAがHymba 1.5Bを発表: 効率的NLPモデルへのハイブリッドアプローチ
NVIDIAの研究者は、トランスフォーマーと状態空間モデル(SSM)アーキテクチャを組み合わせて前例のない効率とパフォーマンスを実現するオープンソース言語モデル、Hymba 1.5Bを発表した。NVIDIAの最適化されたトレーニングパイプラインで設計されたHymbaは、従来のトランスフォーマーの計算およびメモリの制約に対処しつつ、SSMの記憶能力を向上させている。
-
NVIDIA NemotronモデルがAIエージェント開発の加速を目指す
NVIDIAはカスタマーサポート、不正検知、製品サプライチェーンの最適化などのAIエージェントによるワークフローに特に重点を置いたLlama Nemotron大規模言語モデル(LLM)およびCosmos Nemotronビジョン言語モデル(VLM)を発表した。Nemotronファミリーのモデルは多様なシステム要件に適合しやすくするため、Nano、Super、Ultraの3つのサイズで提供される。
-
Amazon Aurora DSQL:アクティブ・アクティブ高可用性な分散SQLデータベース
先日ラスベガスで開催されたAWS re:Inventカンファレンスで、アマゾンはアクティブ・アクティブ高可用性を特徴とするサーバーレス分散SQLデータベースAurora DSQLのパブリックプレビューを発表した。このPostgreSQL互換の新しいデータベース・オプションは、AWSコミュニティ内で大きな興奮を呼び起こし、参加者からはカンファレンスの目玉発表として広く認識された。
-
Predictive Scaling(予測スケーリング)でAmazon ECSを最適化
Amazon Web Services(AWS)は、機械学習(ML)アルゴリズムを採用して需要の急増を予測し、リソースの過剰プロビジョニングを最小限に抑えながらアプリケーションの可用性と応答性を確保する高度なスケーリングポリシー「Predictive Scaling for Amazon ECS」をこのほどリリースした。
-
GitLab Duo Chatでマージリクエストに深く入り込もう
GitLab は最近、開発者とレビュアーがコードレビューをより簡単に行えるように設計された新しいチャットアシスタント、Duo Chat について説明した。この機能はGitLab Duo UltimateとEnterpriseで利用可能で、エンジニアがコードの変更を理解し、ディスカッションをフォローし、依存関係をトラッキングしながら高品質なコードを保証するのに役立つ。
-
Googleが視覚言語モデルファミリーPaliGemma 2をリリース
Google DeepMindは視覚言語モデル(VLM)ファミリー PaliGemma 2をリリースした。PaliGemma 2は3つの異なるサイズと3つの入力画像解像度が利用可能で、複数の視覚言語ベンチマークで最先端の性能を達成している。
-
SlackがAIを活用したハイブリッドアプローチでEnzymeか���Reactテストライブラリに移行した方法
EnzymeはReact 18をサポートしていないため、既存の単体テストは使用できず、それらが提供する基礎的な信頼性を危険にさらしていた、とSergii Gorbachov氏はQCon San Franciscoで述べた。彼は、テストカバレッジの継続性を確保するために、SlackがすべてのEnzymeテストをReact Testing Library(RTL)に移行した方法を示した。
-
Netflixの分散カウンターの内部:グローバル・スケールでスケーラブル、正確、リアルタイムなカウント
Netflixのエンジニアは最近、Distributed Counter Abstraction技術へのディープダイブを発表した。Distributed Counter Abstractionは、ユーザーのインタラクション、機能の利用状況、ビジネス・パフォーマンス・メトリクスを低レイテンシーでグローバルに追跡するために設計されたスケーラブルなサービスである。NetflixのTimeSeries Abstraction技術の上に構築されたこのシステムは、設定可能なカウントモード、弾力性のあるデータ集約、グローバルに分散されたアーキテクチャによって、パフォーマンス、精度、コストのバランスをとっている。
-
Gitpod Flex:Kubernetesの次のクラウド開発
クラウド開発環境のプラットフォームであるGitpodは、6年間の使用と実験を経て、最近になってKubernetesからの移行を決定した。この決断は、150万人のユーザーの開発環境を管理し、毎日多数の環境を扱ってきた経験から生まれた。
-
Express 5.0リリース、安定性とセキュリティにフォーカス
Express.jsチームは2014年の最初のメジャー・バージョン・リリースから10年を経てバージョン5.0.0をリリースした。このリリースは、開発者がより堅牢なNode.jsアプ���ケーションを作成できるよう、安定性とセキュリティにフォーカスしている。
-
インパクトのあるデータ製品戦略を形成する
講演者であり、データ戦略家であり、『Data is Like a Plate of Hummus(データはフムスの皿のようなもの)』の著者でもあるLior Barak(バラック氏)が、Data Engineering Podcastで、戦略計画を推進するためのデータ・ビジョン・ボードの活用について語った。バラック氏は、組織のデータ中心戦略において、データチームはしばしば後になってからコストがかかることになりがちであると主張し、連携、進化、そしてインパクトのある能力の提供を確実にするための3年間の共同ロードマップを提案した。
-
ソフトウェアエンジニアリングの効率化を支援する社内ツールの移行から学んだこと
QCon San Franciscoのプレゼンテーションで、Ying Dai氏(ダイ氏)は2つの重要なソフトウェアエンジニアリングのマイグレーションストーリーを共有した。1つはプロダクションモニタリングに焦点を当てたもので、もう1つは自動検証を伴うプロダクションデプロイメントに関するものである。どちらの移行も、エンジニアリングの効率を向上させるという目標によって進められたが、それぞれに課題と教訓があった。
-
Azure Boost DPU:クラウドのパフォーマンスを強化するマイクロソフトの新しいシリコンソリューション
マイクロソフトは先日のIgniteカンファレンスで、効率的で低消費電力のデータ中心ワークロード向けに設計された、初の自社製データ処理ユニット(DPU)であるAzure Boost DPUを発表した。同社によると、この単一のシリコンは、高速イーサネットおよびPCIe���ンターフェース、ネットワークおよびストレージエンジン、データアクセラレータ、セキュリティ機能を統合し、完全にプログラマブルなシステム・オン・ア・チップになっているという。
-
AWSがポスト量子暗号への移行計画を発表
AWSは、同社のセキュリティ・ブログの最近の記事で、ポスト量子暗号(POC)への移行計画について詳述している。記事では、PQCがもたらす課題を取り上げ、移行プロセスにおけるAWSの現在の進捗状況を概説し、従来の責任共有モデルにおける顧客への影響を説明している。
-
Metaがどのようにして100万行のAndroidコードをJavaからKotlinに移行したか?
生産性と安全性の面でKotlinがもたらす利点を最大化するため、Metaのエンジニアは1,000万行のAndroidコードベースをJavaからKotlinに翻訳する作業に懸命に取り組んできた。このプロセスの1年で、彼らはコードベースの約半分を移行し、プロセスを可能な限り自動化するための特別なツールKotlinatorを開発した。