InfoQ ホームページ データベース に関するすべてのコンテンツ
-
データコントラクトでデータチームのチームコラボレーションを促進するには
データコントラクトは、データプロバイダーとデータコンシューマー間のインターフェース定義であり、データモデル、品質保証、所有権などを指定する。Jochen Christ氏によると、データコントラクトはデータメッシュでの分散データのデータ所有権の決定に不可欠であり、このおかげでデータ特定性、データ相互運用性、データガバナンスが確保されている。データコントラクトでチーム間のコミュニケーションが促進され、データプロダクトの信頼性と品質が向上している。
-
PerplexityがDeep Researchを発表:高度な分析のためのAI駆動ツール
PerplexityはDeep Research、金融、マーケティング、テクノロジーなど様々な分野で詳細な分析を行うために設計されたAI駆動ツールを発表した。このシステムは、複数の検索を実行し、広範な情報源を分析し、数分以内に構造化されたレポートに結果をまとめることでリサーチプロセスを自動化する。
-
MongoDBに代わるオープンソースのFerretDB、バージョン2.0をリリース
FerretDBはバージョン2.0の最初のリリース候補を発表した。最近リリースされたDocumentDBを搭載したFerretDBは、MongoDBに代わるオープンソースとして、大幅なパフォーマンスの向上、機能互換性の強化、ベクトル検索機能、レプリケーションのサポートを提供する。
-
AWS Glue 5.0がSpark 3.5.2を導入、ETLパフォーマンスを強化
ラスベガスで開催された最新のre:Inventカンファレンスにおいて、AmazonはApache Sparkを活用したETLジョブ高速化のために設計されたAWS Glue 5.0の一般提供を発表した。このサーバーレスデータ統合サービスの最新リリースでは、パフォーマンスとセキュリティの向上とともに、Spark 3.5.2、Python 3.11、Java 17を含むアップグレードされたランタイムが導入されている。
-
AWS re:Invent 2024のハイライト:Aurora DSQLからAmazon Novaへ
2024年のre:Inventがラスベガスで閉幕した。予想通り、AIは会議の重要な焦点であり、Amazon NovaとSagemakerの新バージョンはもっとも重要なハイライトの一つであった。しかし、コミュニティでもっとも興奮を呼んだ発表は、アクティブ・アクティブな高可用性を備えたサーバーレス分散SQLデータベース、Amazon Aurora DSQLのプレビューだった。
-
2024年のデータベース:成長、変化、論争
昨年のトレンドと革新を網羅した、Andrew Pavlo氏によるデータベース界の年次回顧が最近公開された。オピニオンレポート「2024年のデータベース: 年間レビュー」は、私たちが確かに「データベースの黄金時代」にいる一方で、昨年は重要なライセンス変更、DuckDBの急速な成長、そしていくつかの驚くべき新リリースがあったことにフォーカスしている。
-
Amazon Aurora DSQL:アクティブ・アクティブ高可用性な分散SQLデータベース
先日ラスベガスで開催されたAWS re:Inventカンファレンスで、アマゾンはアクティブ・アクティブ高可用性を特徴とするサーバーレス分散SQLデータベースAurora DSQLのパブリックプレビューを発表した。このPostgreSQL互換の新しいデータベース・オプションは、AWSコミュニティ内で大きな興奮を呼び起こし、参加者からはカンファレンスの目玉発表として広く認識された。
-
Netflixの分散カウンターの内部:グローバル・スケールでスケーラブル、正確、リアルタイムなカウント
Netflixのエンジニアは最近、Distributed Counter Abstraction技術へのディープダイブを発表した。Distributed Counter Abstractionは、ユーザーのインタラクション、機能の利用状況、ビジネス・パフォーマンス・メトリクスを低レイテンシーでグローバルに追跡するために設計されたスケーラブルなサービスである。NetflixのTimeSeries Abstraction技術の上に構築されたこのシステムは、設定可能なカウントモード、弾力性のあるデータ集約、グローバルに分散されたアーキテクチャによって、パフォーマンス、精度、コストのバランスをとっている。
-
Aurora Serverless v2が真のサーバーレスのためのゼロキャパシティ・スケーリングを追加
Amazon Aurora Serverless v2はゼロキャパシティへのスケーリングをサポートし、データベース接続をベースとした一定期間の非アクティブ後にデータベースが自動的に一時停止するようになると発表した。Auroraのオンデマンド自動スケーリング設定にゼロキャパシティへのスケーリング機能がないことは長年にわたって論争の的となっていた。
-
Timescale、AI対応のPostgreSQLをpgai Vectorizerで強化
Timescale社は最近、pgai VectorizerでPostgreSQLのAIサービスを拡張した。このアップデートにより、開発者は外部ツールや追加インフラを必要とすることなく、リレーショナルデータと共にベクトル埋め込みを作成、保存、管理できるようになる。
-
「OpenSearchクラスタのスケーリングでコスト削減へ」QCon San FranciscoでAmitai Stern氏が講演
先日のQCon San Franciscoの講演で、Logz.ioのエンジニアリングマネージャー兼OpenSearchリーダーシップ委員会のメンバーであるAmitai Stern氏は、負荷の変動が激しいワークロード環境でのOpenSearchクラスタ管理の効率化に向けた実用的な洞察を共有した。同氏の講演、"OpenSearch Cluster Topologies for Cost-Saving Autoscaling"では、コストを最小限に抑えたOpenSearchの効果的なスケーリング戦略を検証した。
-
Uber社、MyRocks差分バックアップでストレージの大幅な節約を実現
Uber社は、分散データベースに新しい差分バックアップシステムを導入し、ストレージコストを最大70%削減することに成功したと発表した。
-
マイクロソフト、GraphQL用Fabric APIの一般提供を発表
マイクロソフトはGraphQL用Fabric APIを発表し、データアクセスレイヤーをパブリックプレビューから一般提供(GA)に移行した。このリリースでは、Azure SQLとFabric SQLデータベースのサポート、保存された資格情報認証、詳細な監視ツール、CI/CDワークフローとの統合など、いくつかの機能強化が導入されて���る。
-
Uber社がPrestoとExpress QueriesでSQLベースのデータ分析を加速した方法とは
Uber社は、オープンソースの分散型SQLクエリエンジンであるPrestoを使用して、Apache Hive、Apache Pinot、MySQL、Apache Kafkaなどの複数のデータソースで分析をしている。
-
メモリ効率を改善したValkey 8.0が一般提供開始
Linux Foundationは、Redisの後継として開発されたオープンソースのインメモリ・ストレージ・ソリューションであるValkey 8.0の一般提供を発表した。スロットごとにディクショナリを導入し、キーをディクショナリエントリに直接埋め込むことで、開発者は最大20%の容量増加を達成し、ノードごとに追加のキーを保存可能になる。