InfoQ ホームページ Data Warehouse に関するすべてのコンテンツ
-
AWSがAmazon Redshift Serverlessを紹介
サーバレス分析のオプションへのトレンドの一環として、AWS は Amazon Redshift Serverless のパブリックプレビューを発表した。マネージドデータウェアハウスサービスの最新バージョンは、変動するワークロードや予測できないスパイクのためにキャパシティの管理が困難な場所でのデプロイメントを対象としている。
-
AWSがAWS Data Exchange for Amazon Redshiftのパブリックプレビューを発表
最近、AWSはAWS Data Exchange for Amazon Redshiftのパブリックプレビューを発表した。この新機能により、顧客はAWS Data Exchangeでサードパーティデータを検索してサブスクライブし、Amazon Redshiftデータウェアハウスでクエリを実行できる。
-
Uber Riderアプリでのデータ収集、標準化、大規模な利用
Uber Engineeringは最近、Uber Riderアプリからデータを収集、標準化、使用する方法を公開した。ライダーデータには、Uberアプリとのライダーのインタラクションがすべて含まれる。このデータは、Uberのオンラインシステムからの毎日の何十億ものイベントを表している。Uberはこのデータを使って、ファンネルコンバージョンの増加、ユーザエンゲージメントなどの主要な問題領域に対処する。
-
Amazon Redshiftデータ共有が一般向け提供へ
Amazonは最近、Amazon Redshiftデータ共有機能の一般向け提供を発表した。これは、Amazon Redshiftクラスタ間でライブデータを共有するためのものである。これにより、単一のデータウェアハウスクラスタをマルチクラスタデプロイに使用し、データをコピーまたは移動することなく即座に共有できる。
-
-
データエンジニアリングの未来 - QCon San FranciscoでのChris Riccomini氏の講演より
QCon San Francisco 2919で、Chris Riccomini氏が、"The Future of Data Engineering"と題した講演を行った。おもな内容は、完全に自動化された非集中型データウェアハウスの実現という、データエンジニアリングの最終目標への到達に関するものだ。
-
Microsoftがデータウェアハウスおよび分析サービスのAzure Synapseを発表
年次開催されるIgniteカンファレンスで、Microsoftによる今年の発表のひとつとして、Azure Synapseという新しい分析サービスに関するものがあった。Azure SQL Data Warehouseの後継となるこのサービスは、企業規模のデータウェアハウスとビッグデータ解析をひとつの場所で実現するもの��。
-
Databricksがデータレイクの信頼性を高めるためにDelta Lakeをオープンソース化
Databricksは最近、ACIDトランザクションをApache Sparkおよびビッグデータワークロードにもたらすための、独自のストレージレイヤであるDelta Lakeのオープンソース化をを発表した。Delta LakeはすでにMcAffee、Upworkなどのいくつかの会社で使用されているが、DatabricksはApache Spark開発者の会社である。Delta Lakeは、データレイクがよく直面する異種データの問題に取り組んでいる。
-
GoogleがMesaを公開 - 地理的レプリケーションと準リアルタイム性を備えた,スケーラブルなデータウェアハウス
GoogleがMesaというデータウェアハウスを新たに公開した。Mesaは複数のデータセンタにスケールして,ペタバイト単位のデータを扱うと同時に,秒以下のオーダでのクエリ応答とACID特性を実現するシステムである。
-
Teradataがクラウド戦略の一環としてデータウェアハウス・アズ・ア・サービスを提供
Teradataは同社のクラウドサービスを改良し,データウェアハウス・データプラットフォーム・アズ・ア・サービスとして提供する。この製品Teradata Cloudは,定義済みライブラリによる豊富な機能セットと効率的なデータロードにより,Amazon Redshiftのライバルとなることを目指している。
-
Amazonが注目のビッグデータ対応サービスを発表
Amazon Web Service(AWS)チームがAmazon Redshiftの限定プレビューを発表した。その費用と機能で業界に波乱を巻き起こしそうなクラウドベースのデータウェアハウスだ。2タイプの大規模コンピュートインスタンスとデータ統合ツールData Pipelineも同時に発表されている。
-
データアクセス フレームワークMetaModelのバージョン1.5で開発効率の向上
eobject.orgの オープンソース JavaフレームワークであるMetaModel は、異なったデータストアへのアクセス、探索、クエリ用の統一されたAPIを実装した。eobjects.org、webサイトとオープンソース ソフトウェア会社の両方共が「ビジネス・インテリジェンスとデータ ウェアハウスに関連したオープンソース ソフトウェアの開発」に専念しており、最近 MetaModelのバージョン1.5をリリースした。
-
FacebookによるHadoop, Hive, HBaseそして A/B Testingへの取組み
2010年のHadoop Summitでは、数多くのHadoopと関連技術の大規模ユーザから、発表があった。とりわけ、 Facebookは、分析にHiveを使っていることについて、基調講演で詳細に発表した。 FacebookでEngineering のVPである Mike Schroepfer氏がHadoopによるデータ処理の規模について基調講演を行った。
-
Mahout 0.3: オープンソースの機械学習プロジェクト
クラスタリング、協調フィルタリング そしてカテゴリー化のような機械学習の技術の必要性が、大量の生データを関連する情報に変換するためのアルゴリズムを必要とする、いくつかのソリューションといっしょに、この10年間に、着実に増えてきた。 Apache Mahout 0.3が3月にアナウンスされ、機能性、安定性、パフォーマンスが改善された。
-
イベントストリーム処理:データウェアハウスに代わる拡張可能な代替案
Dan Pritchett氏は、データウェアハウジングアプリケーションの代わりとなるソリューションを、自身のブログ上で提案している。