InfoQ ホームページ Apache_Hadoop に関するすべてのコンテンツ
-
Hadoopに挑むHydra
ソーシャルネットワーク企業のAddThisは先日,HydraをApacheバージョン2.0ライセンスの下で,オープンソースとして公開すると発表した。Hydraは,半構造化ソーシャルデータをライブストリームとして処理することで,それらのデータに対する効率的なクエリ処理を実現するために開発された,同社の社内プラットフォームを発展させたものだ。
-
Googleが新開発のCloud Storage ConnectorでHadoopパフォーマンスを改善
新たに開発されたコネクタを使えば,従来の分散ファイルシステムに代えて,Google Cloud Storage上でHadoopを直接実行することが可能になる。これによってストレージコスト低減とデータプリケーション動作の削減,プロセス全体の簡略化が実現できる。
-
Cascading 2.5がHadoop 2をサポート
今週リリースされたCascadingの新バージョンにはHadoop 2のサポートとCascading Lingualが含まれている。Cascading Lingualは,Hadoopベースのデータにアクセスする手段として包括的なANSI SQLインターフェースを提供する,オープンソースのプロジェクトだ。
-
Amazon EMR��ベストプラクティス
Best Practices for Amazon EMRというホワイトペーパーで、Parviz DeyhimはAWS EMRのベストプラクティスを説明している。データの移行やデータの収集、圧縮、集約の方法やAmazon EMRの構成の一般的なアーキテクチャパターンを説明している。
-
Cassandra, Hadoop, Solrのセキュリティを強化するDataStax
先週、Cassandra、Hadoop、Solrを使っているクラスタ環境のセキュリティ関連機能を備えたDataStax Enterprise (DSE) 3.0が発表された。InfoQはDataStaxの製品担当バイスプレジデントのRobin Schumacher氏に話を聞いた。
-
ConcurrentがHadoop用SQL DSLをリリース
Concurrent, Inc.企業ビッグデータアプリケーションプラットフォームの会社が今日、Lingualを発表した。これはオープンソースプロジェクトで、SQLを使ってApache Hadoop上で速く、簡単にビッグデータアプリケーションの開発ができるようになる。
-
GreenplumのPivotal HDがSQLのパワーとHadoopを結合する
EMC Greenplum が新しいHadoopディストリビューションの Pivotal HD を発表した。HDFS上で "Hiveより数百倍高速" に動作するという,SQL完全準拠のMPPデータベースを備える。
-
リアルタイムHadoopの実装競争が激しくなってきた
Hortonworksの新しいStingerイニシアチブが最高のリアルタイムHadoop実装を目指して、Apache Drill と Cloudera Impalaとの競争に加わった。
-
OracleのNoSQLデータベースを検証する
Oracleのキーバリュー型データベース,いわゆる "Oracle NoSQL Database" がバージョン2.0になった。基本的にはBerkley DBの分散フロントエンドだが,それをはるかに越える機能を備えたデータベースだ。SQLクエリ,結果整合性に加えて完全整合性,さらにはAvroスキーマを使用したデータ識別によるストレージ領域削減オプションなど,多彩な機能を備えている。
-
Apache AmbariでHadoopを管理
Shaun Conno氏が彼の新しいブログ記事で、Apache Ambariインキュベーションプロジェクトの重要さと2012年に達成した主要なマイルストーンを論じている。単純化したクラスタプロビジョニング、前設定された主要な運用メトリクス、ジョブ実行の仮想化、RESTful API、直感的UI。
-
O’Reilly Strata Conference + Hadoop World 2012からのニュース
先週開催されたO’Reilly Strata Conference + Hadoop World 2012で新しいHadoopベースのフレームワークが発表された。