BT

最新技術を追い求めるデベロッパのための情報コミュニティ

寄稿

Topics

地域を選ぶ

InfoQ ホームページ ニュース Oracle が Big Data Appliance と Connectors を発表,Hadoop および Cloudera Manager との統合をサポート

Oracle が Big Data Appliance と Connectors を発表,Hadoop および Cloudera Manager との統合をサポート

原文(投稿日:2012/02/26)へのリンク

Oracle Big Data Appliance と Big Data Connectors は Hadoop,Cloudera Manager,そして Oracle NoSQL Database との統合をサポートするプロダクトだ。Oracle は先月,この2製品の提供に合わせて Cloudera とのパートナーシップを 発表した

Big Data Appliance に組み込まれた "Cloudera's Distribution" には,Cloudera Manager を備えた Apache Hadoop (CDH) に加えて,統計プログラム言語 R のオープンソース配布版が含まれている。パッケージに同梱された HotSpot Java Virtual Machine を使用して Oracle Enterprise Linux 5.6 オペレーティングシステム上で動作する。Big Data Appliance 上では Oracle NoSQL Database の Community および Enterprise エディションを実行できる。Oracle Big Data Connectors を使用して Exadata や Oracle Database など他の Oracle 製品と統合することにより,企業内にある構造化あるいは非構造化データを解析することも可能だ。

Big Data Connectors:

Oracle Big Data Connectors は,Hadoop あるいは Oracle NoSQL Database に格納されたデータを Oracle Database 11g に統合するプロダクトだ。Oracle の提供するオープンソース R 解析環境を使用して Hadoop データを直接解析することが可能になる。Big Data Connectors のソフトウェアバンドルには以下のコンポーネントが含まれている。

  • Oracle Loader for Hadoop: Hadoop から Oracle Database へのデータローディングを最適化する MapReduce ユーティリティ。Hadoop 内データの ソートとパーティション,あるいは Oracle Database フォーマットへの変換に使用可能である。Hadoop クラスタ上で Hadoop ジョブとして動作し,対象データをプリプロセスした後に,変換されたデータをデータベースにロードする。オンライン/オフラインのロードオプション,ロードバランシングをサポートし,複数の入力フォーマット (区切りテキストファイル,Hive テーブル,その他カスタム形式) に対応する。
  • Oracle Direct Connector for Hadoop Distributed File System (HDFS): HDFS 上のデータに Oracle Database から接続して外部テーブルを作成することによって,HDFS データへのアクセスとインポートを実現する。HDFS に格納されたデータの SQL によるクエリ,Oracle Database 上のデータとの結合,Oracle Database へのロードが可能になる。HDFS 上のデータは Oracle Loader for Hadoop の生成する区切りファイルや,Oracle データポンプファイルに格納されているものでもよい。
  • Oracle Data Integrator (ODI) Application Adapter for Hadoop: ODI 内部でネイティブな Hadoop 統合を提供するアダプタ。ODI 内部での Hadoop メタデータ構築,Hadoop へのデータロード,Hadoop 内でのデータ変換,さらには Oracle Loader for Hadoop で Oracle Database にデータを直接ロードするために ODI モジュールを使用することができる。
  • Oracle R Connector for Hadoop: このコンポーネントは,Hadoop と HDFS に格納されたデータへのアクセスを提供する R パッケージである。MapReduce の処理を活用した大量のデータに対応する R モデルの生成に使用する。

Cloudera Manager:

Cloudera Manager は Big Data Appliance バンドルに含まれている。起動中のノードとサービスに関するクラスタ全体のリアルタイムビューを提供する。さらにクラスタ全体の構成変更を実行するために使用することも可能である。クラスタのパフォーマンス,利用状況などを確認するためのレポート機能と診断ツールも備えている。

Oracle Advanced Analytics:

さらに Oracle は先日,統計プログラム言語 R を Oracle Database 11g に組み込んだ製品 Oracle Advanced Analytics for Big Data を発表した。新たに組み込まれた Oracle Data Mining が予測分析アプリケーションの構築とデプロイを支援し,アプリケーションのパフォーマンスに関するより多くの洞察をユーザに提供する。

 

Srini Penchikala 氏は現在,セキュリティアーキテクトとして活動している。氏はソフトウェア開発管理において 17 年の経験を持っている。

この記事に星をつける

おすすめ度
スタイル

BT