数ヶ月前Microsoftは、管理、分析、大容量データの意味を知ることができるMicrosoftのHadoopディストリビューションである HDInsightをアナウンスした。InfoQは、SQL ServerのシニアプロダクトマーケティングマネージャのVal Fontama氏と接触して、MicrosoftでのエンタープライズBig Dataストーリーの成功例について確認した。
エンタープライズにおけるデータセットサイズの傾向について -
このデータの海は、常に大きくなり続けています。いくつかの予測ではビジネスの情報ストアは毎年二倍になっていくと言われています。ガートナーによると、情報ボリュームは世界中で少なくとも年に59%増加して、そのうちのおよそ85%がビデオクリップ、RFIDタグやWebサイトログなど“構造化されていない ”データです。この構造化されていないデータは、従来のデータ管理システムにすぐに適応できません。さらに、お客様は多くのケースで新しいデータを集めていて、データが急速に増加していることを目の当たりにしています。
お客様は、ビジネスのニーズと彼らが集めたデータで成長するモダンなデータプラットフォームを必要としています。Big dataは世界中で、構造化、非構造化に関わらず彼らが集めた全てのデータから、新しい実践可能な巨大なビジネス機会を生み出しました。結局、Big Dataの最大の約束は、データからよりよい意思決定を促進することです。それを行うには、すべての種類のデータからの新しい洞察が必要です。
HDInsightは、MicrosoftのBig Dataチャレンジに取り組むソリューションである-
Microsoftは、Windows ServerとWindows AzureへのHadoopディストリビューションのポータビリティ、すぐれたパフォーマンス、セキュリティ、簡単なデプロイによってエンタープライズへの(Hadoop)の採用を加速したいと考えています。Microsoftは、HDInsightとActive Directory.を統合することにより、Hadoopのセキュリティを拡張します。これにより、Hadoopクラスタを含む、すべてのIT資産をまたいで首尾一貫したセキュリティを適用することができるようになります。
さらにSystem Centerと統合することにより、HDInsightはHadoopの管理を簡単にして、ITが、SQL Serverデータベースやひとつのガラス板上のアプリケーションと同じように、彼らのHadoopクラスタを管理することができるようになります。
Hadoopベースのアプリケーションは、Excel、Power View、PowerPivotなどMicrosoftのbusiness intelligence (BI)ツールと統合したWindowsプラットフォームをターゲットにしており、大量のビジネス情報を簡単に分析することにより、ユニークで、差別化された価値を創造します。
Apache Hadoop と100%互換を製造するために、MicrosoftのHadoopディストリビューションであるHDInsightは、Hortonworks Data Platform (HDP)上に構築されています。結果として、お客様は彼らのMapReduceジョブを、彼ら自身のWindowsサーバーからクラウドやLinux上で実行されているApache Hadoopディストリビューションに移行することができます。他のベンダーは現在これを提供していません。さらに、Windows ServerとAzureプラットフォームでこれらの機能を提供していて、データから実用的な結果を抽出することを容易にするためにExcel、PowerPivot for Excel、Power Viewといった使い慣れたツールを使用することができます。
SQL Serverはどのようにこのソリューションにフィットさせるのか –
SQL Server 2012のエンタープライズの大きなデータセットを処理するためSQL Server 2008とのもっとも大きな違いのひとつは、Hadoopとの互換性です。Hadoopは、構造化されているものと、されていない両方の大量のデータを迅速に必要なデータを探せるように処理することができ、またHadoopはオープンソースで、低コストでこれを提供することができます。MicrosoftとHortonworksとの提携は、SQL Server 2012とHadoopの互換開発だけじゃなく、最近のアナウンスで、お客様はMicrosoft HDInsight ServerとWindows Azure HDInsight Serviceのプレビューを使ってデータから最適な結果を抽出するためにMicrosoftが開発したHadoopコネクタを使用することができます。SQL ServerをHadoopに接続するHive ODBC Driverにより、お客様は構造化されていないデータを含むすべての種類のデータを分析するためにSQL Server 2012のPowerPivotやPower ViewのようなMicrosoft BIツールを使用することができます。 さらに、SQL Server 2012の新しいData Quality Servicesにより、お客様は生データをモデリングに合う一貫性のあるデータに変換することによって、彼らのデータを向上させることができます。
Microsoftは先日、アプリの構築とデータサービスの利用によりそれらを活用することができるようになるOffice 2013の新機能を発表した。驚くことではないが、Microsoft自身がExcelでBig Dataサービスを提供するためにそれを使用している。–
ExcelはMicrosoftプラットフォームでBig Data分析を可能にする主要なクライアントのひとつです。Excel 2013では、私たちの主要なBIツールは、データモデリングツールのPowerPivotと、データ視覚化ツールのPower Viewであり、ソフトウェアに組み込まれているため、追加でダウンロードする必要がありません。これにより、すべてのレベルのユーザーは使い慣れたExcelインターフェイスを使って、セルフサービスでBIすることができます。
ExcelのHiveアドインを通じて私たちのHDInsightサービスは簡単にOffice 2013のBIツールと統合することができ、ユーザーが非常に使い慣れたツールで大量の構造化された、またはされていないデータを簡単に分析することができます。
MicrosoftはExcelに加えて、Big Dataと対話ができるほかのツールを提供している。BIのプロフェッショナルは、BI Developer Studioを使ってSQL Server Analysis Services のOLAPキューブやスケーラブルPowerPivotモデルの設計ができます。開発者は、.NETで書かれたMapReduceプログラムの開発とテストのためにVisual Studioを継続して使用することができます。最後にITオペレーターは、現在使っているSystem CenterでHDInsight上のHadoopクラスタを管理することができます。
全体にわたってMicrosoftの戦略は、SQL ServerとOfficeなどの既存のツールで新しいデータタイプがシームレスに動作するようにして、企業の既存の投資を活用することができるように拡張することによって顧客がBig Dataを採用するための障壁を最小にしようとしているように見える。