Microsoftスタックを用いてHadoopを試したり、それらを用いてどのような事が可能になるのか知りたくはないだろうか?その手助けとなるいくつかの資料に関して解説する。
MicrosoftはWindows ServerとWindows AzureにHadoopを持ち込むために昨年Hortonworksとのパートナーシップを締結する事をアナウンスした。Hadoopとそれに関連するBig Dataツールを一般のITエンドユーザーが容易にアクセスできるようにし、 そのためにSQL Server Analysis ServicesやSQL Server Reporting ServicesやExcel PowerPivotとHadoopを統合するといった点を中心にMicrosoftのヴィジョンは展開されている。
では実際にはすぐにどのような事が出来るようになるのだろうか。下記にいくつかのリンクを挙げので、すぐにHadoopを始める事が出来るようになるだろう。
- Azure上のHiveにExcel PowerPivotを接続する方法
- SQL Server DBA向けのHadoopの基礎
- Hadoop on Azureは現在招待のみのプレビューである。Roger Jenningsはサンプルプロジェクトと良いウォークスルーを公開している。
- Channel 9のビデオHadoop on Windows Azureの紹介
- .NET Hadoop MapReduceのJob Submissionに関するジェネリックベースのフレームワーク
もしHadoopやMapReduceが初めてという方は、下記を参照する事も出来る。
Apache Hadoopソフトウェアライブラリは簡単なプログラミングモデルを用いて、クラスタリングされたコンピュータを通じて大容量のデータを分散処理する事を可能にするフレームワークである。このライブラリはアプリケーションレイヤーで障害を検知、処理し、それぞれは故障しやすい一般的な機器によって構成されるクラスタの上に高い可用性を持ったサービスの構築を可能にする。