BT

最新技術を追い求めるデベロッパのための情報コミュニティ

寄稿

Topics

地域を選ぶ

InfoQ ホームページ ニュース ビッグデータ: 誇大広告と現実を見分ける

ビッグデータ: 誇大広告と現実を見分ける

原文(投稿日:2012/11/02)へのリンク

 

最近、ビッグデータに関する誇大広告と現実を見分けようとする調査がIBMによって行われた。これによると、28%の会社がビッグデータの試験運用や導入を始めており、47%が計画中、24%が学ぼうとしているという。

2012 Analytics Study - The real-world use of big data(要登録)のレポートはIBM Institute for Business Valueとオックスフォード大学のサイード・ビジネススクールが作成したもので、IBMが2012年中頃に実施し、26の業界と95か国から1144名のプロフェッショナルが参加したBig Data @ Work Surveyに基づいている。

このレポートではビッグデータを4つの“V”次元で定義している。

  • 規模(Volume) – この特性はビッグデータに大きく関係するものだ。回答者の50%強が1TB-1PBにあるものがビッグデータだと見なしており、通常言われるマルチPBからZBまでよりも小さかった。
  • 多様性(Variety) – ビッグデータは、企業の内外、構造化データから、半構造化データ、非構造化データまで、幅広い範囲を含んでいる。またデータには、テキスト、バイナリ、センサーデータ、ツィート、Webデータ、クリック、ログ、オーディオ、ビデオなど、多様なタイプがある。
  • 速度(Velocity) – 現在のデータは以前よりも高速に生成され、リアルタイムで処理するのを非常に難しくしている。
  • 正確さ(Veracity) – このレポートでは、データの信頼性を示す4番目の次元を追加している。外的要因および内的要因が、データの品質、そしてそれに基づく分析に影響を及ぼすおそれがある。したがって、この次元について考慮する必要がある。

以下に、Big Data @ Work 調査結果をまとめる。

  • 組織の28%がビッグデータの試験運用やプロジェクト導入を始めており、47%が計画中、24%がそれについて理解しようとしている。
  • ビッグデータプロジェクトの対象は、顧客向け – 49%、運用最適化 – 18%、リスクや財務管理 – 15%、新規ビジネスモデル開拓 – 14%、従業員のコラボレーション – 4%だった。
  • ビッグデータへの取り組みは通常、内部の構造化データから始まり、次に半構造化データ、それから非構造化データへと移っていく。

以下の図は、ビッグデータに取り組んでいる企業が使っている主要なコンポーネントを示している。 

 

興味深いことに、ビッグデータのソースはソーシャルメディアやRFID、ハードウェアセンサーから主としてやってくるものではなかった。トランザクション – 88%、ログデータ – 73%、イベント – 59%、電子メール – 57%、そのあと、ソーシャルメディア – 43%、センサー – 42%、外部フィード – 42%、RFIDやPOS – 41%、携帯メール – 41%、位置情報 – 40%、オーディオ – 38%、写真やビデオ – 34%だった。

ビッグデータに取り組んでいる会社は、次のようなことが可能になったと報告している。問い合わせと報告 – 91%、データマイニング – 77%、データビジュアライゼーション – 71%、予測モデリング – 67%、最適化 – 65%、シミュレーション – 56%、自然言語テキスト – 52%、位置情報分析 – 43%、ストリーミング分析 – 35%、ビデオ分析 – 26%、音声分析 – 25%。

このオンライン調査には世界中からたくさんの人が自主的に参加し、その大部分はビジネスプロフェッショナル(54%)で、以下、エグゼクティブマネジメント(16%)、マーケティング(15%)、リサーチおよびプロダクト開発(10%)、ジェネラルマネジメント/オペレーション(8%)、ファイナンス(5%)と続いた。少なくとも46%がIT業界だった。

 

この記事に星をつける

おすすめ度
スタイル

BT