InfoQ ホームページ Big Data に関するすべてのコンテンツ
-
ビッグデータ技術を用いたグラフ処理
極度に大きなグラフの処理は現在でもなお難しい問題だ。しかし最近のビッグデータ技術の進歩は,このようなタスクをより実用的なものにしている。ニューヨークを拠点にクロスデバイスなコンテント配信を手掛けているTapadはビッグデータを活用して,テラバイトサイズのデータにまで拡張可能なグラフ処理を,ビジネスモデルの中心とするスタートアップだ。
-
Domino :Datascience-as-a-Service
Dominoはデータサイエンス向けのPlatform-as-a-Serviceであり、クラウド(EC2)を使ってPythonやRのような言語でデータ分析ができる。
-
IBMがWatsonを使用したコグニティブモバイルアプリのコンテストを開催
IBMはMobile World Congressで,IBM Watsonコグニティブ(認知)コンピューティング・プラットフォームを活用した,一般消費者およびビジネス向けモバイルアプリ開発コンテストの開催を発表した。このIBM Watson Mobile Developer Challengeの勝者は,市場へのアクセス獲得に対して,IBMの設計コンサルティングとサポートを受けることができる。
-
-
Elasticsearch 1.0.0リリース
オープンソースアナリティクスツールであるElasticsearchのバージョン1.0.0がリリースされた。Elasticsearchはビッグデータ環境でのリアルタイム分析を実現する分散検索エンジンだ。新しいバージョンはさまざまな機能強化がされており、より直感的に使えるようになっている。
-
ビッグデータ革命と遺伝子情報解析
Curoverse 社とTute Genomics社は、一般大衆に向けた遺伝子解析の提供を目指し、先月担保付き債権1,500万ドルの出資を受けた。Illumina社、Seven Bridges Genomics社、Complete Genomics社等は、研究者や民間組織に対して4桁ドル台の価格で全ゲノム配列解析サービスを提供している。Illumina社 は先ごろ、かねてから待望の1,000ドルのゲノム解析サービス HiSeq X Ten を発表した。
-
-
DataFuがApacheのインキュベーションプロジェクトに
LinkedInによるHadoop用ライブラリのコレクションであるDataFuプロジェクトが1月第1週,正式にApache Software Foundation(ASF)のインキュベーションプロジェクトになった。
-
ビッグデータ: 言語は本当に重要か?
ビッグデータの分野では、数十億ものイベントの中で、たった1ミリセコンドの損失が重大な影響を与える。それにもかかわらず、Pythonのような遅いと考えられている言語が、この1年で非常に人気が出ている。ビッグデータコミュニティの最近の記事や議論では、データサイエンスとビッグデータのプログラミング言語の選択について、論争を始めている。
-
Presto-as-a-Service:AWSでのインタラクティブなSQL実行
Facebookが開発したPrestoは大規模なデータにインタラクティブにSQLを実行できるが、始めてメインストリームの利用例が生まれた。ビックデータ関連のスタートアップであるQuboleAmazon Web Servicesと統合したPresto-as-a-Serviceのアルファ版を発表した。
-
Hadoop-as-a-Service提供のQuboleがGoogle Compute Engine上で稼働可能に
マネージドHadoop-as-a-Serviceを提供するQuboleがGoogle Compute Engine (GCE)上で利用可能となった。QuboleはこれまでAmazon社のAWS上のみで利用可能だったが、この発表はGoogle Compute Engineの一般提供が開始されたほんの数日後に行われた。
-
TwitterがMapReduceストリーミングフレームワークSummingbirdをオープンソースに
Twitterは,Summingbirdと呼ぶ自社のMapReduceストリーミングフレームワークをオープンソースにした。Apache 2ライセンスで公開されるSummingbirdは,コードをバッチモード(Hadoop/MapReduceをベースとする)でもストリームモード(Stormをベースとする)でも,あるいはハイブリッドモードと呼ばれる2つの組み合わせでも同じように実行することができる,大規模データ処理システムだ。
-
-
データラングリング・アズ・ア・サービスの簡易化を目指すTrifacta
データ解析サービスプラットフォームのTrifactaは先頃,データアナリストのデータラングリング(Data Wrangring)作業支援という同社の活動を推進するため,VCによる出資を受け入れた。目標はデータ収集とクレンジング,マージといった作業を,現在よりはるかに少ない時間と労力で可能にすることだ。
-
EC2でMesosによるクラスタの自動デプロイを実現するElastic Mesos
EC2上でApache Mesosの自動デプロイが可能になった。Apache Mesosはクラスタのリソース全体を,複数のデータ処理フレームワークで共有するオープンソースツールである。使用されているのは,ビッグデータの新興企業Mesosphereが提供するElastic Mesosという,新しいWebサービスだ。