BT

最新技術を追い求めるデベロッパのための情報コミュニティ

寄稿

Topics

地域を選ぶ

InfoQ ホームページ Big Data に関するすべてのコンテンツ

  • ビッグデータ技術を用いたグラフ処理

    極度に大きなグラフの処理は現在でもなお難しい問題だ。しかし最近のビッグデータ技術の進歩は,このようなタスクをより実用的なものにしている。ニューヨークを拠点にクロスデバイスなコンテント配信を手掛けているTapadはビッグデータを活用して,テラバイトサイズのデータにまで拡張可能なグラフ処理を,ビジネスモデルの中心とするスタートアップだ。

  • Domino :Datascience-as-a-Service

    Dominoはデータサイエンス向けのPlatform-as-a-Serviceであり、クラウド(EC2)を使ってPythonやRのような言語でデータ分析ができる。

  • IBMがWatsonを使用したコグニティブモバイルアプリのコンテストを開催

    IBMはMobile World Congressで,IBM Watsonコグニティブ(認知)コンピューティング・プラットフォームを活用した,一般消費者およびビジネス向けモバイルアプリ開発コンテストの開催を発表した。このIBM Watson Mobile Developer Challengeの勝者は,市場へのアクセス獲得に対して,IBMの設計コンサルティングとサポートを受けることができる。

  • HazelcastがMapReduce APIをサポート

    オープンソースのインメモリデータグリッドソリューションHazelcastがMapReduceAPIを新たに導入した。

  • Elasticsearch 1.0.0リリース

    オープンソースアナリティクスツールであるElasticsearchのバージョン1.0.0がリリースされた。Elasticsearchはビッグデータ環境でのリアルタイム分析を実現する分散検索エンジンだ。新しいバージョンはさまざまな機能強化がされており、より直感的に使えるようになっている。

  • ビッグデータ革命と遺伝子情報解析

    Curoverse 社とTute Genomics社は、一般大衆に向けた遺伝子解析の提供を目指し、先月担保付き債権1,500万ドルの出資を受けた。Illumina社、Seven Bridges Genomics社、Complete Genomics社等は、研究者や民間組織に対して4桁ドル台の価格で全ゲノム配列解析サービスを提供している。Illumina社 は先ごろ、かねてから待望の1,000ドルのゲノム解析サービス HiSeq X Ten を発表した。

  • SparkRを使ってRでSparkを動かす

    2014年1月にUCバークレーのAMPLabがApache SparkをRから使うための仕組みであるSparkRプロジェクトの開発者プレビューを発表した。

  • DataFuがApacheのインキュベーションプロジェクトに

    LinkedInによるHadoop用ライブラリのコレクションであるDataFuプロジェクトが1月第1週,正式にApache Software Foundation(ASF)のインキュベーションプロジェクトになった。

  • ビッグデータ: 言語は本当に重要か?

    ビッグデータの分野では、数十億ものイベントの中で、たった1ミリセコンドの損失が重大な影響を与える。それにもかかわらず、Pythonのような遅いと考えられている言語が、この1年で非常に人気が出ている。ビッグデータコミュニティの最近の記事や議論では、データサイエンスとビッグデータのプログラミング言語の選択について、論争を始めている。

  • Presto-as-a-Service:AWSでのインタラクティブなSQL実行

    Facebookが開発したPrestoは大規模なデータにインタラクティブにSQLを実行できるが、始めてメインストリームの利用例が生まれた。ビックデータ関連のスタートアップであるQuboleAmazon Web Servicesと統合したPresto-as-a-Serviceのアルファ版を発表した。

  • Hadoop-as-a-Service提供のQuboleがGoogle Compute Engine上で稼働可能に

    マネージドHadoop-as-a-Serviceを提供するQuboleがGoogle Compute Engine (GCE)上で利用可能となった。QuboleはこれまでAmazon社のAWS上のみで利用可能だったが、この発表はGoogle Compute Engineの一般提供が開始されたほんの数日後に行われた。

  • TwitterがMapReduceストリーミングフレームワークSummingbirdをオープンソースに

    Twitterは,Summingbirdと呼ぶ自社のMapReduceストリーミングフレームワークをオープンソースにした。Apache 2ライセンスで公開されるSummingbirdは,コードをバッチモード(Hadoop/MapReduceをベースとする)でもストリームモード(Stormをベースとする)でも,あるいはハイブリッドモードと呼ばれる2つの組み合わせでも同じように実行することができる,大規模データ処理システムだ。

  • データサイエンティスト向け教育プログラム

    2013年はデータサイエンティストやビッグデータ専門家向けの新しい教育プログラムが多く発表された。

  • データラングリング・アズ・ア・サービスの簡易化を目指すTrifacta

    データ解析サービスプラットフォームのTrifactaは先頃,データアナリストのデータラングリング(Data Wrangring)作業支援という同社の活動を推進するため,VCによる出資を受け入れた。目標はデータ収集とクレンジング,マージといった作業を,現在よりはるかに少ない時間と労力で可能にすることだ。

  • EC2でMesosによるクラスタの自動デプロイを実現するElastic Mesos

    EC2上でApache Mesosの自動デプロイが可能になった。Apache Mesosはクラスタのリソース全体を,複数のデータ処理フレームワークで共有するオープンソースツールである。使用されているのは,ビッグデータの新興企業Mesosphereが提供するElastic Mesosという,新しいWebサービスだ。

BT