InfoQのすべての体験をアンロックして、そのメリットを最大限に活用しましょう

ログインして、InfoQのすべての体験をアンロックしましょう！お気に入りの著者やトピックの最新情報を入手し、コンテンツと交流し、限定リソースをダウンロードできます。

ログイン

または

アカウントをお持ちでない方

登録

InfoQ ホームページ Big Data に関するすべてのコンテンツ

ニュース

RSSフィード

最新前の記事

DataBricks，Sparkで構造化データを操作するSpark SQLを発表

Apache Sparkを開発するDataBricksは，SparkエコシステムにSpark SQLという新たな製品を投入すると発表した。Spark SQLはSparkから独立した製品で，Hiveを内部的に使用していない。InfoQでは同社のソフトウェア技術者であるReynold Xin，Michael Armbrust両氏とコンタクトを取り，Spark SQLについて詳しく聞いた。

Matt Kapilevich 翻訳者吉田英人
投稿日 2014年4月24日午前10時16分
Hadoopに挑むHydra

ソーシャルネットワーク企業のAddThisは先日，HydraをApacheバージョン2.0ライセンスの下で，オープンソースとして公開すると発表した。Hydraは，半構造化ソーシャルデータをライブストリームとして処理することで，それらのデータに対する効率的なクエリ処理を実現するために開発された，同社の社内プラットフォームを発展させたものだ。

Rags Srinivas 翻訳者吉田英人
投稿日 2014年4月21日午前1時23分
セルベースのセキュリティが導入されたHBase 0.98

ApacheはHBase 0.98をリリースした。セルベースのセキュリティを通じてApache Accumuloとの共通化を計ると同時に，230以上のJIRAイシューを解決することを主な目的としている。新たに導入されたセキュリティ機能は，Accumuloをモデルとしたものだ。

Rags Srinivas 翻訳者吉田英人
投稿日 2014年4月13日午後8時36分
ThoughtWorks Technology RadarについてRebecca Parsons氏が語��

1月、ThoughtWorksは最新のTechnology Radarで、同社が追跡しているソフトウエア開発のエコシステムの動向を発表した。1)プロダクション環境での警告システムとリカバリ、2)プライバシとビッグデータの緊張関係、3)JavaScriptのエコシステム、4)物理と仮想の環境の境界の曖昧化、の4つが今年の大きなテーマだ。

Shane Hastie 翻訳者徳武聡
投稿日 2014年4月6日午後4時37分
ビッグデータ技術を用いたグラフ処理

極度に大きなグラフの処理は現在でもなお難しい問題だ。しかし最近のビッグデータ技術の進歩は，このようなタスクをより実用的なものにしている。ニューヨークを拠点にクロスデバイスなコンテント配信を手掛けているTapadはビッグデータを活用して，テラバイトサイズのデータにまで拡張可能なグラフ処理を，ビジネスモデルの中心とするスタートアップだ。

Charles Menguy 翻訳者吉田英人
投稿日 2014年3月23日午後3時14分
Domino :Datascience-as-a-Service

Dominoはデータサイエンス向けのPlatform-as-a-Serviceであり、クラウド(EC2)を使ってPythonやRのような言語でデータ分析ができる。

Michael Hausenblas 翻訳者徳武聡
投稿日 2014年3月19日午前1時51分
IBMがWatsonを使用したコグニティブモバイルアプリのコンテストを開催

IBMはMobile World Congressで，IBM Watsonコグニティブ(認知)コンピューティング・プラットフォームを活用した，一般消費者およびビジネス向けモバイルアプリ開発コンテストの開催を発表した。このIBM Watson Mobile Developer Challengeの勝者は，市場へのアクセス獲得に対して，IBMの設計コンサルティングとサポートを受けることができる。

Sergio De Simone 翻訳者吉田英人
投稿日 2014年3月16日午後10時0分
HazelcastがMapReduce APIをサポート

オープンソースのインメモリデータグリッドソリューションHazelcastがMapReduceAPIを新たに導入した。

Michael Hausenblas 翻訳者吉田英人
投稿日 2014年3月9日午後8時24分
Elasticsearch 1.0.0リリース

オープンソースアナリティクスツールであるElasticsearchのバージョン1.0.0がリリースされた。Elasticsearchはビッグデータ環境でのリアルタイム分析を実現する分散検索エンジンだ。新しいバージョンはさまざまな機能強化がされており、より直感的に使えるようになっている。

Ralph Winzinger 翻訳者徳武聡
投稿日 2014年2月24日午後7時11分
ビッグデータ革命と遺伝子情報解析

Curoverse 社とTute Genomics社は、一般大衆に向けた遺伝子解析の提供を目指し、先月担保付き債権1,500万ドルの出資を受けた。Illumina社、Seven Bridges Genomics社、Complete Genomics社等は、研究者や民間組織に対して4桁ドル台の価格で全ゲノム配列解析サービスを提供している。Illumina社は先ごろ、かねてから待望の1,000ドルのゲノム解析サービス HiSeq X Ten を発表した。

Alex Giamas 翻訳者株式会社オープンストリーム寺田英雄
投稿日 2014年2月20日午後5時44分
SparkRを使ってRでSparkを動かす

2014年1月にUCバークレーのAMPLabがApache SparkをRから使うための仕組みであるSparkRプロジェクトの開発者プレビューを発表した。

Charles Menguy 翻訳者徳武聡
投稿日 2014年2月19日午後5時35分
DataFuがApacheのインキュベーションプロジェクトに

LinkedInによるHadoop用ライブラリのコレクションであるDataFuプロジェクトが１月第１週，正式にApache Software Foundation(ASF)のインキュベーションプロジェクトになった。

Charles Menguy 翻訳者吉田英人
投稿日 2014年2月17日午後9時10分
ビッグデータ: 言語は本当に重要か?

ビッグデータの分野では、数十億ものイベントの中で、たった1ミリセコンドの損失が重大な影響を与える。それにもかかわらず、Pythonのような遅いと考えられている言語が、この1年で非常に人気が出ている。ビッグデータコミュニティの最近の記事や議論では、データサイエンスとビッグデータのプログラミング言語の選択について、論争を始めている。

Charles Menguy 翻訳者大田緑 - (株)チェンジビジョン
投稿日 2014年2月11日午後9時17分
Presto-as-a-Service:AWSでのインタラクティブなSQL実行

Facebookが開発したPrestoは大規模なデータにインタラクティブにSQLを実行できるが、始めてメインストリームの利用例が生まれた。ビックデータ関連のスタートアップであるQuboleAmazon Web Servicesと統合したPresto-as-a-Serviceのアルファ版を発表した。

Charles Menguy 翻訳者徳武聡
投稿日 2014年2月9日午後10時40分
Hadoop-as-a-Service提供のQuboleがGoogle Compute Engine上で稼働可能に

マネージドHadoop-as-a-Serviceを提供するQuboleがGoogle Compute Engine (GCE)上で利用可能となった。QuboleはこれまでAmazon社のAWS上のみで利用可能だったが、この発表はGoogle Compute Engineの一般提供が開始されたほんの数日後に行われた。

Michael Hausenblas 翻訳者株式会社オープンストリーム中村
投稿日 2014年1月28日午後10時15分