InfoQ ホームページ Big Data に関するすべてのコンテンツ
-
GoogleがMesaを公開 - 地理的レプリケーションと準リアルタイム性を備えた,スケーラブルなデータウェアハウス
GoogleがMesaというデータウェアハウスを新たに公開した。Mesaは複数のデータセンタにスケールして,ペタバイト単位のデータを扱うと同時に,秒以下のオーダでのクエリ応答とACID特性を実現するシステムである。
-
Hadoop-as-a-Service APIのCloudbreakが公開ベータへ
クラウドに依存しないオープンソース Hadoop-as-a-Service APIとして新たに登場したCloudbreakが,アプリケーション開発者と企業を対象としたベータ版の提供を開始した。Cloudbreakを開発したSequenceIQでは,無償で公開される同社のプロダクトについて,プロビジョニングを抽象化し,オンデマンドHadoopクラスタの管理と監視を容易にする,と主張している。
-
Clouderaがビッグデータ暗号化の新興企業Gazzangを買収
HadoopディストリビュータのClouderaが,Hadoopエコシステムのセキュリティ戦略を進めている。同社は先月,ビッグデータの暗号化とキー管理の新興企業であるGazzangを買収した。この取引はClouderaをセキュリティ面で強化すると同時に,Gazzangの技術チームが先鞭をつけた,Hadoopセキュリティの卓越した中心的存在の創造にもつながるものだ。
-
AyasdiがClouderaと業務提携
Ayasdiは昨月、Apache Hadoopの最大のディストリビュータであるClouderaとの業務提携を発表した。 この業務提携は、Cloudera Enterprise 5(Apache HadoopをベースとするClouderaのビッグデータプラットフォームの最新版) に対する、Ayasdiのソリューションの対応を保証するものだ。
-
Docker 1.0リリース
Docker.ioはDockerConでDockerバージョン1.0を発表した。バージョン0.12.0をリリースしてから数日でのリリースだ。バージョン1.0は新しい機能ではなく、安定性、性能、使いやすさに注力したバージョンだ。運用環境で利用できる状態になったということはDocker.ioがDockerのサポートサービスを提供するということだ。
-
SplunkがHunk 6.1をリリース
Splunkは機械が生成したデータを検索や監視、分析することに特化した企業だ。同社はHunk 6.1のリリースを発表した。Hunkはビッグデータ分析のプラットフォームを提供する。ストリーミングリソースライブラリを使うことで開発者はHunkをどのようなNoSQLエンジンにも接続できるようになった。Apache CassandraやMongoDBやNeo4jなどだ。
-
Cascading 3.0 が複数のフレームワークをサポート。 Concurrent Driven によるビッグデータアプリケーションの管理
ConcurrentはCascading 3.0 を初夏にリリースする予定である。これを使えばMapReduce、Tez、Spark、Storm等の複数のビッグデータフレームワーク上で特定のアプリケーションを実行できる。さらに、Drivenという新しいConcurrentの商用製品はビッグデータ・アプリケーションのための強力なエンタープライズ・データ・アプリケーション管理機能を提供する。
-
ApacheCON NA 2014,テーマは”コミュニティ"
今年のApacheCON North Americaカンファレンスの基調講演のおもなテーマは,オープンソースとそのコミュニティだった。400人以上の参加者と70を越えるプロジェクト,180のセッションが用意されたカンファレンスでは,Apache Software Foundation (ASF)のプロジェクトと同じように,さまざまな話題が数多く取り上げられていた。
-
ビッグデータHadoopソリューション、2014年第一四半期の状況
最新のForrest reportによると、Hadoopの勢いはとどまるところを知らない。エンタープライズでのHadoopの使用は、新しい方法でのデータの保存、処理、分析、そしてビッグデータの共有などの能力により、継続的に増加している。このレポートでは各Hadoopベンダーに注目し、ランク付けを行っている。
-
ClouderaがMongoDBと提携,Hadoopデータを同社のNoSQL DBに
現在の"企業データの80%が非構造であり,構造データの2倍の速度で増加している"という事実を前置きに,ClouderaとMongoDBの2社は,ApacheベースのビッグデータプラットフォームとNoSQLソリューションの組み合わせをオプションとして提供する"戦略的"パートナーシップを発表した。
-
継続的開発は新しいメンテナンスの現実か?
モノのインターネット、Web API、ビッグデータは継続的開発を現実のものとし、開発者を完成したアプリケーションのメンテナンス作業に釘付けにするだろう。Dr.DobbsのAndrew Binstock氏はそう語る。開発者の時間を有効活用するためには、短期スプリント、継続的インテグレーションおよびデプロイメント、最新のプログラミングプラクティスがこれまで以上に重要になる。
-
DataBricks,Sparkで構造化データを操作するSpark SQLを発表
Apache Sparkを開発するDataBricksは,SparkエコシステムにSpark SQLという新たな製品を投入すると発表した。Spark SQLはSparkから独立した製品で,Hiveを内部的に使用していない。InfoQでは同社のソフトウェア技術者であるReynold Xin,Michael Armbrust両氏とコンタクトを取り,Spark SQLについて詳しく聞いた。
-
Hadoopに挑むHydra
ソーシャルネットワーク企業のAddThisは先日,HydraをApacheバージョン2.0ライセンスの下で,オープンソースとして公開すると発表した。Hydraは,半構造化ソーシャルデータをライブストリームとして処理することで,それらのデータに対する効率的なクエリ処理を実現するために開発された,同社の社内プラットフォームを発展させたものだ。
-
セルベースのセキュリティが導入されたHBase 0.98
ApacheはHBase 0.98をリリースした。セルベースのセキュリティを通じてApache Accumuloとの共通化を計ると同時に,230以上のJIRAイシューを解決することを主な目的としている。新たに導入されたセキュリティ機能は,Accumuloをモデルとしたものだ。
-
ThoughtWorks Technology RadarについてRebecca Parsons氏が語る
1月、ThoughtWorksは最新のTechnology Radarで、同社が追跡しているソフトウエア開発のエコシステムの動向を発表した。1)プロダクション環境での警告システムとリカバリ、2)プライバシとビッグデータの緊張関係、3)JavaScriptのエコシステム、4)物理と仮想の環境の境界の曖昧化、の4つが今年の大きなテーマだ。