InfoQ ホームページ Big Data に関するすべてのコンテンツ

ニュース

RSSフィード

最新前の記事

Netflixがビッグデータ分析基盤を紹介

Netflixでシニアソフトウェアエンジニアを務めるTom Gianos氏とNetflixでビッグデータ計算のエンジニアリングマネージャを務めるDan Weeks氏は、QCon San Francisco 2016で同社のビッグデータ戦略と分析基盤について話をした。データの大きさやS3のデータウエアハウス、そして、ビッグデータのオーケストレーションシステムであるGenieが話題に上がった。

Andrew Morgan 翻訳者徳武聡
投稿日 2017年3月28日午前3時37分
Apache Rangerがトップレベルのプロジェクトに昇格

Apache Hadoopエコシステムのセキュリティ管理フレームワークであるApache Rangerがトップレベルに昇格した。Rangerは、Apache HBase、Hadoop（HDFSとYARN）、Apache Hive、Apache Kafka、Apache Solrなど、サポート対象のHadoopコンポーネントに適用されるセキュリティポリシーを一元的に定義および管理するためのコンポーネントである。

Alexandre Rodrigues 翻訳者編集部Ｔ
投稿日 2017年3月22日午前1時26分
デベロップメント

BeamがトップレベルのApacheプロジェクトへ昇格

Beamはインキュベーション期間を終了し、トップレベルのApacheプロジェクトに昇格した。Googleは、さまざまなデータ処理バックエンドをオープンソースでインテグレーションするためのサポートと貢献をしている。

Dylan Raithel 翻訳者編集部Ｔ
投稿日 2017年3月6日午後10時30分
Apache Flink 1.2がリリース、ダイナミックリスケーリング、セキュリティ、Queryable Stateを提供

Apache Flink 1.2が発表された。ダイナミックリスケーリング，セキュリティ，Queryable Stateなどを備える。リリースでは650件の問題点が解決され，公開APIの互換性が維持されるとともに，Apache Kafka 0.10が同梱され，Apache Mesosがサポートされる。ダイナミックリスケーリングによって，ストリーミングジョブやジョブ内のオペレータの並行度を変更することも可能だ。

Alexandre Rodrigues 翻訳者 h_yoshida
投稿日 2017年3月6日午後10時19分
Mathieu Ripert氏，Instacartのマシンラーニング最適化を語る

Instacartは食料品を１時間以内に届けるオンライン・デリバリサービスである。アイテムをWebサイトあるいはモバイルアプリで注文すると，Instacartの購入代行者グループが地元の店舗でそれを購入して，購入者に届ける仕組みだ。InfoQは同社のデータサイエンティストであるMathieu Ripert氏にインタビューして，よりよいカスタマエクスペリエンスを保証する上で，Instacartがマシンラーニングをどのうように活用しているのか聞いた。

Alexandre Rodrigues 翻訳者 h_yoshida
投稿日 2017年2月27日午後8時5分
Giltのディープラーニング応用

ディープラーニングはニューラルネットワークを起源として，マシンラーニングの中で急速に進化しているサブフィールドだ。最近のアルゴリズム的な進歩とGPUによる並列化の活用は，囲碁のようなゲームをマスタするだけでなく，ディープラーニングをベースとしたアルゴリズムによる実用的なアプリケーションをいくつも実現している。ファッション業界はその対象分野のひとつだ。 Giltは実用的なアプリケーションとしてディープラーニングを利用している。

Alex Giamas 翻訳者 h_yoshida
投稿日 2017年2月26日午後10時54分
Apache Eagleがトップレベルプロジェクトに昇格

ビッグデータプラットフォーム上でのセキュリティおよびパフォーマンスに関する問題を特定する，オープンソースソリューションのApache Eagleが，2017年1月10日，Apacheのトップレベルプロジェクトに昇格した。eBayが2015年10月にオープンソースとしたEagleは，機密データへのアクセスや悪意のある活動を簡単に検出し，タイムリに対応する目的で開発されたソフトウェアだ。

Alexandre Rodrigues 翻訳者 h_yoshida
投稿日 2017年2月20日午後8時54分
Microsoftがドローンとロボットのためのシミュレータ、AirSimをリリース

MicrosoftがAirSimを開発してオープンソース化した。これは世界各地におけるドローンの飛行をシミュレートするのに使えるツールだ。シミュレータはUnreal Engineで作られており、Microsoftはまもなくロボットや他の種類の車両のサポートを追加する予定だ。

Abel Avram 翻訳者 sasai
投稿日 2017年2月20日午前1時52分
Apache HBase 1.3リリースで多数のパフォーマンス改善

Apache HBase 1.3.0は、2017年1月中旬にリリースされた。今回のリリースでは、日付ベース階層圧縮がサポートされ、ログ先行書き込み(WAL)や新しいRPCスケジューラなど複数箇所で改善があった。このリリースには、合計で約1,700件の解決済みのissueが含まれている。

Alexandre Rodrigues 翻訳者編集部Ｔ
投稿日 2017年2月19日午後10時19分
MindMeldの対話型アプリケーション構築ガイド

対話型（会話型）AI企業のMindMeldが、対話型アプリケーションを作成するための課題と手順を説明した「The Conversational AI Playbook」を公開した

Abel Avram 翻訳者 sasai
投稿日 2017年2月10日午前1時53分
In-Memory技術を使用したAzure SQLデータベースのパフォーマンス改善

2016年後半に、MicrosoftはAzure SQL Database In-Memory技術の一般向け提供（GA）を発表した。In-Memory処理は、Azure Premiumデータベースサービスでのみ利用可能で、Hybrid Transactional and Analytical Processing (HTAP)のシナリオに対して、On-line Transaction Processing(OLTP)、Clustered Columnstore Indexes、Non-clustered Columnstore Indexesのパフォーマンスが向上する。

Kent Weare 翻訳者編集部Ｔ
投稿日 2017年1月29日午後8時43分
GoogleのBigQueryに新たなパブリックデータセットが追加

Stack Overflowは、そのデータセットをGoogleのBigQueryを通して利用可能となることを最近発表した。開発者は、標準のSQL文を使用して、投稿、投票、タグ、バッジなどのStack Overflowデータ全体を対象にクエリできる。本投稿では、GoogleのBigQueryプラットフォームを通して利用可能なデータをセットを探っていく。

Alex Giamas 翻訳者編集部Ｔ
投稿日 2017年1月17日午前12時2分
Julien Nioche氏が語るStorm Crawler - Apache Stormをベースとするオープンソースのクローラパイプライン

DigitalPebbleのディレクタで，Apache NutchWebクローラプロジェクトのPMCメンバ兼コミッタであるJulien Nioche氏が，StormCrawlerについての講演を行なった。StormCrawlerはストリーミングフレームワークであるApache Stormをベースとした，分散Webクローラ開発のための再利用可能なコンポーネントのコレクションだ。InfoQはプロジェクトの中心的コントリビュータであるNioche氏にインタビューして，StormCrawlerに関する詳細と，同種のテクノロジとの比較について聞くことにした。

Alexandre Rodrigues 翻訳者吉田英人
投稿日 2017年1月16日午後8時56分
Facebookによるグラフデータ処理のためのApache GiraphとSpark GraphXの比較

Facebookチームは、既存のGiraphベースのグラフ処理システムと、人気のSparkフレームワークの一部である新しいGraphXとのパフォーマンス比較を先日公開した。彼らの結論はGraphXは現在、彼らのグラフ処理ワークロードをサポートするために十分なスケーラビリティやパフォーマンスを備えていないということだ。

Srini Penchikala 翻訳者奥田佳享
投稿日 2017年1月16日午前12時21分
Julien Le Dem氏に聞く - Apache Arrowが示すカラム指向データ処理の未来

Apache ArrowプロジェクトでPMCのリーダを務めるJulien Le Dem氏が，カラム指向データ処理の今後について，Data Eng Conf NYでプレゼンテーションを行なった。Apache Arrowはカラム型インメモリデータベースのオープンソース標準である。InfoQはParquetとの違いを確認すべく，氏にインタビューした。

Alexandre Rodrigues 翻訳者吉田英人
投稿日 2017年1月9日午後10時21分