BT

最新技術を追い求めるデベロッパのための情報コミュニティ

寄稿

Topics

地域を選ぶ

InfoQ ホームページ Streaming に関するすべてのコンテンツ

  • Apache Flink 1.2がリリース、ダイナミックリスケーリング、セキュリティ、Queryable Stateを提供

    Apache Flink 1.2が発表された。ダイナミックリスケーリング,セキュリティ,Queryable Stateなどを備える。リリースでは650件の問題点が解決され,公開APIの互換性が維持されるとともに,Apache Kafka 0.10が同梱され,Apache Mesosがサポートされる。 ダイナミックリスケーリングによって,ストリーミングジョブやジョブ内のオペレータの並行度を変更することも可能だ。

  • Mathieu Ripert氏,Instacartのマシンラーニング最適化を語る

    Instacartは食料品を1時間以内に届けるオンライン・デリバリサービスである。アイテムをWebサイトあるいはモバイルアプリで注文すると,Instacartの購入代行者グループが地元の店舗でそれを購入して,購入者に届ける仕組みだ。InfoQは同社のデータサイエンティストであるMathieu Ripert氏にインタビューして,よりよいカスタマエクスペリエンスを保証する上で,Instacartがマシンラーニングをどのうように活用しているのか聞いた。

  • Chaperone - Uberエンジニアリングチームの開発したKafka監査ツール

    UberエンジニアリングチームがChaperoneという名のKafkaの監査ツールを,オープンソースプロジェクトとしてリリースした。ChaperoneはUberの運用するマルチデータセンタかつ大容量のKafaにおけるデータの損失,遅延,メッセージ重複の監査と検出を可能にする。

  • Apache Eagleがトップレベルプロジェクトに昇格

    ビッグデータプラットフォーム上でのセキュリティおよびパフォーマンスに関する問題を特定する,オープンソースソリューションのApache Eagleが,2017年1月10日,Apacheのトップレベルプロジェクトに昇格した。eBayが2015年10月にオープンソースとしたEagleは,機密データへのアクセスや悪意のある活動を簡単に検出し,タイムリに対応する目的で開発されたソフトウェアだ。

  • Julien Nioche氏が語るStorm Crawler - Apache Stormをベースとするオープンソースのクローラパイプライン

    DigitalPebbleのディレクタで,Apache NutchWebクローラプロジェクトのPMCメンバ兼コミッタであるJulien Nioche氏が,StormCrawlerについての講演を行なった。StormCrawlerはストリーミングフレームワークであるApache Stormをベースとした,分散Webクローラ開発のための再利用可能なコンポーネントのコレクションだ。InfoQはプロジェクトの中心的コントリビュータであるNioche氏にインタビューして,StormCrawlerに関する詳細と,同種のテクノロジとの比較について聞くことにした。

  • Azure FunctionsがGA(General Availability)に到達

    Microsoftが先頃,Azure Functionsという名称のプラットフォーム・アズ・ア・サービス(PaaS)を新たに発表した。2016年3月にプレビュー版としてローンチされたAzure Functionsは,イベント駆動のサーバレスなコンピューティングプラットフォームを,使用した分のみの課金で開発者に提供するものだ。

  • Julien Le Dem氏に聞く - Apache Arrowが示すカラム指向データ処理の未来

    Apache ArrowプロジェクトでPMCのリーダを務めるJulien Le Dem氏が,カラム指向データ処理の今後について,Data Eng Conf NYでプレゼンテーションを行なった。Apache Arrowはカラム型インメモリデータベースのオープンソース標準である。InfoQはParquetとの違いを確認すべく,氏にインタビューした。

  • Apache Flinkを使用したZalandoのマイクロサービスおよびストリーム処理用アーキテクチャ

    Javier Lopez氏とMihail Vieru氏はReactive Summit 2016 Conferenceで,クラウドベースのデータ統合と,ビジネスインテリジェンスのユースケースにおけるストリーミング処理で使用される分散プラットフォームについて講演した。

  • Confluentがマルチデータセンタレプリケーションを備えた企業向けKafkaを発表

    Confluent Enterpriseの最新バージョンは,マルチデータセンタレプリケーション,自動データバランシング,クラウドマイグレーション機能をサポートする。Apache Kafkaベースのストリーミングプラットフォームを提供するConfluentは先週,ストリーミングデータパイプライン構築とストリーム処理アプリケーション開発を支援するConfluent Enterpriseの新機能を発表した。

  • Twitterがストリーム処理エンジンHeron��オープンソース化

    InfoQのRags Srinivas氏は,Karthik Ramasamy氏(Twitterの技術マネージャかつ共同開発者)に対し,ストリーム処理エンジンHeron(Apache Stormの後継)のオープンソース化に関する取材を行った。

  • Jey Kreps氏,Apache KafkaとKafka Streamsを利用した分散ストリーム処理を語る

    Apache KafkaとKafka Streamsフレームワークは,ストリーム中心アーキテクチャと分散型ストリーム処理アプリケーションの開発を支援する。Jay Kreps氏(Confluent社のCEO)は,先週,Reactive Summit 2016 Conferenceにて,ストリーム処理とマイクロサービスに関する基調講演を行った。

  • ストリーム処理とLamdaアーキテクチャへの挑戦

    Lamdaアーキテクチャはバッチとストリーム処理を結合させる有名なソリューションである。LinkedInのKatrik Paramasivam氏はデータ処理のためにApache Samzaを用いてチームがどうストリーム処理とLambdaアーキテクチャへの挑戦を行ったかを執筆した。この挑戦はイベントの遅延到着と複製メッセージの処理について記載されている。

  • Neha Narkhede氏が語る - Apache Kafkaを使用した大規模ストリーム処理

    QCon New York 2016で行われたプレゼンテーション“Large-Scale Stream Processing with Apache Kafka”の中で,Neha Narkhede氏は,ストリーミングデータを処理するKafkaの新機能であるKafka Streamを紹介した。アンバウンドなデータが多く見られるようになったことにより,ストリーミング処理は一般的なものになった,とNarkhede氏は言う。マシンラーニングの例でも見られるように,もはやニッチな問題では���いのだ。

  • Apache Spark 2.0テクニカルプレビュー

    Databricksは、Apache Sparkの最初のリリースの2年後に、上流ブランチ2.0.0-previewを基にした、Apache Spark 2.0のテクニカルプレビューを発表した。このプレビューは、安定性とAPIの両方の観点で本番環境向けではなく、一般提供リリースの前にコミュニティからのフィードバックを集めることを目的にしているリリースである。

  • Apache Flinkを用いたデータストリーミングアーキテクチャ

    Jamie Grier氏がApache Flinkを用いたデータストリーミングアーキテクチャについてOSCON 2016 Conferenceで講演した。データストリーミングアプリケーションの構成要素とステートフルなストリーミング処理について、Flinkアプリケーションのサンプルコードとモニタリングをまじえて紹介した。

BT