InfoQ ホームページ data-analysis に関するすべてのコンテンツ
-
Dataikuが最新リリースでディープラーニングとコンピュータビジョンを統合
共同データサイエンスプラットフォームDatakuのData Science Studioの最新リリースには、画像処理用に事前学習されたディープラーニングモデルが含まれている。DSSプラットフォームはデータソーシングや可視化から運用展開まで、データサイエンスプロジェクトの全ステップを実行する。マシンラーニングモデルは標準的なライブラリをサポートする。Hadoopや複数のSparkエンジンとの統合も可能だ。
-
機械学習を使って金融詐欺と戦うAirbnb
民泊サイトであるAirbnbは機械学習を使ってクレジットカード不正利用と戦っている。同社は"フリクション"を使って、チャージバックと戦いながら、正当な顧客が予約できなくなるというネガティブな結果を最小限にしている。
-
ConfluentがApache Kafka用分散ストリーミングSQLエンジンのKSQLをリリース
ConfluentがリリースしたKSQLは、Apache Kafkaのインタラクティブな分散ストリーミングエンジンだ。Apache Kafka内のトピックに対する集約やジョイン、ウィンドウニング、セッション化といったストリーミング処理操作をサポートする。このオープンソースのストリーミングSQLエンジンは、Kafka Summitカンファレンスで発表された。
-
Microsoft、データサイエンティストと開発者向けのAIサービスとツールをアップデート
先日のMicrosoft Igniteにて、AI関連サービスおよびツールのアップデートが発表された。今回のアップデートには、Azure ML Experimentation Service、Azure ML Model Management Service、Azure ML Workbench、Microsoft Cognitive Servicesの一般提供が含まれている。
-
DatameerのAndrew Brust氏に聞く - AIにおけるビッグデータの役割とは
InfoQのRags SrinivasがDatameerのAndrew Brust氏に、AIにおけるビッグデータの役割の拡大と、SmartAIを使ってそれを運用可能にする方法について聞いた。
-
MicrosoftがAzure IoTプラットフォームをアップデート、接続機能と時系列分析、エッジデバイスでの分析を可能に
マイクロソフトは先頃、AzureのIoT(Internet of Things)機能に関するいくつかの発表を行った。発表されたニュースにはAzure Time Series Insightsという新サービスの追加、OPC UA/DA用の接続プラットフォームの新たなサポート、エッジデバイス上でのAzure Stream Analyticのサポートなどが含まれている。Azure IoT Centralという、新しいSaaSベースのIoTソリューションも合わせて発表された。
-
データ準備のパイプライン:戦略、オプション、ツール
データ準備は、データ処理および分析ユースケースの重要な1側面である。ビジネスアナリス���やデータサイエンティストは、データの分析や機械学習モデルの開発ではなく、データの収集と準備に約80%を費やしている。Kelly Stirman氏は先週、Enterprise Data World 2017 Conferenceでデータ準備のベストプラクティスについて講演した。
-
Mathieu Ripert氏,Instacartのマシンラーニング最適化を語る
Instacartは食料品を1時間以内に届けるオンライン・デリバリサービスである。アイテムをWebサイトあるいはモバイルアプリで注文すると,Instacartの購入代行者グループが地元の店舗でそれを購入して,購入者に届ける仕組みだ。InfoQは同社のデータサイエンティストであるMathieu Ripert氏にインタビューして,よりよいカスタマエクスペリエンスを保証する上で,Instacartがマシンラーニングをどのうように活用しているのか聞いた。
-
サードパーティ製ツールがAdidasのパフォーマンス(と文化)をいかに損なったか
靴と服の巨大メーカのIT部門は,パフォーマンスを損なうサードパーティ製ツールのコントロール不能な拡散をいかにして抑え込んだのか。問題はさらに,ビジネスとIT部門の間に生じる非難の文化にも関係する。解決の鍵となったのは,パフォーマンスデータとユーザエクスペリエンスの検証を重視する,新たなサードパーティのガバナンスプロセスだった。
-
Julien Le Dem氏に聞く - Apache Arrowが示すカラム指向データ処理の未来
Apache ArrowプロジェクトでPMCのリーダを務めるJulien Le Dem氏が,カラム指向データ処理の今後について,Data Eng Conf NYでプレゼンテーションを行なった。Apache Arrowはカラム型インメモリデータベースのオープンソース標準である。InfoQはParquet��の違いを確認すべく,氏にインタビューした。
-
Apache Flinkを使用したZalandoのマイクロサービスおよびストリーム処理用アーキテクチャ
Javier Lopez氏とMihail Vieru氏はReactive Summit 2016 Conferenceで,クラウドベースのデータ統合と,ビジネスインテリジェンスのユースケースにおけるストリーミング処理で使用される分散プラットフォームについて講演した。
-
リアクティブ サミット 2016 カンファレンス: リアクティブ マイクロサービスとステージング データパイプライン
リアクティブ マイクロサービス、データセンター スケール オペレーティング システム(DCOS)、そしてステージング リアクティブ データ パイプラインは、今週のリアクティブ サミット 2016 カンファレンスにおける目玉であった。InfoQチームはカンファレンスに参加した。この記事は、カンファレンスの初日のサマリである。
-
ストリーム処理とLamdaアーキテクチャへの挑戦
Lamdaアーキテクチャはバッチとストリーム処理を結合させる有名なソリューションである。LinkedInのKatrik Paramasivam氏はデータ処理のためにApache Samzaを用いてチームがどうストリーム処理とLambdaアーキテクチャへの挑戦を行ったかを執筆した。この挑戦はイベントの遅延到着と複製メッセージの処理について記載されている。
-
Apache Flinkを用いたデータストリーミングアーキテクチャ
Jamie Grier氏がApache Flinkを用いたデータストリーミングアーキテクチャについてOSCON 2016 Conferenceで講演した。データストリーミングアプリケーションの構成要素とステートフルなストリーミング処理について、Flinkアプリケーションのサンプルコードとモニタリングをまじえて紹介した。
-
Google、Cloud Machine LearningとTensorFlowのα版リリース
先月、GoogleがTensorFlowをインテグレートしたクラウド機械学習サービスのα版をリリースした。このサービスは、TensorFlowライブラリをGoogle Cloud Platform (GCP)上でスケールさせて動かしたいというニーズの高まりに応えるものだ。Googleは自らのビッグデータおよびアナリティクスプラットフォームと機械学習を密にインテグレートするという発表の中で、HadoopとSparkのマネージドサービスであるDataprocなどと統合して、TensorFlowの利用をスケールさせるための新機能について説明している。