InfoQ ホームページ data-analysis に関するすべてのコンテンツ

ニュース

RSSフィード

最新前の記事

AIと機械学習、データエンジニアリング

Amazonが分析のためにサステナビリティデータセットを提供

Amazon Web Services Open Data (AWSOD) とAmazon Sustainability (AS)は、AWS Simple Storage Service (S3)でサステナビリティデータセットを利用できるようにするために協力して、最適な検索のためにデータセットを前処理することで一様に処理する重い処理を取り除く。持続可能なデータセットは一般に衛星、地質学的研究、気象レーダー、農業研究などからのものである。

Aslan Brooke 翻訳者編集部T _
投稿日 2019年2月6日午前2時15分
AIと機械学習、データエンジニアリング

NoSQL データベースのアジャイルなデータモデリング

Data Arachitecture Summit 2018 Conference にて Pascal Desmarets 氏が NoSQL データベースのためのアジャイルなモデリングとベストプラクティスについて語った。

Srini Penchikala 翻訳者高橋洸
投稿日 2018年11月5日午前5時9分
AIと機械学習、データエンジニアリング

ソフトウェア開発から機械学習へのチーム転換：QCon NYのGolestan Radwan

企業がビッグデータや機械学習の戦略をプロジェクトポートフォリオに追加する際、チームがソフトウェアエンジニアリングからデータエンジニアリングや機械学習へ移行することなど、いくつかの困難に直面する。Golestan "Sally" Radwan氏は最近QCon New York 2018で、伝統的なソフトウェアエンジニアリングチームの機械学習／AIジャーニーを先導した経験について講演した。

Srini Penchikala 翻訳者西村美沙
投稿日 2018年7月31日午前1時50分
AIと機械学習、データエンジニアリング

分散型メッセージングフレームワークApache Pulsar 2.0がスキーマレジストリとトピック圧縮をサポート

オープンソースの分散型pub-subメッセージングフレームワークApache Pulsarの最新バージョンによって、企業は、動いているデータを操作することによって「バッチでできることを超える」ことができる。 Streamlioは最近、Apache Pulsar 2.0ストリーミングメッセージングソリューションの利用できるようになったことを発表した。新しいバージョンでは、Pulsar関数、スキーマレジストリ、トピック圧縮がサポートされている。

Srini Penchikala 翻訳者編集部T _
投稿日 2018年7月23日午前4時13分
AIと機械学習、データエンジニアリング

並列実行とライブレコメンデーションを可能にするeBayのAcceleratorデータ処理フレームワーク

eBayのAcceleratorデータ処理フレームワークは、並列実行機能と、ソースコードと入力データ、結果の自動管理を可能にする。データ分析やアルゴリズム開発、さらにはライブレコメンデーションシステムでの利用が可能だ。

Srini Penchikala 翻訳者 h_yoshida _
投稿日 2018年7月6日午前2時42分
統合データAPIとGSQLを備えたPayPalのGimel分析プラットフォーム

PayPalのRomit Mehta氏とDeepak Chandramouli氏は、先日のQCon.aiカンファレンスで、Gimelデータ分析プラットフォームと、同プラットフォームを用いたデータアクセスのコモディティ化について講演した。Mehta、Chandramouli両氏に、同データプラットフォームのセキュリティ面のサポート、データのバージョニング、将来的なロードマップについて話を聞いた。

Srini Penchikala 翻訳者 h_yoshida _
投稿日 2018年5月9日午後10時59分
Dataikuが最新リリースでディープラーニングとコンピュータビジョンを統合

共同データサイエンスプラットフォームDatakuのData Science Studioの最新リリースには、画像処理用に事前学習されたディープラーニングモデルが含まれている。DSSプラットフォームはデータソーシングや可視化から運用展開まで、データサイエンスプロジェクトの全ステップを実行する。マシンラーニングモデルは標準的なライブラリをサポートする。Hadoopや複数のSparkエンジンとの統合も可能だ。

Alexis Perrier 翻訳者 h_yoshida _
投稿日 2018年5月7日午前3時41分
機械学習を使って金融詐欺と戦うAirbnb

民泊サイトであるAirbnbは機械学習を使ってクレジットカード不正利用と戦っている。同社は"フリクション"を使って、チャージバックと戦いながら、正当な顧客が予約できなくなるというネガティブな結果を最小限にしている。

Srini Penchikala 翻訳者徳武聡
投稿日 2018年3月30日午前4時7分
ConfluentがApache Kafka用分散ストリーミングSQLエンジンのKSQLをリリース

ConfluentがリリースしたKSQLは、Apache Kafkaのインタラクティブな分散ストリーミングエンジンだ。Apache Kafka内のトピックに対する集約やジョイン、ウィンドウニング、セッション化といったストリーミング処理操作をサポートする。このオープンソースのストリーミングSQLエンジンは、Kafka Summitカンファレンスで発表された。

Srini Penchikala 翻訳者 h_yoshida
投稿日 2017年12月5日午後8時38分
Microsoft、データサイエンティストと開発者向けのAIサービスとツールをアップデート

先日のMicrosoft Igniteにて、AI関連サービスおよびツールのアップデートが発表された。今回のアップデートには、Azure ML Experimentation Service、Azure ML Model Management Service、Azure ML Workbench、Microsoft Cognitive Servicesの一般提供が含まれている。

Kent Weare 翻訳者 sasai
投稿日 2017年10月10日午前4時4分
DatameerのAndrew Brust氏に聞く - AIにおけるビッグデータの役割とは

InfoQのRags SrinivasがDatameerのAndrew Brust氏に、AIにおけるビッグデータの役割の拡大と、SmartAIを使ってそれを運用可能にする方法について聞いた。

Rags Srinivas 翻訳者 h_yoshida
投稿日 2017年9月8日午前2時49分
MicrosoftがAzure IoTプラットフォームをアップデート、接続機能と時系列分析、エッジデバイスでの分析を可能に

マイクロソフトは先頃、AzureのIoT(Internet of Things)機能に関するいくつかの発表を行った。発表されたニュースにはAzure Time Series Insightsという新サービスの追加、OPC UA/DA用の接続プラットフォームの新たなサポート、エッジデバイス上でのAzure Stream Analyticのサポートなどが含まれている。Azure IoT Centralという、新しいSaaSベースのIoTソリューションも合わせて発表された。

Kent Weare 翻訳者 h_yoshida
投稿日 2017年6月7日午後10時31分
データ準備のパイプライン：戦略、オプション、ツール

データ準備は、データ処理および分析ユースケースの重要な1側面である。ビジネスアナリストやデータサイエンティストは、データの分析や機械学習モデルの開発ではなく、データの収集と準備に約80％を費やしている。Kelly Stirman氏は先週、Enterprise Data World 2017 Conferenceでデータ準備のベストプラクティスについて講演した。

Srini Penchikala 翻訳者編集部Ｔ
投稿日 2017年4月24日午前3時30分
Mathieu Ripert氏，Instacartのマシンラーニング最適化を語る

Instacartは食料品を１時間以内に届けるオンライン・デリバリサービスである。アイテムをWebサイトあるいはモバイルアプリで注文すると，Instacartの購入代行者グループが地元の店舗でそれを購入して，購入者に届ける仕組みだ。InfoQは同社のデータサイエンティストであるMathieu Ripert氏にインタビューして，よりよいカスタマエクスペリエンスを保証する上で，Instacartがマシンラーニングをどのうように活用しているのか聞いた。

Alexandre Rodrigues 翻訳者 h_yoshida
投稿日 2017年2月27日午後8時5分
サードパーティ製ツールがAdidasのパフォーマンス(と文化)をいかに損なったか

靴と服の巨大メーカのIT部門は，パフォーマンスを損なうサードパーティ製ツールのコントロール不能な拡散をいかにして抑え込んだのか。問題はさらに，ビジネスとIT部門の間に生じる非難の文化にも関係する。解決の鍵となったのは，パフォーマンスデータとユーザエクスペリエンスの検証を重視する，新たなサードパーティのガバナンスプロセスだった。

Manuel Pais 翻訳者吉田英人
投稿日 2017年2月19日午後9時3分