BT

最新技術を追い求めるデベロッパのための情報コミュニティ

寄稿

Topics

地域を選ぶ

InfoQ ホームページ Data に関するすべてのコンテンツ

  • 機微データを保護するための新しい機械学習ライブラリ、TensorFlow Privacyの紹介

    最近のブログ記事で、TensorFlowはTensorFlow Privacyを発表した。これは、研究者や開発者が強力なプライバシーを持つ機械学習モデルを構築できるようにするオープンソースライブラリである。このライブラリによって、強力な数学的保証に基づいて、トレーニングプロセスでユーザデータが記憶されないよう保証される。

  • Microsoft、Azure Data Box Diskの一般提供を発表

    最近のブログ記事で、MicrosoftはAzure Data Box Diskの一般提供を発表した。これはオフラインでAzureにデータを転送する、SSDベースのソリューションだ。MicrosoftはAzure Data Box Blob Storageのパブリックプレビューも発表した。これにより、顧客はData Box上のBlob Storageにデータをコピーできるようになる。

  • Google CloudがEU内のクラウドデータ移行用にTransfer Applianceベータ版を発表

    Googleは、大容量データをGCP(Google Cloud Platform)に迅速かつ安全に移動可能な大容量サーバであるTransfer Applianceを発表した。EU(欧州連合)内でベータ版として提供される。データの転送はEU内のGCPのTransfer Applianceを使用して処理され、データがEUを離れることはない。

  • Bank of Ameriaのブロックチェーンデータストレージ特許が公開

    On April 12, the United States Patent and Trademark Office (USPTO) released a patent filing from the Bank of America outlining their plans for a permissioned blockchain implementation that enables personal and business data sharing. A user will authorize service providers to securely access their data, but only for the specific records they have access to.

  • 継続的改善のためのデータ駆動思考

    組織は、継続的に改善するために、パフォーマンスを計測し、ビジネスの成果に行動を結びつける客観的な方法が必要だ。Avvoでは、自律的なチームモデルとふりかえりを実践し、データ駆動決定フレームワークを使う。このフレームワークは、継続的に改善するために、人々がよりよい決定と提案をするのに役立つ。

  • Baiduが自律走行車研究のための巨大データセットApolloScapeをリリース

    中国のインターネット巨大企業、Baiduが、自律走行車のシミュレーションと研究の大規模データセットであるApolloScapeをリリースした。ApolloScapeは、同種のオープンデータセットよりも、一桁以上大きくて複雑であり、Baiduの自動車シミュレーションとハードウェアのプラットフォーム、Apolloの一部となっている。このリリースにより、Baiduは自動運転セクタの立場を強固にする。

  • 裁判所がLinkedInに対して、公開されたプロファイルデータのスクレイピングを認めるように指示

    米国連邦裁判所は、MicrosoftのLinkedInがサードパーティWebスクレイパ(scraper)に対して、一般公開されているプロファイルからのデータ入手を阻むことはできない、という判決を下した。

  • NetflixはHollow、インメモリデータセットのためのJavaライブラリを発表した

    NetflixはHollowを発表した。これはJavaライブラリとツールキットで、“ビッグデータ”のように特徴づけられていないインメモリのデータセットを処理するためものもである。単一のプロデューサはデータセットを提供する。多くのコンシューマはそこからリードオンリーのアクセスをする。プロデューサとコンシューマ間のコミュニケーションメカニズムはリアルタイムのデータセット変更を含む。

  • Facebookが数十億を越える語彙を効率的に扱うニューラルネットワークモデルを構築

    シーケンス予測(sequence prediction)にニューラルネットワークを用いるのは,音声認識や機械翻訳,言語モデルなどさまざまなアプリケーション分野において,計算機科学ではよく知られた問題だ。FB AI Researchの研究者たちは,数十億を越える語彙に対してニューラルネットワークを効率的に教育するため,GPUに特化した近似アルゴリズムであるAdaptive SoftMaxを設計した。

  • ClouderaがBroad Instituteとの提携を発表

    ClouderaはMITとハーバードのBroad Instituteとの提携を発表するとともに,ゲノム解析ツールキットパイプラインに関する経験を公開した。

  • Yahoo!がApache Flink, Spark, Stormのベンチマークを実施

    Yahoo!は,代表的なストリーム処理フレームワークであるApache Flink, Spark, Stormの3つを対象としたベンチマークを行った。

  • UI設計 - 外に出てデータを求めよ

    Chris Atherton氏がGOTO Berlin 2015カンファレンスで閉会講演を行い,ソフトウェアの設計について語った。講演の中で氏は,ソフトウェアがいかにあるべきかという専門家の意見に頼るよりも,外に出て実際のユーザの声を聞くべきだ,と提案した。InfoQは氏に,ユーザインターフェースの設計とテストについてインタビューした。

  • Samsung SAMI - IoTのためのD3プラットフォーム

    SamsungのSAMIは,IoTデバイスのデータの送受信と保管を行うためのデータ駆動開発(Data-driven Development/D3)プラットフォームだ。任意のデバイスが送信するさまざまな形式のデータを,JSON形式に正規化し,クラウド内にストアする。ストアされたデータは,他のデバイスから要求することが可能だ。

  • データの品質を向上する - Preziのケース

    組織がデータ駆動型であるためには,データの山を積み上げるだけでは不十分だ。 そのデータが正確で,かつ意味を持っていなくてはならない。PreziのデータエンジニアであるJulianna Göbölös-Szabó氏は,同社がどのようにデータの品質を向上したかについて講演した。氏らが選択したソリューションは,全チームを正しい方向に向かわせる手段として,契約をベースとした軽量アプローチを採用し,それによって非構造的データから構造的データに移行する,というものだ。

  • PrismaticがSchema 0.2にデータ型強制変換を追加

    Prismaticでは,同社のClojureデータ記述ライブラリであるSchemaの0.2リリースに,データの強制型変換(coercion)を追加した。これにより,不正な型のデータを単にリジェクトするのではなく,スキーマに適合させてインスタンスを変換するような設定が可能になる。InfoQではSchemaについて,PrismaticのJason Wolfe氏に話を聞いた。

BT