InfoQ ホームページ Data に関するすべてのコンテンツ
-
Googleのイノベーションから学んだこと - 問題の枠組み、データの使用、MVPの定義
真に偉大で、革新的で、価値に富んだアイデアの根源は大きく2つある。それは、あなたのユーザと、あなたと共に働く人たちだ。"プロダクトマネージャ"の帽子をかぶった人がそうだとは限らない。アイデアを実際の製品やテクノロジに具現化するには実験が有用だ。問題点を洗い出し、データを使用して、MVPを定義することが、イノベーションにおける成功のチャンスを大きくする。
-
AIとデータに関するロサンゼルスCTO円卓会議
先日ロサンゼルスで行われた"Leaders in Data CTO Roundtable"では、ビジネス向け人工知能(AI)フレームワークやプラットフォーム、今後5年間のデータ、データソフトウェアスタック、データ人材の獲得などが議論された。
-
機微データを保護するための新しい機械学習ライブラリ、TensorFlow Privacyの紹介
最近のブログ記事で、TensorFlowはTensorFlow Privacyを発表した。これは、研究者や開発者が強力なプライバシーを持つ機械学習モデルを構築できるようにするオープンソースライブラリである。このライブラリによって、強力な数学的保証に基づいて、トレーニングプロセスでユーザデータが記憶されないよう保証される。
-
Microsoft、Azure Data Box Diskの一般提供を発表
最近のブログ記事で、MicrosoftはAzure Data Box Diskの一般提供を発表した。これはオフラインでAzureにデータを転送する、SSDベースのソリューションだ。MicrosoftはAzure Data Box Blob Storageのパブリックプレビューも発表した。これにより、顧客はData Box上のBlob Storageにデータをコピーできるようになる。
-
Google CloudがEU内のクラウドデータ移行用にTransfer Applianceベータ版を発表
Googleは、大容量データをGCP(Google Cloud Platform)に迅速かつ安全に移動可能な大容量サーバであるTransfer Applianceを発表した。EU(欧州連合)内でベータ版として提供される。データの転送はEU内のGCPのTransfer Applianceを使用して処理され、データがEUを離れることはない。
-
Bank of Ameriaのブロックチェーンデータストレージ特許が公開
On April 12, the United States Patent and Trademark Office (USPTO) released a patent filing from the Bank of America outlining their plans for a permissioned blockchain implementation that enables personal and business data sharing. A user will authorize service providers to securely access their data, but only for the specific records they have access to.
-
継続的改善のためのデータ駆動思考
組織は、継続的に改善するために、パフォーマンスを計測し、ビジネスの成果に行動を結びつける客観的な方法が必要だ。Avvo��は、自律的なチームモデルとふりかえりを実践し、データ駆動決定フレームワークを使う。このフレームワークは、継続的に改善するために、人々がよりよい決定と提案をするのに役立つ。
-
Baiduが自律走行車研究のための巨大データセットApolloScapeをリリース
中国のインターネット巨大企業、Baiduが、自律走行車のシミュレーションと研究の大規模データセットであるApolloScapeをリリースした。ApolloScapeは、同種のオープンデータセットよりも、一桁以上大きくて複雑であり、Baiduの自動車シミュレーションとハードウェアのプラットフォーム、Apolloの一部となっている。このリリースにより、Baiduは自動運転セクタの立場を強固にする。
-
裁判所がLinkedInに対して、公開されたプロファイルデータのスクレイピングを認めるように指示
米国連邦裁判所は、MicrosoftのLinkedInがサードパーティWebスクレイパ(scraper)に対して、一般公開されているプロファイルからのデータ入手を阻むことはできない、という判決を下した。
-
NetflixはHollow、インメモリデータセットのためのJavaライブラリを発表した
NetflixはHollowを発表した。これはJavaライブラリとツールキットで、“ビッグデータ”のように特徴づけられていないインメモリのデータセットを処理するためものもである。単一のプロデューサはデータセットを提供する。多くのコンシューマはそこからリードオンリーのアクセスをする。プロデューサとコンシューマ間のコミュニケーションメカニズムはリアルタイムのデータセット変更を含む。
-
Facebookが数十億を越える語彙を効率的に扱うニューラルネットワークモデルを構築
シーケンス予測(sequence prediction)にニューラルネットワークを用いるのは,音声認識や機械翻訳,言語モデルなどさまざまなアプリケーション分野において,計算機科学ではよく知られた問題だ。FB AI Researchの研究者たちは,数十億を越える語彙に対してニューラルネットワークを効率的に教育するため,GPUに特化した近似アルゴリズムであるAdaptive SoftMaxを設計した。
-
ClouderaがBroad Instituteとの提携を発表
ClouderaはMITとハーバードのBroad Instituteとの提携を発表するとともに,ゲノム解析ツールキットパイプラインに関する経験を公開した。
-
Yahoo!がApache Flink, Spark, Stormのベンチマークを実施
Yahoo!は,代表的なストリーム処理フレームワークであるApache Flink, Spark, Stormの3つを対象としたベンチマークを行った。
-
UI設計 - 外に出てデータを求めよ
Chris Atherton氏がGOTO Berlin 2015カンファレンスで閉会講演を行い,ソフトウェアの設計について語った。講演の中で氏は,ソフトウェアがいかにあるべきかという専門家の意見に頼るよりも,外に出て実際のユーザの声を聞くべきだ,と提案した。InfoQは氏に,ユーザインターフェースの設計とテストについてインタビューした。
-
Samsung SAMI - IoTのためのD3プラットフォーム
SamsungのSAMIは,IoTデバイスのデータの送受信と保管を行うためのデータ駆動開発(Data-driven Development/D3)プラットフォームだ。任意のデバイスが送信するさまざまな形式のデータを,JSON形式に正規化し,クラウド内にストアする。ストアされたデータは,他のデバイスから要求することが可能だ。