BT

最新技術を追い求めるデベロッパのための情報コミュニティ

寄稿

Topics

地域を選ぶ

InfoQ ホームページ ニュース ディープラーニングとStreet ViewイメージによるGoogle Mapsの改善

ディープラーニングとStreet ViewイメージによるGoogle Mapsの改善

原文(投稿日:2017/06/13)へのリンク

GoogleのGround Truthチームは先頃、 Googleマップの改善を目的として、位置情報の画像ファイルから情報を自動的に抽出する、新たなディープラーニングモデルを発表した。このニューラルネットワークモデルは、難易度の高いFSNS(French Street Name Signs)データセットにおいて、高い精度を達成している。Julian Ibarz氏(Google Brainチーム)とSujoy Banerjee氏(Ground Truthチーム)は、実際の画像からテキストを抽出する、という問題に使用した今回のTensorFlowモデルについて、Google Research BlogのWebサイト記事を書いた

Google Mapsソフトウェアは、方角やリアルタイム交通情報、ビジネス関連の情報に使用されているが、10億人を超えるユーザにより優れたエクスペリエンスを提供するためには、世界中の変化を反映する必要がある。Street View用の車両がこれまでに収集したイメージの数は800億に上る。この膨大な画像データを手作業で分析して、Googleマップに必要な新しい情報や情報の変化を見つけることは不可能だ。そのためチームは目標のひとつとして、地理的位置情報のイメージから構造化情報を自動的に抽出することを掲げている。

現在は開発者を対象に公開されている、今回の新しいディープニューラルネットワークは、FSNSFrench Street Name Signs)データセットのStreet View画像からの街路名の読み取りにおいて、従来よりも高度なニューラルネットワーク(84.2%)を構築している。このモデルを拡張すれば、店頭でその店の名前を読み取るなど、Street Viewイメージから他の情報を取得することも可能になる。

都市や道路や商店など、自然環境におけるテキストの認識は、コンピュータビジョン(CV)やマシンラーニングにおける課題のひとつだ。歪みや閉塞性、方向の不明確さ、背景の乱れ、視点の相違といったものが、自然環境からのテキスト読み出しをより難しいものにしている。Googleのチームは2008年から、ニューラルネットワークを基盤としたモデルを使ってStreet Viewイメージの顔や表札をぼかすことで、ユーザのプライバシ保護を行なってきた。この成果がベースとなり、マシンラーニングを使用した、最新の地理情報によるGoogleマップの自動的な改善が可能になったのだ。

ディープラーニングモデルは、新しいStreet Viewイメージに対する自動的なラベル付け、命名規則に一致させるためのテキストの正規化、データ分析とは無関係な余剰テキストの無視、といったことも可能にした。これにより、街路名や住所が分からなくても、画像から直接、新たな住所を作成することが可能になる。例えばStreet View車両が新たに建設された道路を通る場合、このモデルによって、キャプチャイメージを分析して道路の名称と番号を抽出することで、GoogleMap上にそのアドレスを生成し、配置することが可能になるのだ。

これらのモデルを大規模なStreet Viewイメージデータセットに適用するため、Ground Truthチームでは、マシンラーニングユニットであるTensor Processing Unit(TPU)を使用して、パイプラインのインターフェースにおける計算コストの削減を図っている。

 

 
 

この記事を評価

採用ステージ
スタイル
 
 

この記事に星をつける

おすすめ度
スタイル

BT