BT

最新技術を追い求めるデベロッパのための情報コミュニティ

寄稿

Topics

地域を選ぶ

InfoQ ホームページ ニュース GoogleがObject Detection APIでのTensorFlow2のサポートを発表

GoogleがObject Detection APIでのTensorFlow2のサポートを発表

原文(投稿日:2020/07/21)へのリンク

Googleは、TensorFlow Object Detection(OD)APIにおいてTensorFlow 2(TF2)のサポートを発表した。このリリースには、Eagerモード互換のバイナリ、2つの新しいネットワークアーキテクチャ、およびサポートされているすべてのモデルに対する事前トレーニング済みの重みが含まれている。

TensorFlowブログに書き込みで、ソフトウェアエンジニアのVivek Rathodと研究科学者のJonathan Huang氏が、リリースの新機能の概要を説明した。多くは、Kerasレイヤーを使用するようにモデルコードを移植し、重みをTF2スタイルのチェックポイントとして提供することにより、既存の事前トレーニング済みモデルをTF2互換に移行することに重点を置いている。ODフレームワークには、同期分散トレーニングのサポートと共に、トレーニング、評価、およびエクスポート用の新しいイーガーモードバイナリも含まれている。新しいモデルと新しい開発はすべてTF2でのみ提供される予定であるが、TF1は引き続きサポートされる。ほとんどのコードモジュールは、TensorFlowバージョンと、2つのバージョンがないバージョンのいずれかと互換性がある。Rathod氏とHuang氏は次の通り述べている。

この移行に対する私たちの指針は、TF1を引き続き使用している幅広いユーザーベースを引き続きサポートしながら、TF2とKerasのすべての利点を公開することでした。

TensorFlow Object Detection APIは、「TensorFlow上に構築されたオープンソースフレームワークであり、オブジェクト検出モデルの構築、トレーニング、デプロイを簡単に行うことができる」。このフレームワークには、画像データ入力を管理するための一連のユーティリティと、オブジェクト検出モデルのインターフェイスが含まれている。一般に、オブジェクト検出モデルは、入力画像を受け、画像内で検出されたオブジェクトの位置を表す境界ボックスを出力する。OD APIは、事前にトレーニングされたモデルの「model zoo」も提供する。これは、カスタムオブジェクト検出アプリケーションを開発するための開始点として役立つ。これには、いくつかの人気のあるディープラーニングコンピュータービジョンアーキテクチャが含まれる。例えば、MobileNetResNetなど、Common Objects in Context(COCO)2017データセットでトレーニングされたものである。

TensorFlowバージョン2は2019年9月にリリースされた。人気のあるディープラーニングフレームワークに対する多くの変更の中には、モデルを定義するための公式の高レベルAPIとしてのKerasの採用があった。Kerasはもともと、ニューラルネットワークを定義するためのユーザーフレンドリーなインターフェースとして考案された。このニューラルネットワークは、計算グラフをより重視するTensorFlowやTheanoなどのバックエンドをサポートしている。TF2ではまた、Eager実行がデフォルトモードとなっており、開発とデバッグを容易にしている。OD APIの新しいリリースでは、これらの機能を利用している。事前にトレーニングされたモデルはKerasレイヤーを使用して再実装され、重みはTF2チェックポイント形式で保存されている。ODフレームワークのユーティリティコードは、Eager実行できるようにコンパイルされている。これにより、開発者はスクリプトをインタラクティブにデバッグしてモデルをチューニングできる。新しいOD APIは、同期分散トレーニングもサポートする。これにより、大規模モデルのトレーニングを高速化できる。非同期分散トレーニングでは精度を損なう可能性があるが、そのようなこともない。

新しいリリースには、zooでの既存のモデルの移植に加えて、CenterNetEfficientDetの2つの新しいモデルアーキテクチャが含まれている。CenterNetは、オブジェクトの場所を境界ボックスではなく単一のポイントとして表す。COCOデータセットで「最高の速度と精度のトレードオフ」を実現する。EfficientDetは、4倍から9倍サイズが小さく、以前のSOTAモデルよりも13倍から42倍少ないFLOPを使用する新しい最先端のオブジェクト検出モデルである。

リリースのニュースに反応して、Redditユーザは次のようにコメントした。

EfficientDetはとても有望です。TF2を通して、トレーニングODモデルによりアクセスしやすくすることに専念しているようです。ただ、TFチームは、Torch Hub、Huggingface、さらにはTensorflow Hubからインスピレーションを得る形で、よりシンプルなObj Detection APIの構築することにいくらかのリソースを投資してもよいと思います。

Object Detection APIのソースコードと事前トレーニング済みのモデルは、GitHubで入手できる。

この記事に星をつける

おすすめ度
スタイル

BT