MicrosoftがProject Oxfordという名で、顔認識、音声処理などの機械学習アルゴリズムを使ったアプリケーションを開発者が構築できるようにする、RESTful APIを公開した。現在、新しいAPIはAzureの一部としてβ版にあり、月5,000コールまでフリーで利用できる。
Project Oxfordはライブデモを提供しており、次の4つのコンポーネントが含まれている。
-
顔認識:写真の顔を認識し、2つの顔が同一人物かを確認するのに使える。Microsoftによると、顔認識は顔認証につかえるそうだ。
-
音声処理: 音声合成と音声認識を提供する。
-
画像ツール: 画像を解析して不適切な内容を特定したり、テキストを検出して理解したり、目に見えるコンテンツを分類したりする(たとえばビーチ、動物、食べ物などの画像)のに使える。
-
知的言語理解サービス (LUIS: Language Understanding Intelligent Service): ユーザが話したりタイプした自然言語から、アプリケーションがユーザの意図を理解するのを可能にすると約束する。現在のところ、このAPIは招待された人だけ利用できる。
RESTful APIに加えて、Project Oxfordは、そのサービスを.NetおよびAndroidプラットフォームに統合するのを簡単にするためのSDKを提供する。Speech SDKはiOSにも提供される。
それぞれのサービスについて、Project Oxfordには詳細なドキュメントが含まれており、サービスへの登録から基本的なアプリへの統合まで、開発者に一通りの手順を説明している。
TechCrunchが報告している(日本語版)ように、MicrosoftはかつてBingの名のもとに同様のAPIを提供していた。Microsoft Technology and ResearchでOxfordプロジェクトのシニアプログラムマネージャを務めるRyan Galgon氏によると、Bingのものはよりデスクトップ体験にフォーカスしていたという。