LinkedInは、正確な将来予測を解釈可能な(interpretable)形式で提供するPythonライブラリのGreykiteを、オープンソースとして公開した。トレンドや季節性、その他の効果を視覚化することが可能になる。フレキシブルで直感的、さらに高速であることを目指して開発されたこのライブラリは、LinkedInチームの手によって、FBのprophetに比較して4倍の性能を持つと同時に、1日と7日の予測において、より正確な結果を提供することが実証されている。
ライブラリはPythonで記述されており、短期および長期の予測に使用することができる。高速で正確、かつ直感的であるというその性格から、ライブラリの中核的アルゴリズムであるSilverkiteは、対話的な自動予測の大規模運用に適している。時系列予測は、時間経過と合わせて計測可能なメトリクスその他の数量に対して、将来的な予測を提供することができる。
これらのモデルを使用することで、将来に対するあらゆる観点からの最適化と、よりよい準備を行うことが可能になる。
LinkedInのケースでは、リソース計画やパフォーマンス管理、最適化、エコシステムの洞察生成などに使用されている。さらに具体的に、LinkedInで使用されているシナリオを挙げるならば、
- ピークトラフィックの処理に必要なインフラストラクチャのプロビジョニング
- メトリクスによるビジネス目標の設定と、運用成功に向けた進捗追跡
- さまざまな市場の成長予測による、予算決定の最適化
- COVID-19パンデミックのようなショックからの回復が早い国と遅い国の把握
この予測を活用して、LinkedInのサイト信頼性エンジニアリング(SRE)チームでは、費用対効果の高い方法でによるサイトの可用性確保を可能にしている — 来年の分レベルのピークQPS(queries per seconds)とサービスQPSを予測することによって、過剰なバッファやコストを要することなく、十分な容量をプロビジョニングすることができるのだ。周到なサイト能力測定に裏打ちされた、将来的なトラフィックに関するより正確な洞察が、確信を持った意思決定を可能にする。わずかなコスト削減が総じて全体コストの削減につながる。正確な予測はビジネスに大きな影響を与えるのだ。
正確な予測はLinkedInのMarketing Solutionでも活用されており、予算、クリック数、収益などのメトリクスに関する短期的予測をヘルスダッシュボードに送ることで、潜在的な問題の特定に役立てている。ここでの予測は、偏差の存在を示すと同時に、変異を説明する上で有用なメトリクスディメンションないし関連メトリクスを特定する上でのコンテキストも提供している。長期的な予測は、メトリクスによる目標設定や、それに沿った推移を確認するためのルーチンチェックを可能にする。
アウトプットは解釈可能なものでであり、トレンドや季節性といった影響要素を、その統計的有意性とともに視覚化することができる。Silverkiteアルゴリズムは(時間とともに変化する可能性のある)トレンドや季節性を伴う時系列、反復的なイベントや休日、および/または短期的影響などに関して良好に機能する。LinkedInでは、時間頻度の異なる(毎時、毎日、毎週など)さまざまなメトリクスに加えて、1日先(短期)や1年先(長期)といったさまざまな予測期間での適用に成功している。
特筆すべきメリットは次のようなものだ。
- フレキシブル: トレンド、季節性、休日、時系列、変化点、自己回帰の時系列リグレッサ(regressor)を提供する。
- 直感的: 探索的プロット、チューニング用テンプレート、明確な仮定を伴った説明可能な予測を提供する。
- 高速: 迅速なプロトタイピングと大規模なデプロイメントを可能にする。
Greykite開発チームが実施したベンチマークでは、デフォルト設定を使用したSilverkiteが、1日から7日という予測範囲において、比較対象としたAuto-ArimaとProphetよりも優れたパフォーマンスを示した。平均的な運用に関しては、GreykiteとAuto-Arimaが、Prophetに比較して4倍高速であった(LinkedInの公開した次表による)。
Greykiteは、Silverkiteの他にFacebook Prophetもサポートしており、将来的には他のオープンソースアルゴリズムも可能にする計画である。
LinkedInがGreykiteをオープンソースとして公開したことは、将来によりよく備えたい人に対するツールの提供になる。今回のリリースは、Java用MLライブラリのDagli、AIモデルの公正さを計測するLift、AIパーソナライゼーションモデルのトレーニング用フレームワークであるGDMix、メディアファイルなどのオブジェクトストアのAmbryなど、これまでにリリースされた一連のツールに続くものだ。GreykiteはGitHubとPyPlで入手が可能である。
Greykiteは短期および長期の両方において、正確な将来予測の提供を約束する。