企業がビッグデータや機械学習の戦略をプロジェクトポートフォリオに追加する際、チームがソフトウェアエンジニアリングからデータエンジニアリングや機械学習へ移行することなど、いくつかの困難に直面する。Golestan "Sally" Radwan氏は最近QCon New York 2018カンファレンスで、伝統的なソフトウェアエンジニアリングチームの機械学習/AIジャーニーを先導した経験について講演した。
Radwan氏は、ソフトウェアアーキテクトからデータアーキテクトへの移行においてうまくいったことについて話した。頻繁なビジュアルコミュニケーションといったテクニックは役に立ったが、タフなテクノロジーと人の意思決定を作らなければならなかったという。彼女は転換における3つのレベルについて話した:
- 個人
- チーム
- ビジネス
個人の転換には例えばPHPからPythonといった言語の移行があった;テクノロジーを変えることは簡単ではない。開発者は全く異なるデータ構造、フォーマット、データソースを扱うことに慣れなければならなかった。
彼らはまた、よりDevOpsに近付いて働くことを学ばなければならなかった。彼女は開発者に、速く学んで、折り合いをつける準備をするようにアドバイスした。チームを頼ることは重要である。アーキテクトはデータと機械学習のパイプラインを学ばなければならない。各アルゴリズム、それぞれの良い点、悪い点、異なるタイプのデータへの適合性にパフォーマンスに焦点を当てるのだ。
彼らが転換に向けて頼りにしていた規律やリソースには以下のものがある:
- 数学(線形代数、多変数微分積分学)
- 確率と統計
- MOOC's
- 書籍
- Kaggleコンテスト、Google Colaboratory、AWS ML、Azure MLといったオンラインリソース
チームレベルでは、定期的な知識の共有セッションに焦点を当てた;"lunch and learn"ミーティングは毎週火曜日に開かれ、そこでチームメンバーは自分が学んだことを共有できた。彼らはまた、データサイエンティストの貴重な時間を活用するためにこれを形式知にし、CircleCIを使って関連プロセスを自動化した。
データサイエンスの規律については、Radwan氏はデータサイエンティストを採用するときには開発スキル(最低限プロトタイプする)を捜し求めるよう提案した。彼らが全体像、企業のゴールにどれくらい関心を持っているか、組織にどう適合するかを知るために、彼らの現実世界の理解を探るのだ。
そして最後は組織レベルである。演台があるなら、ステークホルダーに対して率直に話し、期待を抱かせるのだ。他のチームを教育し、協力する。ターゲット、ゴール、要求を明確にすることは重要だ。機械学習の空間では、プライバシー、起源、バイアス、品質に責任を持つこと。自分がやっていることのコンテキストと意味を理解するのに時間を取ること。
Radwan氏は、QCon.ai 2018カンファレンスでの機械学習のバイアスの分析に関するRachel Thomas氏のプレゼンテーションについて言及した。彼女は、コトをややこしくしたい衝動を抑えれば、機械学習の戦略は成功するとチームに述べて講演を締めくくった。
Rate this Article
- Editor Review
- Chief Editor Action