BT

最新技術を追い求めるデベロッパのための情報コミュニティ

寄稿

Topics

地域を選ぶ

InfoQ ホームページ ニュース 子どもと開発チームのためのML解説

子どもと開発チームのためのML解説

原文(投稿日:2018/03/07)へのリンク

読者の皆様へ:ノイズを減らすための一連の機能を開発しました。関心のあるトピックについて電子メールとWeb通知を受け取ることができます新機能の詳細をご覧ください。

3月5日にQCon London 2018が開かれ、Artificial Intelligence and Machine Learning for Software EngineersというタイトルでRob Harrop氏の基調講演が行われた。Harrop氏によると、機械学習の専門知識は、開発チームとデータサイエンスチームを分離する壁の辺りに位置付けられている。これらの分離された部門によって、データとその基礎ドメインを理解することなくモデルが開発されてしまう可能性がある。さらにソフトウェアチームは、分離された部門と、MLの周りの神秘主義のオーラのために、自分の能力を開発することができなくなることがしばしばある。Dale Lane氏はスポンサー講演で、宣言的でアクセシブルなツールを通じてMLを子供たちがどのように利用できるようにしているかを実演し、MLのエッジケースを中心に実践的なコーチングを行った。

Harrop氏はSkipjaqのCTOであり、SpringSourceの創業者でもある。qcon.aiで視聴することができる彼のQCon London 2018基調講演は、分離された専門家集団の間にハンドオーバーを再導入する危険性を強調した。今回、専門家とは、データ専門家とML機能を適用したいチームのことである。Harrop氏は、開発チームの境界づけられたコンテキストにおけるコンテキスト上のビジネス理解が欠けているデータスペシャリストと協力する際に、バイアスがかかってしまうのを回避する必要があると話した。

カンファレンスのスポンサーであるIBMを代表してLane氏は、ml-for-kidsのデモを行った。ml-for-kidsは、機械学習を子供に教育することを目的としたWebベースのツールである。ml-for-kidsはMITのScratch上に構築されている。Scratchは、プログラミングを教えるためのビジュアルプラットフォームである。子どもがML機能を組み込んだプログラム可能なフローを作成できるようにする便利なインターフェイスを提供する。シンプルなインターフェースにより、ユーザは画像認識、NLP、センチメント分析、他のパターンの検出に使用するモデルを訓練することができる。

Lane氏は、実際の事例を通して、過剰適合やデータバイアスなどの、データ品質の問題を、どのように子どもに気づかせられるかについて話し合った。テーマパークや遊園地向けのレコメンデーションモデルを訓練する例を使って、Lane氏は遊園地へのデータセットバイアスをクラスに示した。遊園地向けに過剰適合されたモデルによって、Lane氏は子供たちに、個々の生活と両事業の成功に向けたモラルのある結果について考えさせることができた。子供たちに救命救急医療のレコメンデーションを考えるよう勧め、彼はそのようなデータバイアスに関するモラルの重要性を、どのように子どもがどのように気づかせたかについて話をした。

Harrop氏はEUのGeneral Data Protection Regulationの問題を取り上げた。これは、個人の信念、宗教的背景、民族性、性的指向、政治的な繋がりに基づいた差別的なデータを組織が使用することは間もなく不法になるというものである。Harrop氏は、データの事前フィルタリングを行っても、モデルが固有のパターンを学習し、同じようなバイアスが適用される危険があることを強調した。これに対処するため、Harrop氏は、開発者に対して、望ましくないバイアスがかからないようにソリューションを開発し、テストすることを推奨している。Harrop氏は「機械学習に関する社会学的な問題について、バイアスは最も重要である」と感じている。

Harrop氏とLane氏はともに、社会における機械学習の神秘性について話した。Harrop氏は、基礎理論を知っているデータ専門家の必要性に焦点を置くことが多くなっている一方で、実際にはMLを使用するユースケースでは、ソフトウェアエンジニアリング活動が中心となることを聴衆に思い出させた。Q&Aで、Lane氏は、ml-for-kidsフレームワークを通じて、適用されたMLを理解し、教え、効果的に利用できるようになった、教師と技術の低い教師について語った。

Harrop氏は、機械学習は競争上の重要な優位性であるが、その核心の大部分はソフトウェアエンジニアリングであると指摘している。彼は聴衆に、次のような以前から言われてきた間違いを回避するよう警告している。

データサイエンスチームとソフトウェアチームを持たないようにしてください。それらを同じ場所に集めてください。みんなが他の人がしていることを理解している状態にしてください。

Lane氏は、子供と大人が実験を始めることができる、すぐにアクセス可能なウェブベースのMLプラットフォームをいくつか共有した。

  • machinelearningforkids.co.uk
  • teachablemachine.withgoogle.com
  • moralmachine.mit.edu
 
 

Rate this Article

Adoption Stage
Style
 
 

この記事に星をつける

おすすめ度
スタイル

特集コンテンツ一覧

BT