BT

最新技術を追い求めるデベロッパのための情報コミュニティ

寄稿

Topics

地域を選ぶ

InfoQ ホームページ ニュース データサイエンスコミュニティのCOVID-19パンデミックへの対応

データサイエンスコミュニティのCOVID-19パンデミックへの対応

原文(投稿日:2020/03/30)へのリンク

データサイエンス、AI、機械学習のコミュニティは、業界主要な出版物で、COVID-19パンデミックに関する多数のデータ指向の記事やブログ投稿を公開している。

コンテンツには、データへのアクセスを提供し、危機に対処するためにML技術を利用するための提案と草の根的な取り組みが含まれる。COVID-19データに基づいて課題を提起するために、いくつかのKaggleコンテストが企画された。

この状況において、パンデミック予測医療診断治療発見の分野で製品またはサービスを開発しているAIとMLを活用した企業が注目を集めている。進行中の危機においてこれらの企業が影響力のある役割を果たすことを期待する人もいる。当然のことながら、学界の研究チームやラボも危機に反応しており、このトピックに関する研究論文の発表が急増している。

コロナウイルスとの闘いを助けるためにデータサイエンス技術を適用しようと試みているのは、テクノロジー企業や学界だけではない。米国疾病対策センター(CDC)は、カーネギーメロン大学の機械学習部門の研究者と協力して、コロナウイルスの蔓延を予測している。チームは、インフルエンザ関連のGoogle検索、Twitterアクティビティ、Webトラフィックなどのいくつかのソースからのデータを処理してウイルスの蔓延を予測する機械学習モデルを構築した。

科学コミュニティ全体の多大な努力は、データサイエンスコミュニティにもユニークな機会を提供している。その一例がCOVID-19 Open Research Dataset(CORD-19)を作成する取り組みである。これは、29,000件を超える記事を含む、広範な機械的に読み込み可能なコロナウイルスの文献のコレクションであり、データおよびテキストマイニングに利用できる。ホワイトハウス科学技術政策局から要請され、このデータセットは、アレンAI研究所、チャンザッカーバーグイニシアチブ(CZI)、ジョージタウン大学のセキュリティおよび新興技術センター(CSET)、Microsoft、国立衛生研究所の国立医学図書館(NLM)の研究者によって作成された。このようなデータセットにより、さまざまなデータマイニング、自動化された知識発見、洞察抽出技術を使用できるようになる。これは、科学コミュニティがCOVID-19に関連する優先度の高い科学的質問に答えるのに役立つ。

技術メディアで受けたこれらの取り組みのかなりの報道の中、一部の批判的な声として、COVID-19危機においてAIとデータサイエンスコミュニティが果たすことができる役割について、期待できる範囲と、誇大宣伝について懸念が表明された。感染症の発生予測を専門とするBlueDotやMetabiota などの企業による毎日の予測は、人間の専門家による予測を上回らず、最初の2週間後には精度が大幅に低下したことが指摘された。さらに、診断と治療法発見を自動化および改善するための AIを活用した取り組みは、これらのプロセスで重要な役割を果たすまでに数か月、さらには数年はかかるであろう。それは、疾患のデータ量が少なく、部分的な理解しかないためである。最後に、疫学の経験がほとんどない、あるいはまったくないデータサイエンティストとML実践者による、その情報に対する内訳とそれに対する反応を分析する大量の独断的な記事は、専門家による大きな反発を引き起こしている。より責任のある記述と、根拠のない推測や結論を避けることが求められている。

この記事に星をつける

おすすめ度
スタイル

BT