2013年はデータサイエンティストやビッグデータ専門家向けの新しい教育プログラムが多く発表された。
昨年11月、ホワイトハウスの科学技術政策局(OSTP)は5年間で3780万ドルを拠出し、未来の科学者のためにデータサイエンスとビッグデータの普及を支援し、この分野の主導的な大学であるニューヨーク大学、ワシントン大学、カリフォルニア大学バークレー校との強力関係を作ると発表した。資金はムーア財団とスローン財団が拠出する。スローン財団のデジタルITプログラムのディレクターであるJoshua Greenberg氏は声明の中で、このパートナーシップについて、“大学の文化を変え、データサイエンスの文化を作る”試みだと説明している。
この計画に参加する大学は既にデータサイエンスの教育プログラムを立ち上げている。バークレー校はオンラインのデータサイエンスの修士課程を発表している。ニューヨーク大学はCenter for Data Scienceの一環として新しいデータサイエンスの修士課程を発表した。Sparkのようなビックデータ関連のプロジェクトとともに、この分野の人材不足を背景に、これらの教程の卒業生に多くの期待が集まっている。
また、2013年を特徴づけるのはMOOCの普及だった。ここにもデータサイエンティスト向けの教材がある。データサイエンティストに興味があるならMOOCプラットフォームであるCourseraでワシントン大学のリサーチディレクターであるBill Howe氏のコースを見るとよいだろう。リレーショナルデータベース、NoSQL、機械学習、MapReduce、Hadoop、データビジュアライゼーションといったデータサイエンティストが知っておくべき領域を扱っているコースだ。通常、MOOCはコースを修了するのは受講者のうち10%に満たないが、このコースは15%を超えており、コースのフォーラムでも評判が良い。現在のデータサイエンティストの需要に適したコースなのだろう。
そのほかのオンライン大学もこの動きに呼応している。例えば、UdacityはビックデータのスタートアップであるClouderaと提携してビッグデータを中心としたオンラインデータサイエンストレーニングを提供している。はじめのトラックはHadoopとMapReduceのイントロダクションだ。講師はClouderaのインストラクタでHDFSの使い方やHadoop MapReduceのジョブの書き方などを教える。ClouderaはすでにHadoop関連の実績を多く積んでおり、HadoopのディストリビューションやオープンソースプロジェクトであるImpalaも一定の評価を得ている。期待できるコースと言えるだろう。興味があれば無料でサインアップできる。2014年1月にはスタートする予定だ。
これらの新しい機会がありながら、データサイエンス周辺にはさまざまな噂、憶測が飛び交っている。ニューヨーク市で活動している有名なデータサイエンティストであり、HackNYの主催者のひとりであるHilary Mason氏は“Data science is a growing area”とツイートしている。Strata 2013ではニューヨーク大学のデータサイエンスプログラムのディレクターであるYann LeCun氏がセッションを開催し、最新のデータサイエンスの動向や機会、そしてそのような機会がどのようにして21世紀で最も魅力的な仕事を作るのか説明している。