「データサイエンティスト」という職業が今、東大生の就職先として人気だということをご存じだろうか。

一般的には、「ビッグデータなどを有効活用し、新たな知識を産み出し、その活用のシナリオを導き出す仕事」とされるが、これだけではなかなかイメージしにくいかもしれない。

では、データサイエンティストが以下の仕事を具体的に手がけている、と知ったらどうだろう。

1. 医師にとっても診断が難しい病気を医療画像から高い精度で診断する。
2. クレジットカード履歴から身に覚えのない購買履歴(詐欺)を発見する
3. 大規模システムの挙動からトラブルの原因を特定して、事故を未然に防ぐ
4. POSや求人票などからリアルタイムで景気や経済動向を読み取る
5. ECサイトでおすすめの映画や写真を表示する
6. 防犯カメラの映像から凶悪犯を見つけ出す
7. 株・為替・金利等のチャートの形状から、過去に類似したチャートの形状を持つ時期を発見する

このいずれもが私たちの日常生活と切っても切り離せない関係にある。データサイエンスを駆使した仕事が、意外と身近に存在していることに驚くことだろう。

一方で、 まだ新しい職種であるデータサイエンティストを取り巻く環境が整っているとはいいがたいようだ。

「IoT時代におけるICT経済の諸課題に関する調査研究報告書」(総務省、2017年3月発表)では、合計3755社に調査を行った結果、データサイエンティストが「現時点で不足している」と回答した割合は全体で29.3%に達した。さらに、「2020年以降 / 2025年以降 / 2030年以降に不足する見通し」と回答した分まで含めると、合わせて50.4%の結果となった。

さらに、大企業に着目すると、「現時点で不足している」は38.8%と中小企業の26.2%を上回り、「2020年以降 / 2025年以降 / 2030年以降に不足する見通し」との回答分を加えると72.7%にも及ぶ。総じて、データサイエンティストに対する需要に対し、供給が追いついていない実態が明らかとなっている。

総務省「IoT時代におけるICT経済の諸課題 に関する調査研究」内の「人材不足の状況・見通し(データサイエンティスト)」より引用

こうした状況の中、東京大学は2016年4月、同大学院情報理工学系研究科が主体となった教育プログラム「東京大学データサイエンスティスト養成講座」(DSS)を開講。

約4年を経た現在、情報理工学系研究科の学生だけでなく、他研究科からの参加も目立っているというのだ。講座をサポートする同研究科「山西研究室」の山西健司教授は、東大生の就職先としてデータサイエンティストの人気は高く、年々上昇傾向にあると指摘する。

企業からの需要に供給が追いついていない現状で、これからの時代を生き抜く上で大きな武器となりそうな職業だが、実際はどのような能力を求められるのだろうか?
そして、GAFA(グーグル、アマゾン、フェイスブック、アップル)などのグローバルな舞台で活躍する機会もありそうだが、修了生はどのような道に進んでいるのだろうか?
山西教授に詳しく話を聞いた。

コンサルタントとは違う

ーーまず、データサイエンティストにはどんな能力が必要?

1. 今あるデータから潜在化した問題を発掘する能力
2. その問題を数理的なモデルに置き換える能力
3. プログラミングを通じて数理モデルを実際に構築していく能力
4. データを分析し評価できる能力
5. 得られた結果を領域知識(ある専門分野に特化した知識のこと)に落とし込んで真の価値を引き出す能力


などが必要です。

ーー「コンサルタント」とは違うの?

より専門的な数理モデルと計算技術に基づいて大量のデータを扱い、科学・工学的観点からソリューションを提供する点が異なります。

養成講座の修了生にはGAFAで働く人も…

では、そのようなデータサイエンティストを育てる「東京大学データサイエンティスト養成講座」では、どのようなカリキュラムが組まれているのだろうか?
引き続き、山西教授に話を聞いた。

ーー「養成講座」はどのような内容になっている?

本講座は、東京大学の大学院生を対象とした教育研究プログラムであり、データサイエンスの基礎知識だけではなく、実践的な演習も備えた教育を目指して開講しています。

かねてより、「データ分析をいかに行うか(How)」を学ぶ講義は存在していました。しかし、「大量のデータを目の前にして何を発見すべきか(What)」の掘り起こしがより重要であったにもかかわらず、その分野の教育はほぼ存在していませんでした。

そこで、「What」に関する能力醸成を重点化し、産業界からも参加してもらった上で、「実際のデータを題材にした実践的なデータサイエンスの教育の場を実現しよう」と計画しました。

ーー講座では、どのようなことを、どのようなスタイルで学習させている?

ここでは、基礎課程、応用課程、実践課程の3課程を設けています。

1. 基礎課程

データサイエンティストに必要なスキルを「数学」「アルゴリズム」「コンピュータ科学基礎」「ソフトウェア」「データサイエンス」の5つに分類し、まずデータサイエンスに関する基礎知識を体系立てて学べるようにしました。

2. 応用課程

学生がグループワークで「IT、マーケティング、製造など幅広い業界に属する企業から募集した現場の課題」に取り組み、その解決法を提供するという実践的演習を開講しております。これは先に挙げた、「What」の能力養成を目的としたものであり、企業の再参加率も高い課程です。

3. 実践課程

上記2課程に加え、データサイエンスに関係する分野で学術として先端的な研究を実施した学生には、さらに修了証を発行しております。非常にハードルが高いので、修了者はまだ多くありませんが、過去に3人修了しました。

講座の模様。 画像提供:山西研究室

ーー受講生はどんな人たちが多い? 社会人と進学者との比率はどのくらい?

開講当初は情報理工学系研究科の大学院生(修士1年から博士3年まで)が大半でした。

しかし年度を重ねるにつれ徐々に評判が広がり、最近では演習講義に絞っても、情報理工学系研究科の学生のみならず、工学系研究科、理学系研究科、新領域創成科学研究科、情報学環・学際情報学府、農学生命科学研究科、医学系研究科、薬学系研究科、経済学研究科、公共政策大学院、総合文化研究科と、広範囲にわたる大学院生が修了するようになっています。

社会人学生からの参加希望や問い合わせも非常に多いですが、現状では基礎課程までの修了に留まっています。

ーーだとすると、受講者数はやはり伸びている?

非常に伸びています。説明会にも毎学期100名以上の学生が集まるなど非常に盛況です。演習講義においても、受講希望者が定員を大幅に超える状況が続いております。

ーー修了生は直近、どんな分野に進んでいる?

IT系、金融系、製造業、その他サービス業と多岐に渡ります。アカデミア(大学、研究機関)も多いです。

ーーGAFA(グーグル、アマゾン、フェイスブック、アップル)に就職した人もいる?

そうした学生もいます。

終身雇用が揺れる今、データサイエンスは“手に職”

ーーなぜ、養成講座に人気が集まっている?

数理とデータサイエンスが、かつての“読み書きそろばん”に代わる基本的な技能として将来位置づけられようとしていること、そしてデータサイエンスには専門的な基本知識のみならず、ノウハウ的なものや経験的なものまで要求されるからであると思います。

ーー「数理」「科学」など、文系には難しそうだが、データサイエンティストとして活躍できる?


十分にあり得ます。文系の学生は社会に関するさまざまな領域知識を有しており、それがデータサイエンスの価値を高める上で有用になります。

加えて、データサイエンスの数理的側面や計算技術的側面に関しては、教育体系が急速に整備されて文系学生にも学びやすいものになってきています。文系分野における領域知識との融合部分を強みにして、データサイエンスに挑戦する学生が増えることを期待しています。

ーー終身雇用が当たり前でなくなる中、データサイエンスはいわゆる“手に職”になりえる?

“手に職”にもなりえると思います。ひとつの理由として、社会が大きな変革期を迎え、データ中心社会になっていることが挙げられます。大量のデータを活用してサービスを大幅に改善したりコストを下げたりする上で、データサイエンスの需要が高まっています。

もう一つの理由として、高度な専門性が要求され、一定以上の教育と経験がないとスキルが身につかない性質の職種だということもあります。冒頭で述べた、データサイエンティストに必要となる各種能力はいずれも高度な専門能力であり、中でも数理モデルの構築能力は数学的素養がある方にとって特に大きな武器となりえるでしょう。

ーーでは、グローバルに活躍できそうな職業だといえる?

科学や工学のスキル(いわゆるSTEM、“Science, Technology, Engineering and Mathematics”:科学、技術、工学、数学のこと)は世界中どこでも通用するものです。したがって、グローバルに活躍することもできますし、GAFAの例に漏れず実際なされている方も多くいます。

日本の課題はどこにあるかを聞いた

ーーデータサイエンティストは、今後どんな分野で新たに活躍できそう?

端的にデータを扱う全ての分野です。

先の応用課程では過去、IT、マーケティング、製造、精密機械、建設、自動車、金融、広告など幅広い業界から課題を提供していただきました。どの企業さまも我々が思いもしなかった新しい課題に直面しており、驚かされることが非常に多いです。

そのため、通常想定されていない分野こそ、新たに開拓できるチャンスは大きく、視野を狭めずに広く考えていくのがよいと思います。

ーー最後に、データサイエンティスト育成においての日本の課題は?

3つあると思います。

1. 産学連携の推進

これは教育に関しても、研究に関しても当てはまります。教育に関しては、大学ではデータサイエンスに関わる根幹技術を徹底して指導し、ビジネスライクな話は社会に出てから学べばよいという意見もありますが、大学にいる頃から実社会に出た後に何ができそうなのかにある程度思いを巡らせるのはよいことだと思います。また研究に関しても、ビジネス現場での領域知識が新たな気づきを生むなど、双方にとって有用となるケースは非常に多くあります。

2. 文系と理系の垣根をより低くすること

文系分野においても、データを用いて、エビデンスに基づいて考えることが重要だとする声が盛んに言われるようになってきています。そうした需要に呼応する形で、文系学生がデータサイエンスに興味を持つことは増えているのですが、なにぶん垣根をまたぎづらいという状況が未だにあるようです。

3. 生涯学習体制の構築

受講生の箇所で述べたとおり、データサイエンスに興味を持つ社会人も文系学生同様に増えています。しかしながら、そうした社会人が適切に学べる機会が少ないというのも事実です。社会人をサポートできる体制を構築していくことも重要だと思います。


私たちが暮らす社会を影ながら支え、次々にもたらされる課題を解決していく「データサイエンティスト」。
文系理系問わず活躍のチャンスがあるということなので、“手に職”をつけるために今から学ぶべき教育なのかもしれない。


「世界に負けない教育」特集をすべて見る!