2017年に滋賀大学がデータサイエンスコースを設立して以来、日本の大学でも次々とデータサイエンスコースが新設されています。
一方、edX、udemy、Youtube、などのオンライン上の教育プラットフォームにも、データサイエンティストとしてのスキルを高めるための優良な教育コンテンツが数多くアップロードされています。
最近は大学の講義もYoutubeでアップロードされており、データサイエンスを学ぶ機会は広く提供されていると言えます。
このような状況において、データサイエンスを大学で学ぶ価値とは何でしょうか?
目次
データサイエンスを学ぼうと決めた理由
そもそも何でデータサイエンスに興味を持ち、学ぼうと思ったんですか?
データサイエンスに興味を持ったのは、2015年の業務でRを使ってデータ解析を始めたことがきっかけでした。
データサイエンスというキーワードは、解析手法を調べている過程で知りました。
その中でデータサイエンスを学びたいと感じた理由が3つありました。
1. 実験アプローチと環境の変化
ひとつは、身の回りの変化に対応する必要があると感じていたからです。
アプリ、ウェアラブル端末、IoTデバイス、5Gサービスの登場・導入により、これまでラボベースで取得していたデータがより簡単、かつ、膨大に取得可能になります。
これらのIT技術を導入することで、今後の実験アプローチや環境も大きく変化していくと考えられます。
例えば、目的のデータを得るための環境を準備できれば、誰でも多量のデータを取得可能になります。
少数精鋭の新しいベンチャー企業が高速でデータ取得・解析のサイクルを回すことで、大企業の対応が後手に回る可能性は十分考えられます。
2. ビッグデータへの期待
ふたつめは、ビッグデータを扱うスキル・知識がこれからの研究スキルに大事になると考えたからです。
大規模なデータから新しい価値を発見することが期待されています。しかし、取得できるデータの数・種類が増えると、1)データのクリーニングスキル、2)ビッグデータを適切に扱うための解析スキル、3)解析結果の可視化スキル、4)得られる結果を解釈するスキル、が重要になります。
扱うデータ量が大きくなるこれからの時代において、これらのスキルを身につける必要がありました。
3. ITとの組み合わせ
みっつめは、疑う余地もなく、IT技術が社会の仕組みを変えている原動力になっているからです。(1)
メーカーにとって、モノの機能だけで勝負することは難しくなっており、ITとの組み合わせから新しいサービスを作らなければいけない段階にあると感じていました。
一方で、企業は研究データを膨大に蓄積しています。「これら基礎研究のデータをIT技術と組み合わせることで、社会に提供できるもっと便利なサービスがあるのでは」とも妄想してました。
絵に描いた餅で終わらせないためにも、ビジョン、技術ロードマップをより具体的に描く必要があります。
そのために、これからの発展の鍵となるデータサイエンスは、これから学ぶべき分野だと考えていました。
ITスキルが大事っていう記事はよく目にするようになりましたね。
独学の時期
留学前はどのようにデータサイエンスに関連する内容を勉強をしていたんですか?
留学を決断するまでに私がやっていたことは、
- データサイエンスが関連するニュースにアンテナを張る
- 参考書籍を使ってデータサイエンスの勉強をする
- 社内のRユーザーから解析方法を教わる
ことでした。
解析に利用できるデータはたくさんあったので、とにかくRを使ったデータ解析に慣れることに専念しました。
参考までに以下の書籍を使って勉強していました。
独学の限界
書籍を読んだり、分析経験が得られる環境であるにも関わらず、なぜ大学でデータサイエンスを学ぼうという考えに至ったのでしょう?
「これで本当にデータサイエンティストと呼べるのか?」という疑問が、自分の中で新たに芽生えていたことが大きいです。
2年もするとRを使ってデータ解析やグラフを作成するスキルは身につき、社内ではRを使える人と認識されるようにもなりました。
人によっては、私のことを「データサイエンティストだね」と言ってくれる人もいました。
一方、データサイエンティストは
Data scientists are big data wranglers, gathering and analyzing large sets of structured and unstructured data.
データサイエンティストとはビッグデータを取り扱う者のことであり、大規模な構造化データと非構造化データのデータセットを集積・解析する。
2U. INC., Master’s in Data Science, “What is a Data Scientist?”
と定義されています。
この定義を見直したとき
- そもそも本当に自分はデータサイエンスが何かを理解しているのか?
- 今の自分のスキルが本当にデータサイエンティストと呼べるレベルなのか?
- PythonやRで高度な解析ができればデータサイエンティストなのか?
という疑問に立ち返りました。
このとき、独学で足りていないと感じたポイントが3つありました。
1. 数学的知識の欠如
ひとつめが、数学の知識が弱かったことです。
Rを使って、いわゆるサイズが大きいデータを解析できるようになりました。
しかし、その多くがパッケージに依存した解析であり、数学的知識をベースにしたモデリングではありませんでした。
また、理論や導出過程をちゃんと理解しているかと問われたら怪しかったです。
そこで、次のステップとして、数学の理論を知識として詰めたいと考え始めていました。
2. IT知識の欠如
ふたつめが、IT関連スキルが乏しかったことです。
データの解析スキルは向上しましたが、データベース構造・コンピューターサイエンスに関する知識・スキル向上の機会は皆無でした。
また、一般的に飛び交っているビッグデータの定義・認識は正しいのか?、現場で自由気ままに分散している研究データ達を扱うためのデータベース設計をいかに実現するか?、という疑問が残ったままでした。
私は研究開発部門の所属でしたので、おそらく情報システム部門に異動しない限り、この分野の実務スキルを磨くことは難しいと考えていました。
3. 機械学習の正しい理解
みっつめが、機械学習への理解に満足していなかったことです。
17年は、私が関わる研究領域でも、機械学習を適用した研究論文や記事が目立ち始めていた頃でした。
一方、「機械学習によって〜を達成!」のような見出し記事をよく見かけており、「データを機械学習で解析すれば、これまで得られなかった新しい知見が得られる」といった、何か怪しい雰囲気を感じていました。
そう感じていた理由としては、1)どの解析方法をどういったケースで適用するか?、2)どういったケースで、どのようにパラメータ調整を行えばいいか?、3)今の課題は何であり、解決のために何をすべきか?、といった判断が自身でできなかったからだと思います。
例えば、2016年ごろのニューラルネットワークのアプローチを図を見ただけでもこれだけありました。
アルゴリズムの原理を理解しないと、どのアプローチがいいのか、わたしには分かりませんでした。
目的にあわせ、自らで最適なアプローチを検討するためには、データサイエンスをもっと本格的に勉強し、本質を理解する必要があると感じていました。
こうした経緯から、独学ではなく、最先端の研究をする専門家が多く在籍する大学でデータサイエンスを勉強しようという結論に至りました。
海外留学を決めた理由
スキルアップのために大学を選択した理由は分かりました。でも何で海外の大学なんですか?日本の大学ではダメだったんでしょうか?
海外の大学を選択したのは以下3つの理由からです。
- 17年当時、日本にデータサイエンスのマスターコースがなかった
- 英語スキルも磨きたい
- 文化や価値観の違いも学びたい
データサイエンスを勉強する目的とは別に“違う文化・価値観に触れ、日本では得られない気づきを獲得すること”が研究に大事だと考えていました。
そのため、海外留学への気持ちが強かったです。
留学中はデータサイエンスの勉強以外に、日本の良いところ・悪いところを考えたり、政治・歴史への興味も強くなりました。留学を選択したことにとても満足しています。
まとめ
わたしがデータサイエンスを海外の大学で学ぼうと思った主な理由は
- 独学に限界を感じ、スキル向上のために、最先端をよく知る専門家のもとで学びたい
- 視野を広げるために、違う文化・価値観に触れ、日本で得られない気づきを得たい
という2点にまとめられます。
最後に、海外進学を決めるまでの経緯をまとめます。
- 2年間は独学でRの解析を学ぶ
- 独学に限界を感じ、大学でデータサイエンスを学ぼうと決意
- 英語、文化、価値観の違いを学ぶことにも興味があり、海外大学院への進学を決意
データサイエンスを大学で学ぼうと思った理由がよく分かりました。でも、データサイエンスを学びたかったら大学に行かないといけないのでしょうか?
「データサイエンスを学ぶために大学に必ず行かなければいけないか?」と問われると、大学は無理していく場所ではなく、大学で学びたいと考える人が進学すればいい、というのが今のわたしの答えです。
もし、大学で学び直したいけど年齢を気にしているというなら、年齢は無視していいと思います。面白いことに、この分野の海外の大学には30~40代の修士はたくさんいます。
この記事は以上です。最後まで読んで頂きありがとうございました!
参考資料
(1) 日経BP, “日経クロストレンド「トレンドマップ 2020夏」を発表”, (9/3/2020)
(2) THE ASIMOVE INSTITUTE, “THE NEWRAL NETWORK ZOO”, (9/16/2016)
この記事は管理人が「大学のデータサイエンスコースへ進学を志望した理由」をまとめます。