あなたはどんな人ですか?
バックグラウンドは何ですか?
なぜデータサイエンスを学ぼうと思ったんですか?
どうして30代から留学をしようと考えたんですか?
留学するためには何から始めたらいいんですか?
たくさんの質問をありがとうございます!
この記事では「管理人のプロフィール」と「データサイエンスを学ぼうと思った理由」を紹介します。
- 管理人がどんな人物か
- なぜデータサイエンスを学ぼうと思ったか
- どうして海外留学を選択したか
目次
プロフィール
管理人は化学系企業のR&Dに所属の30代中堅研究員です。
バックグラウンドは分析化学、工学修士を卒業しています。
分析化学はありとあらゆる手段を駆使し、力づくで分析対象(ウイルス、抗体、化学物質、など)を検出・測定する分野です。
これまで、有機化学、高分子化学、物理化学、生体化学、免疫学、電気化学といった学問を学んできました。
15年からはRを使って多変量解析をはじめました。企業では基礎研究から商品開発を経験しました。
新しい計測方法の確立のために、どんな学問もアプローチに取りこもうとする分析化学の姿勢を気に入っています。
データサイエンスを学ぶ理由
なぜ化学系出身からデータサイエンスを学ぼうと思ったんですか?
データサイエンスを学ぼうと思ったきっかけが2つあります。
抽象的ですが、大きな理由としては、
- ビッグデータを使って挑戦したいことがある
- 過去に担当したデータサイエンスのプロジェクトに課題を感じた
からです。
特に、プロジェクト経験以降、「データサイエンスが関わるプロジェクトを推進するために、自身もこの分野の知識・スキルを習得する必要がある」という気持ちが強くなりました。
プロジェクトからの学び
プロジェクトで感じた課題ってどんなことですか?
わたしはプロジェクトから以下3つの課題を感じました。
- ドメイン知識
- 解析アルゴリズムの理解
- プロジェクト開始までの労力と継続性
1. ドメイン知識
ドメイン知識が課題とはどういうことでしょう?
データ解析を始める前にデータの構造と意味を理解しなければいけません。
当時、私たちが協働したデータサイエンティストはIT企業に所属する方でした。
少しだけ想像してみてください。
例えば、あなたは化学分野に全く馴染みがありません。専門家から、先端研究に関するデータの説明を受けただけで、専門家と同じようなデータの解釈ができるでしょうか?
わたしはできないですね…逆の立場で、例えば、情報システム、電子工学、経済学の話を専門家から丁寧に説明されても、私が理解できることは表面的なことまでな気がします。
その通りです。本当に優秀な方は理解されるのかもしれないですが、大多数はそうではないです。
データ構造が複雑になるほど、あるいは、データ量が増えるほど、データサイエンティストが専門家のようにデータの本質を理解することは容易ではないと感じました。
このことから、データサイエンスのプロジェクトにとって、ドメイン知識がいかに大事になるか気づけました。
もちろん、「チームとして活動することで足りない知識を補う」という方法もあります。
しかし、短期間のプロジェクト、かつ、専門性が高い領域において迅速・適切にデータ解析を実施するためには、解析対象分野の専門知識を備えたデータサイエンティストが必要だと思いました。
2. 解析アルゴリズムの理解
一方、プロジェクト依頼側にとって、プロジェクトから得た結果の考察が困難と感じました。
これが起こる原因の一つには、依頼側に解析アルゴリズムの知識が欠如しているため、と考えます。
「結果の考察が困難」ってどういう意味ですか?
データを解析すれば、必ず何らかの結果が得られます。
しかし、解析の意図を理解せずして、
「なぜこのような結果が得られたのか?」
「他の解析アルゴリズムを適用すると結果がどのように変わるのか?」
「課題を解決するために次のアクションに何が必要なのか?」
といった考察ができません。
使用したアルゴリズムが複雑になるほど、この傾向は顕著でした。
得られた結果から次のアクションに繋げるために、依頼側も解析アルゴリズムを理解する必要があると思えました。
「ドメイン知識を持たないデータサイエンティスト」と「解析アルゴリズムを理解していない専門家」のチームから生み出せる発見は少なく、最悪の場合、大きく誤った結論を導く可能性もある、と感じました。
3. プロジェクト開始までの労力と継続性
費用に関してですが、当然、社外にデータ解析を依頼すると、データ解析のコストが発生します。
また、オープンイノベーションが推進されているとはいえ、研究データの機密情報の観点から、何でも気軽に協働プロジェクトとして社外に依頼できない様子でした。
機密保持契約を結ぶことはできますが、そのステージに辿り着くまでの労力がしんどい。
仮に協働プロジェクトとして進めることができたとしても、
1)プロジェクトを継続する場合、追加契約・コストが発生する
2)検討したい他のテーマもたくさん控えている
といった理由から、当時の状況では、プロジェクトの長期継続は難しかったです。
データサイエンスの専門家が少なく、「集中と選択」を行えば、そうなりますよね。
最終的に、担当したプロジェクトは複数のアプローチを数回試みて終了しました。
プロジェクトを始めるまでに時間・労力がかかるうえ、社運をかけたような大きなプロジェクトでない限り、プロジェクトの継続は難しいと思いました。
プロジェクト終了後の所感
このプロジェクト経験から、化学研究の知識を持ちながらデータサイエンスの関連スキル・知識を身につけることが、自身のキャリア・スキルアップだけでなく、会社にとってもこの分野を推進していくことに繋がるのでは、と考え始めました。
「最新アルゴリズムでデータ解析すれば、スゴい発見が勝手に得られる」みたいに思ってましたが、そうではないのですか?
プロジェクトからは、高度な解析スキルを身につけるだけでは課題解決に繋がらないことを学びました。
正直、データサイエンスのことをよくわかっていなかった当時、私もデータサイエンスに対して同様の過剰な期待を抱いていました。
データサイエンティストには、解析スキルだけでなく、データを読み解く力も必要です。
データサイエンスは、課題解決のための手段の1つでしかありません。
今は、ビッグデータを扱い解析できる人材を”データサイエンティスト”と呼び重宝しています。
しかし、近い将来、データサイエンティストに必要な知識・スキルは持っていて当然になると個人的には思います。
気をつけたいのは、データサイエンスだけで何かができるわけではないということです。
海外留学を決意した理由
なるほど!でも、データサイエンスを学ぶのにどうして海外留学なんですか?
データサイエンスを学ぶために、海外大学への留学を決めた理由は3つあります。
1. 専門家の近くで修行
残念ながら、当時はこの分野の専門家が化学企業に勤める私の身の回りには多くはいませんでした。基本的には独学です。
社外のセミナーにも何度か参加もしましたが、短時間の話を聞いただけでは、それ以上のスキル向上を実感できませんでした。
こうした経緯から、データサイエンスの知識とスキルを専門家のもとで集中的に学ぶ必要がある、という考えに至り、大学で学ぼうと考え始めました。
19年まで日本はデータサイエンスコースの大学院がなかったため(2)、自然と「海外の大学」を選択しました。
2. 国際的な資格
データサイエンスに関わる資格はありますが、実はデータサイエンティストであることを証明する資格はありません。「私はデータサイエンティストです」と自由に名乗れます。
データサイエンスの修士号(MSDS)がグローバルで活躍するための今後のキャリア形成にも繋がる、と考え、MSDSの取得を目指すことにしました。
3. 視座の底上げ
研究者の立場として、「様々な文化や考えの違いの経験が研究者、人間としての力を高める」という言葉に共感しています。
最近は、日本国内でもデータサイエンスを学ベますが、海外で学ぶことがデータサイエンティストとしてのスキル向上のみならず、研究・ビジネスのための新しい着想を得る機会に繋がると期待し、海外留学を決断しました。
まとめ
本記事で紹介した管理人のプロフィールをまとめます。
- 化学系企業の研究員
- 現在は、データサイエンスコースの社会人大学院生
- 過去のプロジェクトから感じた課題が3つ
- ドメイン知識
- アルゴリズムの理解
- プロジェクト開始までの労力と継続性
- プロジェクトの経験がデータサイエンティストを目指すきっかけに変わる
- 3つの目的から海外留学を志望
- 専門家の近くで修行
- 国際的な資格
- 視座の底上げ
最後まで読んでいただきありがとうございました。
データサイエンスを学ぼうと考えている方の役にも立つブログ運営をしていきたいと思います。
これからどうぞよろしくお願いいたします。
参考資料
(1): Harvard Business Review, “Data Scientist: The Sexiest Job of the 21st Century”, (2012/11)
(2): 滋賀大学, “日本初の大学院データサイエンス研究科設置に関わる学長談話”, (2018/8/29)
はじめまして!研究とデータサイエンスの融合を目指すワカメ(@wakame-msds)です。オーストラリアのデータサイエンスコースへ留学していました。