データサイエンスって何?
データサイエンスって何ができるの?
データサイエンティストって何をする人?
ここ数年、ニュースや記事でデータサイエンスが取り上げられているとはいえ、私の家族、職場、友人を含め、まだまだデータサイエンスのことを知らない人は多いです。
- なぜデータサイエンスが注目されているのか
- データサイエンティストの需要はどのように変化するのか
- これからのデータサイエンティストには何が求められるのか
データサイエンスとは?
⑴ドメイン知識、⑵コンピュータサイエンス、⑶数学・統計、が融合した分野をデータサイエンスと言います。これらの分野を融合することで、データから価値があるインサイトを見つけ出すことを目的とします。
驚くことに、データサイエンスという言葉は、およそ50年前からありました。ビッグデータが注目されたことで、データサイエンスは大きな転換期を迎えました。
データサイエンスが注目される理由
ビッグデータ
今日、私たちの日常生活からは、様々な種類のデータが生み出されています。
SNSの写真・テキスト、Youtubeの動画視聴、クレジットカードの支払い、航空券の予約、健康診断の記録、どれも生活の中での何気ない行動の一部ですが、PC、スマホ、センサーなどから生成されるデータの総量は増加しています。
2020年5月、アメリカの市場調査会社「International Data Corporation (IDC)」は “2020年に世界で生成・消費されるデータ総量はおよそ59ゼタバイト(ZB)に及ぶ”と発表しました。(1)
さらに興味深いことに、”今後3年で生成されるデータ総量が過去30年で生成されたデータ総量を超える”とも予想されています。
データは“現代の石油“とも比喩されており(3)、これらデータをうまく取り扱うことが、新たなサービスとイノベーションの源泉になると期待されています。
ビッグデータの課題
データってそんな勢いで増えているんですね!
でも、ビッグデータとデータサイエンスにどんな関係があるんですか?
実は、ビッグデータの取り扱いには課題もあります。データをたくさん持っているだけでは、あまり意味がありません。
例えば、解析のために事前にデータを加工する作業が必要になりますが、およそ8割のデータが異なるデータソースから生成されているため、データの種類や質が一致しないです。
もうひとつ気をつけないといけないのは、データ自体は意味を持たないことです。データはデータでしかなく、ヒトがデータに意味を与えなければいけません。
また、「得られたデータをいかに活用するか」アウトプットを描く必要もあります。データを集めただけで何か新しいことが分かる、ということはあり得ません。
膨大・複雑なビッグデータを適切に取り扱うことで、状況に応じた最適解を導き、次のアクションに向けた選択をするために、データサイエンスは重要な分野として注目されています。
今後のデータサイエンティストの需要
- ビッグデータを適切に解析
- ビッグデータからインサイトを発見
- 意思決定者をサポート
ができる人材をデータサイエンティストと呼びます。
データサイエンスの期待は大きく、労働市場において世界的にもデータサイエンティストは不足しています。
Indeedによると、アメリカでのデータサイエンティスト枠の募集は、2013年12月から2019年1月までに256%も上昇しています。(4)
同じようにデータサイエンティストの不足は続くんでしょうか?
断言できませんが、各国がデータサイエンティストの育成に力を入れていますので、いずれ解消されるでしょう。
また、データのクリーニングやモデルを自動化するソフトウェアが登場することで、データサイエンティストの市場価値が下がる可能性もあります。
え……、では、これからデータサイエンスを学ぼうと思ったらどうしたらいいんでしょうか?
データサイエンスを学ぶことは大切ですが、将来はデータサイエンス一本でご飯を食べていくことは難しくなる、ことを前提に考える必要があります。
これからのデジタル時代において、「数学・統計」「プログラミング」は、英語のように必修スキル化すると想定した方がいいでしょう。
実際、高校の新しい学習指導要領に基づき作成された「情報Ⅱ」教員研修用教材は、データサイエンスの主要な知識・スキルをカバーしています。
最も大事になるのは「ドメイン知識」だと私は考えます。
既に社会経験を積んでおり、ドメイン知識がある20~40代もデータサイエンスを学んだ方が良いです。あらゆる国・産業で「情報のデータ化 x AI」の検討が進められており、2030年までに、仕事・研究・生活のあり方が大きく変わるでしょう。
今後のプロジェクトマネジメントのためにも、データサイエンスは知っておくべき知識・スキルだと言えます。
まとめ
今後のデータサイエンティストの需要について、管理人の考えをまとめます。
- データサイエンスは「ドメイン知識」「コンピュータサイエンス」「数学・統計」が融合した学問
- 世界的にデータサイエンティストは不足しており、需要は高い
- 将来はデータサイエンティストの不足は解決される見込み
- データサイエンスと組み合わせるドメイン知識を高めることが大事
データサイエンスを学ぶことは大事ですが、英語のようなスキルの一種と考えた方がいいです。
データサイエンティストとしての差別化のポイントは、ドメイン知識を持ち、データサイエンス+αの組み合わせから、新しい価値を生み出すマインドを持つことです。
最後まで読んでいただき、ありがとうございました!
参考
参考(3): The Economist, “The world’s most valuable resource is no longer oil, but data”, (5/6/2017)
参考(4): quanthub, “Is There a Data Scientist Shortage in 2019?”, (6/3/2019)
この記事では、データサイエンスのトレンド、今後のデータサイエンティストの需要についてまとめます。