クイーンズランド大学(UQ)のデータサイエンスコースでは何を学ぶか。受講したコースを紹介するこのシリーズは今回で最後となります。
- UQのデータサイエンスコースでは何を学ぶか
- 単位取得のために何を満たす必要があるか
- その講座の学びがどんなことに繋がるか
目次
UQのデータサイエンスコース
UQは、高度な分析技術・スキルと特定産業における必要不可欠な知識を学ぶことができるオーストラリアで最も包括的なデータサイエンスマスターコースを提供しています。(1)
このコースでは、各々の能力や目標に合わせて、データサイエンスに必要な知識・スキルを伸ばすことができます。提供されているコースは、UQのコースリストから確認できます。
以下、21年Semester2で受講した3つの講座についてまとめます。
COMP3710: Pattern Recognition and Analysis

概要
この講座は、3つのメインモジュール: 1)自然界のパターン、2)伝統的パターン認識、3)畳み込みニューラルネットワーク(CNN)、から設計されています。将来的に、画像、音響、といった様々な分野でのパターン認識・分析のためのアルゴリズム実装、課題解決ができる人材の育成を目的とします。
- 対称群やフラクタル幾何学などを数学的に説明できる
- データのパターンを抽出・解釈、そして、問題の解決ができる
- パターン認識のための様々な変換ドメインと次元削減手法を利用できる
- Convolutional Neural Network(CNN)を利用できる
- TensorflowとPyTorchを使ってアルゴリズムを開発できる
- パターン認識の研究を実施するために適切なコミュニケーションが取れる
学習内容
この講座で学ぶ代表トピックです。
- Symmetry & Self-similarity
- Groups
- Fractal
- Traditional Pattern Recognition
- Fourier Transformation
- Principal Component Analysis
- Deep Learning
- Convolution
- Gradient Descent
- Models
- Transformer
- GAN
- YOLO
- Mask R-CNN
- UNet
- GCN
- VQ-VAE
成績は5つの課題の総合点から評価されます。
- フラクタルに関するアルゴリズムの実装と解説: 10%
- オンライン上のクイズ: 10%
- パターン認識に関するアルゴリズムの実装と解説: 20%
- Deep Learningに関するアルゴリズムの実装とレポート: 40%
- 期末試験: 20%
Deep Learningの実技課題のウェイトは、期末試験よりも大きいです。実技は、TensorflowとPyTorchの使用以外認められません。 numpy等のパッケージの使用は禁止されていました。
どんなことに役立つか
データサイエンスコースにとって、このコースは選択科目です。必修科目ではありませんが、ディープ・ラーニングをより専門的に学びたい人にとっては、おすすめのコースです。
この分野で活躍するPhDの学生、外部の研究者、教授たちが実施するプレゼンもあり、コンピュータ・ビジョンにおけるディープ・ラーニングの利用例と実装スキルを学ぶ機会は、現在のAI研究の動向と課題の理解に繋がります。
特に、異なる分野での経験がある方は、自身の分野の組み合わせから新しいアイディアのヒントを得る機会にも繋がると思います。

あっという間に新しいアプローチとモデルが登場してくるため、学ぶ内容は毎年更新されているそうです。この分野のスピード感を学べた点も非常に有益でした。
DATA7703: Machine Learning for Data Scientists

概要
このコースは以下の人材育成を目的としています。
- 様々な機械学習モデルの機能と特性の理解できる
- 目的データに対する機械学習アルゴリズムを実装できる
- 機械学習モデルから得られたデータを評価できる
- 機械学習と他のモデルとの関係性を説明できる
- …

コースプロファイルにはたくさん書かれているのですが、端的には「機械学習の特徴を理解して適切に扱える人材」です。

一般的に言われている内容と変わらないのですが、具体的には何を学ぶのでしょうか?
学習内容
この分野で学ぶ代表トピックです。
- Classification
- Regression
- PCA & LDA
- Clustering
- Support Vector Machine
- Ensemble Methods
- Multilayer Perceptrons
- Convolutional Neural Network
- Robust Machine Learning
- Interpretable Machine Learning
- Bayesian Methods
この講座はアサイメント4つ、中間試験1つ、チームプロジェクトの総合点から評価されます。
- アサイメント:各10%
- 中間試験:30%
- チームプロジェクト:30%
どんなことに役立つか
機械学習で代表的な手法と理論を一通りカバーし、データと目的に応じたアルゴリズムを実装するための力に繋がります。

データサイエンスコースの必修科目ということで、このコースで学ぶ機械学習の知識・スキルは、データサイエンスに関わるならば必ず身につけたい技能と個人的には捉えています。
DATA7902: Data Science Capstone Project 2

概要
この講座は、他で紹介しているDATA7901とセットのコースです。1年を通して受講します。この講座の目的は、科学、行政、産業が抱える課題の解決を目標とした協働プロジェクトを通じて、以下の人材を育成することです。
- 効果的な言葉・文章を使うことで、明確にデータサイエンスの問題を定式化できる
- 様々なデータソースからの情報を統合し、プロジェクトの計画を立てることができる
- 有効な視覚効果と発表スキルにより聴衆を惹きつけ、首尾一貫した説得力ある議論ができる
- 倫理および法的側面を考慮して、技術的に実現可能なデータサイエンス解決策を設計できる
- 実際の問題に対して、適切なデータサイエンスの手法を特定できる
- 専門家とステークホルダーの双方に適したプロジェクトの詳細を提案できる
学習内容
成績は以下2点から評価されます。
- プレゼンテーション: 30%
- レポート: 70%
プレゼンテーションとレポートの採点は、指導教官と評価者の2名で評価されます。評価者は、関連分野の専門家、または、パートナー企業の社員から選ばれていました。
どんなことに役立つか
データサイエンスコースの集大成を担う講座であり、データサイエンティストに必要な知識・スキルを総動員する貴重な経験になります。同時に、データサイエンスの難しさを体験することにもなります。
最終的に、これらの経験は、卒業後にデータサイエンティストとして独り立ちしていくための大事な糧となります。
まとめ
今回の記事の内容をまとめます。
- Pattern Recognition and Analysis:パターン認識・分析のためのアルゴリズム実装、課題解決ができるようになることを目指す
- Machine Learning for Data Scientists:データサイエンスで大事な機械学習の知識・実装スキルの習得を目指す
- Data Science Capstone Project2:データサイエンスプロジェクトを通じて、データサイエンティストとして独り立ちしていくための経験の獲得を目指す
この記事は以上です。

個人的にはPattern Recognition and Analysis(PR)の講座が今季で最も面白かったです。Capstone Projectも満足な内容だったのですが、PRの講座はPhDたちが担当している研究にも触れられるため、新しくインプットした情報量はPRの方が多かった気がします。最後まで読んで頂きありがとうございました。
参考
(1) Master of Data Science – UQ
この記事では、クイーンズランド大学(UQ)の「データサイエンス・マスターコースが提供する講座から学べる知識・スキル」を紹介します。
今回は管理人が2年目のSemester2で受講した3つの講義をまとめます。
*「年度」「コースコーディネーター」の変更に伴い、講座の内容も変わることがあります