データサイエンスコースで学んだ統計と線形代数の知識をまとめます.
確率変数と確率分布:事象の発生確率を示す
統計用語を自分の言葉でもっと説明できるようになりたく、勉強のために本記事をまとめます。 この記事は「確率変数と確率分布」についてまとめます。 確率変数 確率変数 端的に、確率変数(Random variable)とは、ラ...
データサイエンスコースで学んだ統計と線形代数の知識をまとめます.
統計用語を自分の言葉でもっと説明できるようになりたく、勉強のために本記事をまとめます。 この記事は「確率変数と確率分布」についてまとめます。 確率変数 確率変数 端的に、確率変数(Random variable)とは、ラ...
一般化線形モデル(Generalized Linear Model: GLM)のコンセプトの学習は、確率分布を統計モデルにどのように組み込むか考え始める機会に繋がります。 では、一般線形回帰モデル(General Lin...
ブートストラップ法は、データセットから無作為に何度もリサンプリングして母集団の特徴の推定を試みる統計手法です。 複雑な計算を簡単なシミュレーションに置き換えたブートストラップ法は、今日ではコンピュータ技術の発展に伴い、よ...
大学の講義で強烈に印象に残ったタイトルのひとつです。 p値ハッキング: p-hackingは、実際は統計的に差がないデータに差があると示してしまう誤ったデータ分析の行為です。 意識的、無意識的な行為に関わらず、知らないう...
統計はデータの中から注目すべきポイントやパターンの発見を手助けします。 一方、たびたび耳にする「記述統計」と「推測統計」というワード。統計の基礎と言われますが、他人に違いを説明しようとすると、分かっているようで分かってい...
線形代数で扱う射影は、高次元のデータセットに対する様々な数学演算の理解に役立ちます。 機械学習、数値計算において、射影の代表的な利用例には線形回帰、特異値分解などがあげられ、その利用は幅広いです。 射影がどのように利用さ...
グラム・シュミット・アルゴリズム(Gram-Schmidt Algorithm)は、有限の線形独立なベクトルを取ったとき、これらのベクトルが張る部分空間と同じ部分空間を張るための正規直交系を作り出します。 この記事は「グ...
4つの基本部分空間(Four Fundamental Subspace)は、1993年にGilbert Strang氏の論文: “The fundamental theorem of linear algebra”&nb...
ある条件を満たすと、線形結合に扱われるベクトルは、線形独立、または、線形従属と呼ばれます。線形独立・線形従属は、他のベクトルと任意のスカラーで対象とするベクトルを表現できるか否かを示します。 この記事は復習のために「線形...
ベクトル空間。高校・大学で線形代数を勉強したことはあるけど、私はすっかり忘れていました。概念が抽象的で同じように忘れている人も多いのではないでしょうか。 この記事は、復習のため、最低限知っておきたい「ベクトル空間」をまと...