研究型データサイエンティストのブログ

  • ホームHome
  • プロフィールProfile
  • 海外留学Study Abroad
  • 機械学習・最適化Machine Learning・Optimization
  • 統計・線形代数Statistics・Linear Algebra
  • データベースDatabase
  • その他Others
  • お問い合わせMail
  • ホームHome
  • プロフィールProfile
  • 海外留学Study Abroad
  • 機械学習・最適化Machine Learning・Optimization
  • 統計・線形代数Statistics・Linear Algebra
  • データベースDatabase
  • その他Others
  • お問い合わせMail
search menu
  • 海外留学

    データサイエンスコース在籍中にオススメされた&使用した書籍

  • 海外留学

    クイーンズランド大学が提供するデータサイエンス・マスターコース

  • 海外留学

    目標スコアを達成!オススメできるIELTSの学習教材

  • 海外留学

    海外大学院の合格に必要な勉強時間。30代サラリーマンの受験体験記

  • 海外留学

    データサイエンスが学べる海外大学院の探し方

統計・線形代数

確率変数と確率分布:事象の発生確率を示す

2023.03.15

統計用語を自分の言葉でもっと説明できるようになりたく、勉強のために本記事をまとめます。 この記事は「確率変数と確率分布」についてまとめます。 確率変数 確率変数 端的に、確率変数(Random variable)とは、ラ...

データベース

大規模データの分析を強力にサポート: Apache Sparkの概要

2023.01.04

Apache Sparkは、大規模なデータを扱うためのオープンソースの統合分析エンジンです。 Apache Spark 3.0からはGPUを扱った並列分散処理、3.2ではSpark上でPandas APIの利用が可能とな...

機械学習・最適化

DBSCAN: 外れ値/ノイズを発見するための密度ベースクラスタリング

2022.09.04

クラスタリングは、類似性が高いデータをグループ化する教師なし学習の一種です。 クラスタリングには様々なアルゴリズムがありますが、使用アルゴリズムごとでデータセットから得られる結果も異なります。 さらに、クラスタリングには...

統計・線形代数

一般化線形モデル (GLM):一般線形モデルの拡張モデル

2022.11.27

一般化線形モデル(Generalized Linear Model: GLM)のコンセプトの学習は、確率分布を統計モデルにどのように組み込むか考え始める機会に繋がります。 では、一般線形回帰モデル(General Lin...

データベース

APIとは何か?: 役割・種類・利用例のまとめ

2022.08.13

「データを利用した〇〇のサービスを始めるなら、□□のAPIを利用して〜」 データを利用したビジネスやアプリケーション開発に関わる人は、こんな会話を耳にするのではないでしょうか。 APIとよく耳にしますが、APIが何なのか...

統計・線形代数

ブートストラップ法: リサンプリングを利用して母集団の特徴を推定

2022.08.05

ブートストラップ法は、データセットから無作為に何度もリサンプリングして母集団の特徴の推定を試みる統計手法です。 複雑な計算を簡単なシミュレーションに置き換えたブートストラップ法は、今日ではコンピュータ技術の発展に伴い、よ...

統計・線形代数

p値ハッキング: 統計的有意は本当にシルバーブレットか?

2022.07.20

大学の講義で強烈に印象に残ったタイトルのひとつです。 p値ハッキング: p-hackingは、実際は統計的に差がないデータに差があると示してしまう誤ったデータ分析の行為です。 意識的、無意識的な行為に関わらず、知らないう...

統計・線形代数

統計: 記述統計と推測統計の違いは何か?

2022.07.14

統計はデータの中から注目すべきポイントやパターンの発見を手助けします。 一方、たびたび耳にする「記述統計」と「推測統計」というワード。統計の基礎と言われますが、他人に違いを説明しようとすると、分かっているようで分かってい...

統計・線形代数

線形代数の基礎: 射影と最小二乗法の理解

2022.08.13

線形代数で扱う射影は、高次元のデータセットに対する様々な数学演算の理解に役立ちます。 機械学習、数値計算において、射影の代表的な利用例には線形回帰、特異値分解などがあげられ、その利用は幅広いです。 射影がどのように利用さ...

機械学習・最適化

クラスタリング:k-meansクラスタリング

2022.07.11

クラスタリングは、データの特徴量から似ているユーザー・製品・サンプルなどをグループ化する方法です。 様々な手法が存在するクラスタリング手法の中でも、k-meansクラスタリングは扱いが簡単な代表モデルのひとつです。 この...

1 2 3 … 6 >

Search – 検索

Profile – プロフィール

ワカメ
Data Scientist/Researcher. 専門: MSDS & M.Eng. in Mat.Sci. このブログは以下2点を目的に運営しています.
1. 学び・体験の復習機会
2. 海外留学を目指す方の参考情報
*ブログ・SNSは所属組織と無関係の個人発信.

Sponsored Links – スポンサーリンク

Sponsored Links – スポンサーリンク

Trending – トレンド

Tags – タグ

BIGDATA (4) DB (3) DS (6) ENG (4) Julia (9) LA (14) ML (7) OR (5) PICKUP (5) plotly (2) python (17) Spark (1) STATS (6) UQ (8) プロジェクト (1) プロフィール (1) 学習 (6) 留学準備 (6)

Archives – アーカイブス

  • ホームHome
  • プロフィールProfile
  • 海外留学Study Abroad
  • 機械学習・最適化Machine Learning・Optimization
  • 統計・線形代数Statistics・Linear Algebra
  • データベースDatabase
  • その他Others
  • お問い合わせMail

アーカイブ

  • 2023年3月
  • 2023年1月
  • 2022年9月
  • 2022年8月
  • 2022年7月
  • 2022年6月
  • 2022年4月
  • 2022年3月
  • 2022年2月
  • 2022年1月
  • 2021年12月
  • 2021年11月
  • 2021年7月
  • 2021年6月
  • 2021年4月
  • 2021年2月
  • 2021年1月
  • 2020年12月

カテゴリー

  • その他
  • データベース
  • 機械学習・最適化
  • 海外留学
  • 統計・線形代数
  • ホーム
  • サイト概要
  • プライバシーポリシー
  • 免責事項

©Copyright 2023 研究型データサイエンティストのブログ .All Rights Reserved.