研究型データサイエンティストのブログ

  • ホームHome
  • プロフィールProfile
  • 海外留学Study Abroad
  • 機械学習・最適化Machine Learning・Optimization
  • 統計・線形代数Statistics・Linear Algebra
  • データベースDatabase
  • その他Others
  • お問い合わせMail
  • ホームHome
  • プロフィールProfile
  • 海外留学Study Abroad
  • 機械学習・最適化Machine Learning・Optimization
  • 統計・線形代数Statistics・Linear Algebra
  • データベースDatabase
  • その他Others
  • お問い合わせMail
search menu
  • 海外留学

    データサイエンスコース在籍中にオススメされた&使用した書籍

  • 海外留学

    クイーンズランド大学が提供するデータサイエンス・マスターコース

  • 海外留学

    目標スコアを達成!オススメできるIELTSの学習教材

  • 海外留学

    海外大学院の合格に必要な勉強時間。30代サラリーマンの受験体験記

  • 海外留学

    データサイエンスが学べる海外大学院の探し方

その他

データ分析で使える!qcutとcutで連続値にラベルをつける方法【pandas入門】

2025.05.23

データセット中の連続量の値に対して簡単にラベルを付与したいと思ったことはないでしょうか。例えば、収入の分布を値に応じて「低」「中」「高」などに分けたいなどです。pandasで提供されている関数qcutとcutは簡単にラベ...

その他

相関行列の作成と解釈サポートのための可視化【pandas入門】

2025.05.23

pandasはデータサイエンス、データアナリシス、機械学習の分野で広く利用されているpythonのオープンソースパッケージです。 この記事は「pandasを使った相関行列の作成方法」をまとめます。 相関行列 via GI...

統計・線形代数

確率変数と確率分布:事象の発生確率を示す

2023.03.15

統計用語を自分の言葉でもっと説明できるようになりたく、勉強のために本記事をまとめます。 この記事は「確率変数と確率分布」についてまとめます。 確率変数 確率変数 端的に、確率変数(Random variable)とは、ラ...

データベース

大規模データの分析を強力にサポート: Apache Sparkの概要

2023.01.04

Apache Sparkは、大規模なデータを扱うためのオープンソースの統合分析エンジンです。 Apache Spark 3.0からはGPUを扱った並列分散処理、3.2ではSpark上でPandas APIの利用が可能とな...

機械学習・最適化

DBSCAN: 外れ値/ノイズを発見するための密度ベースクラスタリング

2022.09.04

クラスタリングは、類似性が高いデータをグループ化する教師なし学習の一種です。 クラスタリングには様々なアルゴリズムがありますが、使用アルゴリズムごとでデータセットから得られる結果も異なります。 さらに、クラスタリングには...

統計・線形代数

一般化線形モデル (GLM):一般線形モデルの拡張モデル

2022.11.27

一般化線形モデル(Generalized Linear Model: GLM)のコンセプトの学習は、確率分布を統計モデルにどのように組み込むか考え始める機会に繋がります。 では、一般線形回帰モデル(General Lin...

データベース

APIとは何か?: 役割・種類・利用例のまとめ

2022.08.13

「データを利用した〇〇のサービスを始めるなら、□□のAPIを利用して〜」 データを利用したビジネスやアプリケーション開発に関わる人は、こんな会話を耳にするのではないでしょうか。 APIとよく耳にしますが、APIが何なのか...

統計・線形代数

ブートストラップ法: リサンプリングを利用して母集団の特徴を推定

2022.08.05

ブートストラップ法は、データセットから無作為に何度もリサンプリングして母集団の特徴の推定を試みる統計手法です。 複雑な計算を簡単なシミュレーションに置き換えたブートストラップ法は、今日ではコンピュータ技術の発展に伴い、よ...

統計・線形代数

p値ハッキング: 統計的有意は本当にシルバーブレットか?

2022.07.20

大学の講義で強烈に印象に残ったタイトルのひとつです。 p値ハッキング: p-hackingは、実際は統計的に差がないデータに差があると示してしまう誤ったデータ分析の行為です。 意識的、無意識的な行為に関わらず、知らないう...

統計・線形代数

統計: 記述統計と推測統計の違いは何か?

2022.07.14

統計はデータの中から注目すべきポイントやパターンの発見を手助けします。 一方、たびたび耳にする「記述統計」と「推測統計」というワード。統計の基礎と言われますが、他人に違いを説明しようとすると、分かっているようで分かってい...

1 2 3 … 7 >

Search – 検索

Profile – プロフィール

ワカメ
Data Scientist, Master of Data Science & Master of Engineering in Material Science
このブログは以下2点を目的に運営.
1. 管理人の学び・体験の復習機会
2. 海外留学を目指す方の参考情報
趣味の範囲で淡々と更新します.
*ブログ・SNSは所属組織と無関係の個人発信.

Sponsored Links – スポンサーリンク

Tags – タグ

BIGDATA (4) DB (3) DS (6) ENG (4) Julia (9) LA (14) ML (7) OR (5) PICKUP (5) plotly (2) python (19) Spark (1) STATS (6) UQ (8) プロジェクト (1) プロフィール (1) 学習 (6) 留学準備 (6)

Archives – アーカイブス

  • ホームHome
  • プロフィールProfile
  • 海外留学Study Abroad
  • 機械学習・最適化Machine Learning・Optimization
  • 統計・線形代数Statistics・Linear Algebra
  • データベースDatabase
  • その他Others
  • お問い合わせMail

アーカイブ

  • 2025年5月
  • 2023年3月
  • 2023年1月
  • 2022年9月
  • 2022年8月
  • 2022年7月
  • 2022年6月
  • 2022年4月
  • 2022年3月
  • 2022年2月
  • 2022年1月
  • 2021年12月
  • 2021年11月
  • 2021年7月
  • 2021年6月
  • 2021年4月
  • 2021年2月
  • 2021年1月
  • 2020年12月

カテゴリー

  • その他
  • データベース
  • 機械学習・最適化
  • 海外留学
  • 統計・線形代数
  • ホーム
  • サイト概要
  • プライバシーポリシー
  • 免責事項

© 2025 研究型データサイエンティストのブログ All Rights Reserved.