オブジェクト同士の類似度を測る方法。代表的な類似度計測方法のまとめ。
類似度は、ふたつのオブジェクトがどれくらい似ているかを示します。オブジェクト同士の類似度を計測する方法は、多くのデータマイニング、機械学習の手法で利用されます。 では、どのようにしてオブジェクト同士の類似度を計測するので...
類似度は、ふたつのオブジェクトがどれくらい似ているかを示します。オブジェクト同士の類似度を計測する方法は、多くのデータマイニング、機械学習の手法で利用されます。 では、どのようにしてオブジェクト同士の類似度を計測するので...
pandasはデータサイエンス、データアナリシス、機械学習の分野で広く利用されているpythonのオープンソースパッケージです。 ある程度操作を覚えてしまうと非常に便利、柔軟、パワフルなツールですが、スキルとして身につく...
データ・オブジェクトはデータベースのエンティティを意味し、アトリビュートを使って記述します。 データ・オブジェクトの記述に使うアトリビュートとはなんでしょう?この記事は「アトリビュートの定義・種類・例」についてまとめます...
データ前処理(Data Preprocessing) には、(1)データクリーニング(Data Cleaning), (2)データインテグレーション(Data Integration), (3)データリダクション(Dat...
グラム・シュミット・アルゴリズム(Gram-Schmidt Algorithm)は、有限の線形独立なベクトルを取ったとき、これらのベクトルが張る部分空間と同じ部分空間を張るための正規直交系を作り出します。 この記事は「グ...
クラスタリング(またはクラスター分析)は、集合に含まれるオブジェクトの類似度に基づき、それぞれのオブジェクトをグループ分けする手法です。 クラスタリングは、例えば、機械学習、パターン認識、画像分析、情報検索、バイオインフ...
日本と異なる文化・価値観を学びたい。そんな気持ちを原動力に海外留学を目指し、ご縁あって選択した学びの地はオーストラリアのブリスベン。 留学中の21年7月には、ブリスベンは32年のオリンピックホストシティに決定しました。今...
4つの基本部分空間(Four Fundamental Subspace)は、1993年にGilbert Strang氏の論文: “The fundamental theorem of linear algebra”&nb...
英語でレジュメを書く際、同じ単語を何度も繰り返して使うことは避けるよう教わります。 また、自分自身の経験を魅力的に説明するため、力強い動作動詞を効果的に使う必要もあります。 この記事では、UQキャリアサポートセンター主催...
世はまさにビッグデータビジネスの時代。 データサイエンスへの注目も年々高まっていますが、一方で、「eコーマス、SNSを起点とした新しいデータの出現」「急激に増加し続けるデータ」などを背景に、私たちが気づかないところでは、...