R の相関行列 correlation matrix

UB3/informatics/r/cor_test

このページの最終更新日: 2022/07/26

  1. 概要: 相関行列 correlation matrix とは
  2. corrplot 関数による相関行列の視覚化

広告

概要: 行列 correlation matrix とは

相関行列 correlation matrix とは、複数の変数間における相関係数を行列にしたもののことをいう。相関係数については、ピアソンの相関 のページなどを参照のこと。

R の 組み込みデータセット swiss を使って説明する。

swiss は、スイスの 47 の地区における出生率と、さまざまな社会的要因のデータである。 Rの組み込みデータセット swiss

数字をざっと見ると、Examination と Education に正の相関がありそうである。変数を指定して cor() 関数を使うと、次のように相関係数を算出してくれる。

cor(swiss$Education, swiss$Examination)
[1] 0.6984153

cor() をデータ全体に対して使うと、相関行列が作られる。

mat <-cor(swiss)

swissの相関行列

Fertility vs. Fertility の相関係数はもちろん 1 であり、これは他の変数についても同様なので、対角線に 1 が並ぶ。


広告

corrplot 関数による相関行列の視覚化

cor() 関数で計算した相関行列は、そのまま ヒートマップ にしてもよいが・・・

swiss相関行列のヒートマップ

corrplot() 関数 を使う方が何かと便利なことが多い。とりあえずは corrplot documentation へのリンクを張っておく。そのうちオプションなどをまとめたい。

ggcorrplot も何度か試したことがある。heatmaply を使うと、デンドログラムをつけられる。


広告

References

コメント欄

各ページのコメント欄を復活させました。スパム対策のため、以下の禁止ワードが含まれるコメントは表示されないように設定しています。レイアウトなどは引き続き改善していきます。「管理人への質問」「フォーラム」へのバナーも引き続きご利用下さい。

禁止ワード: http, the, м (ロシア語のフォントです)


このページにコメント

Name:


Comment:



これまでに投稿されたコメント

Date Name Comment