R の組み込みデータセット: 一覧と便利な使い方

UB3/informatics/r/built_in

このページの最終更新日: 2021/07/08

  1. R 組み込みデータセットの一覧

広告

R 組み込みデータセットの一覧

data() で一覧が表示される。


chickwts

horsebeanm, linseed などの餌を与えられて育ったニワトリの体重データ。棒グラフ の練習に使った。以下のような形式で、ToothGrowth と似ている。

iris

iris は「アヤメ」の意味。花弁の長さ petal length、がくの長さ sepal length などのデータが入っているが、petal とか sepal とか length とか width とか非常にややこしく、しかも花のサイズとか別に興味ないしどうでもよいので、あまり使いたくないデータセットである。

iris は統計学者フィッシャーによるデータセットらしく、フィッシャーが優生学の信奉者だったこともあり、iris の使用停止を勧める こんなページ もあるようだ。

lh

血中ホルモン量のタイムコース、48 タイムポイント。typeof で double となるので、一次元の vector データだと思うのだが、is.vector では false になる。

Orange

木の年齢と胴回りのデータセット。木は 1 から 5 という名前の 5 つのグループに分かれており、数字をカテゴリー変数をして扱うオプション as.factor を覚えるのにも良い。

swiss

スイスの 47 の地区における出生率と、さまざまな社会的要因のデータ。ピアソンの相関 で例として用いている。

ToothGrowth

ビタミン C またはオレンジジュースをいくつかの dose で投与されたモルモットの歯の長さのデータ。chickwts と似ているが、dose の違いという要素がある。

全体としては 二元配置分散分析 のデータ。平均値などの算出、棒グラフ、t 検定など、さまざまな関数の練習に有用。

BostonHousing

ボストン地区の家の値段と、さまざまな要因のデータ。mlbench というパッケージに含まれるデータセットなので、まずはこのパッケージをインストールする必要がある。正則化回帰 で例として用いている。

CO2

植物の二酸化炭素取り込み量データ。



広告

広告

References

コメント欄

各ページのコメント欄を復活させました。スパム対策のため、以下の禁止ワードが含まれるコメントは表示されないように設定しています。レイアウトなどは引き続き改善していきます。「管理人への質問」「フォーラム」へのバナーも引き続きご利用下さい。

禁止ワード: http, the, м (ロシア語のフォントです)


このページにコメント

Name:


Comment:



これまでに投稿されたコメント

Date Name Comment