確率変数と確率分布: 定義、実例など

statistics/basics/random_variable
2018/07/25 更新

  1. 確率変数とは
  2. 確率分布とは
    • 離散型の確率分布
    • 離散型分布の例
    • 連続型の確率分布
    • 連続型分布の例
  3. 累積分布関数

広告

概要: 確率変数とは

確率変数 random variable とは、それぞれの要素が確率 probability をもつ変数 variable のことである。

なお変数 variavble とは、数学では未知の数、不定の数を示す文字記号のことで、教科書に出てくる x, y, z などのこと。ある変数のとる実際の値が、確率によって定まる場合、その変数は確率変数と呼ばれる。具体例を挙げてみよう。

  • サイコロの目を x とおいてみる。x は 1 から 6 までの整数値をとる変数である。これ対して、サイコロを振るという行為を考えた場合、x のそれぞれの値は 1/6 という確率を有することになる。したがって、サイコロの目は確率変数である。
  • ある人の体重 BW を測定したときに、ある一定の確率で BW = 60 kg という値が出るだろう。したがって、体重は確率変数である。

身長、血糖値、寿命など、通常の実験で測定されるような値は、全て確率変数であると考えて良さそうだ。


確率分布とは

確率分布 probability distribution は以下のように定義されている。

  • 確率変数 X のとる値 x が実軸上の領域 A に含まれる確率を A の関数として表したもの。確率空間 (Ω, B, P)の測度、すなわち確率 P によって P(X ∈ A) のように与えられる (2)。
  • 一般に可算集合 {x1, x2, ...} の中の値をとる確率変数 X は離散型といわれ、それぞれの値の確率 P(X=xk) = f(xk) を確率分布という (3)。

離散型の確率分布

実例として、正 5 面体の理想的なサイコロを考えてみる。確率変数は 1, 2, 3, 4, および 5 であり、それぞれの値がもっている確率は 0.2 である。

確率分布とは、0.2 という値が散らばっているパターンそのもの のことをいう。視覚化するならば図のようになる。

この例では、サイコロは 1 - 5 以外の値をとらないため、離散型の確率分布 discrete probability distribution と呼ばれる。


確率分布を記述する関数を、確率密度関数 probability density function という。上の例では、

P(X=1) = P(X=2) = P(X=3) = P(X=4) = P(X=5) = 0.2

となる。次に述べる連続型の確率分布では、もう少し関数らしく見える確率密度関数が得られる。


離散型分布の例

データ範囲 分布の名前 説明

有限

ベルヌーイ分布

確率 p で事象 A が、確率 q = 1 - p で 事象 B が起こる分布である。両者の確率から、起こり得る事象は A および B の 2 つだけであることもわかる。コイントスが代表的な例。

有限

一様離散分布

上のサイコロの例のように、有限な数の事象があり、かつそれぞれの確率が等しい分布。「同様に確からしい」という表現がよく使われる。

無限

ポアソン分布
Poisson distribution

1 時間当たりに受け取るメールの数、年間の交通事故数のように、自然数を要素とする確率変数 X が従う分布。


広告

連続型の確率分布

身長や体重は、サイコロの目のように離散的な値をとらず、連続的な分布を示す。この場合は、上記の例のように 0.2 などの数値の羅列で分布のパターンを記述することはできないため、関数で記述する必要がある。

連続型の確率変数の場合も、分布のパターンを確率分布といい、それを記述する関数を確率密度関数という。

たとえば、太郎が学校を出てから家にたどり着くまでの時間を表すと、おそらく以下のような正規分布になるだろう。ここで重要なのは、グラフにも書かれているが、以下の点である。

  • 時間は、はサイコロの目のように有限な数の要素にわけることができない。
  • つまり、グラフの線はいくら拡大しても線であり、点の集合ではない。
  • 逆に言えば、たとえば太郎が正確に 30 分で家にたどり着く確率はゼロである。


太郎が正確に 30 分で家にたどり着く確率はゼロであるが、「30 - 35 分」のように範囲を与えることで、積分によって確率を指定することができるようになる。



連続型分布の例

データ範囲 分布の名前 説明
有限

ベータ分布 

分布形状の自由度が高く、様々な分布にフィットさせることができる。
有限

ジョンソン SB

ベータ分布と同様に自由度が高い。平均、標準偏差、歪度、尖度を自由に調整できる。樹木の幹の直径の分布?

データ範囲 分布の名前 説明
半無限 指数分布 たまに起きる事象の「間隔」の分布。この分布に従って事故が発生すると、その頻度はポアソン分布になる。
半無限

対数正規分布

正規分布の対数。年収などがこの分布に従うらしい。
半無限

カイ二乗分布

カイ二乗検定 chi-square test に利用される。
半無限

F 分布

F 検定に利用される。

データ範囲 分布の名前 説明
無限

コーシー分布

正規分布に似るが、外れ値の多い分布である。

無限

ロジスティック分布

正規分布に似るが、裾が少し厚い。正規分布よりも式が簡単で扱いやすい。また、この分布の累積分布関数はロジスティック曲線であり、様々な分野で応用されている。

無限

正規分布

平均値と分散で決まる基本的な分布。
無限

t 分布

t 検定 に利用される。

広告

累積分布関数

まず、確率変数 X が A 以下の値をとる事象を {X ≤ A} とする。決まった範囲でなく 「A 以下の全ての値」

 -∞ ≤ X ≤ A  であることに注意しよう。

このとき、この確率は P(XA) = F(x) という関数で表される。関数 F(x) を 累積分布関数 cumulative distribution function, CDF という。 

横軸に x 、縦軸に F(x) をとり、累積分布関数の図を描いてみよう。以下のことから、大体の形をイメージできるだろう。

  1. F(x) はあくまで確率なので、正の値をとり、かつ 1 を超えない。
  2. x が ∞ のとき、F(x) は 「確率変数 Y が無限大以下である確率」 である。つまり F(x) = 1 である。
  3. 逆に、x が - 無限大に近づくと、F(x) は 0 に近づいてゆくだろう。

したがって、F(x) は F(x)=1 と F(x)=0 を漸近線とするグラフになる。



よく言われるのが、「累積分布関数を微分すると確率密度関数になる」 ということである。これは全く正しいが、積分から考えたほうがイメージしやすいのではないかと思う。

  • 積分とは、関数と軸の間の面積を計算することである。
  • 累積分布関数を微分すると確率密度関数になるのだから、逆に確率密度関数を積分すると累積分布関数になる。

これらのことを踏まえた上で、図 1 または図 2 で関数と X 軸の間の面積を左の方から(-∞ から)足し合わせていくイメージで考えてみよう。

  1. x は -∞ まで及んでいるが、x が小さいときは確率もとても小さいので、x を増やして行っても面積の増加はわずかである。
  2. x が 0 に近づくと、次第に増加率も大きくなっていく。
  3. この図は x = 0 に対して左右対称であり、かつ x = ∞ までの面積を全部足すと 1 になる。したがって、x = 0 のとき、ちょうど面積は 0.5 になり、そこから増加率が徐々に減ってゆく。
  4. x が正の ∞ に近づくと、増加率は非常に小さくなる。

x を動かしていったとき、その面積の変化がそのまま累積分布関数 F(x) になることがイメージ出来ただろうか?


コメント欄

一言コメントをどうぞ! (100 字まで)

このコメント欄は各ページにあるので、いつ管理人がコメントを見ることになるのか分かりません。内容について質問がある場合は、下のリンク先のフォームから質問頂ければ、早めに返信するようにします。


References

  1. 確率と確率変数. Web pdf.
  2. Amazon link: 岩波 理化学辞典 第5版: 使っているのは 4 版ですが 5 版を紹介しています。
  3. 統計学入門 (基礎統計学 I)