プログラミング

累積分布関数の完全ガイド

累積分布関数(Cumulative Distribution Function, CDF)についての完全かつ包括的な解説

累積分布関数(CDF)は、確率論や統計学において、確率変数がある特定の値以下である確率を示す関数です。確率論におけるCDFは、確率変数の分布の特性を理解するための重要なツールです。本記事では、CDFの基本的な概念からその数学的な性質、実際の利用例、そして具体的な計算方法について詳しく解説します。

1. 累積分布関数(CDF)の定義

累積分布関数は、確率変数XXに対して、ある値xx以下になる確率を表す関数です。数式で表すと、次のようになります。

FX(x)=P(Xx)F_X(x) = P(X \leq x)

ここで、FX(x)F_X(x)XXの累積分布関数を示し、P(Xx)P(X \leq x)は確率変数XXxx以下になる確率を示します。簡単に言うと、CDFは、特定の値より小さいか等しい値を取る確率の累積を示す関数です。

2. 累積分布関数の性質

CDFは確率分布を完全に記述するための重要なツールです。CDFの主要な性質は以下の通りです。

2.1 単調増加関数

CDFは単調増加関数です。これは、確率変数が増加するにつれてその累積確率も増加することを意味します。すなわち、次の関係が成り立ちます。

FX(x1)FX(x2)forx1x2F_X(x_1) \leq F_X(x_2) \quad \text{for} \quad x_1 \leq x_2

2.2 極限値

CDFは次のような極限値を持ちます。

  • limxFX(x)=0\lim_{x \to -\infty} F_X(x) = 0
  • limxFX(x)=1\lim_{x \to \infty} F_X(x) = 1

これは、確率変数が非常に小さな値を取る確率は0に近づき、非常に大きな値を取る確率は1に近づくことを意味します。

2.3 連続性と不連続性

CDFは、確率変数が連続である場合、連続した関数になります。しかし、確率変数が離散的である場合、CDFは不連続となり、その不連続点が確率質量関数(PMF)に対応します。

3. 累積分布関数の計算方法

累積分布関数は、確率変数が離散的か連続的かによって計算方法が異なります。

3.1 離散型確率変数の場合

離散型確率変数の場合、CDFはその確率質量関数(PMF)を累積することで求められます。離散型確率変数におけるCDFは次のように定義されます。

FX(x)=P(Xx)=xixP(X=xi)F_X(x) = P(X \leq x) = \sum_{x_i \leq x} P(X = x_i)

ここで、P(X=xi)P(X = x_i)は確率質量関数(PMF)によって与えられる確率です。

3.2 連続型確率変数の場合

連続型確率変数の場合、CDFはその確率密度関数(PDF)を積分することで求められます。連続型確率変数におけるCDFは次のように定義されます。

FX(x)=P(Xx)=xfX(t)dtF_X(x) = P(X \leq x) = \int_{-\infty}^{x} f_X(t) \, dt

ここで、fX(t)f_X(t)は確率密度関数(PDF)です。この積分は、確率変数がxx以下の値を取る確率を計算するための方法です。

4. 累積分布関数の例

4.1 一様分布の場合

一様分布は、指定された区間内で全ての値が同じ確率で起こる分布です。例えば、区間[0,1][0, 1]で定義された一様分布のCDFは、次のように計算されます。

  • FX(x)=0F_X(x) = 0 for x<0x < 0
  • FX(x)=xF_X(x) = x for 0x10 \leq x \leq 1
  • FX(x)=1F_X(x) = 1 for x>1x > 1

この場合、CDFは線形に増加し、区間[0,1][0, 1]内ではFX(x)=xF_X(x) = xで表されます。

4.2 正規分布の場合

正規分布(ガウス分布)は、確率論において非常に重要な分布です。正規分布のCDFは明示的に計算することは難しいですが、標準正規分布の場合、次のように表されます。

FX(x)=12(1+erf(xμσ2))F_X(x) = \frac{1}{2} \left( 1 + \text{erf}\left( \frac{x – \mu}{\sigma \sqrt{2}} \right) \right)

ここで、μ\muは平均、σ\sigmaは標準偏差、そしてerf\text{erf}は誤差関数です。正規分布のCDFは、確率変数が指定された値以下である確率を求めるために広く利用されます。

5. 累積分布関数の応用

CDFは統計学や確率論の中で多くの場面で利用されます。特に次のような場面で重要です。

5.1 確率の計算

CDFを用いることで、特定の範囲における確率を簡単に計算することができます。例えば、P(aXb)P(a \leq X \leq b)の確率は、次のようにCDFを使って求めることができます。

P(aXb)=FX(b)FX(a)P(a \leq X \leq b) = F_X(b) – F_X(a)

Back to top button