確率密度関数 Probability Density


|| 連続データの時に定義される関数

「連続型のデータが表す分布」の

『形を表す関数』のこと。

スポンサーリンク

 

 

厳密には「累積分布関数 F の導関数 f 」のことで

 

\begin{array}{llllll} \displaystyle P(a<x≤b)&=&F(b)-F(a) \\ \\ &=&\displaystyle \int_{a}^{b}f(x) \, dx \end{array}

 

この時の f のことを

『確率密度関数』と呼びます。

 

 

 

 

 

役割

 

データが範囲内でなんでもとれる(連続)場合は

データが離散型(点々)のパターンと違い

 

\begin{array}{lllcr} \displaystyle F_{\mathrm{discrete}}(2)&=&P(X=1)+&&P(X=2) \\ \\ F_{\mathrm{continuous}}(2)&=&P(X=1)+&?&+P(X=2) \end{array}

 

このように「累積分布関数」では

12 の間にある無数の数』を扱えないので

直接的に確率を求めることはできません。

 

 

ここで必要になるのが「確率密度関数」で

「確率の和」を『積分』で表現し

『範囲内の面積』として「確率」を定義することで

 

\begin{array}{llllll} \displaystyle \displaystyle P(a<x≤b)&=&F(b)-F(a) \\ \\ &=&\displaystyle \int_{a}^{b}f(x) \, dx \end{array}

 

「分布」を『グラフに描ける関数』として

この関数は役割を持つことになります。

 

 

 

 

 

確認

 

確率密度関数 f の定義は

 

\begin{array}{llllll} \displaystyle P(a<x≤b)&=&F(b)-F(a) \\ \\ &=&\displaystyle \int_{a}^{b}f(x) \, dx \end{array}

 

この時の f です。

 

 

そしてこれは「確率」を表しますから

『全区間 I=(-\infty,\infty) 』をこのように定めると

 

\begin{array}{llllll} \displaystyle \displaystyle P(-\infty<X<\infty)&=&\displaystyle\int_{-\infty}^{\infty}f(x)\,dx \\ \\ &=&1 \end{array}

 

必ずこのようになります。

 

 

逆を言えば、

こうならないなら「確率密度関数」ではありません。