|| 連続データの時に定義される関数
「連続型のデータが表す分布」の
『形を表す関数』のこと。
スポンサーリンク
厳密には「累積分布関数 F の導関数 f 」のことで
\begin{array}{llllll} \displaystyle P(a<x≤b)&=&F(b)-F(a) \\ \\ &=&\displaystyle \int_{a}^{b}f(x) \, dx \end{array}
この時の f のことを
『確率密度関数』と呼びます。
役割
データが範囲内でなんでもとれる(連続)場合は
データが離散型(点々)のパターンと違い
\begin{array}{lllcr} \displaystyle F_{\mathrm{discrete}}(2)&=&P(X=1)+&&P(X=2) \\ \\ F_{\mathrm{continuous}}(2)&=&P(X=1)+&?&+P(X=2) \end{array}
このように「累積分布関数」では
『 1 と 2 の間にある無数の数』を扱えないので
直接的に確率を求めることはできません。
ここで必要になるのが「確率密度関数」で
「確率の和」を『積分』で表現し
『範囲内の面積』として「確率」を定義することで
\begin{array}{llllll} \displaystyle \displaystyle P(a<x≤b)&=&F(b)-F(a) \\ \\ &=&\displaystyle \int_{a}^{b}f(x) \, dx \end{array}
「分布」を『グラフに描ける関数』として
この関数は役割を持つことになります。
確認
確率密度関数 f の定義は
\begin{array}{llllll} \displaystyle P(a<x≤b)&=&F(b)-F(a) \\ \\ &=&\displaystyle \int_{a}^{b}f(x) \, dx \end{array}
この時の f です。
そしてこれは「確率」を表しますから
『全区間 I=(-\infty,\infty) 』をこのように定めると
\begin{array}{llllll} \displaystyle \displaystyle P(-\infty<X<\infty)&=&\displaystyle\int_{-\infty}^{\infty}f(x)\,dx \\ \\ &=&1 \end{array}
必ずこのようになります。
逆を言えば、
こうならないなら「確率密度関数」ではありません。