|| 同じ分布のデータは互いに不干渉だよ
「確率変数を別々に扱えるよ」という『仮定』のこと。
スポンサーリンク
言い換えるなら
『確率を感覚的に使うための仮定』のことで
これが仮定されていると非常に計算がしやすくなります。
具体的な感じ
よく例に出される「サイコロ」で考えるなら
XP(X)161261361461561661
それぞれの「確率変数 X 」の『確率』は
他の確率変数に影響を与えない
P(1)P(3)==6161→→P(3)P(1)==6161
つまり『他がどうでも変わらない』
だから「試行回数」が増えたとしても
P2⎝⎜⎛X1X2==12⎠⎟⎞==P(X1)P(X2)621
例えば「 1 の後に 2 が出る確率」なんかは
このように簡単に計算ができて
これが正しい値になる。
当たり前のように思うかもしれませんが
これが「独立同分布」の感覚で
P(A∣B)P(B∣A)==P(A)P(B)
実際には多くあるそうではないパターン
つまり『確率変数同士が独立ではない』パターンでは
A∩B=∅
P(A∩B)==P(A∣B)P(B)P(B∣A)P(A)P(A∣B)P(B∣A)====0000
「片方しか起こらない」場合とかだと
このように 0 になったりもして
簡単に計算することができなくなります。
独立 Independent
「確率変数(データ・事象)」について
『データとデータの間で影響が無い』感じのことを
「独立」であると言ったりします。
P(A∩B)=P(A)P(B)
まあ要はこれがしたい感じですね。
事象 A と事象 B が起こる時
P(A∩B)===P(A∣B)P(B)P(B∣A)P(A)P(A)P(B)
互いが互いの確率に影響を与えない
これを「独立」というわけです。
P(Xafter∣Xbefore)=P(Xafter)
厳密な定義は「条件付確率」で与えられていて
このようになる場合、独立であると言います。
独立ではない感じ
これは「トランプ」とか
そういうカード系の話が分かりやすいかもしれません。
P(X1)=13×41
というのも
デッキに戻さずカードを2枚引く場合
狙った1枚を引く場合に1枚目はこうなりますが
P(X2∣X1)=13×4−11
2枚目からの確率はこのようになります。
また「同じカードは引けない」ので
2枚目を引く時、例えば D1 (ダイヤの1)を引いたなら
P(D1∩D1)=P(D1∣D1)P(D1)P(D1∣D1)==00
存在しない2枚目のダイヤ1を引くことはできません。
これでなんとなく分かったと思いますが
この感覚が「独立ではない」という感覚になります。
比較すればわかると思いますが
「サイコロ」や「コイン」ではこのようにはなりません。
どの目も「前の目とは関係なく」一定の確率で出ますし
表が出た後も変わらず2分の1で表は出ますから。
ちなみにトランプも「1枚引くだけ」だったり
「1枚引く度にデッキに戻す」なら
サイコロやコインと同様になります。
同分布である Identically Distributed
「同じ分布(関数)に従う」感じのこと。
P(X)
要は『同じ関数の変数だ』って話で
「サイコロ」とか「コイン」の話ですね。
∀x∈I(P(x≥Xa)=P(x≥Xb))
「2つの確率変数 Xa,Xb 」があったとして
これが「同分布である」というのは
形式的にはこんな感じ。
意味するところはそのままです。
「全ての x で P(x≥X) が一致する」なら
「 Xa と Xb は同じ関数の変数」
すごく当たり前ですが
「他の話」を持ち出すときとか
そういう場合に意識する必要があります。
ちなみにだいたい同分布です。
データは似たような環境でとられるので
これを意識することはあまりありません。
同分布じゃない感じ
「トランプ」の話でも良いですが
「コイン」と「サイコロ」でも良いですね。
Pcoin(XA)Pdice(XB)==2161
「コインで表が出る」
「サイコロで1が出る」
AB=={表,裏}{1,2,3,4,5,6}
この「確率変数 XA,XB 」は
『別の確率分布(関数)の変数』です。
とまあ要はこういう話で、
これが「同分布ではない」という感覚になります。