標本 Sample


|| 英訳の方が直感的

『調査して得たデータ』のこと。

このデータを根拠に全体の性質を「推測」していきます。

スポンサーリンク

 

厳密な意味は

『全体(母集団)』の「部分集合」のことで

つまりは「母集団の一部」を意味する言葉になります。

 

 

「総数」は必ず『有限』

さらには『処理可能な数』となります。

 

 

 

 

 

データの数が多過ぎる

 

「全体(母集団)」の『データの数』が

「無限」になってしまう。

 

 

こういったことはわりと頻繁に起きていて、

例えば「全体」を考える場合

 

 

「人間」とか「ある動物」とか

こういったもののサンプルをとると

 

\begin{array}{llllll} \displaystyle 過去&今&未来 \\ \\ 正確か不明&分かる&予測しかできん \end{array}

 

「過去」や「未来」まで含めれば

ほぼ無制限にサンプリングすることが可能。

 

 

つまり『母集団の平均・分散』を調べる場合

「無限個のサンプルをとる」必要があって

 

\begin{array}{llllll} \displaystyle μ&=&\displaystyle\lim_{n→\infty}\frac{1}{n}\sum_{i=1}^{n}x_i \end{array}

 

でもそれは「人間には」不可能ですから

実質、母数(平均)を求めることは不可能

とまあそういうことになってしまいます。

 

 

 

 

 

サンプルの存在意義

 

「サンプル」は『母数の推測』のために必要な考え方で

「限られた個数のデータ」から答えを得られないか?

みたいな発想から生まれた概念になります。

 

\begin{array}{llllll} \displaystyle μ&=&\displaystyle\lim_{n→\infty}\frac{1}{n}\sum_{i=1}^{n}x_i \\ \\ \displaystyle μ_{\mathrm{sample}}&=&\displaystyle\frac{1}{n}\sum_{i=1}^{n}x_i \end{array}

 

『無限』は扱えないから扱いたくない。

『有限』個のものから全体像(母数)を得たい。

 

 

もしくは「有限でも多すぎる」から

「より少ない有限」個のサンプルで済ませたい。

 

 

こういった要望を叶えるために必要になったのが

この「サンプル」という考え方になります。

 

 

 

 

 

以上、サンプルってのはこんな感じ。

以下、紛らわしい用語を解説しておきます。

 

 

 


 


サンプル数 Number of Samples

 

|| サンプリングした回数を表す数のこと

「サンプルの回数(標本数)」を表す。

 

\begin{array}{llllll} \displaystyle 1000&→&20&&1 \\ \\ 1000&→&20×2&&2 \end{array}

 

『サンプルの数』ではなく

『抽出(サンプリング)した回数』を表す数字です。

「抽出したデータの数」を表す数字ではありません。

 

 

1000 人」の内「 100 人」を

『1回選ぶ』場合であれば

この時のサンプル数は「 1 」になります。

 

 

 


 


サンプルサイズ Sample Size

 

|| サンプリングしたデータの個数

「サンプルしたものの個数」のこと。

 

 

『サンプル数』が「サンプルの回数」を表すのに対し

これは「何個取り出したか」を表します。

 

 

 

まとめると

例えば「1000人」調べることを

「20回」行うことで、合計「20000人」のデータを得た場合

 

 

「サンプル数」は 20

「サンプルサイズ」は 1000 となります。

 

 

「1000人」を1回

「500人」を2回みたいなパターンなら

 

 

サンプル数は 3

サンプルサイズは「 (1000,500,500) 」です。