|| 英訳の方が直感的
『調査して得たデータ』のこと。
このデータを根拠に全体の性質を「推測」していきます。
スポンサーリンク
厳密な意味は
『全体(母集団)』の「部分集合」のことで
つまりは「母集団の一部」を意味する言葉になります。
「総数」は必ず『有限』
さらには『処理可能な数』となります。
データの数が多過ぎる
「全体(母集団)」の『データの数』が
「無限」になってしまう。
こういったことはわりと頻繁に起きていて、
例えば「全体」を考える場合
「人間」とか「ある動物」とか
こういったもののサンプルをとると
\begin{array}{llllll} \displaystyle 過去&今&未来 \\ \\ 正確か不明&分かる&予測しかできん \end{array}
「過去」や「未来」まで含めれば
ほぼ無制限にサンプリングすることが可能。
つまり『母集団の平均・分散』を調べる場合
「無限個のサンプルをとる」必要があって
\begin{array}{llllll} \displaystyle μ&=&\displaystyle\lim_{n→\infty}\frac{1}{n}\sum_{i=1}^{n}x_i \end{array}
でもそれは「人間には」不可能ですから
実質、母数(平均)を求めることは不可能
とまあそういうことになってしまいます。
サンプルの存在意義
「サンプル」は『母数の推測』のために必要な考え方で
「限られた個数のデータ」から答えを得られないか?
みたいな発想から生まれた概念になります。
\begin{array}{llllll} \displaystyle μ&=&\displaystyle\lim_{n→\infty}\frac{1}{n}\sum_{i=1}^{n}x_i \\ \\ \displaystyle μ_{\mathrm{sample}}&=&\displaystyle\frac{1}{n}\sum_{i=1}^{n}x_i \end{array}
『無限』は扱えないから扱いたくない。
『有限』個のものから全体像(母数)を得たい。
もしくは「有限でも多すぎる」から
「より少ない有限」個のサンプルで済ませたい。
こういった要望を叶えるために必要になったのが
この「サンプル」という考え方になります。
以上、サンプルってのはこんな感じ。
以下、紛らわしい用語を解説しておきます。
サンプル数 Number of Samples
|| サンプリングした回数を表す数のこと
「サンプルの回数(標本数)」を表す。
\begin{array}{llllll} \displaystyle 1000&→&20&&1 \\ \\ 1000&→&20×2&&2 \end{array}
『サンプルの数』ではなく
『抽出(サンプリング)した回数』を表す数字です。
「抽出したデータの数」を表す数字ではありません。
「 1000 人」の内「 100 人」を
『1回選ぶ』場合であれば
この時のサンプル数は「 1 」になります。
サンプルサイズ Sample Size
|| サンプリングしたデータの個数
「サンプルしたものの個数」のこと。
『サンプル数』が「サンプルの回数」を表すのに対し
これは「何個取り出したか」を表します。
まとめると
例えば「1000人」調べることを
「20回」行うことで、合計「20000人」のデータを得た場合
「サンプル数」は 20
「サンプルサイズ」は 1000 となります。
「1000人」を1回
「500人」を2回みたいなパターンなら
サンプル数は 3
サンプルサイズは「 (1000,500,500) 」です。