統計ツールを使用する研究では、信頼区間とも呼ばれる誤差範囲を含めて結果が表示されます。製品または政治問題に関する意見が調査されるかどうかに関係なく、特定の母集団のサンプルでデータを収集した調査では、結果として特定の値が示されます。通常はパーセンテージで、前に記号 +/- が付いた別の値が続きます。この2番目の値は誤差であり、サンプルで測定された値とともに、母集団で調査された真の値が変動すると推定される値の範囲を定義します。この範囲の下限値は測定値から誤差を差し引いた値であり、上限値は測定値に誤差を加えた値です。
十分に大きな母集団から無作為に抽出された単純なサンプルの一般的なケースを見てみましょう。例として、特定の製品を消費する都市の人口の割合を調査することがあります。このために、無作為に選ばれたその都市の多くの人々で構成されるグループが、その製品を消費するかどうか相談されます.
最初に下さなければならない決定は、誤差範囲を決定するための信頼レベルです。信頼レベルは、標準正規分布の領域で考慮したいパーセンテージとして決定されます。これは、前述の条件下でイベントが従う確率分布です。下の図に示すように、面積によってz α/2の値が決まります。面積が大きいほど、考慮される誤差範囲の信頼度が高くなります。
次の表は、信頼水準のさまざまな値に対するz α/2パラメーターの値を示しています。これは、カバーされる正規分布の領域を表し、合計領域のパーセンテージとして表されます。
信頼水準が定義されると、誤差範囲は次のように計算されます。
e = z α/2 /( 2√n )
ここで、nは分析対象のサンプルを構成するケースの数です。この式を適用すると、調査対象のサンプルのサイズが大きくなればなるほど、誤差範囲が小さくなることが明らかです。
前の例で、相談を受けた人々のグループが 900 人の個人で構成されており、95% の信頼レベルで誤差範囲が必要な場合、z α/2の値は1.96 です。式を適用すると、e = 0.0327 となり、パーセンテージで表すと 3.27% になります。調査の結果、相談を受けた人の半数が製品を消費している、つまり値v = 50% である場合、調査の結果は V = 50 +/- 3% となり、マージンは 3% に近似します。間違い。別の言い方をすれば、得られるデータは 47 ~ 53% の値で、信頼度は 95% です。
ソース
気分、アレキサンダー。グレイビル、フランクリンA。Boes、Duane C.統計理論の紹介。第 3 版、McGraw-Hill、1974 年。
仮説検定。統計的推論。メキシコ国立自治大学。2021 年 10 月にアクセス。
Westfall、Peter H.高度な統計手法の理解。フロリダ州ボカラトン: CRC プレス、2013 年。