통계 도구를 사용하는 연구에서는 신뢰 구간이라고도 하는 오차 한계를 포함하여 결과가 제시됩니다. 제품에 대한 의견이나 정치적 문제에 대한 의견이 연구되었는지 여부에 관계없이 특정 모집단의 표본에서 데이터를 수집한 설문 조사는 결과적으로 특정 값(일반적으로 백분율)과 +/- 기호가 앞에 오는 다른 값을 나타 냅니다 . 이 두 번째 값은 오류이며 샘플에서 측정된 값과 함께 모집단에서 연구된 참 값이 다양할 것으로 추정되는 값의 범위를 정의합니다. 이 범위의 하한값은 측정값에서 오차를 뺀 값이고 상한값은 측정값에서 오차를 더한 값입니다.
충분히 큰 모집단에서 무작위로 추출한 간단한 샘플의 일반적인 경우를 살펴보겠습니다. 예를 들어 특정 제품을 소비하는 도시 인구의 비율을 연구할 수 있습니다. 이를 위해 무작위로 선택된 해당 도시의 많은 사람들로 구성된 그룹이 해당 제품을 소비하는지 상담합니다.
내려야 할 첫 번째 결정은 오차 한계를 결정할 신뢰 수준입니다. 신뢰 수준은 언급된 조건 하에서 이벤트가 따르는 확률 분포인 표준 정규 분포 영역에서 고려하려는 백분율로 결정됩니다. 아래 그림과 같이 영역에 따라 z α/2 값이 결정됩니다 . 영역이 클수록 고려되는 오차 한계에 대한 신뢰 수준이 높아집니다.
다음 표는 신뢰 수준의 다른 값에 대한 매개 변수 z α/2 의 값을 보여줍니다. 이는 정규 분포의 영역을 전체 영역의 백분율로 표현하여 표현합니다.
신뢰 수준이 정의되면 오차 한계는 다음과 같이 계산됩니다.
e = z α/2 /( 2√n )
여기서 n 은 분석 중인 샘플을 구성하는 사례 수입니다. 이 공식을 적용할 때 우리가 연구하는 샘플의 크기가 클수록 오차 범위가 작아진다는 것이 분명합니다.
이전 예에서 상담한 사람들의 그룹이 900명의 개인으로 구성되고 95%의 신뢰 수준에서 오차 한계가 필요한 경우 z α/2 값은 1.96입니다. 공식을 적용하면 e = 0.0327이 되고 백분율로 표시하면 3.27%가 됩니다. 조사 결과가 상담한 사람의 절반이 제품을 소비하는 것, 즉 v = 50%의 값이라면 조사 결과는 V = 50 +/- 3%로 대략 3%의 마진이 됩니다. 실수. 다른 방식으로 표현하면, 얻어지는 데이터는 95%의 신뢰 수준에서 47~53% 사이의 값이 될 것입니다.
출처
기분, 알렉산더; 그레이빌, 프랭클린 A.; Boes, Duane C. 통계 이론 소개 . 제3판, McGraw-Hill, 1974.
가설 테스트 . 통계적 추론. 멕시코국립자치대학교. 2021년 10월 액세스.
Westfall, Peter H. 고급 통계 방법의 이해 . 보카 라톤, 플로리다: CRC Press, 2013.