모집단 비율의 신뢰 구간을 구성하는 방법

Artículo revisado y aprobado por nuestro equipo editorial, siguiendo los criterios de redacción y edición de YuBrain.

통계 매개변수의 신뢰 구간은 이 매개변수가 취할 수 있는 것으로 추정되는 값의 범위입니다. 즉, 이 매개 변수가 특정 수준의 신뢰도에 따라 달라질 수 있는 두 값입니다. 신뢰 구간의 계산은 모집단의 통계적 매개변수 결정의 일부입니다. 매개변수의 값은 모집단의 표본에서 결정되며 동일한 계산 프로세스에서 얻은 매개변수 값의 신뢰 구간이 결정됩니다. 추론 통계를 사용하여 추정할 수 있는 매개변수의 한 유형은 모집단의 비율입니다.

예를 들어, 물어볼 수 있는 질문은 특정 법률을 지지하는 국가의 인구 비율입니다. 이러한 유형의 질문에서는 결정된 값에 대한 신뢰 구간을 결정해야 합니다. 우리는 모집단 비율의 신뢰 구간이 구성되어 이론적 근거의 일부를 노출시키는 방법을 아래에서 볼 것입니다.

이미 언급한 바와 같이 통계 매개변수의 신뢰 구간은 이 매개변수가 특정 신뢰 수준에 따라 달라질 수 있는 두 값으로 정의됩니다. 매개변수 추정기는 이 범위의 중앙에 위치합니다. 따라서 신뢰 구간은 다음과 같은 형식을 갖습니다.

추정기 +/- 불확실성

따라서 결정해야 하는 두 가지 숫자가 있습니다. 연구 중인 매개변수의 추정치와 불확실성 또는 오차 한계입니다.

계산 구내

통계 계산을 수행하려면 해당 특정 결정에 대해 정의된 특정 전제가 충족되어야 합니다. 모집단의 비율을 평가하기 위해 신뢰구간을 결정하는 경우 전제는 다음과 같다.

1. 크기가 상당히 큰 모집단에서 무작위로 추출한 표본을 평가해야 합니다. 샘플에는 여러 가지 경우가 있습니다 . n .

2. 샘플의 구성원은 서로 독립적으로 선택되어야 합니다.

3. 크기가 n 인 표본에서 최소 15개의 성공과 15개의 실패가 있어야 합니다 .

표본과 모집단의 비율

모집단의 비율을 추정하는 절차를 살펴보겠습니다. 표본 평균을 사용하여 모집단 평균을 추정하는 것처럼 표본 비율을 사용하여 모집단 비율을 추정할 수도 있습니다. 모집단의 비율은 알 수 없는 매개변수이며 결정해야 할 값입니다. 이 매개변수를 계산하는 방법은 샘플에 등록된 성공을 더하고 합계 결과를 샘플의 총 케이스 수인 n 으로 나누는 것입니다. 우리는 p를 부를 것이다연구할 모집단의 매개변수, 특정 기준을 충족하는 모집단의 비율. 같은 방식으로 우리는 표본에 비율을 갖게 될 것입니다. 인구의 비율과 구별하기 위해 다음 수식과 같이 그 위에 선을 긋습니다. 표본의 비율은 모집단 비율의 추정치입니다.

모집단 비율의 신뢰 구간을 결정하려면 다음 그림과 같이 통계 분포가 무엇인지 알아야 합니다.

인구 비율의 통계적 분포.
인구 비율의 통계적 분포.

통계 분포를 사용하면 추정량과 표준 편차 SE를 결정할 수 있으며 신뢰 구간을 구성하는 값

신뢰 구간

자신감 수준으로

신뢰 수준

이러한 통계 문제에서 표준 편차 SE는 다음 공식에 표시된 것처럼 모집단 크기 n 의 샘플에서 양성 사례의 비율인 p 추정량의 함수로서 이항 동작을 가집니다 .

표준 편차

일반적인 정의는 표준편차에 대한 공식에서 p- 값을 사용하는데 이는 알 수 없는 값이므로 앞의 공식에서 알 수 있듯이 표준오차를 그 추정량에 p를 대입하여 사용한다.

고려해야 할 또 다른 측면은 확립된 세 가지 전제 하에서 이항 분포가 표준 정규 분포로 근사될 수 있다는 것입니다.

이러한 방식으로 모집단 비율의 신뢰 구간을 결정하는 공식을 얻습니다.

모집단 비율의 신뢰 구간입니다.

신뢰 수준은 이전 그림과 같이 표준 정규 분포에서 고려해야 할 백분율로 결정됩니다. 영역이 클수록 신뢰 구간에 대한 신뢰 수준이 높아집니다. 다음 표는 커버할 분포 영역을 나타내는 다양한 신뢰 수준 값에 대한 매개 변수 값을 보여줍니다.

신뢰 수준.

모집단 비율에 대한 신뢰구간 결정의 예

특정 정당과 동일시되는 도시의 유권자 비율을 95% 신뢰도로 알고 싶다고 가정합니다. 우리는 그 도시에 거주하는 100명으로 구성된 단순 무작위 샘플에서 정보를 수집했고 그들 중 64명이 정당과 동일시된다는 것을 발견했습니다.

먼저 설정한 세 가지 전제가 충족되는지 확인합니다. 인구가 상당히 많은 도시의 인구에 대한 의견을 평가하고 표본을 무작위로 추출합니다. 이 경우 n 은 100입니다. 100개 사례 중 주어진 사례에 대한 정보는 독립적으로 수집되었습니다. 상담에 대한 긍정적 응답 즉, 성공과 부정적인 응답, 즉 실패 모두 15건을 초과합니다.

표본의 비율 값, 우리가 결정하고자 하는 매개변수의 추정치, 즉 문제의 정당과 동일시하는 도시 인구의 비율은 긍정적 사례와 샘플을 구성하는 n 케이스의 수 ; 64 나누기 100, 0.64. 이것은 추정기의 값이며 신뢰 구간의 중심입니다.

불확실성을 평가하는 공식에는 두 가지 요소가 있습니다. 첫 번째 요인은 95%로 결정된 신뢰 수준이며, 이에 대한 요인은 1.96이 됩니다. 두 번째 요소를 평가하려면 0.64와 100 값을 공식에 ​​대입해야 하며 두 번째 요소의 값은 0.048임을 알 수 있습니다. 두 요소의 곱으로 불확실성이 얻어집니다. 0.094. 따라서 이 예에서 신뢰 구간은

0.640 +/- 0.094

이 신뢰 구간은 95%의 신뢰도, 즉 결과가 전체 인구의 95%를 나타낸다는 것으로 해석할 수 있으며 해당 도시에서 정당과 동일시하는 사람들의 비율은 54.6%와 73.4%.

관련 통계 개념

이러한 유형의 신뢰 구간을 결정하는 데 관련된 많은 아이디어와 통계적 문제가 있습니다. 예를 들어 모집단 비율 값과 관련된 가설 검정을 수행할 수 있습니다. 또한 서로 다른 두 모집단의 두 비율을 비교할 수도 있습니다.

출처

기분, 알렉산더; 그레이빌, 프랭클린 A.; Boes, Duane C. 통계 이론 소개 . 제3판, McGraw-Hill, 1974.

가설 테스트 . 통계적 추론. 멕시코국립자치대학교. 2021년 10월 액세스.

Westfall, Peter H. 고급 통계 방법의 이해 . 보카 라톤, 플로리다: CRC Press, 2013.

mm
Sergio Ribeiro Guevara (Ph.D.)
(Doctor en Ingeniería) - COLABORADOR. Divulgador científico. Ingeniero físico nuclear.

Artículos relacionados