Sådan konstrueres et konfidensinterval for en befolkningsandel

Tabla de Contenidos

Konfidensintervallet for en statistisk parameter er rækken af værdier, som det anslås, at denne parameter kan tage; Med andre ord er de to værdier, mellem hvilke denne parameter kan variere med et vist niveau af tillid. Beregningen af konfidensintervallet er en del af bestemmelsen af en statistisk parameter for en population; værdien af parameteren bestemmes på en stikprøve af populationen, og i samme beregningsproces bestemmes konfidensintervallet for værdien af parameteren, der er opnået. En type parameter, der kan estimeres ved hjælp af inferentiel statistik, er en andel af en population.

For eksempel er et spørgsmål, der kan stilles, hvor stor en procentdel af befolkningen i et land, der støtter en bestemt lov. I denne type spørgsmål er det nødvendigt at bestemme et konfidensinterval for den værdi, der bestemmes. Vi vil nedenfor se, hvordan konfidensintervallet for en del af en befolkning er konstrueret, hvilket blotlægger en del af dets teoretiske grundlag.

Som allerede nævnt er konfidensintervallet for en statistisk parameter defineret som to værdier, mellem hvilke denne parameter kan variere med et vist niveau af konfidens; parameterestimatoren er placeret i midten af dette område. Et konfidensinterval vil således have formen

estimator +/- usikkerhed

Derfor vil der være to tal, der skal bestemmes: estimatet af parameteren, som vi studerer, og usikkerheden eller fejlmarginen.

Beregningspræmisser

For at udføre en statistisk beregning er det nødvendigt, at visse forudsætninger, der er defineret for den specifikke bestemmelse, er opfyldt. I tilfælde af at bestemme et konfidensinterval for at evaluere en andel af en befolkning, er præmisserne følgende.

1. En tilfældig stikprøve fra en population, der er signifikant stor i størrelse, skal evalueres. Prøven vil have et antal tilfælde n .

2. Medlemmerne af stikprøven skal udvælges uafhængigt af hinanden.

3. Der skal være mindst 15 succeser og 15 fejl i stikprøven af størrelse n .

Andel af stikprøve og population

Lad os se på proceduren for at lave et skøn over en andel i en population. Ligesom et stikprøvemiddel bruges til at estimere et populationsmiddel, kan en stikprøveandel også bruges til at estimere en populationsandel. Andelen af populationen er den ukendte parameter, det er værdien, der skal bestemmes. Måden at beregne denne parameter på er ved at tilføje succeserne registreret i stikprøven og dividere resultatet af summen med n , det samlede antal tilfælde i stikprøven. vi ringer til stil parameteren for den population, der skal undersøges, den andel af befolkningen, der opfylder et bestemt kriterium. På samme måde vil vi have andelen i stikprøven, som for at differentiere den fra andelen af populationen vil vi placere en linje over den som vist i følgende formler. Andelen i stikprøven er estimatoren for andelen i populationen.

For at bestemme konfidensintervallet for en andel af en befolkning er det nødvendigt at vide, hvad dens statistiske fordeling er, som vist i følgende figur.

Statistisk fordeling af andelen af en befolkning.

Med den statistiske fordeling er det muligt at bestemme estimatoren og standardafvigelsen SE , værdier der udgør konfidensintervallet

med et konfidensniveau

I disse statistiske problemer har standardafvigelsen SE en binomial adfærd som funktion af estimatoren af p , andelen af positive tilfælde i stikprøven af størrelse n af populationen, som vist med følgende formel.

Den generelle definition bruger p- værdien i formlen for standardafvigelsen, som er en ukendt værdi, så standardfejlen bruges, idet p-værdien erstattes af dens estimator, som den foregående formel viser.

Et andet aspekt at overveje er, at under de tre præmisser, der blev etableret, kan binomialfordelingen tilnærmes med standard normalfordelingen.

På denne måde opnås formlen til at bestemme konfidensintervallet for en andel af en population.

Konfidensinterval for en andel af en befolkning.

Konfidensniveauet er bestemt som den procentdel, der skal tages i betragtning i standard normalfordelingen, som vist i den foregående figur; jo større område, desto højere grad af tillid skal have i konfidensintervallet. Følgende tabel viser værdierne af parameteren for de forskellige værdier af konfidensniveauet, som udtrykker det distributionsområde, der skal dækkes.

Eksempel på bestemmelse af et konfidensinterval for en befolkningsandel

Antag, at vi med 95 % sikkerhed vil vide, hvor stor en procentdel af vælgerne i en by, der identificerer sig med et givet politisk parti. Vi indsamler oplysningerne i en simpel stikprøve bestående af 100 personer i den by, og vi finder ud af, at 64 af dem identificerer sig med det politiske parti.

Først verificerer vi, at de tre lokaler, vi etablerede, er opfyldt. Meningen fra befolkningen i en by, en betydeligt stor befolkning, evalueres, og stikprøven tages tilfældigt. I dette tilfælde er n lig med 100. Oplysningerne for en given af de 100 tilfælde blev indsamlet uafhængigt. Både de positive svar på høringen, det vil sige succeserne, og de negative svar, det vil sige fiaskoerne, overstiger 15 sager.

Værdien af andelen af stikprøven, estimatoren af den parameter, som vi ønsker at bestemme, dvs. andelen af befolkningen i byen, der identificerer sig med det pågældende politiske parti, bestemmes som kvotienten mellem de positive tilfælde og antallet af n , der udgør prøven; 64 divideret med 100, 0,64. Dette er værdien af estimatoren og er centrum for konfidensintervallet.

I formlen, der vurderer usikkerheden, er der to faktorer. Den første faktor er konfidensniveauet, der blev bestemt til at være 95 %, for hvilket faktoren vil være 1,96. For at evaluere den anden faktor skal værdierne 0,64 og 100 erstattes i formlen, og det opnås, at værdien af den anden faktor er 0,048. Med produktet af begge faktorer opnås usikkerheden; 0,094. Så konfidensintervallet i dette eksempel er

0,640 +/- 0,094

Dette konfidensinterval kan tolkes som, at med en konfidens på 95 %, det vil sige, at resultaterne repræsenterer 95 % af den samlede befolkning, vil andelen af personer i den pågældende by, der identificerer sig med det politiske parti, være mellem 54,6 % og 73,4 %.

Beslægtede statistiske begreber

Der er en række ideer og statistiske spørgsmål involveret i at bestemme denne type konfidensinterval. For eksempel kan vi udføre en hypotesetest relateret til værdien af populationsandelen. Vi kunne også sammenligne to proportioner fra to forskellige populationer.

Kilder

Stemning, Alexander; Graybill, Franklin A.; Boes, Duane C. Introduktion til teorien om statistik . Tredje udgave, McGraw-Hill, 1974.

Hypotese test . Statistisk slutning. National Autonomous University of Mexico. Tilgået oktober 2021.

Westfall, Peter H. Understanding Advanced Statistical Methods . Boca Raton, FL: CRC Press, 2013.

-Reklame-