Tabla de Contenidos
Den centrale grænsesætning er en grundlæggende sætning i sandsynlighedsteori. Udtrykket “central” svarer til fundamental eller af central betydning, og blev opfundet af George Polyá i 1920, hvilket betyder relevansen af teoremet i sandsynlighedslæren. Grænsesætningen har flere versioner foreslået af forskellige matematikere. Grundlæggende siger den centrale grænsesætning, at fordelingen af summen af et meget stort antal tilfældige variable under visse hypoteser nærmer sig en normalfordeling .
Den centrale grænsesætning
Udsagnet om den centrale grænsesætning er abstrakt, men lad os se en måde at forstå det trin for trin på. Antag, at vi har et simpelt tilfældigt udvalg af n elementer fra en population af interesse. I denne stikprøve kan stikprøvegennemsnittet beregnes, som repræsenterer gennemsnittet af populationen af interesse. En fordeling af stikprøvegennemsnittet kan genereres ved gentagne gange at vælge simple tilfældige prøver fra den samme population, der har samme størrelse, og derefter beregne middelværdien af hver af disse prøver. Hver af de simple tilfældige prøver skal være uafhængige af de andre.
Den centrale grænsesætning omhandler fordelingen af stikprøvemiddelværdier og siger, at denne fordeling nærmer sig en normalfordeling. Jo større de simple tilfældige stikprøver er, desto bedre er tilnærmelsen til en normalfordeling af fordelingen af stikprøvegennemsnit. Det skal bemærkes, at den centrale grænsesætning fastslår, at fordelingen af stikprøvegennemsnittet under disse forhold er normal, uanset dens initiale fordeling. Selvom befolkningen har en skæv fordeling, en hyppig situation, når man studerer parametre som folks indkomst eller deres vægt, vil fordelingen af stikprøvegennemsnittet være normal, hvis stikprøvestørrelsen er stor nok.
Og det er på dette punkt, hvor vigtigheden af den centrale grænsesætning ligger, da den giver os mulighed for at forenkle statistiske problemer, når vi arbejder med en fordeling, der kan betragtes som normal. Der er mange og meget relevante anvendelser, hvor det er essentielt at kunne overveje, at befolkningen har en normalfordeling, såsom hypotesetest eller bestemmelse af konfidensintervaller.
Det er ikke svært at finde datasæt fra den virkelige verden, der viser outliers, skæve fordelinger eller flere peaks. Men ved at anvende den centrale grænsesætning, hvis en passende stikprøvestørrelse vælges, kan problemer, hvor populationerne ikke præsenterer en normalfordeling, løses. Derfor, selvom fordelingen af populationen, der skal undersøges, ikke er kendt, sikrer den centrale grænsesætning, at hvis vi tager store nok prøver, kan den reelle fordeling tilnærmes ved en normalfordeling. I specifikke situationer kan en eksplorativ analyse af dataene hjælpe med at måle størrelsen af prøven, så den centrale grænsesætning er gyldig.
Springvand
Jimena Blaiotta, Pablo Delieutraz. Central grænsesætning . Fakultet for Eksakt og Naturvidenskab, University of Buenos Aires, Argentina, 2004.