Tabla de Contenidos
Sentralgrensesetningen er en grunnleggende teorem i sannsynlighetsteori. Begrepet «sentral» tilsvarer fundamental, eller av sentral betydning, og ble laget av George Polyá i 1920, noe som betyr relevansen til teoremet i sannsynlighetsteori. Grensesetningen har flere versjoner foreslått av forskjellige matematikere. I utgangspunktet sier den sentrale grensesetningen at under visse hypoteser tilnærmer fordelingen av summen av et veldig stort antall tilfeldige variabler en normalfordeling .
The Central Limit Theorem
Utsagnet om sentralgrensesetningen er abstrakt, men la oss se en måte å forstå det steg for steg på. Anta at vi har et enkelt tilfeldig utvalg av n elementer fra en populasjon av interesse. I dette utvalget kan utvalgets gjennomsnitt beregnes, som representerer gjennomsnittet av populasjonen av interesse. En fordeling av utvalgsgjennomsnittet kan genereres ved gjentatte ganger å velge enkle tilfeldige utvalg fra samme populasjon som har samme størrelse, og deretter beregne gjennomsnittet for hver av disse prøvene. Hvert av de enkle tilfeldige utvalgene må være uavhengige av de andre.
Sentralgrensesetningen gjelder fordelingen av utvalgsmidler, og sier at denne fordelingen tilnærmer en normalfordeling. Jo større enkle tilfeldige utvalg, jo bedre tilnærming til en normalfordeling av fordelingen av utvalgsmidler. Det skal bemerkes at den sentrale grensesetningen fastslår at under disse forholdene er fordelingen av prøvegjennomsnittet normal, uavhengig av dens initiale fordeling. Selv om populasjonen har en skjev fordeling, en hyppig situasjon når man studerer parametere som folks inntekt eller vekt, vil fordelingen av utvalgsgjennomsnittet være normal dersom utvalgsstørrelsen er stor nok.
Og det er på dette punktet hvor viktigheten av sentralgrenseteoremet ligger, siden det lar oss forenkle statistiske problemer når vi arbeider med en fordeling som kan anses som normal. Det er mange og svært relevante applikasjoner der det er vesentlig å kunne vurdere at populasjonen har en normalfordeling, som hypotesetester eller fastsettelse av konfidensintervall.
Det er ikke vanskelig å finne datasett fra den virkelige verden som viser uteliggere, skjeve fordelinger eller flere topper. Men ved å bruke den sentrale grensesetningen, hvis en passende utvalgsstørrelse velges, kan problemer der populasjonene ikke presenterer en normalfordeling løses. Derfor, selv om fordelingen av populasjonen som skal studeres ikke er kjent, sikrer den sentrale grensesetningen at hvis vi tar store nok prøver, kan den reelle fordelingen tilnærmes med en normalfordeling. I spesifikke situasjoner kan en utforskende analyse av dataene bidra til å måle utvalgets størrelse slik at den sentrale grensesetningen er gyldig.
Fontene
Jimena Blaiotta, Pablo Delieutraz. Sentralgrensesetning . Fakultet for eksakte og naturvitenskapelige vitenskaper, Universitetet i Buenos Aires, Argentina, 2004.