Tabla de Contenidos
Populationsstandardafvigelsen er en af de vigtigste populationsparametre til måling af variabiliteten eller spredningen af data inden for populationen. Som enhver parameter i statistik er den repræsenteret af et græsk bogstav, i dette tilfælde bogstavet σ (sigma). Dette gør det let at skelne fra standardafvigelsen for prøven/prøverne, som, selv om den er ens, ikke er den samme, og den er heller ikke beregnet med de samme formler.
Dernæst vil vi ved hjælp af et eksempel se forskellige måder at beregne standardafvigelsen for en population på. Det skal bemærkes, at for at beregne populationens standardafvigelse er det vigtigt at kende alle populationsdata. Dette sker sjældent i virkelige sammenhænge, men det er stadig vigtigt at forstå, hvordan det beregnes, da det hjælper med at forstå nogle af de matematiske karakteristika ved denne vigtige parameter.
Befolkningsstandardafvigelsesformler
Afhængigt af de tilgængelige data kan populationens standardafvigelse bestemmes ved hjælp af tre forskellige formler.
Matematisk definition af populationens standardafvigelse
Standardafvigelsen er defineret som kvadratroden af variansen, σ 2 . Det vil sige, at hvis vi kender variansen af populationen, kan vi beregne standardafvigelsen ved hjælp af følgende ligning:
Dette tilfælde forekommer sjældent, men det er godt at huske på.
Andre populationsstandardafvigelsesformler
Hvis vi i stedet for at kende variansen af en population kender alle de N dataelementer, der udgør den, så kan vi beregne populationens standardafvigelse som kvadratroden af gennemsnittet af de kvadrerede afvigelser fra middelværdien. Det vil sige:
I denne ligning repræsenterer x i værdien af hvert dataelement i populationen, N repræsenterer antallet af dataelementer i populationen (eller størrelsen af populationen, som er den samme), og μ er populationens middelværdi. Bemærk, at befolkningsgennemsnittet også er repræsenteret med et græsk bogstav, fordi det er en anden populationsparameter, og populationens størrelse er repræsenteret med N (stort bogstav) for at skelne det fra n, der normalt er forbundet med størrelsen af en stikprøve .
Populationsmiddelværdien, μ, er givet ved:
Ligning 2 kan udvides, omarrangeres og forenkles for at opnå:
I tilfælde af ikke at have individuelle data for populationen, men data grupperet i en frekvenstabel, er de foregående formler lidt ændret for at give:
I ovenstående ligninger er den mængde, der ligger inden for roden, ikke andet end populationsvariansen. Ligning 4 har den fordel, at den udelukkende er etableret i form af befolkningsdata og ikke af en eller anden populationsparameter som i tilfældet med ligning 2 og 5.
Eksempel på beregning af populationens standardafvigelse
Antag, at vi ønsker at bestemme variabiliteten i vægten af en bestemt bilmodel, hvoraf der kun findes 20 eksempler på verdensplan. Dataene for vægten i kilogram af disse 20 biler er præsenteret i følgende tabel:
410 | 408 | 408 | 405 | 391 | 390 | 402 | 397 | 397 | 395 |
390 | 404 | 397 | 394 | 399 | 397 | 405 | 408 | 410 | 400 |
Da vi ved, at der kun er 20 biler af denne model, repræsenterer disse hele befolkningen, så vi har alle de nødvendige data til at bestemme befolkningens standardafvigelse. Lad os se på tre forskellige måder at bestemme denne standardafvigelse på.
Metode 1: Beregning baseret på definitionen af varians
Denne metode er baseret på brugen af ligning 2 præsenteret ovenfor. Som vi kan se, kræver ligningen brugen af populationsmiddelværdien og en anden række beregninger, der er detaljeret nedenfor:
Trin 1: Bestem befolkningsgennemsnittet
Populationsmiddelværdien eller μ beregnes ved hjælp af ligning 3, hvor alle data lægges sammen og divideres med det samlede antal data, som i dette tilfælde er 20.
Trin 2: Beregn afvigelserne fra middelværdien
Dette trin involverer beregning af subtraktionerne (x i – μ). For eksempel:
x 1 – μ = 410 – 400,35 kg = 9,65 kg
x 2 – μ = 408 – 400,35 kg = 7,65 kg
x 3 – μ = 408 – 400,35 kg = 7,65 kg
…
X 20 – μ = 400 kg – 400,35 kg = – 0,35
Resultaterne er præsenteret i følgende tabel:
x i | x i – μ |
410 | 9,65 |
408 | 7,65 |
408 | 7,65 |
405 | 4,65 |
391 | -9.35 |
390 | -10.35 |
402 | 1,65 |
397 | -3,35 |
397 | -3,35 |
395 | -5,35 |
390 | -10.35 |
404 | 3,65 |
397 | -3,35 |
394 | -6.35 |
399 | -1,35 |
397 | -3,35 |
405 | 4,65 |
408 | 7,65 |
410 | 9,65 |
400 | -0,35 |
Trin 3: Kvadret alle afvigelser fra middelværdien
(x 1 – μ) 2 = (9,65) 2 = 93,1225 kg 2
(x 2 – μ) 2 = (7,65) 2 = 58,5225 kg 2
(x 3 – μ) 2 = (7,65) 2 = 58,5225 kg 2
…
(x 20 – μ) 2 = (– 0,35) 2 = 0,1225 kg 2
Resultaterne er præsenteret i følgende tabel:
x i /kg | (x i – μ)/ kg | (x i – μ ) 2 / kg 2 |
410 | 9,65 | 93,1225 |
408 | 7,65 | 58,5225 |
408 | 7,65 | 58,5225 |
405 | 4,65 | 21,6225 |
391 | -9.35 | 87,4225 |
390 | -10.35 | 107,1225 |
402 | 1,65 | 2,7225 |
397 | -3,35 | 11,2225 |
397 | -3,35 | 11,2225 |
395 | -5,35 | 28,6225 |
390 | -10.35 | 107,1225 |
404 | 3,65 | 13,3225 |
397 | -3,35 | 11,2225 |
394 | -6.35 | 40,3225 |
399 | -1,35 | 1,8225 |
397 | -3,35 | 11,2225 |
405 | 4,65 | 21,6225 |
408 | 7,65 | 58,5225 |
410 | 9,65 | 93,1225 |
400 | -0,35 | 0,1225 |
Trin 4: Læg alle de kvadrerede afvigelser sammen
Trin 5: Anvend formlen fra ligning 2
Nu hvor vi har denne sum, er der kun tilbage at erstatte denne værdi, såvel som antallet af data, som er 20, i ligning 2:
Således får vi, at standardafvigelsen af vægten af befolkningen på 20 biler er ca. 6,5 kg.
Metode 2: Brug af den omarrangerede ligning
Nu vil vi udføre den samme beregning, men ved hjælp af ligning 4, som svarer til den ligning, vi lige har brugt, men er mere praktisk, især hvis du arbejder med et større antal data. Den største fordel er, at det ikke er nødvendigt at beregne en ekstra parameter (populationsmiddelværdien) for at kunne beregne afvigelserne, men alt beregnes ud fra de oprindelige individuelle data. Du behøver heller ikke på noget tidspunkt at arbejde med negative tal, som er en stor fejlkilde blandt elever.
Trin 1: Beregn kvadratet af hver enkelt data
Det vil sige, at følgende beregninger udføres:
(x 1 ) 2 = (410) 2 = 168.100 kg 2
(x 2 ) 2 = (408) 2 = 166,464 kg 2
(x 3 ) 2 = (408) 2 = 166,464 kg 2
…
(x 20 ) 2 = (400) 2 = 160.000 kg 2
Resultaterne er præsenteret i følgende tabel:
x i | x i 2 |
410 | 168.100 |
408 | 166.464 |
408 | 166.464 |
405 | 164.025 |
391 | 152.881 |
390 | 152.100 |
402 | 161.604 |
397 | 157.609 |
397 | 157.609 |
395 | 156.025 |
390 | 152.100 |
404 | 163.216 |
397 | 157.609 |
394 | 155.236 |
399 | 159.201 |
397 | 157.609 |
405 | 164.025 |
408 | 166.464 |
410 | 168.100 |
400 | 160.000 |
Trin 2: Tilføj alle de individuelle data
Trin 3: Tilføj alle firkanterne
Trin 4: Anvend formlen fra ligning 4
Det sidste trin er at introducere disse to værdier og antallet af data i ligning 4 for at opnå populationens standardafvigelse:
Metode 3: Brug af regneark
Regneark som Microsoft Excel, Apple Numbers eller Google Sheets inkluderer blandt deres grundlæggende funktioner den direkte beregning af standardafvigelsen (både stikprøve og population). Disse funktioner tager et datasæt som et argument og udfører alle beregningerne vist i den foregående metode for direkte at returnere standardafvigelsen i cellen, hvor formlen er indtastet.
Fremgangsmåden er den næste:
Trin 1: Indtast dataene i regnearket
Vi kan indtaste dataene i form af en kolonne, række eller matrix hvor som helst i regnearket. Følgende skærmbillede viser, hvordan dataene for dette problem ser ud i Excel 2016.
Trin 2: Brug formlen til at beregne standardafvigelsen
Når dataene er tilføjet, bruger vi standardafvigelsesfunktionen, der placerer cellerne, hvor dataene findes, som argumenter.
For at kalde en funktion i et regneark starter vi normalt med at skrive lighedstegnet (=) efterfulgt af navnet på den funktion, vi vil bruge. Navnene ændrer sig lidt fra den ene applikation til den anden og ændrer sig i nogle tilfælde også afhængigt af det sprog, du arbejder på.
I tilfælde af Excel (spansk version) kaldes funktionen til at beregne populationens standardafvigelse STDEV.P, mens det i Google Sheets er STDEVP (uden point). Derefter skal du indtaste funktionens argument(er) mellem parenteser. I vores eksempel videregiver vi som et argument celleområdet, hvori dataene er placeret (fra celle A3 til J4).
Ved at trykke på ENTER kører programmet funktionen og beregner standardafvigelsen for populationen og præsenterer resultatet i den respektive celle, som vist nedenfor:
Som vi kan se, giver enhver af de tre metoder, der praktiseres her, det samme resultat. Det er bare forskellige måder at gøre det samme på.
andre metoder
Ud over de tre ovennævnte metoder har videnskabelige og finansielle regnemaskiner også ofte en funktion til at bestemme standardafvigelsen for et datasæt, det være sig stikprøve eller population. Måden, hvorpå data indtastes og opnåede resultater varierer fra producent til producent, og endda fra en regnemaskinemodel til en anden, så det er upraktisk at vise de specifikke trin for at gøre det her.
I stedet vil vi diskutere de vigtigste generelle trin uden at dykke ned i dem. Enhver, der ønsker at bruge denne funktion på deres videnskabelige lommeregner, bør henvise til brugervejledningen, der fulgte med lommeregneren, eller søge den online for at bestemme den specifikke tastekombination i hvert enkelt tilfælde.
Trin 1: Ryd hukommelsen
På mange lommeregnere er tidligere lagrede data ikke synlige. Hvis vi indtaster data om andre, der allerede var gemt uden at være klar over det, vil lommeregneren give et forkert resultat. For at sikre, at dette ikke sker, er det tilrådeligt at rydde hele lommeregnerens hukommelse (eller i det mindste den statistiske analysetilstand), før du begynder at indtaste nye data.
Trin 2: Få adgang til statistiktilstand
Funktionerne til at beregne standardafvigelsen er en del af “Statistics”, “Statistics” eller blot “S” tilstanden på de fleste lommeregnere, så vi skal starte med at gå ind i denne driftstilstand.
Trin 3: Indtast dataene
Dette varierer fra den ene lommeregner til den anden. I nogle tilfælde kan data tilføjes i tabelform, mens data i andre indtastes én efter én efter tryk på DT (eller DAT) tasten. Det er vigtigt at kontrollere antallet af indtastede data i slutningen af dette trin for at sikre, at ingen manglede.
Trin 4: Beregn populationens standardafvigelse
Når dataene er indtastet, er der kun tilbage at spørge lommeregneren om det resultat, vi leder efter. På mange regnemaskiner er både stikprøven og populationens standardafvigelser repræsenteret af symbolet σ (selvom dette er en fejl i tilfælde af stikprøveafvigelsen). Vi kan dog skelne stikprøveafvigelsen fra populationsafvigelsen, fordi stikprøveafvigelsen er ledsaget af n-1 (det vil sige, den vises som σ n-1 ), mens populationsafvigelsen vises som s n . Dette refererer til, at den i beregningen af stikprøvens standardafvigelse divideres med n-1 i stedet for n som i populationen.
Referencer
Devore, JL (2019). Sandsynlighed og statistik (1. udg .). Cengage læring.
MateMobile. (2021, 1. januar). Varians og standardafvigelse for indlagte data | matermobil . https://matemovil.com/varianza-y-desviacion-estandar-para-datos-agrupados-por-intervalos/
Googles tekniske support. (nd). STDEV (STDEV) – Hjælp til Google Docs Editors . Google – Hjælp til Google Docs Editors. https://support.google.com/docs/answer/3094054?hl=da-419
Superprof. (nd). Standardafvigelse . Matematikordbog | Superprof. https://www.superprof.es/diccionario/matematicas/estadistica/desviacion-estandar.html
TOMi.digital. (nd). Standardafvigelse for grupperede data . https://tomi.digital/da/52202/standard-deviation-for-grouped-data?utm_source=google&utm_medium=seo