Tabla de Contenidos
Populasjonsstandardavviket er en av de viktigste populasjonsparametrene for å måle variasjonen eller spredningen av data i populasjonen. Som enhver parameter i statistikk er den representert med en gresk bokstav, i dette tilfellet bokstaven σ (sigma). Dette gjør at det enkelt kan skilles fra standardavviket til prøven(e) som, selv om det er like, ikke er det samme og heller ikke beregnes med de samme formlene.
Deretter vil vi se, ved hjelp av et eksempel, forskjellige måter å beregne standardavviket til en populasjon på. Det skal bemerkes at for å beregne populasjonsstandardavviket er det viktig å kjenne alle populasjonsdataene. Dette skjer sjelden i virkelige sammenhenger, men det er likevel viktig å forstå hvordan det beregnes, da det hjelper å forstå noen av de matematiske egenskapene til denne viktige parameteren.
Populasjonsstandardavviksformler
Avhengig av tilgjengelige data kan populasjonsstandardavviket bestemmes ved hjelp av tre forskjellige formler.
Matematisk definisjon av populasjonens standardavvik
Standardavviket er definert som kvadratroten av variansen, σ 2 . Det vil si at hvis vi kjenner variansen til populasjonen, kan vi beregne standardavviket ved å bruke følgende ligning:
Dette tilfellet forekommer sjelden, men det er greit å huske på.
Andre populasjonsstandardavviksformler
Hvis vi i stedet for å vite variansen til en populasjon kjenner alle de N dataelementene som utgjør den, kan vi beregne populasjonsstandardavviket som kvadratroten av gjennomsnittet av de kvadrerte avvikene fra gjennomsnittet. Det er å si:
I denne ligningen representerer x i verdien av hvert dataelement i populasjonen, N representerer antall dataelementer i populasjonen (eller størrelsen på populasjonen, som er den samme) og μ er gjennomsnittet for populasjonen. Merk at populasjonsgjennomsnittet også er representert med en gresk bokstav fordi det er en annen populasjonsparameter og størrelsen på populasjonen er representert med N (stor bokstav) for å skille den fra n som vanligvis er assosiert med størrelsen på et utvalg .
Befolkningsgjennomsnittet, μ, er gitt av:
Ligning 2 kan utvides, omorganiseres og forenkles for å oppnå:
I tilfelle man ikke har individuelle data for befolkningen, men data gruppert i en frekvenstabell, er de tidligere formlene litt modifisert for å gi:
I ligningene ovenfor er mengden som ligger innenfor roten ikke noe mer enn populasjonsvariansen. Ligning 4 har fordelen av å være etablert utelukkende i form av populasjonsdata og ikke av noen populasjonsparameter som i tilfellet med ligning 2 og 5.
Eksempel på beregning av befolkningens standardavvik
Anta at vi ønsker å bestemme variasjonen i vekten til en bestemt bilmodell, som det bare finnes 20 eksempler på over hele verden. Dataene for vektene i kilo for disse 20 bilene er presentert i følgende tabell:
410 | 408 | 408 | 405 | 391 | 390 | 402 | 397 | 397 | 395 |
390 | 404 | 397 | 394 | 399 | 397 | 405 | 408 | 410 | 400 |
Siden vi vet at det kun er 20 biler av denne modellen, representerer disse hele befolkningen, så vi har alle dataene som trengs for å bestemme populasjonsstandardavviket . La oss se på tre forskjellige måter å bestemme dette standardavviket på.
Metode 1: Beregning basert på definisjonen av varians
Denne metoden er basert på bruken av ligning 2 presentert ovenfor. Som vi kan se, krever ligningen bruk av populasjonsgjennomsnittet og en annen serie beregninger som er detaljert nedenfor:
Trinn 1: Bestem populasjonsgjennomsnittet
Populasjonsmiddelverdien eller μ beregnes ved hjelp av ligning 3, legger alle dataene til og dividerer med det totale antallet data, som i dette tilfellet er 20.
Trinn 2: Beregn avvikene fra gjennomsnittet
Dette trinnet innebærer å beregne subtraksjonene (x i – μ). For eksempel:
x 1 – μ = 410 – 400,35 kg = 9,65 kg
x 2 – μ = 408 – 400,35 kg = 7,65 kg
x 3 – μ = 408 – 400,35 kg = 7,65 kg
…
X 20 – μ = 400 kg – 400,35 kg = – 0,35
Resultatene er presentert i følgende tabell:
x i | x i – μ |
410 | 9,65 |
408 | 7,65 |
408 | 7,65 |
405 | 4,65 |
391 | -9.35 |
390 | -10.35 |
402 | 1,65 |
397 | -3,35 |
397 | -3,35 |
395 | -5.35 |
390 | -10.35 |
404 | 3,65 |
397 | -3,35 |
394 | -6.35 |
399 | -1.35 |
397 | -3,35 |
405 | 4,65 |
408 | 7,65 |
410 | 9,65 |
400 | -0,35 |
Trinn 3: Kvaddra alle avvik fra gjennomsnittet
(x 1 – μ) 2 = (9,65) 2 = 93,1225 kg 2
(x 2 – μ) 2 = (7,65) 2 = 58,5225 kg 2
(x 3 – μ) 2 = (7,65) 2 = 58,5225 kg 2
…
(x 20 – μ) 2 = (– 0,35) 2 = 0,1225 kg 2
Resultatene er presentert i følgende tabell:
x i / kg | (x i – μ)/ kg | (x i – μ ) 2 / kg 2 |
410 | 9,65 | 93,1225 |
408 | 7,65 | 58,5225 |
408 | 7,65 | 58,5225 |
405 | 4,65 | 21,6225 |
391 | -9.35 | 87,4225 |
390 | -10.35 | 107,1225 |
402 | 1,65 | 2,7225 |
397 | -3,35 | 11.2225 |
397 | -3,35 | 11.2225 |
395 | -5.35 | 28,6225 |
390 | -10.35 | 107,1225 |
404 | 3,65 | 13,3225 |
397 | -3,35 | 11.2225 |
394 | -6.35 | 40,3225 |
399 | -1.35 | 1,8225 |
397 | -3,35 | 11.2225 |
405 | 4,65 | 21,6225 |
408 | 7,65 | 58,5225 |
410 | 9,65 | 93,1225 |
400 | -0,35 | 0,1225 |
Trinn 4: Legg sammen alle kvadratiske avvik
Trinn 5: Bruk formelen til ligning 2
Nå som vi har denne summen, gjenstår det bare å erstatte denne verdien, samt antallet data, som er 20, i ligning 2:
Dermed får vi at standardavviket for vekten til befolkningen på 20 biler er ca. 6,5 kg.
Metode 2: Bruke den omorganiserte ligningen
Nå skal vi utføre den samme beregningen, men ved å bruke ligning 4, som tilsvarer ligningen vi nettopp brukte, men som er mer praktisk, spesielt hvis du jobber med et større antall data. Hovedgevinsten er at det ikke er nødvendig å beregne en tilleggsparameter (populasjonsgjennomsnittet) for å kunne beregne avvikene, men alt beregnes basert på de opprinnelige individuelle dataene. Du trenger heller ikke på noe tidspunkt å jobbe med negative tall, som er en stor feilkilde blant elever.
Trinn 1: Beregn kvadratet av hver enkelt data
Det vil si at følgende beregninger utføres:
(x 1 ) 2 = (410) 2 = 168 100 kg 2
(x 2 ) 2 = (408) 2 = 166,464 kg 2
(x 3 ) 2 = (408) 2 = 166,464 kg 2
…
(x 20 ) 2 = (400) 2 = 160 000 kg 2
Resultatene er presentert i følgende tabell:
x i | x i 2 |
410 | 168 100 |
408 | 166.464 |
408 | 166.464 |
405 | 164 025 |
391 | 152.881 |
390 | 152.100 |
402 | 161 604 |
397 | 157.609 |
397 | 157.609 |
395 | 156 025 |
390 | 152.100 |
404 | 163.216 |
397 | 157.609 |
394 | 155.236 |
399 | 159.201 |
397 | 157.609 |
405 | 164 025 |
408 | 166.464 |
410 | 168 100 |
400 | 160 000 |
Trinn 2: Legg sammen alle individuelle data
Trinn 3: Legg til alle rutene
Trinn 4: Bruk formelen til ligning 4
Det siste trinnet er å introdusere disse to verdiene og antall data i ligning 4 for å få populasjonsstandardavviket:
Metode 3: Bruke regneark
Regneark som Microsoft Excel, Apple Numbers eller Google Sheets inkluderer blant sine grunnleggende funksjoner direkte beregning av standardavviket (både utvalg og populasjon). Disse funksjonene tar et datasett som et argument og utfører alle beregningene vist i forrige metode for direkte å returnere standardavviket i cellen der formelen er angitt.
Prosedyren er den neste:
Trinn 1: Skriv inn dataene i regnearket
Vi kan legge inn dataene i form av en kolonne, rad eller matrise hvor som helst i regnearket. Følgende skjermbilde viser hvordan dataene for dette problemet ser ut i Excel 2016.
Trinn 2: Bruk formelen til å beregne standardavviket
Når dataene er lagt til bruker vi standardavviksfunksjonen, og plasserer cellene der dataene finnes som argumenter.
For å kalle en funksjon i et regneark starter vi vanligvis med å skrive likhetstegnet (=) etterfulgt av navnet på funksjonen vi ønsker å bruke. Navnene endres litt fra en applikasjon til en annen og endres i noen tilfeller også avhengig av språket du jobber på.
Når det gjelder Excel (spansk versjon), kalles funksjonen for å beregne populasjonsstandardavviket STDEV.P, mens det i Google Sheets er STDEVP (uten poenget). Deretter må du angi argumentet(e) til funksjonen mellom parentes. I vårt eksempel passerer vi som et argument celleområdet som dataene er plassert i (som strekker seg fra celle A3 til J4).
Ved å trykke ENTER kjører programmet funksjonen og beregner standardavviket til populasjonen, og presenterer resultatet i den respektive cellen, som vist nedenfor:
Som vi kan se, gir en av de tre metodene som praktiseres her det samme resultatet. Det er bare forskjellige måter å gjøre det samme på.
andre metoder
I tillegg til de tre metodene nevnt ovenfor, har vitenskapelige og økonomiske kalkulatorer også ofte en funksjon for å bestemme standardavviket til et datasett, det være seg utvalg eller populasjon. Måten data legges inn på og oppnådde resultater varierer fra produsent til produsent, og til og med fra en kalkulatormodell til en annen, så det er upraktisk å vise de spesifikke trinnene for å gjøre det her.
I stedet vil vi diskutere de viktigste generelle trinnene uten å fordype oss i dem. Alle som ønsker å bruke denne funksjonen på sin vitenskapelige kalkulator bør se i brukerhåndboken som fulgte med kalkulatoren eller søke på den på nettet for å finne den spesifikke tastekombinasjonen i hvert tilfelle.
Trinn 1: Tøm minnet
På mange kalkulatorer er tidligere lagrede data ikke synlige. Hvis vi legger inn data om andre som allerede var lagret uten å være klar over det, vil kalkulatoren gi feil resultat. For å sikre at dette ikke skjer, er det tilrådelig å tømme hele kalkulatorens minne (eller i det minste den statistiske analysemodusen) før du begynner å legge inn nye data.
Trinn 2: Få tilgang til statistikkmodus
Funksjonene for å beregne standardavviket er en del av «Statistics», «Statistics» eller ganske enkelt «S»-modus på de fleste kalkulatorer, så vi må starte med å gå inn i denne driftsmodusen.
Trinn 3: Skriv inn dataene
Dette varierer fra en kalkulator til en annen. I noen tilfeller kan data legges til i tabellform, mens i andre legges data inn én etter én etter å ha trykket på DT (eller DAT)-tasten. Det er viktig å sjekke antall data som er angitt på slutten av dette trinnet for å sikre at ingen manglet.
Trinn 4: Beregn populasjonsstandardavviket
Når dataene er lagt inn, gjenstår det bare å spørre kalkulatoren om resultatet vi leter etter. På mange kalkulatorer er både utvalget og populasjonsstandardavviket representert med symbolet σ (til tross for at dette er en feil i tilfellet med utvalgsavviket). Imidlertid kan vi skille utvalgsavviket fra populasjonsavviket fordi utvalgsavviket er ledsaget av n-1 (det vil si at det vises som σ n-1 ) mens populasjonsavviket vises som s n . Dette refererer til at i beregningen av utvalgets standardavvik deles det på n-1 i stedet for n som i populasjonen.
Referanser
Devore, JL (2019). Sannsynlighet og statistikk (1. utg .). Cengage læring.
MateMobile. (2021, 1. januar). Varians og standardavvik for innlagte data | matermobil . https://matemovil.com/varianza-y-desviacion-estandar-para-datos-agrupados-por-intervalos/
Googles tekniske støtte. (nd). STDEV (STDEV) – Google Docs Editors Hjelp . Google – Google Docs Editors Hjelp. https://support.google.com/docs/answer/3094054?hl=no-419
Superprof. (nd). Standardavvik . Matematikkordbok | Superprof. https://www.superprof.es/diccionario/matematicas/estadistica/desviacion-estandar.html
TOMi.digital. (nd). Standardavvik for grupperte data . https://tomi.digital/en/52202/standard-deviation-for-grouped-data?utm_source=google&utm_medium=seo