Tabla de Contenidos
I et stort datasæt er det bedst at bruge den gennemsnitlige absolutte afvigelse og standardafvigelsen for at finde ud af, i hvilket omfang der er variationer i forhold til en middelscore . Standardafvigelsen er målet for spredningen af resultaterne i et datasæt. For at finde den samlede variabilitet af vores datasæt tilføjer vi blot afvigelsen af hver score fra gennemsnittet.
Den gennemsnitlige afvigelse af en score kan beregnes ved at dividere totalen (den samlede variabilitet af datasættet) med antallet af scores . Den absolutte afvigelse og standardafvigelsen er spredningsmål , der gør det muligt at udlede, afhængigt af det anvendte mål, variationen af en score i forhold til middelværdien.
Absolut afvigelse og betyder absolut afvigelse
Den nemmeste måde at beregne en scores afvigelse fra middelværdien på er at tage hver af scorerne og finde middelværdien. Som eksempel vil vi arbejde med den gennemsnitlige score for en gruppe på 100 elever, der fremgår af følgende tabel.
Den gennemsnitlige score for denne gruppe på 100 elever er 58,75 ud af 100. Ved at bruge eksemplet med eleven med 60 ud af 100 point, er afvigelsen af denne score fra gennemsnittet 1,25. Denne værdi er resultatet af at trække elevens score, som er 60, fra middelværdien, som er 58,78. Det er vigtigt at bemærke, at scores over middelværdien har positive afvigelser, mens scores under middelværdien vil have negative afvigelser.
På den anden side, hvis vi ender med at have positive og negative fortegn, vil de ved at tilføje alle disse afvigelser udligne, hvilket giver os en total afvigelse på nul. Hvis vores interesse for eksempel er fokuseret på at vide, hvad afvigelsen af en score er, men ikke i hvilket interval gennemsnittet er, så kan vi simpelthen undvære minustegnet og fokusere vores opmærksomhed på den værdi, der ville give os absolut afvigelse.
Hvis vi lægger alle disse absolutte afvigelser sammen og dividerer dem med det samlede antal point, får vi den gennemsnitlige absolutte afvigelse . Derfor er den gennemsnitlige absolutte forskel for vores 100 elever i dette eksempel 12,81. Formlen for at opnå det er følgende:
Hvor:
- MAD = middel absolut afvigelse
- ∑ = summen af.
- X= eksempel (score for dette eksempel).
- µ= middelværdi
- N = antal værdier.
Så:
- DMA = 1281/100
- DMA = 12,81
Standardafvigelse
Standardafvigelsen er et mål for spredningen af resultater i et datasæt. Generelt bruges dette mål til at finde ud af variabiliteten af populationen for de data, der måles. Men fordi vi ofte kun præsenteres for data fra en stikprøve, kan vi estimere populationens standardafvigelse fra stikprøvens standardafvigelse. Disse to standardafvigelser, dvs. stikprøvens standardafvigelse og populationens standardafvigelse, beregnes forskelligt.
Prøve eller populationsstandardafvigelse, hvornår skal man bruge hver?
Normalt er vi interesserede i at kende befolkningens standardafvigelse, fordi vores befolkning indeholder alle de værdier, vi har brug for. Derfor vil vi beregne populationens standardafvigelse, hvis vi har hele populationen, eller hvis vi har en stikprøve fra en større population, men kun er interesseret i den prøve og ikke ønsker at generalisere vores resultater til hele populationen.
Standardafvigelsen er dog ikke fritaget for at kunne give prøver, som vi kan generalisere en population med. Derfor, hvis du kun har en stikprøve, men ønsker at udtale dig om standardafvigelsen for den population, den er trukket fra, skal du bruge stikprøvens standardafvigelse. Forvirring om, hvilken standardafvigelse, der skal bruges, kan ofte opstå, da navnet “stikprøve”-standardafvigelse fejlagtigt fortolkes som standardafvigelsen for selve stikprøven snarere end som et estimat af standardafvigelsen for en population, der tages som stikprøvegrundlag.
Formlen for prøvens standardafvigelse er som følger:
Hvor:
- s = standardafvigelse for prøven.
- ∑ = summen af.
- X = prøve.
- x¯ = prøvegennemsnit.
- n = antal point i prøven.
Hvad skal man overveje, når man beregner standardafvigelsen
Til at begynde med er det vigtigt at huske på, at standardafvigelsen er et mål for spredning, der sammen med middelværdien bruges til at reducere kontinuerlige data, men ikke kategoriske data. På samme måde er det kun hensigtsmæssigt at bruge disse former for datakvantificering, når der er sikkerhed for, at de kontinuerlige data hverken har værdier ude af det typiske eller bias i en højere procentdel.
Afslutningsvis beregnes middelafvigelsen eller den gennemsnitlige absolutte afvigelse på samme måde som standardafvigelsen, men bruger absolutte værdier. Dette gøres for at undgå problemet med negative forskelle mellem datapunkter og deres midler. I praksis betyder absolut værdi, at vi skal fjerne eventuelle negative fortegn foran et tal og behandle alle tal som positive (eller nul).
Kilder
- Castillo, O. (2009). Anvendt statistik . Spredningsforanstaltninger .
- Flatiron Skole. (2015). Spredningsmål .
- Lopez, J. (2017). Standard eller typisk afvigelse . Economipedia.com
- Mendizabal, M (2017). Hvordan beregnes den absolutte afvigelse ?