Tabla de Contenidos
Variansen og standardavviket er to termer av stor betydning, både i statistikk og i alle grener av vitenskap og ingeniørfag. Begge er mål for spredning med hensyn til en sentral verdi, men avhengig av konteksten de brukes i, kan de defineres på forskjellige måter.
I feltene statistikk og sannsynlighet måler varians og standardavvik hvor langt verdiene til en tilfeldig variabel (nesten alltid representert med bokstaven X) avviker fra gjennomsnittsverdien.
Men når disse begrepene brukes i vitenskap eller ingeniørfag, refererer variansen og standardavviket til spredningen av en dataserie, enten av en hel populasjon eller et utvalg, rundt populasjonen eller utvalgets gjennomsnitt. Standardavviket til en serie repeterende målinger ved bruk av samme måleinstrument brukes også ofte for å gi en ide om presisjonsnivået til nevnte instrument.
I det første tilfellet måler variansen og standardavviket variasjonen til en tilfeldig variabel, mens i det andre måler de spredningen av eksperimentelle data. I begge tilfeller indikerer en varians eller standardavvik på null ingen variasjon i det hele tatt (den tilfeldige variabelen er faktisk konstant, eller alle dataene er nøyaktig like), mens en høy verdi indikerer det motsatte.
Disse to begrepene er nært beslektet og kan noen ganger forveksles med hverandre, men det er viktige forskjeller mellom de to som vi kommer til med en gang.
Forskjeller mellom varians og standardavvik
1. De har forskjellige definisjoner
Den første forskjellen mellom disse to statistiske termene er definisjonen deres:
Definisjon av varians
I statistikk er varians definert som forventet verdi av kvadratet av differansen mellom verdien av en tilfeldig variabel og dens middelverdi.
Matematisk skrives dette slik:
På en litt mindre formell måte kan det også defineres som gjennomsnittet av kvadratene av forskjellene mellom de individuelle dataene til en dataserie (populasjon eller utvalg) og dens middelverdi.
Standardavviksdefinisjon
Uavhengig av konteksten det brukes i, er standardavviket, også kjent som standardavviket, definert som den positive kvadratroten av variansen.
Matematisk skrives dette slik:
2. De er representert med forskjellige symboler
Varians og standardavvik er representert på ulike måter både i statistikktekster og i formler og ligninger:
Forskjell:
- σ 2 når det refereres til populasjonsvariansen
- S 2 når det refereres til prøvevariansen
- Var(X) når det refereres til variansen til en tilfeldig variabel, i dette tilfellet X.
Standardavvik:
- σ når det refereres til populasjonsstandardavviket
- S når det refereres til prøvens standardavvik
- SD(X) når det refereres til standardavviket til en tilfeldig variabel, i dette tilfellet X.
3. De har forskjellige formler
For både variansen og standardavviket er det to formler, avhengig av om dataserien som variansen eller standardavviket beregnes for er data fra en populasjon eller fra et utvalg.
Befolkningsvariansformel (σ 2 )
I en av de to formlene for populasjonsvariansen representerer μ populasjonsgjennomsnittet, X i representerer den ite populasjonsdataverdien, og N representerer størrelsen på populasjonen eller det totale antallet datapunkter.
Eksempelvariansformel (S 2 )
Her representerer x-bar gjennomsnittet av prøvedataene (prøvegjennomsnitt), x i representerer verdien av de ite prøvedataene, og n representerer størrelsen eller det totale antallet data i prøven.
Populasjonsstandardavviksformel (σ)
For standardavviket kan det beregnes på tre forskjellige måter:
Eksempel på standardavviksformel(er)
Også her kan en av tre forskjellige måter brukes:
Det må noteres med hensyn til de to siste formlene. Det er vanlig at man ved beregning av standardavvik først beregner variansen og deretter tar kvadratroten. Standardavviket bestemmes sjelden ved å bruke de sistnevnte ligningene uten å beregne variansen først, så førstnevnte går nesten alltid foran sistnevnte.
4. De har forskjellige enheter
Både enhetene for variansen og standardavviket avhenger av arten og enhetene til dataene eller den tilfeldige variabelen de refererer til, men enhetene er forskjellige i hvert enkelt tilfelle.
Standardavviket har de samme enhetene som de opprinnelige dataene eller den tilfeldige variabelen, mens variansen kommer i disse enhetene i annen.
Eksempel:
Hvis du har dataene for vektene i kilogram (kg) til et utvalg av elever i 8. klasse ved en bestemt utdanningsinstitusjon, vil variansen til nevnte data ha enheter på kg 2 mens standardavviket vil komme i kg .
5. De er forskjellige i tolkningen
For både variansen og standardavviket er tolkningen den samme som allerede nevnt: hvis de er verdt null, er det ingen spredning og alle dataene er nøyaktig like med hverandre; hvis de er små verdier vil det være liten spredning og hvis de er store vil det være mye spredning.
Men når man forstår hva det betyr å være en stor eller liten verdi, er standardavviksverdier mye lettere å tolke enn variansverdier, siden de er i samme enheter som dataene. Dette er ikke så enkelt når det gjelder varians.
6. De er forskjellige i sin følsomhet for ekstreme verdier
Som spredningsmål lider både variansen og standardavviket av følsomhet for eksistensen av ekstreme verdier (enten svært høye eller svært lave). Dette betyr at når man beskriver en dataserie der alle dataene er svært like bortsett fra én som er mye større eller mindre enn de andre, vil verken variansen eller standardavviket representere spredningen av dataene godt (begge vil gi verdier store til tross for at det store flertallet av dataene viser svært liten spredning).
Men når man sammenligner variansen med standardavviket, er variansen mye mer følsom for disse uteliggere siden alle avvik er kvadratisk, mens standardavviket ikke er det.
7. De er forskjellige i sine matematiske egenskaper
Den siste forskjellen vi skal se på omfatter faktisk flere mye dypere forskjeller som er viktige først og fremst for statistikere (eller de som studerer statistikk).
Som matematiske funksjoner er varians og standardavvik forskjellige når det gjelder effekten av å multiplisere dataene med en konstant, effekten av å legge til konstanter, legge til tilfeldige variabler sammen, heve til potenser, og så videre.
Disse forskjellene er imidlertid utenfor rammen av denne artikkelen.
Eksempel på beregning av varians og standardavvik
Anta at en prøve på 12 okser fra en lokal produsent ble veid. Vektene, i kilo, er presentert nedenfor:
507 | 497 | 510 | 508 | 491 | 510 |
500 | 509 | 496 | 491 | 505 | 503 |
Du blir bedt om å bestemme variansen og standardavviket til denne prøven.
LØSNING
Som nevnt ovenfor, når du har en dataserie, er det praktisk å først bestemme variansen og deretter standardavviket.
Beregning av utvalgsvariansen (S 2 )
Vi vil bruke den andre prøvevariansformelen, da den er mer praktisk. For å gjøre dette, følges følgende trinn:
- Trinn 1: Det lages en vertikal liste over alle dataene
- Trinn 2: Kvadraten til hver data beregnes og skrives ved siden av i en ny kolonne.
- Trinn 3: Alle dataene legges til og resultatet registreres på slutten av den første kolonnen.
- Trinn 4: Legg sammen alle rutene og skriv ned resultatet på slutten av den andre kolonnen.
Disse første 5 trinnene er oppsummert i følgende tabell:
Xi _ | x i 2 |
500 | 250 000 |
509 | 259081 |
496 | 246016 |
491 | 241081 |
505 | 255025 |
503 | 253009 |
507 | 257049 |
497 | 247009 |
510 | 260100 |
508 | 258064 |
491 | 241081 |
510 | 260100 |
∑Xi _ | ∑X i 2 |
6027 | 3027615 |
- Trinn 5: Formelen brukes til å beregne variansen:
Så prøvevariansen er omtrentlig S 2 = 50 kg 2 .
Beregning av prøvens standardavvik (S)
Nå som vi har variansen, er det like enkelt å beregne standardavviket som å ta kvadratroten av det første:
Som man kan se, lar sammenligningen av standardavviket, som er 7 kilo, med gjennomsnittsvekten til oksene, som er 502,25 kilo (beregnet separat), oss konkludere med at denne prøven har en lav spredning, siden den kun er 1,4 % av snittvekten til oksene.
Referanser
Espinoza, CI, & Echecopar, AL (2020). Statistiske applikasjoner som bruker MS Excel med trinnvise eksempler (spansk utgave) (1. utg .). Lima, Peru: Luis Felipe Arizmendi Echecopar og Duo Negocios SAC.
Investopedia. (2021, 16. april). Finn ut hvordan standardavvik bestemmes ved å bruke varians. Hentet 24. juli 2021 fra https://www.investopedia.com/ask/answers/021215/what-difference-between-standard-deviation-and-variance.asp
Lopez, JF (18. november 2017). Varians . Hentet fra https://economipedia.com/definiciones/varianza.html
Nasjonalt institutt for standarder og teknologi. (nd). Grunnleggende definisjoner av usikkerhet. Hentet 24. juli 2021 fra https://physics.nist.gov/cuu/Uncertainty/basic.html
Webster, A. (2001). Statistikk brukt på næringsliv og økonomi (spansk utgave) . Toronto, Canada: Irwin Professional Publishing.