Hva er forskjellen mellom varians og standardavvik?

Artículo revisado y aprobado por nuestro equipo editorial, siguiendo los criterios de redacción y edición de YuBrain.


Variansen og standardavviket er to termer av stor betydning, både i statistikk og i alle grener av vitenskap og ingeniørfag. Begge er mål for spredning med hensyn til en sentral verdi, men avhengig av konteksten de brukes i, kan de defineres på forskjellige måter.

I feltene statistikk og sannsynlighet måler varians og standardavvik hvor langt verdiene til en tilfeldig variabel (nesten alltid representert med bokstaven X) avviker fra gjennomsnittsverdien.

Men når disse begrepene brukes i vitenskap eller ingeniørfag, refererer variansen og standardavviket til spredningen av en dataserie, enten av en hel populasjon eller et utvalg, rundt populasjonen eller utvalgets gjennomsnitt. Standardavviket til en serie repeterende målinger ved bruk av samme måleinstrument brukes også ofte for å gi en ide om presisjonsnivået til nevnte instrument.

Standardavviket til en serie gjentatte målinger gir en ide om nøyaktighetsnivået til måleinstrumentet.

I det første tilfellet måler variansen og standardavviket variasjonen til en tilfeldig variabel, mens i det andre måler de spredningen av eksperimentelle data. I begge tilfeller indikerer en varians eller standardavvik på null ingen variasjon i det hele tatt (den tilfeldige variabelen er faktisk konstant, eller alle dataene er nøyaktig like), mens en høy verdi indikerer det motsatte.

Disse to begrepene er nært beslektet og kan noen ganger forveksles med hverandre, men det er viktige forskjeller mellom de to som vi kommer til med en gang.

Forskjeller mellom varians og standardavvik

1. De har forskjellige definisjoner

Den første forskjellen mellom disse to statistiske termene er definisjonen deres:

Definisjon av varians

I statistikk er varians definert som forventet verdi av kvadratet av differansen mellom verdien av en tilfeldig variabel og dens middelverdi.

Matematisk skrives dette slik:

Statistisk definisjon av varians

På en litt mindre formell måte kan det også defineres som gjennomsnittet av kvadratene av forskjellene mellom de individuelle dataene til en dataserie (populasjon eller utvalg) og dens middelverdi.

Standardavviksdefinisjon

Uavhengig av konteksten det brukes i, er standardavviket, også kjent som standardavviket, definert som den positive kvadratroten av variansen.

Matematisk skrives dette slik:

Statistisk definisjon av standardavvik.

2. De er representert med forskjellige symboler

Varians og standardavvik er representert på ulike måter både i statistikktekster og i formler og ligninger:

Forskjell:

  • σ 2 når det refereres til populasjonsvariansen
  • S 2 når det refereres til prøvevariansen
  • Var(X) når det refereres til variansen til en tilfeldig variabel, i dette tilfellet X.

Standardavvik:

  • σ når det refereres til populasjonsstandardavviket
  • S når det refereres til prøvens standardavvik
  • SD(X) når det refereres til standardavviket til en tilfeldig variabel, i dette tilfellet X.

3. De har forskjellige formler

For både variansen og standardavviket er det to formler, avhengig av om dataserien som variansen eller standardavviket beregnes for er data fra en populasjon eller fra et utvalg.

Befolkningsvariansformel (σ 2 )

Formler for varianspopulasjonsvariansen

I en av de to formlene for populasjonsvariansen representerer μ populasjonsgjennomsnittet, X i representerer den ite populasjonsdataverdien, og N representerer størrelsen på populasjonen eller det totale antallet datapunkter.

Eksempelvariansformel (S 2 )

formler for utvalgsvarians

Her representerer x-bar gjennomsnittet av prøvedataene (prøvegjennomsnitt), x i representerer verdien av de ite prøvedataene, og n representerer størrelsen eller det totale antallet data i prøven.

Populasjonsstandardavviksformel (σ)

For standardavviket kan det beregnes på tre forskjellige måter:

Formel for populasjonsstandardavviket.

En annen formel for populasjonsstandardavviket

Praktisk formel for populasjonsstandardavviket.

Eksempel på standardavviksformel(er)

Også her kan en av tre forskjellige måter brukes:

Formel for prøvestandardavvik.

En annen formel for prøvestandardavvik.

Praktisk formel for prøvestandardavvik.

Det må noteres med hensyn til de to siste formlene. Det er vanlig at man ved beregning av standardavvik først beregner variansen og deretter tar kvadratroten. Standardavviket bestemmes sjelden ved å bruke de sistnevnte ligningene uten å beregne variansen først, så førstnevnte går nesten alltid foran sistnevnte.

4. De har forskjellige enheter

Både enhetene for variansen og standardavviket avhenger av arten og enhetene til dataene eller den tilfeldige variabelen de refererer til, men enhetene er forskjellige i hvert enkelt tilfelle.

Standardavviket har de samme enhetene som de opprinnelige dataene eller den tilfeldige variabelen, mens variansen kommer i disse enhetene i annen.

Eksempel:

Hvis du har dataene for vektene i kilogram (kg) til et utvalg av elever i 8. klasse ved en bestemt utdanningsinstitusjon, vil variansen til nevnte data ha enheter på kg 2 mens standardavviket vil komme i kg .

5. De er forskjellige i tolkningen

For både variansen og standardavviket er tolkningen den samme som allerede nevnt: hvis de er verdt null, er det ingen spredning og alle dataene er nøyaktig like med hverandre; hvis de er små verdier vil det være liten spredning og hvis de er store vil det være mye spredning.

tolkning av varians og standardavvik.

Men når man forstår hva det betyr å være en stor eller liten verdi, er standardavviksverdier mye lettere å tolke enn variansverdier, siden de er i samme enheter som dataene. Dette er ikke så enkelt når det gjelder varians.

6. De er forskjellige i sin følsomhet for ekstreme verdier

Som spredningsmål lider både variansen og standardavviket av følsomhet for eksistensen av ekstreme verdier (enten svært høye eller svært lave). Dette betyr at når man beskriver en dataserie der alle dataene er svært like bortsett fra én som er mye større eller mindre enn de andre, vil verken variansen eller standardavviket representere spredningen av dataene godt (begge vil gi verdier store til tross for at det store flertallet av dataene viser svært liten spredning).

Men når man sammenligner variansen med standardavviket, er variansen mye mer følsom for disse uteliggere siden alle avvik er kvadratisk, mens standardavviket ikke er det.

7. De er forskjellige i sine matematiske egenskaper

Den siste forskjellen vi skal se på omfatter faktisk flere mye dypere forskjeller som er viktige først og fremst for statistikere (eller de som studerer statistikk).

Som matematiske funksjoner er varians og standardavvik forskjellige når det gjelder effekten av å multiplisere dataene med en konstant, effekten av å legge til konstanter, legge til tilfeldige variabler sammen, heve til potenser, og så videre.

Disse forskjellene er imidlertid utenfor rammen av denne artikkelen.

Eksempel på beregning av varians og standardavvik

Anta at en prøve på 12 okser fra en lokal produsent ble veid. Vektene, i kilo, er presentert nedenfor:

507 497 510 508 491 510
500 509 496 491 505 503

Du blir bedt om å bestemme variansen og standardavviket til denne prøven.

LØSNING

Som nevnt ovenfor, når du har en dataserie, er det praktisk å først bestemme variansen og deretter standardavviket.

Beregning av utvalgsvariansen (S 2 )

Vi vil bruke den andre prøvevariansformelen, da den er mer praktisk. For å gjøre dette, følges følgende trinn:

  • Trinn 1: Det lages en vertikal liste over alle dataene
  • Trinn 2: Kvadraten til hver data beregnes og skrives ved siden av i en ny kolonne.
  • Trinn 3: Alle dataene legges til og resultatet registreres på slutten av den første kolonnen.
  • Trinn 4: Legg sammen alle rutene og skriv ned resultatet på slutten av den andre kolonnen.

Disse første 5 trinnene er oppsummert i følgende tabell:

Xi _ x i 2
500 250 000
509 259081
496 246016
491 241081
505 255025
503 253009
507 257049
497 247009
510 260100
508 258064
491 241081
510 260100
∑Xi _ ∑X i 2
6027 3027615
  • Trinn 5: Formelen brukes til å beregne variansen:
Eksempel på beregning av varians

Så prøvevariansen er omtrentlig S 2 = 50 kg 2 .

Beregning av prøvens standardavvik (S)

Nå som vi har variansen, er det like enkelt å beregne standardavviket som å ta kvadratroten av det første:

Eksempel på beregning av standardavvik

Som man kan se, lar sammenligningen av standardavviket, som er 7 kilo, med gjennomsnittsvekten til oksene, som er 502,25 kilo (beregnet separat), oss konkludere med at denne prøven har en lav spredning, siden den kun er 1,4 % av snittvekten til oksene.

Referanser

Espinoza, CI, & Echecopar, AL (2020). Statistiske applikasjoner som bruker MS Excel med trinnvise eksempler (spansk utgave) (1. utg .). Lima, Peru: Luis Felipe Arizmendi Echecopar og Duo Negocios SAC.

Investopedia. (2021, 16. april). Finn ut hvordan standardavvik bestemmes ved å bruke varians. Hentet 24. juli 2021 fra https://www.investopedia.com/ask/answers/021215/what-difference-between-standard-deviation-and-variance.asp

Lopez, JF (18. november 2017). Varians . Hentet fra https://economipedia.com/definiciones/varianza.html

Nasjonalt institutt for standarder og teknologi. (nd). Grunnleggende definisjoner av usikkerhet. Hentet 24. juli 2021 fra https://physics.nist.gov/cuu/Uncertainty/basic.html

Webster, A. (2001). Statistikk brukt på næringsliv og økonomi (spansk utgave) . Toronto, Canada: Irwin Professional Publishing.

-Annonse-

Israel Parada (Licentiate,Professor ULA)
Israel Parada (Licentiate,Professor ULA)
(Licenciado en Química) - AUTOR. Profesor universitario de Química. Divulgador científico.

Artículos relacionados