Vad är skillnaden mellan varians och standardavvikelse?

Artículo revisado y aprobado por nuestro equipo editorial, siguiendo los criterios de redacción y edición de YuBrain.


Variansen och standardavvikelsen är två termer av stor betydelse, både inom statistik och inom alla grenar av naturvetenskap och teknik. Båda är spridningsmått med avseende på ett centralt värde, men beroende på i vilket sammanhang de används kan de definieras på olika sätt.

Inom områdena statistik och sannolikhet mäter varians och standardavvikelse hur långt värdena på en slumpvariabel (nästan alltid representerad av bokstaven X) skiljer sig från deras medelvärde.

Men när dessa termer används inom vetenskap eller teknik, hänvisar variansen och standardavvikelsen till spridningen av en dataserie, antingen av en hel population eller ett urval, runt populationen eller urvalsmedelvärdet. Standardavvikelsen för en serie repetitiva mätningar med samma mätinstrument används också ofta för att ge en uppfattning om precisionsnivån för nämnda instrument.

Standardavvikelsen för en serie repetitiva mätningar ger en uppfattning om mätinstrumentets precisionsnivå.

I det första fallet mäter variansen och standardavvikelsen variabiliteten hos en slumpvariabel, medan de i det andra mäter spridningen av experimentella data. I båda fallen indikerar en varians eller standardavvikelse på noll ingen variation alls (den slumpmässiga variabeln är faktiskt konstant, eller så är alla data exakt samma), medan ett högt värde indikerar motsatsen.

Dessa två termer är nära besläktade och kan ibland förväxlas med varandra, men det finns viktiga skillnader mellan de två som vi kommer till direkt.

Skillnader mellan varians och standardavvikelse

1. De har olika definitioner

Den första skillnaden mellan dessa två statistiska termer är deras definition:

Definition av varians

I statistik definieras varians som det förväntade värdet på kvadraten på skillnaden mellan värdet på en slumpvariabel och dess medelvärde.

Matematiskt skrivs detta som:

Statistisk definition av varians

På ett lite mindre formellt sätt kan det också definieras som genomsnittet av kvadraterna av skillnaderna mellan de individuella uppgifterna i en dataserie (population eller urval) och dess medelvärde.

Standardavvikelse Definition

Oavsett i vilket sammanhang den används, definieras standardavvikelsen, även känd som standardavvikelsen, som den positiva kvadratroten av variansen.

Matematiskt skrivs detta som:

Statistisk definition av standardavvikelse.

2. De representeras med olika symboler

Varians och standardavvikelse representeras på olika sätt både i statistiktexter och i formler och ekvationer:

Variation:

  • σ 2 när man hänvisar till populationsvariansen
  • S 2 när man hänvisar till provvariansen
  • Var(X) när man refererar till variansen för en slumpvariabel, i detta fall X.

Standardavvikelse:

  • σ när man hänvisar till populationens standardavvikelse
  • S när man hänvisar till provets standardavvikelse
  • SD(X) när man refererar till standardavvikelsen för en slumpvariabel, i detta fall X.

3. De har olika formler

För både variansen och standardavvikelsen finns det två formler, beroende på om dataserien för vilken variansen eller standardavvikelsen beräknas är data från en population eller från ett urval.

Populationsvariansformel (σ 2 )

Formler för varianspopulationsvariansen

I någon av de två formlerna för populationsvariansen representerar μ populationsmedelvärdet, X i representerar det i:te populationsdatavärdet och N representerar populationens storlek eller det totala antalet datapunkter.

Provvariansformel (S 2 )

formler för provvarians

Här representerar x-stapel medelvärdet av provdata (provmedelvärde), xi representerar värdet av i:te provdata och n representerar storleken eller det totala antalet data i provet.

Populationsstandardavvikelseformel (σ)

När det gäller standardavvikelsen kan den beräknas på tre olika sätt:

Formel för populationens standardavvikelse.

En annan formel för populationens standardavvikelse

Praktisk formel för populationens standardavvikelse.

Exempel på standardavvikelseformler

Även här kan ett av tre olika sätt användas:

Formel för provets standardavvikelse.

En annan formel för provets standardavvikelse.

Praktisk formel för provets standardavvikelse.

En notering måste göras med avseende på de två sista formlerna. Det är vanligt att man vid beräkning av standardavvikelsen först beräknar variansen och sedan tar kvadratroten. Standardavvikelsen bestäms sällan med de senare ekvationerna utan att beräkna variansen först, så den förra föregår nästan alltid den senare.

4. De har olika enheter

Både enheterna för variansen och standardavvikelsen beror på arten och enheterna för data eller den slumpmässiga variabel som de refererar till, dock är enheterna olika i varje enskilt fall.

Standardavvikelsen har samma enheter som originaldata eller slumpvariabeln, medan variansen kommer i dessa enheter i kvadrat.

Exempel:

Om du har data för vikterna i kilogram (kg) för ett urval av elever i 8:e klass vid en viss läroanstalt, kommer variansen av nämnda data att ha enheterna kg 2 medan standardavvikelsen kommer i kg .

5. De skiljer sig i sin tolkning

För både variansen och standardavvikelsen är tolkningen densamma som den som redan nämnts: om de är värda noll, så finns det ingen spridning och alla data är exakt lika med varandra; om de är små värden blir det lite spridning och om de är stora kommer det att bli mycket spridning.

tolkning av varians och standardavvikelse.

Men när man förstår vad det innebär att vara ett stort eller litet värde är standardavvikelsevärden mycket lättare att tolka än variansvärden, eftersom de är i samma enheter som data. Detta är inte så enkelt i fallet med varians.

6. De skiljer sig i sin känslighet för extrema värden

Som mått på spridning lider både variansen och standardavvikelsen av känslighet för förekomsten av extrema värden (antingen mycket höga eller mycket låga). Detta betyder att när man beskriver en dataserie där alla data är väldigt lika utom en som är mycket större eller mindre än de andra, kommer varken variansen eller standardavvikelsen att representera spridningen av data väl (båda kommer att ge värden stora trots att den stora majoriteten av uppgifterna visar mycket liten spridning).

Men när man jämför variansen med standardavvikelsen är variansen mycket mer känslig för dessa extremvärden eftersom alla avvikelser är kvadratiska, medan standardavvikelsen inte är det.

7. De skiljer sig åt i sina matematiska egenskaper

Den sista skillnaden vi ska titta på omfattar faktiskt flera mycket djupare skillnader som är viktiga främst för statistiker (eller de som studerar statistik).

Eftersom matematiska funktioner skiljer sig varians och standardavvikelse i termer av effekten av att multiplicera data med en konstant, effekten av att addera konstanter, addera slumpvariabler tillsammans, höja till potenser, och så vidare.

Dessa skillnader ligger dock utanför ramen för denna artikel.

Varians och standardavvikelseberäkningsexempel

Antag att ett prov på 12 tjurar från en lokal producent vägdes. Vikterna, i kilo, visas nedan:

507 497 510 508 491 510
500 509 496 491 505 503

Du ombeds att bestämma variansen och standardavvikelsen för detta prov.

LÖSNING

Som nämnts ovan, när man har en dataserie, är det bekvämt att först bestämma variansen och sedan standardavvikelsen.

Beräkning av urvalsvariansen (S 2 )

Vi kommer att använda den andra provvariansformeln, eftersom den är mer praktisk. För att göra detta, följs följande steg:

  • Steg 1: En vertikal lista görs över all data
  • Steg 2: Kvadraten på varje data beräknas och skrivs bredvid den i en ny kolumn.
  • Steg 3: All data läggs till och resultatet registreras i slutet av den första kolumnen.
  • Steg 4: Lägg ihop alla rutor och skriv ner resultatet i slutet av den andra kolumnen.

Dessa första 5 steg sammanfattas i följande tabell:

Xi _ x i 2
500 250 000
509 259081
496 246016
491 241081
505 255025
503 253009
507 257049
497 247009
510 260100
508 258064
491 241081
510 260100
∑Xi _ ∑X i 2
6027 3027615
  • Steg 5: Formeln används för att beräkna variansen:
Exempel på variansberäkningsexempel

Så provvariationen är ungefär S 2 = 50 kg 2 .

Beräkning av provets standardavvikelse (S)

Nu när vi har variansen är det lika enkelt att beräkna standardavvikelsen som att ta kvadratroten av den första:

Exempel på beräkning av standardavvikelse

Som kan ses gör jämförelsen av standardavvikelsen, som är 7 kilo, med tjurarnas medelvikt, som är 502,25 kilo (beräknat separat), att vi kan dra slutsatsen att detta prov har en låg spridning, eftersom det endast är 1,4 % av tjurarnas medelvikt.

Referenser

Espinoza, CI, & Echecopar, AL (2020). Statistiska applikationer som använder MS Excel med steg-för-steg-exempel (spanska upplagan) ( första upplagan ). Lima, Peru: Luis Felipe Arizmendi Echecopar och Duo Negocios SAC.

Investopedia. (2021, 16 april). Lär dig hur standardavvikelse bestäms genom att använda varians. Hämtad 24 juli 2021 från https://www.investopedia.com/ask/answers/021215/what-difference-between-standard-deviation-and-variance.asp

Lopez, JF (18 november 2017). Varians . Hämtad från https://economipedia.com/definiciones/varianza.html

National Institute of Standards and Technology. (nd). Grundläggande definitioner av osäkerhet. Hämtad 24 juli 2021 från https://physics.nist.gov/cuu/Uncertainty/basic.html

Webster, A. (2001). Statistik tillämpad på företag och ekonomi (spanska upplagan) . Toronto, Kanada: Irwin Professional Publishing.

-Annons-

Israel Parada (Licentiate,Professor ULA)
Israel Parada (Licentiate,Professor ULA)
(Licenciado en Química) - AUTOR. Profesor universitario de Química. Divulgador científico.

Artículos relacionados