Tabla de Contenidos
Variansen och standardavvikelsen är två termer av stor betydelse, både inom statistik och inom alla grenar av naturvetenskap och teknik. Båda är spridningsmått med avseende på ett centralt värde, men beroende på i vilket sammanhang de används kan de definieras på olika sätt.
Inom områdena statistik och sannolikhet mäter varians och standardavvikelse hur långt värdena på en slumpvariabel (nästan alltid representerad av bokstaven X) skiljer sig från deras medelvärde.
Men när dessa termer används inom vetenskap eller teknik, hänvisar variansen och standardavvikelsen till spridningen av en dataserie, antingen av en hel population eller ett urval, runt populationen eller urvalsmedelvärdet. Standardavvikelsen för en serie repetitiva mätningar med samma mätinstrument används också ofta för att ge en uppfattning om precisionsnivån för nämnda instrument.
I det första fallet mäter variansen och standardavvikelsen variabiliteten hos en slumpvariabel, medan de i det andra mäter spridningen av experimentella data. I båda fallen indikerar en varians eller standardavvikelse på noll ingen variation alls (den slumpmässiga variabeln är faktiskt konstant, eller så är alla data exakt samma), medan ett högt värde indikerar motsatsen.
Dessa två termer är nära besläktade och kan ibland förväxlas med varandra, men det finns viktiga skillnader mellan de två som vi kommer till direkt.
Skillnader mellan varians och standardavvikelse
1. De har olika definitioner
Den första skillnaden mellan dessa två statistiska termer är deras definition:
Definition av varians
I statistik definieras varians som det förväntade värdet på kvadraten på skillnaden mellan värdet på en slumpvariabel och dess medelvärde.
Matematiskt skrivs detta som:
På ett lite mindre formellt sätt kan det också definieras som genomsnittet av kvadraterna av skillnaderna mellan de individuella uppgifterna i en dataserie (population eller urval) och dess medelvärde.
Standardavvikelse Definition
Oavsett i vilket sammanhang den används, definieras standardavvikelsen, även känd som standardavvikelsen, som den positiva kvadratroten av variansen.
Matematiskt skrivs detta som:
2. De representeras med olika symboler
Varians och standardavvikelse representeras på olika sätt både i statistiktexter och i formler och ekvationer:
Variation:
- σ 2 när man hänvisar till populationsvariansen
- S 2 när man hänvisar till provvariansen
- Var(X) när man refererar till variansen för en slumpvariabel, i detta fall X.
Standardavvikelse:
- σ när man hänvisar till populationens standardavvikelse
- S när man hänvisar till provets standardavvikelse
- SD(X) när man refererar till standardavvikelsen för en slumpvariabel, i detta fall X.
3. De har olika formler
För både variansen och standardavvikelsen finns det två formler, beroende på om dataserien för vilken variansen eller standardavvikelsen beräknas är data från en population eller från ett urval.
Populationsvariansformel (σ 2 )
I någon av de två formlerna för populationsvariansen representerar μ populationsmedelvärdet, X i representerar det i:te populationsdatavärdet och N representerar populationens storlek eller det totala antalet datapunkter.
Provvariansformel (S 2 )
Här representerar x-stapel medelvärdet av provdata (provmedelvärde), xi representerar värdet av i:te provdata och n representerar storleken eller det totala antalet data i provet.
Populationsstandardavvikelseformel (σ)
När det gäller standardavvikelsen kan den beräknas på tre olika sätt:
Exempel på standardavvikelseformler
Även här kan ett av tre olika sätt användas:
En notering måste göras med avseende på de två sista formlerna. Det är vanligt att man vid beräkning av standardavvikelsen först beräknar variansen och sedan tar kvadratroten. Standardavvikelsen bestäms sällan med de senare ekvationerna utan att beräkna variansen först, så den förra föregår nästan alltid den senare.
4. De har olika enheter
Både enheterna för variansen och standardavvikelsen beror på arten och enheterna för data eller den slumpmässiga variabel som de refererar till, dock är enheterna olika i varje enskilt fall.
Standardavvikelsen har samma enheter som originaldata eller slumpvariabeln, medan variansen kommer i dessa enheter i kvadrat.
Exempel:
Om du har data för vikterna i kilogram (kg) för ett urval av elever i 8:e klass vid en viss läroanstalt, kommer variansen av nämnda data att ha enheterna kg 2 medan standardavvikelsen kommer i kg .
5. De skiljer sig i sin tolkning
För både variansen och standardavvikelsen är tolkningen densamma som den som redan nämnts: om de är värda noll, så finns det ingen spridning och alla data är exakt lika med varandra; om de är små värden blir det lite spridning och om de är stora kommer det att bli mycket spridning.
Men när man förstår vad det innebär att vara ett stort eller litet värde är standardavvikelsevärden mycket lättare att tolka än variansvärden, eftersom de är i samma enheter som data. Detta är inte så enkelt i fallet med varians.
6. De skiljer sig i sin känslighet för extrema värden
Som mått på spridning lider både variansen och standardavvikelsen av känslighet för förekomsten av extrema värden (antingen mycket höga eller mycket låga). Detta betyder att när man beskriver en dataserie där alla data är väldigt lika utom en som är mycket större eller mindre än de andra, kommer varken variansen eller standardavvikelsen att representera spridningen av data väl (båda kommer att ge värden stora trots att den stora majoriteten av uppgifterna visar mycket liten spridning).
Men när man jämför variansen med standardavvikelsen är variansen mycket mer känslig för dessa extremvärden eftersom alla avvikelser är kvadratiska, medan standardavvikelsen inte är det.
7. De skiljer sig åt i sina matematiska egenskaper
Den sista skillnaden vi ska titta på omfattar faktiskt flera mycket djupare skillnader som är viktiga främst för statistiker (eller de som studerar statistik).
Eftersom matematiska funktioner skiljer sig varians och standardavvikelse i termer av effekten av att multiplicera data med en konstant, effekten av att addera konstanter, addera slumpvariabler tillsammans, höja till potenser, och så vidare.
Dessa skillnader ligger dock utanför ramen för denna artikel.
Varians och standardavvikelseberäkningsexempel
Antag att ett prov på 12 tjurar från en lokal producent vägdes. Vikterna, i kilo, visas nedan:
507 | 497 | 510 | 508 | 491 | 510 |
500 | 509 | 496 | 491 | 505 | 503 |
Du ombeds att bestämma variansen och standardavvikelsen för detta prov.
LÖSNING
Som nämnts ovan, när man har en dataserie, är det bekvämt att först bestämma variansen och sedan standardavvikelsen.
Beräkning av urvalsvariansen (S 2 )
Vi kommer att använda den andra provvariansformeln, eftersom den är mer praktisk. För att göra detta, följs följande steg:
- Steg 1: En vertikal lista görs över all data
- Steg 2: Kvadraten på varje data beräknas och skrivs bredvid den i en ny kolumn.
- Steg 3: All data läggs till och resultatet registreras i slutet av den första kolumnen.
- Steg 4: Lägg ihop alla rutor och skriv ner resultatet i slutet av den andra kolumnen.
Dessa första 5 steg sammanfattas i följande tabell:
Xi _ | x i 2 |
500 | 250 000 |
509 | 259081 |
496 | 246016 |
491 | 241081 |
505 | 255025 |
503 | 253009 |
507 | 257049 |
497 | 247009 |
510 | 260100 |
508 | 258064 |
491 | 241081 |
510 | 260100 |
∑Xi _ | ∑X i 2 |
6027 | 3027615 |
- Steg 5: Formeln används för att beräkna variansen:
Så provvariationen är ungefär S 2 = 50 kg 2 .
Beräkning av provets standardavvikelse (S)
Nu när vi har variansen är det lika enkelt att beräkna standardavvikelsen som att ta kvadratroten av den första:
Som kan ses gör jämförelsen av standardavvikelsen, som är 7 kilo, med tjurarnas medelvikt, som är 502,25 kilo (beräknat separat), att vi kan dra slutsatsen att detta prov har en låg spridning, eftersom det endast är 1,4 % av tjurarnas medelvikt.
Referenser
Espinoza, CI, & Echecopar, AL (2020). Statistiska applikationer som använder MS Excel med steg-för-steg-exempel (spanska upplagan) ( första upplagan ). Lima, Peru: Luis Felipe Arizmendi Echecopar och Duo Negocios SAC.
Investopedia. (2021, 16 april). Lär dig hur standardavvikelse bestäms genom att använda varians. Hämtad 24 juli 2021 från https://www.investopedia.com/ask/answers/021215/what-difference-between-standard-deviation-and-variance.asp
Lopez, JF (18 november 2017). Varians . Hämtad från https://economipedia.com/definiciones/varianza.html
National Institute of Standards and Technology. (nd). Grundläggande definitioner av osäkerhet. Hämtad 24 juli 2021 från https://physics.nist.gov/cuu/Uncertainty/basic.html
Webster, A. (2001). Statistik tillämpad på företag och ekonomi (spanska upplagan) . Toronto, Kanada: Irwin Professional Publishing.