Tabla de Contenidos
Populationsstandardavvikelsen är en av de viktigaste populationsparametrarna för att mäta variationen eller spridningen av data inom populationen. Som alla parametrar i statistik representeras den av en grekisk bokstav, i det här fallet bokstaven σ (sigma). Detta gör att den lätt kan särskiljas från standardavvikelsen för provet/proven som, även om den är lika, inte är densamma och inte heller beräknas med samma formler.
Därefter kommer vi att se, med hjälp av ett exempel, olika sätt att beräkna standardavvikelsen för en population. Det bör noteras att för att beräkna populationens standardavvikelse är det viktigt att känna till alla populationsdata. Detta händer sällan i verkliga sammanhang, men det är fortfarande viktigt att förstå hur det beräknas, eftersom det hjälper till att förstå några av de matematiska egenskaperna hos denna viktiga parameter.
Populationsstandardavvikelseformler
Beroende på tillgängliga data kan populationens standardavvikelse bestämmas med hjälp av tre olika formler.
Matematisk definition av populationens standardavvikelse
Standardavvikelsen definieras som kvadratroten av variansen, σ 2 . Det vill säga, om vi känner till variansen för populationen kan vi beräkna standardavvikelsen med hjälp av följande ekvation:
Detta fall inträffar sällan, men det är bra att ha i åtanke.
Andra populationsstandardavvikelseformler
Om vi istället för att veta variansen för en population känner till alla N dataposter som den utgör, så kan vi beräkna populationens standardavvikelse som kvadratroten av medelvärdet av de kvadratiska avvikelserna från medelvärdet. Det vill säga:
I denna ekvation representerar x i värdet av varje datapost i populationen, N representerar antalet dataposter i populationen (eller storleken på populationen, som är densamma) och μ är populationsmedelvärdet. Observera att populationsmedelvärdet också representeras av en grekisk bokstav eftersom det är en annan populationsparameter och populationens storlek representeras av N (versal) för att skilja det från n som vanligtvis är associerat med storleken på ett urval .
Populationsmedelvärdet, μ, ges av:
Ekvation 2 kan utökas, ordnas om och förenklas för att få:
Om man inte har individuella uppgifter om populationen utan data grupperade i en frekvenstabell, är de tidigare formlerna något modifierade för att ge:
I ovanstående ekvationer är den kvantitet som ligger inom roten inget annat än populationsvariansen. Ekvation 4 har fördelen att den är etablerad uteslutande i termer av populationsdata och inte av någon populationsparameter som i fallet med ekvationerna 2 och 5.
Exempel på beräkning av populationens standardavvikelse
Anta att vi vill bestämma variabiliteten i vikten för en viss bilmodell, varav endast 20 exempel är kända över hela världen. Data för vikterna i kilogram för dessa 20 bilar presenteras i följande tabell:
410 | 408 | 408 | 405 | 391 | 390 | 402 | 397 | 397 | 395 |
390 | 404 | 397 | 394 | 399 | 397 | 405 | 408 | 410 | 400 |
Eftersom vi vet att det bara finns 20 bilar av denna modell representerar dessa hela populationen, så vi har all data som behövs för att fastställa populationens standardavvikelse. Låt oss titta på tre olika sätt att bestämma denna standardavvikelse.
Metod 1: Beräkning baserad på definitionen av varians
Denna metod är baserad på användningen av ekvation 2 som presenteras ovan. Som vi kan se kräver ekvationen användningen av populationsmedelvärdet och en annan serie beräkningar som beskrivs nedan:
Steg 1: Bestäm populationsmedelvärdet
Populationsmedelvärdet eller μ beräknas med hjälp av ekvation 3, addera all data och dividera med det totala antalet data, vilket i detta fall är 20.
Steg 2: Beräkna avvikelserna från medelvärdet
Detta steg innebär att man beräknar subtraktionerna (xi – μ). Till exempel:
x 1 – μ = 410 – 400,35 kg = 9,65 kg
x 2 – μ = 408 – 400,35 kg = 7,65 kg
x 3 – μ = 408 – 400,35 kg = 7,65 kg
…
X 20 – μ = 400 kg – 400,35 kg = – 0,35
Resultaten presenteras i följande tabell:
x i | x i – μ |
410 | 9,65 |
408 | 7,65 |
408 | 7,65 |
405 | 4,65 |
391 | -9.35 |
390 | -10.35 |
402 | 1,65 |
397 | -3,35 |
397 | -3,35 |
395 | -5.35 |
390 | -10.35 |
404 | 3,65 |
397 | -3,35 |
394 | -6.35 |
399 | -1.35 |
397 | -3,35 |
405 | 4,65 |
408 | 7,65 |
410 | 9,65 |
400 | -0,35 |
Steg 3: Kvadrera alla avvikelser från medelvärdet
(x 1 – μ) 2 = (9,65) 2 = 93,1225 kg 2
(x 2 – μ) 2 = (7,65) 2 = 58,5225 kg 2
(x 3 – μ) 2 = (7,65) 2 = 58,5225 kg 2
…
(x 20 – μ) 2 = (– 0,35) 2 = 0,1225 kg 2
Resultaten presenteras i följande tabell:
x i /kg | (x i – μ)/ kg | (x i – μ ) 2 / kg 2 |
410 | 9,65 | 93,1225 |
408 | 7,65 | 58,5225 |
408 | 7,65 | 58,5225 |
405 | 4,65 | 21,6225 |
391 | -9.35 | 87,4225 |
390 | -10.35 | 107,1225 |
402 | 1,65 | 2,7225 |
397 | -3,35 | 11,2225 |
397 | -3,35 | 11,2225 |
395 | -5.35 | 28,6225 |
390 | -10.35 | 107,1225 |
404 | 3,65 | 13,3225 |
397 | -3,35 | 11,2225 |
394 | -6.35 | 40,3225 |
399 | -1.35 | 1,8225 |
397 | -3,35 | 11,2225 |
405 | 4,65 | 21,6225 |
408 | 7,65 | 58,5225 |
410 | 9,65 | 93,1225 |
400 | -0,35 | 0,1225 |
Steg 4: Lägg ihop alla kvadratiska avvikelser
Steg 5: Tillämpa formeln i ekvation 2
Nu när vi har denna summa återstår bara att ersätta detta värde, såväl som antalet data, som är 20, i ekvation 2:
Således får vi att standardavvikelsen för vikten av befolkningen på 20 bilar är ca. 6,5 kg.
Metod 2: Använd den omarrangerade ekvationen
Nu kommer vi att utföra samma beräkning, men med ekvation 4, vilket motsvarar ekvationen vi just använde, men är mer praktiskt, speciellt om du arbetar med ett större antal data. Den största fördelen är att det inte är nödvändigt att beräkna ytterligare en parameter (populationsmedelvärdet) för att kunna beräkna avvikelserna, utan allt beräknas utifrån de ursprungliga individuella uppgifterna. Dessutom behöver du inte vid något tillfälle arbeta med negativa tal, som är en stor felkälla bland elever.
Steg 1: Beräkna kvadraten av varje enskild data
Det vill säga följande beräkningar utförs:
(x 1 ) 2 = (410) 2 = 168 100 kg 2
(x 2 ) 2 = (408) 2 = 166,464 kg 2
(x 3 ) 2 = (408) 2 = 166,464 kg 2
…
(x 20 ) 2 = (400) 2 = 160 000 kg 2
Resultaten presenteras i följande tabell:
x i | x i 2 |
410 | 168 100 |
408 | 166,464 |
408 | 166,464 |
405 | 164 025 |
391 | 152,881 |
390 | 152 100 |
402 | 161 604 |
397 | 157 609 |
397 | 157 609 |
395 | 156 025 |
390 | 152 100 |
404 | 163,216 |
397 | 157 609 |
394 | 155,236 |
399 | 159,201 |
397 | 157 609 |
405 | 164 025 |
408 | 166,464 |
410 | 168 100 |
400 | 160 000 |
Steg 2: Lägg ihop alla individuella data
Steg 3: Lägg till alla rutor
Steg 4: Tillämpa formeln i ekvation 4
Det sista steget är att införa dessa två värden och antalet data i ekvation 4 för att få populationens standardavvikelse:
Metod 3: Använd kalkylblad
Kalkylblad som Microsoft Excel, Apple Numbers eller Google Sheets inkluderar bland sina grundläggande funktioner den direkta beräkningen av standardavvikelsen (både urval och population). Dessa funktioner tar en datamängd som ett argument och utför alla beräkningar som visas i föregående metod för att direkt returnera standardavvikelsen i cellen där formeln anges.
Proceduren är nästa:
Steg 1: Ange data i kalkylarket
Vi kan lägga in data i form av en kolumn, rad eller matris var som helst i kalkylbladet. Följande skärmdump visar hur data för detta problem ser ut i Excel 2016.
Steg 2: Använd formeln för att beräkna standardavvikelsen
När data har lagts till använder vi standardavvikelsefunktionen, och placerar cellerna där data finns som argument.
För att anropa en funktion i ett kalkylblad brukar vi börja med att skriva likhetstecknet (=) följt av namnet på den funktion vi vill använda. Namnen ändras något från en applikation till en annan och ändras i vissa fall även beroende på vilket språk du arbetar på.
I fallet med Excel (spansk version) kallas funktionen för att beräkna populationens standardavvikelse STDEV.P, medan det i Google Sheets är STDEVP (utan poängen). Sedan måste du ange argumentet/argumenten för funktionen mellan parenteser. I vårt exempel skickar vi som ett argument cellintervallet där data finns (från cell A3 till J4).
Genom att trycka på ENTER kör programmet funktionen och beräknar standardavvikelsen för populationen och presenterar resultatet i respektive cell, som visas nedan:
Som vi kan se ger någon av de tre metoderna som praktiseras här samma resultat. Det är bara olika sätt att göra samma sak.
andra metoder
Utöver de tre ovan nämnda metoderna har vetenskapliga och finansiella räknare också ofta en funktion för att fastställa standardavvikelsen för en datamängd, vare sig det är stickprov eller population. Sättet på vilket data matas in och resultaten varierar från tillverkare till tillverkare, och till och med från en kalkylatormodell till en annan, så det är opraktiskt att visa de specifika stegen för att göra det här.
Istället kommer vi att diskutera de viktigaste allmänna stegen utan att fördjupa oss i dem. Alla som vill använda den här funktionen på sin vetenskapliga miniräknare bör hänvisa till användarhandboken som följde med räknaren eller söka på den online för att bestämma den specifika tangentkombinationen i varje enskilt fall.
Steg 1: Rensa minnet
På många miniräknare är tidigare lagrad data inte synlig. Om vi matar in data om andra som redan lagrats utan att vi inser det kommer räknaren att ge ett felaktigt resultat. För att säkerställa att detta inte händer, är det lämpligt att rensa hela räknarens minne (eller åtminstone det statistiska analysläget) innan du börjar mata in nya data.
Steg 2: Få åtkomst till statistikläge
Funktionerna för att beräkna standardavvikelsen är en del av läget ”Statistik”, ”Statistik” eller helt enkelt ”S” på de flesta miniräknare, så vi måste börja med att gå in i detta funktionsläge.
Steg 3: Ange data
Detta varierar från en miniräknare till en annan. I vissa fall kan data läggas till i tabellform, medan i andra uppgifter läggs in en efter en efter att ha tryckt på DT (eller DAT)-tangenten. Det är viktigt att kontrollera antalet inmatade data i slutet av detta steg för att säkerställa att ingen saknades.
Steg 4: Beräkna populationens standardavvikelse
När uppgifterna väl är inmatade återstår bara att be räknaren om resultatet vi letar efter. På många miniräknare representeras både urvalet och populationens standardavvikelser av symbolen σ (trots att detta är ett fel i fallet med urvalsavvikelsen). Vi kan dock skilja urvalsavvikelsen från populationsavvikelsen eftersom urvalsavvikelsen åtföljs av n-1 (det vill säga den visas som σ n-1 ) medan populationsavvikelsen visas som s n . Detta syftar på att vid beräkningen av urvalets standardavvikelse divideras den med n-1 istället för n som i populationen.
Referenser
Devore, JL (2019). Sannolikhet och statistik (1: a uppl .). Cengage Learning.
MateMobile. (2021, 1 januari). Varians och standardavvikelse för lagrade data | matermobil . https://matemovil.com/varianza-y-desviacion-estandar-para-datos-agrupados-por-intervalos/
Googles tekniska support. (nd). STDEV (STDEV) – Hjälp för Google Docs Editors . Google – Hjälp för Google Dokumentredigerare. https://support.google.com/docs/answer/3094054?hl=sv-419
Superprof. (nd). Standardavvikelse . Matematikordbok | Superprof. https://www.superprof.es/diccionario/matematicas/estadistica/desviacion-estandar.html
TOMi.digital. (nd). Standardavvikelse för grupperade data . https://tomi.digital/en/52202/standard-deviation-for-grouped-data?utm_source=google&utm_medium=seo