Lær at beregne standardafvigelsen

Artículo revisado y aprobado por nuestro equipo editorial, siguiendo los criterios de redacción y edición de YuBrain.


Standardafvigelsen, repræsenteret enten ved det græske bogstav σ (sigma) eller ved bogstavet S , er et mål for variabiliteten af ​​en dataserie. Mere præcist repræsenterer det et mål for de gennemsnitlige afvigelser af dataene fra en stikprøve eller en population i forhold til populationsmiddelværdien, hvilket indikerer, hvor spredt dataene er omkring den centrale tendensværdi.

En høj standardafvigelse indikerer, at data i gennemsnit er langt fra middelværdien i begge retninger (dataene er meget spredte), mens en lille standardafvigelse indikerer det modsatte.

Standardafvigelsen beregnes altid som kvadratroden af ​​et andet mål for variabilitet, kaldet variansen. Der er flere måder at beregne variansen på afhængigt af typen af ​​tilgængelige data (stikprøve eller population), hvilket resulterer i mere end én måde at beregne standardafvigelsen på.

I begge tilfælde bruges lidt forskellige formler, som er beskrevet i næste afsnit. Herefter er det beskrevet, hvordan man beregner hver af dem trin for trin og “i hånden”. Den beskriver også, hvordan man bruger lommeregnere med statistiske funktioner og regneark som Excel eller Google Sheets til at beregne denne vigtige statistiske variabel.

Der er to typer standardafvigelse

I statistik er der to slags beskrivende mål for en dataserie, afhængigt af om alle data fra en population eller kun dem fra en stikprøve er tilgængelige. De mål, der bruges til at beskrive befolkningen, kaldes befolkningsparametre og er normalt repræsenteret med græske bogstaver. I mellemtiden kaldes parametrene, der beskriver en prøve, statistik og er normalt repræsenteret med små bogstaver.

I lyset af dette er der to typer standardafvigelse:

  • Populationsstandardafvigelsen , som er en populationsparameter repræsenteret ved det græske bogstav σ ( små bogstaver).
  • Prøvestandardafvigelsen , som er en statistisk parameter , der er repræsenteret ved bogstavet S.

Nedenfor er formlerne til beregning af begge typer standardafvigelse.

Formler til at beregne populationens standardafvigelse σ

Formel til at beregne populationens standardafvigelse

I disse ligninger repræsenterer x i værdien af ​​hvert enkelt dataelement, μ er populationsmiddelværdien, og n er det samlede antal dataelementer i populationen.

Formler til at beregne prøvens standardafvigelse S

Formel til at beregne prøvens standardafvigelse

I disse ligninger repræsenterer x i værdien af ​​hvert enkelt dataelement i stikprøven, ¯x er prøvegennemsnittet, og n er det samlede antal dataelementer i prøven.

Den eneste reelle forskel i måden, de to standardafvigelser beregnes på, er, at den i det ene tilfælde divideres med n, mens den i det andet er divideret med n – 1 . Sidstnævnte er at korrigere forskellen mellem stikprøvegennemsnittet og populationsgennemsnittet, som normalt ikke er det samme.

Hvilken formel skal bruges?

Det eneste, der skal tages i betragtning ved beslutningen om, hvilken af ​​formlerne, der skal bruges, er, om de data, som standardafvigelsen skal beregnes for, repræsenterer alle data i en population eller kun repræsenterer en stikprøve. Dette fremgår normalt af erklæringen (i tilfælde af, at et statistisk problem løses) eller af den måde, dataene blev indhentet på.

TIP: Når du er i tvivl, er det sikrest at antage, at dette er en stikprøve, da du sjældent har alle data for en population.

Med hensyn til at bruge den første (den til venstre) eller den anden (den til højre) formel for σ eller for S, giver de to viste ligninger i begge tilfælde det samme resultat. Det er dog mere praktisk at bruge formlen til højre, selvom det kan virke mere kompliceret. Årsagen er meget enkel: Der kræves færre trin for at beregne standardafvigelsen med formlerne til højre end med dem til venstre.

Sådan beregnes standardafvigelsen “i hånden”

Nedenfor præsenterer vi de trin, der skal udføres for at beregne standardafvigelsen, ved hjælp af et eksempel til at illustrere processen.

Problem

Den tid, det tog en prøve på 15 biler at fylde brændstoftanken på en tankstation, blev bestemt. Dataene, målt i sekunder, er præsenteret nedenfor:

71 65 48 76 80
64 42 55 80 66
53 49 70 67 42

Bestem standardafvigelsen.

Løsning: i dette tilfælde specificerer sætningen, at dataene svarer til en prøve, så ligningen, vi vil bruge til at bestemme standardafvigelsen (prøven) vil være:

Eksempel på formel 1 til at beregne prøvens standardafvigelse

For at anvende denne formel behøver vi kun at beregne summen af ​​dataene (∑X i ), summen af ​​kvadraterne af dataene (∑X i 2 ) og det samlede antal data (n). Dette opnås nemt gennem følgende trin:

Trin 1: Organiser dataene lodret

At beregne standardafvigelsen er nemmere, hvis du har dine data arrangeret i en vertikal liste, da det gør de næste trin nemmere. Det er ikke strengt nødvendigt, men det hjælper også at have hvert dataelement identificeret med et nummer, da det nemt giver det samlede antal dataelementer (n), som er nødvendigt for at formlen kan bruge. Dataene skal ikke bestilles på nogen måde.

# Xi _ x i 2
1 71  
2 65  
3 48  
4 76  
5 80  
6 64  
7 42  
8 55  
9 80  
10 66  
elleve 53  
12 49  
13 70  
14 67  
femten 42  

Trin 2: Beregn kvadratet af hver data

Det næste trin er at kvadre hvert enkelt dataelement og derefter skrive resultatet i en kolonne ved siden af ​​det.

# Xi _ x i 2
1 71 5041
2 65 4225
3 48 2304
4 76 5776
5 80 6400
6 64 4096
7 42 1764
8 55 3025
9 80 6400
10 66 4356
elleve 53 2809
12 49 2401
13 70 4900
14 67 4489
femten 42 1764

Trin 3: Sum alle de originale data

Vi tilføjer alle de værdier, der vises i kolonnen, som vi identificerer som X i , og skriver resultatet ned i slutningen af ​​den kolonne.

Trin 4: Tilføj alle kvadraterne af dataene og skriv resultatet nederst i kolonnen

Vi tilføjer alle de værdier, der vises i kolonnen, som vi identificerer som X i 2 , og skriver resultatet ned i slutningen af ​​den kolonne. Efter at have udført trin 3 og 4, vil tabellen se sådan ud:

# Xi _ x i 2
1 71 5041
2 65 4225
3 48 2304
4 76 5776
5 80 6400
6 64 4096
7 42 1764
8 55 3025
9 80 6400
10 66 4356
elleve 53 2809
12 49 2401
13 70 4900
14 67 4489
femten 42 1764
Antal data (n) Sum af data ( ∑X i ) Summen af ​​kvadrater ( ∑X i 2 )
femten 928 59750

Trin 5: Anvend standardafvigelsesformlen

Det sidste trin er simpelthen at erstatte værdierne i slutningen af ​​tabellen i den respektive formel:

Erstat værdier i formlen for at beregne standardafvigelsen

Resultat af håndberegning af standardafvigelsen

Sådan beregnes standardafvigelse med statistisk lommeregner

De fleste videnskabelige og finansielle regnemaskiner har særlige funktioner til at lette beregningen af ​​alle mål for central tendens og spredning, der bruges i statistik. Proceduren, uanset regnemaskinens model, er altid den samme:

Trin 1 – Gå ind i statistiktilstand

Lommeregnere har normalt en speciel tilstand til statistiske funktioner. Det tilgås normalt ved at trykke på MODE- knappen efterfulgt af et tal, der normalt vises på skærmen ved siden af ​​STAT , SD (for standardafvigelse ) eller noget lignende.

Trin 2 – Ryd op i hukommelsen

På ældre lommeregnere vises det ikke, om der allerede er data gemt i lommeregnerens hukommelse, så det er altid en god idé at rydde hukommelsen, inden du begynder. For at gøre dette skal du trykke på CLR- eller MCL- tasten og derefter vælge MODE- indstillingen (dette sletter kun de data, der er gemt i statistiktilstanden). I mange tilfælde er det nødvendigt at gå ind i statistiktilstand igen efter dette trin.

Trin 3: Indtast alle data

Alle data indtastes sekventielt, én efter én, ved at trykke på DT , DATA- tasten eller lignende imellem.

Trin 4: få resultatet

Det sidste trin er blot at spørge lommeregneren om standardafvigelsen. Hvor resultaterne er placeret varierer meget mellem modeller og mærker af regnemaskiner. I nogle skal du trykke på SHIFT- tasten efterfulgt af tasten, der siger S-VAR ovenfor , i andre er det anderledes. Det er tilrådeligt at se manualen til lommeregneren.

Når vi har fået den rigtige menu, skal vi vælge hvilken af ​​de to standardafvigelser vi skal bruge. Hvis det er befolkningsdata, vælger vi den mulighed, der siger σ eller σ(n). Hvis det er prøvedata, vælger vi den mulighed, der siger σ(n-1) eller S.

Sådan beregnes standardafvigelse i Microsoft® Excel™

Den nemmeste måde at beregne standardafvigelsen på er gennem regneark som Excel eller Google Sheets. Disse programmer har allerede alle protokollerne til at beregne de forskellige statistiske variabler, som vi muligvis har brug for. Dette gøres i to enkle trin:

Trin 1: Indsæt eller tilføj dataene

Dette er så simpelt som at kopiere dataene direkte, én efter én til separate celler (i form af kolonner, rækker eller matricer, det er lige meget hvad). I tilfældet med vores eksempel:

Sådan beregnes standardafvigelsen i regneark som Excel

TRIN 2: Skriv formlen for den standardafvigelse, vi skal bruge

Dette afhænger af det anvendte regneark og det sprog, det er indstillet til. I tilfælde af Microsoft® Excel™, spansk version, er formlerne for standardafvigelsen:

Eksempel på standardafvigelse (S): =STDEV.M(data 1; data 2;…;data n)
Populationsstandardafvigelse (σ): =STDEV.P(data 1; data 2;…;data n)

Du behøver ikke indtaste de enkelte data, du skal blot vælge de celler, som dataene allerede er indsat i. I vores eksempel er dataene i området fra celle B1 til celle F3, som er skrevet som B2:F3.

Sådan beregnes standardafvigelsen i regneark som Excel - Trin 2

Til sidst trykkes ENTER- tasten ned og KLAR! Standardafvigelsen opnås.

Referencer

  • Espinoza, CI, & Echecopar, AL (2020). Statistiske applikationer ved hjælp af MS Excel med trinvise eksempler (spansk udgave) (1. udg .). Lima, Peru: Luis Felipe Arizmendi Echecopar og Duo Negocios SAC.
-Reklame-

Israel Parada (Licentiate,Professor ULA)
Israel Parada (Licentiate,Professor ULA)
(Licenciado en Química) - AUTOR. Profesor universitario de Química. Divulgador científico.

Artículos relacionados

Hvad betyder LD50?

hvad er borax