Tabla de Contenidos
Standardafvigelsen, repræsenteret enten ved det græske bogstav σ (sigma) eller ved bogstavet S , er et mål for variabiliteten af en dataserie. Mere præcist repræsenterer det et mål for de gennemsnitlige afvigelser af dataene fra en stikprøve eller en population i forhold til populationsmiddelværdien, hvilket indikerer, hvor spredt dataene er omkring den centrale tendensværdi.
En høj standardafvigelse indikerer, at data i gennemsnit er langt fra middelværdien i begge retninger (dataene er meget spredte), mens en lille standardafvigelse indikerer det modsatte.
Standardafvigelsen beregnes altid som kvadratroden af et andet mål for variabilitet, kaldet variansen. Der er flere måder at beregne variansen på afhængigt af typen af tilgængelige data (stikprøve eller population), hvilket resulterer i mere end én måde at beregne standardafvigelsen på.
I begge tilfælde bruges lidt forskellige formler, som er beskrevet i næste afsnit. Herefter er det beskrevet, hvordan man beregner hver af dem trin for trin og “i hånden”. Den beskriver også, hvordan man bruger lommeregnere med statistiske funktioner og regneark som Excel eller Google Sheets til at beregne denne vigtige statistiske variabel.
Der er to typer standardafvigelse
I statistik er der to slags beskrivende mål for en dataserie, afhængigt af om alle data fra en population eller kun dem fra en stikprøve er tilgængelige. De mål, der bruges til at beskrive befolkningen, kaldes befolkningsparametre og er normalt repræsenteret med græske bogstaver. I mellemtiden kaldes parametrene, der beskriver en prøve, statistik og er normalt repræsenteret med små bogstaver.
I lyset af dette er der to typer standardafvigelse:
- Populationsstandardafvigelsen , som er en populationsparameter repræsenteret ved det græske bogstav σ ( små bogstaver).
- Prøvestandardafvigelsen , som er en statistisk parameter , der er repræsenteret ved bogstavet S.
Nedenfor er formlerne til beregning af begge typer standardafvigelse.
Formler til at beregne populationens standardafvigelse σ
I disse ligninger repræsenterer x i værdien af hvert enkelt dataelement, μ er populationsmiddelværdien, og n er det samlede antal dataelementer i populationen.
Formler til at beregne prøvens standardafvigelse S
I disse ligninger repræsenterer x i værdien af hvert enkelt dataelement i stikprøven, ¯x er prøvegennemsnittet, og n er det samlede antal dataelementer i prøven.
Den eneste reelle forskel i måden, de to standardafvigelser beregnes på, er, at den i det ene tilfælde divideres med n, mens den i det andet er divideret med n – 1 . Sidstnævnte er at korrigere forskellen mellem stikprøvegennemsnittet og populationsgennemsnittet, som normalt ikke er det samme.
Hvilken formel skal bruges?
Det eneste, der skal tages i betragtning ved beslutningen om, hvilken af formlerne, der skal bruges, er, om de data, som standardafvigelsen skal beregnes for, repræsenterer alle data i en population eller kun repræsenterer en stikprøve. Dette fremgår normalt af erklæringen (i tilfælde af, at et statistisk problem løses) eller af den måde, dataene blev indhentet på.
TIP: Når du er i tvivl, er det sikrest at antage, at dette er en stikprøve, da du sjældent har alle data for en population.
Med hensyn til at bruge den første (den til venstre) eller den anden (den til højre) formel for σ eller for S, giver de to viste ligninger i begge tilfælde det samme resultat. Det er dog mere praktisk at bruge formlen til højre, selvom det kan virke mere kompliceret. Årsagen er meget enkel: Der kræves færre trin for at beregne standardafvigelsen med formlerne til højre end med dem til venstre.
Sådan beregnes standardafvigelsen “i hånden”
Nedenfor præsenterer vi de trin, der skal udføres for at beregne standardafvigelsen, ved hjælp af et eksempel til at illustrere processen.
Problem
Den tid, det tog en prøve på 15 biler at fylde brændstoftanken på en tankstation, blev bestemt. Dataene, målt i sekunder, er præsenteret nedenfor:
71 | 65 | 48 | 76 | 80 |
64 | 42 | 55 | 80 | 66 |
53 | 49 | 70 | 67 | 42 |
Bestem standardafvigelsen.
Løsning: i dette tilfælde specificerer sætningen, at dataene svarer til en prøve, så ligningen, vi vil bruge til at bestemme standardafvigelsen (prøven) vil være:
For at anvende denne formel behøver vi kun at beregne summen af dataene (∑X i ), summen af kvadraterne af dataene (∑X i 2 ) og det samlede antal data (n). Dette opnås nemt gennem følgende trin:
Trin 1: Organiser dataene lodret
At beregne standardafvigelsen er nemmere, hvis du har dine data arrangeret i en vertikal liste, da det gør de næste trin nemmere. Det er ikke strengt nødvendigt, men det hjælper også at have hvert dataelement identificeret med et nummer, da det nemt giver det samlede antal dataelementer (n), som er nødvendigt for at formlen kan bruge. Dataene skal ikke bestilles på nogen måde.
# | Xi _ | x i 2 |
1 | 71 | |
2 | 65 | |
3 | 48 | |
4 | 76 | |
5 | 80 | |
6 | 64 | |
7 | 42 | |
8 | 55 | |
9 | 80 | |
10 | 66 | |
elleve | 53 | |
12 | 49 | |
13 | 70 | |
14 | 67 | |
femten | 42 |
Trin 2: Beregn kvadratet af hver data
Det næste trin er at kvadre hvert enkelt dataelement og derefter skrive resultatet i en kolonne ved siden af det.
# | Xi _ | x i 2 |
1 | 71 | 5041 |
2 | 65 | 4225 |
3 | 48 | 2304 |
4 | 76 | 5776 |
5 | 80 | 6400 |
6 | 64 | 4096 |
7 | 42 | 1764 |
8 | 55 | 3025 |
9 | 80 | 6400 |
10 | 66 | 4356 |
elleve | 53 | 2809 |
12 | 49 | 2401 |
13 | 70 | 4900 |
14 | 67 | 4489 |
femten | 42 | 1764 |
Trin 3: Sum alle de originale data
Vi tilføjer alle de værdier, der vises i kolonnen, som vi identificerer som X i , og skriver resultatet ned i slutningen af den kolonne.
Trin 4: Tilføj alle kvadraterne af dataene og skriv resultatet nederst i kolonnen
Vi tilføjer alle de værdier, der vises i kolonnen, som vi identificerer som X i 2 , og skriver resultatet ned i slutningen af den kolonne. Efter at have udført trin 3 og 4, vil tabellen se sådan ud:
# | Xi _ | x i 2 |
1 | 71 | 5041 |
2 | 65 | 4225 |
3 | 48 | 2304 |
4 | 76 | 5776 |
5 | 80 | 6400 |
6 | 64 | 4096 |
7 | 42 | 1764 |
8 | 55 | 3025 |
9 | 80 | 6400 |
10 | 66 | 4356 |
elleve | 53 | 2809 |
12 | 49 | 2401 |
13 | 70 | 4900 |
14 | 67 | 4489 |
femten | 42 | 1764 |
Antal data (n) | Sum af data ( ∑X i ) | Summen af kvadrater ( ∑X i 2 ) |
femten | 928 | 59750 |
Trin 5: Anvend standardafvigelsesformlen
Det sidste trin er simpelthen at erstatte værdierne i slutningen af tabellen i den respektive formel:
Sådan beregnes standardafvigelse med statistisk lommeregner
De fleste videnskabelige og finansielle regnemaskiner har særlige funktioner til at lette beregningen af alle mål for central tendens og spredning, der bruges i statistik. Proceduren, uanset regnemaskinens model, er altid den samme:
Trin 1 – Gå ind i statistiktilstand
Lommeregnere har normalt en speciel tilstand til statistiske funktioner. Det tilgås normalt ved at trykke på MODE- knappen efterfulgt af et tal, der normalt vises på skærmen ved siden af STAT , SD (for standardafvigelse ) eller noget lignende.
Trin 2 – Ryd op i hukommelsen
På ældre lommeregnere vises det ikke, om der allerede er data gemt i lommeregnerens hukommelse, så det er altid en god idé at rydde hukommelsen, inden du begynder. For at gøre dette skal du trykke på CLR- eller MCL- tasten og derefter vælge MODE- indstillingen (dette sletter kun de data, der er gemt i statistiktilstanden). I mange tilfælde er det nødvendigt at gå ind i statistiktilstand igen efter dette trin.
Trin 3: Indtast alle data
Alle data indtastes sekventielt, én efter én, ved at trykke på DT , DATA- tasten eller lignende imellem.
Trin 4: få resultatet
Det sidste trin er blot at spørge lommeregneren om standardafvigelsen. Hvor resultaterne er placeret varierer meget mellem modeller og mærker af regnemaskiner. I nogle skal du trykke på SHIFT- tasten efterfulgt af tasten, der siger S-VAR ovenfor , i andre er det anderledes. Det er tilrådeligt at se manualen til lommeregneren.
Når vi har fået den rigtige menu, skal vi vælge hvilken af de to standardafvigelser vi skal bruge. Hvis det er befolkningsdata, vælger vi den mulighed, der siger σ eller σ(n). Hvis det er prøvedata, vælger vi den mulighed, der siger σ(n-1) eller S.
Sådan beregnes standardafvigelse i Microsoft® Excel™
Den nemmeste måde at beregne standardafvigelsen på er gennem regneark som Excel eller Google Sheets. Disse programmer har allerede alle protokollerne til at beregne de forskellige statistiske variabler, som vi muligvis har brug for. Dette gøres i to enkle trin:
Trin 1: Indsæt eller tilføj dataene
Dette er så simpelt som at kopiere dataene direkte, én efter én til separate celler (i form af kolonner, rækker eller matricer, det er lige meget hvad). I tilfældet med vores eksempel:
TRIN 2: Skriv formlen for den standardafvigelse, vi skal bruge
Dette afhænger af det anvendte regneark og det sprog, det er indstillet til. I tilfælde af Microsoft® Excel™, spansk version, er formlerne for standardafvigelsen:
Eksempel på standardafvigelse (S): | =STDEV.M(data 1; data 2;…;data n) |
Populationsstandardafvigelse (σ): | =STDEV.P(data 1; data 2;…;data n) |
Du behøver ikke indtaste de enkelte data, du skal blot vælge de celler, som dataene allerede er indsat i. I vores eksempel er dataene i området fra celle B1 til celle F3, som er skrevet som B2:F3.
Til sidst trykkes ENTER- tasten ned og KLAR! Standardafvigelsen opnås.
Referencer
- Bhandari, P. (2021, 21. januar). Forståelse og beregning af standardafvigelse . Hentet fra https://www.scribbr.com/statistics/standard-deviation/
- Espinoza, CI, & Echecopar, AL (2020). Statistiske applikationer ved hjælp af MS Excel med trinvise eksempler (spansk udgave) (1. udg .). Lima, Peru: Luis Felipe Arizmendi Echecopar og Duo Negocios SAC.
- Webster, A. (2001). Statistik anvendt på erhvervslivet og økonomien (spansk udgave) . Toronto, Canada: Irwin Professional Publishing.
- DEVESTA (DEVESTA-funktion) . Microsoft Office support. Hentet fra https://support.microsoft.com/es-es/office/desvesta-funci%C3%B3n-desvesta-5ff38888-7ea5-48de-9a6d-11ed73b29e9d .