Tabla de Contenidos
I en stor uppsättning data, för att ta reda på i vilken utsträckning det finns variationer i förhållande till ett medelvärde, är det bäst att använda den genomsnittliga absoluta avvikelsen och standardavvikelsen . Standardavvikelsen är måttet på spridningen av resultaten i en datamängd. För att hitta den totala variationen i vår datamängd lägger vi helt enkelt till avvikelsen för varje poäng från medelvärdet.
Medelavvikelsen för en poäng kan beräknas genom att dividera den totala (totala variationen av datamängden) med antalet poäng . Den absoluta avvikelsen och standardavvikelsen är spridningsmått som gör det möjligt att, beroende på vilket mått som används, härleda variationen av en poäng i förhållande till medelvärdet.
Absolut avvikelse och betyder absolut avvikelse
Det enklaste sättet att beräkna avvikelsen för en poäng från medelvärdet är att ta var och en av poängen och hitta medelvärdet. Som ett exempel kommer vi att arbeta med medelpoängen för en grupp på 100 elever som visas i följande tabell.
Medelpoängen för denna grupp på 100 elever är 58,75 av 100. Med exemplet med eleven med 60 av 100 poäng är avvikelsen för denna poäng från medelvärdet 1,25. Detta värde är resultatet av att subtrahera elevens poäng, som är 60, från medelvärdet, som är 58,78. Det är viktigt att notera att poäng över medelvärdet har positiva avvikelser, medan poäng under medelvärdet kommer att ha negativa avvikelser.
Å andra sidan, om vi har positiva och negativa tecken, genom att lägga till alla dessa avvikelser skulle de ta bort, vilket ger oss en total avvikelse på noll. Om, till exempel, vårt intresse är fokuserat på att veta vad avvikelsen för en poäng är, men inte inom vilket intervall medelvärdet är, så kan vi helt enkelt avstå från minustecknet och fokusera vår uppmärksamhet på värdet som skulle ge oss absolut avvikelse.
Om vi adderar alla dessa absoluta avvikelser och dividerar dem med det totala antalet poäng får vi den genomsnittliga absoluta avvikelsen . Därför, för våra 100 elever i det här exemplet, är den genomsnittliga absoluta skillnaden 12,81. Formeln för att få det är följande:
Var:
- MAD = genomsnittlig absolut avvikelse
- ∑ = summan av.
- X= prov (poängen för detta exempel).
- µ= medelvärde
- N = antal värden.
Så:
- DMA = 1281/100
- DMA = 12,81
Standardavvikelse
Standardavvikelsen är ett mått på spridningen av resultat i en datamängd. I allmänhet används detta mått för att ta reda på variabiliteten hos populationen för de data som mäts. Men eftersom vi ofta bara presenteras med data från ett urval, kan vi uppskatta populationens standardavvikelse från urvalets standardavvikelse. Dessa två standardavvikelser, det vill säga provets standardavvikelse och populationens standardavvikelse, beräknas olika.
Urval eller populationsstandardavvikelse när ska man använda varje?
Normalt är vi intresserade av att veta standardavvikelsen för befolkningen eftersom vår befolkning innehåller alla värden vi behöver. Därför skulle vi beräkna populationens standardavvikelse om vi har hela populationen, eller om vi har ett urval från en större population men bara är intresserade av det urvalet och inte vill generalisera våra resultat till hela populationen.
Standardavvikelsen är dock inte undantagen från att kunna ge prover som vi kan generalisera en population med. Därför, om du bara har ett urval men vill göra ett uttalande om standardavvikelsen för populationen från vilken det togs, bör du använda urvalets standardavvikelse. Det kan ofta uppstå förvirring om vilken standardavvikelse som ska användas, eftersom namnet ”prov”-standardavvikelse felaktigt tolkas som standardavvikelsen för själva urvalet snarare än som en uppskattning av standardavvikelsen för en population som tas som provbas.
Formeln för provets standardavvikelse är följande:
Var:
- s = standardavvikelsen för provet.
- ∑ = summan av.
- X= prov.
- x¯ = provmedelvärde.
- n = antal poäng i urvalet.
Vad ska man tänka på när man beräknar standardavvikelsen
Till att börja med är det viktigt att tänka på att standardavvikelsen är ett spridningsmått som används, tillsammans med medelvärdet, för att reducera kontinuerliga data, men inte kategoriska data. På samma sätt är det endast lämpligt att använda dessa former av datakvantifiering när det finns säkerhet om att den kontinuerliga datan varken har värden utanför det typiska eller fördomar i en högre procentandel.
Sammanfattningsvis beräknas medelavvikelsen eller genomsnittlig absolut avvikelse på ett liknande sätt som standardavvikelsen, men använder absoluta värden. Detta görs för att undvika problemet med negativa skillnader mellan datapunkter och deras medel. I praktiken innebär absolut värde att vi måste ta bort eventuella negativa tecken framför ett tal och behandla alla tal som positiva (eller noll).
Källor
- Castillo, O. (2009). Tillämpad statistik . Spridningsåtgärder .
- Flatiron skola. (2015). Spridningsmått .
- Lopez, J. (2017). Standard eller typisk avvikelse . Economipedia.com
- Mendizabal, M (2017). Hur beräknas den absoluta avvikelsen ?