Tabla de Contenidos
A sokaság szórása az egyik legfontosabb populációs paraméter az adatok sokaságon belüli változékonyságának vagy szórásának mérésére. Mint a statisztikákban minden paramétert, ezt is egy görög betű jelöli, jelen esetben a σ (szigma) betű. Ez lehetővé teszi, hogy könnyen megkülönböztesse a minta(ok) szórását, amely bár hasonló, de nem ugyanaz, és nem is ugyanazokkal a képletekkel számítják ki.
Ezután egy példán keresztül látni fogjuk, hogyan lehet kiszámítani egy sokaság szórását . Megjegyzendő, hogy a populáció szórásának kiszámításához elengedhetetlen az összes populációs adat ismerete. Ez ritkán fordul elő valós környezetben, de még mindig fontos megérteni, hogyan számítják ki, mivel segít megérteni e fontos paraméter néhány matematikai jellemzőjét.
Populációs szórási képletek
A rendelkezésre álló adatoktól függően a sokaság szórása három különböző képlettel határozható meg.
A sokaság szórásának matematikai meghatározása
A szórást a variancia négyzetgyökeként definiáljuk, σ 2 . Azaz, ha ismerjük a sokaság szórását, akkor a szórást a következő egyenlet segítségével számíthatjuk ki:
Ez az eset ritkán fordul elő, de jó észben tartani.
Egyéb sokaság szórási képletek
Ha egy sokaság szórásának ismerete helyett ismerjük az összes azt alkotó N adatelemet, akkor a sokaság szórását az átlagtól való négyzetes eltérések átlagának négyzetgyökeként számíthatjuk ki. Vagyis:
Ebben az egyenletben x i jelenti a sokaság egyes adatelemeinek értékét, N a sokaság adatelemeinek számát (vagy a sokaság méretét, amely megegyezik), μ pedig a sokaság átlagát. Vegye figyelembe, hogy a sokaság átlagát görög betű is jelöli, mivel ez egy másik populációs paraméter, és a sokaság méretét N (nagybetű) jelöli, hogy megkülönböztesse azt n-től, amelyet általában a minta méretével társítanak .
A populáció átlagát, μ, a következő képlet adja:
A 2. egyenlet kibővíthető, átrendezhető és egyszerűsíthető, hogy megkapjuk:
Abban az esetben, ha a sokaság egyedi adatai nem állnak rendelkezésre, hanem gyakorisági táblázatban vannak csoportosítva, az előző képleteket kis mértékben módosítjuk, így adjuk meg:
A fenti egyenletekben a gyökben lévő mennyiség nem más, mint a populáció varianciája. A 4. egyenletnek megvan az az előnye, hogy kizárólag népességi adatok alapján állapítható meg, nem pedig valamilyen populációs paraméter alapján, mint a 2. és 5. egyenlet esetében.
Példa a sokaság szórásának kiszámítására
Tegyük fel, hogy meg akarjuk határozni egy adott autómodell tömegének ingadozását, amelyre csak 20 példa ismert világszerte. A 20 autó kilogrammban kifejezett tömegének adatait az alábbi táblázat tartalmazza:
410 | 408 | 408 | 405 | 391 | 390 | 402 | 397 | 397 | 395 |
390 | 404 | 397 | 394 | 399 | 397 | 405 | 408 | 410 | 400 |
Mivel tudjuk, hogy ebből a modellből mindössze 20 autó van, ezek a teljes népességet képviselik, így a populáció szórásának meghatározásához minden adatunk megvan . Nézzünk meg három különböző módot ennek a szórásnak a meghatározására.
1. módszer: Számítás a variancia definíciója alapján
Ez a módszer a fent bemutatott 2. egyenlet használatán alapul. Amint látjuk, az egyenlet a sokaság átlagának és egy másik számítási sorozat felhasználását igényli, amelyeket az alábbiakban részletezünk:
1. lépés: Határozza meg a populáció átlagát
A populációs átlagot vagy μ-t a 3. egyenlet segítségével számítjuk ki, összeadjuk az összes adatot, és elosztjuk az adatok teljes számával, ami ebben az esetben 20.
2. lépés: Számítsa ki az átlagtól való eltéréseket
Ez a lépés magában foglalja a kivonások (x i – μ) kiszámítását. Például:
x 1 – μ = 410 – 400,35 kg = 9,65 kg
x 2 – μ = 408 – 400,35 kg = 7,65 kg
x 3 – μ = 408 – 400,35 kg = 7,65 kg
…
X 20 – μ = 400 kg – 400,35 kg = – 0,35
Az eredményeket az alábbi táblázat mutatja be:
x i | x i – μ |
410 | 9.65 |
408 | 7.65 |
408 | 7.65 |
405 | 4.65 |
391 | -9.35 |
390 | -10.35 |
402 | 1.65 |
397 | -3.35 |
397 | -3.35 |
395 | -5.35 |
390 | -10.35 |
404 | 3.65 |
397 | -3.35 |
394 | -6.35 |
399 | -1.35 |
397 | -3.35 |
405 | 4.65 |
408 | 7.65 |
410 | 9.65 |
400 | -0,35 |
3. lépés: Az átlagtól való összes eltérést négyzetre emelje
(x 1 – μ) 2 = (9,65) 2 = 93,1225 kg 2
(x 2 – μ) 2 = (7,65) 2 = 58,5225 kg 2
(x 3 – μ) 2 = (7,65) 2 = 58,5225 kg 2
…
(x 20 – μ) 2 = (– 0,35) 2 = 0,1225 kg 2
Az eredményeket az alábbi táblázat mutatja be:
x i / kg | (x i – μ)/ kg | (x i – μ ) 2 / kg 2 |
410 | 9.65 | 93.1225 |
408 | 7.65 | 58,5225 |
408 | 7.65 | 58,5225 |
405 | 4.65 | 21.6225 |
391 | -9.35 | 87,4225 |
390 | -10.35 | 107.1225 |
402 | 1.65 | 2,7225 |
397 | -3.35 | 11.2225 |
397 | -3.35 | 11.2225 |
395 | -5.35 | 28.6225 |
390 | -10.35 | 107.1225 |
404 | 3.65 | 13.3225 |
397 | -3.35 | 11.2225 |
394 | -6.35 | 40,3225 |
399 | -1.35 | 1,8225 |
397 | -3.35 | 11.2225 |
405 | 4.65 | 21.6225 |
408 | 7.65 | 58,5225 |
410 | 9.65 | 93.1225 |
400 | -0,35 | 0,1225 |
4. lépés: Adja össze az összes négyzetes eltérést
5. lépés: Alkalmazza a 2. egyenlet képletét
Most, hogy megvan ez az összeg, csak le kell cserélni ezt az értéket, valamint az adatok számát, amely 20, a 2. egyenletben:
Így azt kapjuk, hogy a 20 gépkocsi tömegének szórása kb. 6,5 kg.
2. módszer: Az átrendezett egyenlet használata
Most ugyanezt a számítást végezzük el, de a 4-es egyenlet felhasználásával, amely egyenértékű az imént használt egyenlettel, de praktikusabb, különösen, ha nagyobb számú adattal dolgozik. Legfőbb előnye, hogy az eltérések kiszámításához nem kell további paramétert (a sokaság átlagát) számítani, hanem minden az eredeti egyedi adatok alapján történik. Ezenkívül soha nem kell negatív számokkal dolgozni, amelyek nagy hibaforrást jelentenek a diákok körében.
1. lépés: Számítsa ki az egyes adatok négyzetét
Vagyis a következő számításokat hajtják végre:
(x 1 ) 2 = (410) 2 = 168 100 kg 2
(x 2 ) 2 = (408) 2 = 166,464 kg 2
(x 3 ) 2 = (408) 2 = 166,464 kg 2
…
(x 20 ) 2 = (400) 2 = 160 000 kg 2
Az eredményeket az alábbi táblázat mutatja be:
x i | x i 2 |
410 | 168 100 |
408 | 166 464 |
408 | 166 464 |
405 | 164,025 |
391 | 152,881 |
390 | 152 100 |
402 | 161,604 |
397 | 157.609 |
397 | 157.609 |
395 | 156,025 |
390 | 152 100 |
404 | 163,216 |
397 | 157.609 |
394 | 155,236 |
399 | 159,201 |
397 | 157.609 |
405 | 164,025 |
408 | 166 464 |
410 | 168 100 |
400 | 160 000 |
2. lépés: Adja össze az összes egyedi adatot
3. lépés: Adja hozzá az összes négyzetet
4. lépés: Alkalmazza a 4. egyenlet képletét
Az utolsó lépés ennek a két értéknek és a 4. egyenletben szereplő adatok számának bevezetése a sokaság szórásának kiszámításához:
3. módszer: Táblázatok használata
Az olyan táblázatok, mint a Microsoft Excel, az Apple Numbers vagy a Google Sheets, alapvető funkcióik közé tartozik a szórás közvetlen kiszámítása (mind a minta, mind a sokaság). Ezek a függvények egy adatkészletet vesznek fel argumentumként, és végrehajtják az előző módszerben bemutatott összes számítást, hogy közvetlenül visszaadják a szórást abban a cellában, ahol a képletet beírták.
Az eljárás a következő:
1. lépés: Írja be az adatokat a táblázatba
Az adatokat oszlop, sor vagy mátrix formájában bárhol beírhatjuk a táblázatba. A következő képernyőkép azt mutatja, hogy a probléma adatai hogyan néznek ki az Excel 2016-ban.
2. lépés: Használja a képletet a szórás kiszámításához
Az adatok hozzáadása után a szórás függvényt használjuk, argumentumként elhelyezve azokat a cellákat, ahol az adat található.
Ha egy függvényt táblázatban szeretnénk meghívni, akkor általában az egyenlőségjel (=) beírásával kezdjük, majd a használni kívánt függvény nevét. A nevek enyhén változnak egyik alkalmazásról a másikra, és bizonyos esetekben attól függően is változnak, hogy milyen nyelven dolgozik.
Az Excel (spanyol verzió) esetében a sokaság szórását számító függvény neve STDEV.P, míg a Google Sheetsben STDEVP (pont nélkül). Ezután zárójelbe kell írnia a függvény argumentumait. Példánkban argumentumként adjuk át a cellák azon tartományát, amelyben az adatok találhatók (A3-tól J4-ig).
Az ENTER megnyomásával a program futtatja a függvényt és kiszámítja a sokaság szórását, az eredményt a megfelelő cellában megjelenítve, az alábbiak szerint:
Amint látjuk, az itt alkalmazott három módszer bármelyike ugyanazt az eredményt hozza. Csak különböző módokon lehet ugyanazt a dolgot csinálni.
egyéb módszerek
A fent említett három módszer mellett a tudományos és pénzügyi számológépeknek gyakran van olyan funkciója is, amely meghatározza egy adathalmaz szórását, legyen az minta vagy sokaság. Az adatok bevitelének és az eredmények megszerzésének módja gyártónként, sőt számológépenként is eltérő, ezért nem célszerű itt bemutatni ennek konkrét lépéseit.
Ehelyett megvitatjuk a legfontosabb általános lépéseket anélkül, hogy elmélyülnénk bennük. Bárki, aki ezt a funkciót tudományos számológépén szeretné használni, olvassa el a számológéphez mellékelt használati útmutatót, vagy keressen benne online, hogy minden esetben meghatározza a konkrét billentyűkombinációt.
1. lépés: Törölje a memóriát
Sok számológépen a korábban tárolt adatok nem láthatók. Ha másokról adunk meg adatokat, amelyek már el lettek tárolva anélkül, hogy észrevennénk, akkor a számológép rossz eredményt ad. Annak érdekében, hogy ez ne forduljon elő, ajánlatos a számológép teljes memóriáját (vagy legalább a statisztikai elemzési módot) kiüríteni, mielőtt új adatok bevitelét kezdené.
2. lépés: A statisztikai mód elérése
A szórás kiszámítására szolgáló függvények a legtöbb számológépen a „Statisztika”, „Statisztika” vagy egyszerűen „S” üzemmód részét képezik, ezért először ebbe a működési módba kell belépni.
3. lépés: Adja meg az adatokat
Ez számológépenként változik. Egyes esetekben az adatok táblázatos formában adhatók hozzá, míg más esetekben a DT (vagy DAT) gomb megnyomása után egyenként kerül beírásra. Fontos, hogy ellenőrizze a lépés végén beírt adatok számát, hogy megbizonyosodjon arról, hogy egyik sem hiányzik.
4. lépés: Számítsa ki a sokaság szórását
Az adatok megadása után már csak a keresett eredményt kell megkérdezni a kalkulátortól. Sok számológépen mind a minta, mind a sokaság szórását a σ szimbólum jelöli (annak ellenére, hogy a minta eltérése esetén ez hiba). Megkülönböztethetjük azonban a minta eltérését a sokaság eltérésétől, mert a mintaeltérést n-1 kíséri (vagyis σ n-1 -ként jelenik meg ), míg a sokaság eltérése s n -ként jelenik meg . Ez arra utal, hogy a minta szórásának számításakor azt n helyett n-1-gyel osztják, mint a sokaságban.
Hivatkozások
Devore, JL (2019). Valószínűség és statisztika (1. kiadás ). Cengage Learning.
MateMobile. (2021, január 1.). Variancia és szórása bindált adatokhoz | matermobile . https://matemovil.com/varianza-y-desviacion-estandar-para-datos-agrupados-por-intervalos/
Google technikai támogatás. (nd). STDEV (STDEV) – Google Dokumentumok Szerkesztői Súgó . Google – Google Docs Editors Súgó. https://support.google.com/docs/answer/3094054?hl=hu-419
Szuperprof. (nd). Szórás . Matematika szótár | Szuperprof. https://www.superprof.es/diccionario/matematicas/estadistica/desviacion-estandar.html
TOMi.digitális. (nd). Csoportosított adatok standard eltérése . https://tomi.digital/en/52202/standard-deviation-for-grouped-data?utm_source=google&utm_medium=seo