Tabla de Contenidos
A variancia és a szórás két nagy jelentőségű fogalom, mind a statisztikában, mind a tudomány és a műszaki tudomány minden ágában. Mindkettő a diszperzió mértéke egy központi értékhez képest, de attól függően, hogy milyen kontextusban használják őket, különböző módon definiálhatók.
A statisztika és a valószínűség területén a variancia és a szórás azt mérik, hogy egy valószínűségi változó értékei (majdnem mindig X betűvel jellemezve) mennyire térnek el a középértéküktől.
Ha azonban ezeket a kifejezéseket a tudományban vagy a mérnöki területen használják, a variancia és a szórás egy adatsor szórására vonatkozik, akár egy teljes sokaságra, akár egy mintára, a sokaság vagy a minta átlaga körül. Ugyanazon mérőműszerrel végzett ismétlődő mérések sorozatának szórását is gyakran használják arra, hogy képet adjunk az adott műszer pontossági szintjéről.
Az első esetben a variancia és a szórás egy valószínűségi változó variabilitását, míg a második esetben a kísérleti adatok szórását mérik. Mindkét esetben a nulla szórása vagy szórása azt jelzi, hogy egyáltalán nem változik (a valószínűségi változó valójában állandó, vagy az adatok teljesen azonosak), míg a magas érték az ellenkezőjét jelzi.
Ez a két kifejezés szorosan összefügg, és néha összetéveszthető egymással, azonban vannak kulcsfontosságú különbségek a kettő között, amelyekre azonnal rátérünk.
A variancia és a szórás közötti különbségek
1. Különböző definícióik vannak
Az első különbség e két statisztikai kifejezés között a definíciójuk:
A variancia definíciója
A statisztikában a variancia a valószínűségi változó értéke és az átlagértéke közötti különbség négyzetének várható értéke.
Matematikailag ez így van leírva:
Kicsit kevésbé formális módon egy adatsor (populáció vagy minta) egyedi adatai és átlagértéke közötti különbségek négyzeteinek átlagaként is definiálható.
Szórás definíció
Függetlenül attól, hogy milyen környezetben használják, a szórást, más néven szórást a variancia pozitív négyzetgyökeként határozzuk meg.
Matematikailag ez így van leírva:
2. Különböző szimbólumokkal vannak ábrázolva
A szórást és a szórást különböző módon ábrázolják mind a statisztikai szövegekben, mind a képletekben és egyenletekben:
Variancia:
- σ 2 , ha a populációs varianciára hivatkozunk
- S 2 a minta varianciájára hivatkozva
- Var(X), amikor egy valószínűségi változó, ebben az esetben X, varianciájára hivatkozunk.
Szórás:
- σ a sokaság szórására hivatkozva
- S ha a minta szórására hivatkozunk
- SD(X), amikor egy valószínűségi változó szórására hivatkozunk, ebben az esetben X.
3. Különböző képletekkel rendelkeznek
Mind a variancia, mind a szórás esetében két képlet létezik, attól függően, hogy az adatsor, amelyre a variancia vagy a szórás számít, egy sokaságból vagy egy mintából származó adatok.
Populációs variancia képlet (σ 2 )
A populációs variancia két képletében a μ a sokaság átlagát, X i az i-edik populáció adatértékét, N pedig a sokaság méretét vagy az adatpontok teljes számát jelenti.
Minta varianciaképlet (S 2 )
Itt az x-bar a mintaadatok átlagát (mintaátlagot), az x i az i-edik mintaadatok értékét, az n pedig a mintában lévő adatok méretét vagy teljes számát jelenti.
Populációs szórás képlete (σ)
A szórás esetében háromféleképpen számítható ki:
Minta szórási képlet(ek)
Itt is a három különböző mód egyike használható:
Az utolsó két képletre vonatkozóan megjegyzést kell tenni. Gyakori, hogy a szórás kiszámításakor először a szórást számítják ki, majd a négyzetgyököt veszik. A szórást ritkán határozzuk meg az utóbbi egyenletekkel anélkül, hogy először kiszámolnánk a szórást, így az előbbi szinte mindig megelőzi az utóbbit.
4. Különböző egységeik vannak
Mind a variancia, mind a szórás mértékegységei függenek az adatok vagy a valószínűségi változó jellegétől és mértékegységeitől, amelyre vonatkoznak, azonban az egységek minden esetben eltérőek.
A szórásnak ugyanazok az egységei, mint az eredeti adatoknak vagy a valószínűségi változónak, míg a variancia ezekben az egységekben négyzetes.
Példa:
Ha egy adott oktatási intézmény 8. osztályos tanulóinak mintájának kilogrammban (kg) kifejezett súlyának adataival rendelkezünk, akkor az adatok szórása kg 2, míg a szórása kg-ban lesz megadva .
5. Értelmezésükben különböznek
Mind a variancia, mind a szórás esetében az értelmezés megegyezik a már említettel: ha nullát érnek, akkor nincs szóródás, és minden adat pontosan egyenlő egymással; ha kis értékek, akkor kicsi lesz a szóródás, ha pedig nagyok, akkor sok lesz a szóródás.
Azonban, ha megértjük, mit jelent nagy vagy kicsi értéknek lenni, a szórásértékek sokkal könnyebben értelmezhetők, mint a varianciaértékek, mivel az adatokkal azonos egységekben vannak. Ez szórások esetén nem ilyen egyszerű.
6. Különböznek a szélsőséges értékekre való érzékenységükben
A diszperzió mértékeként mind a variancia, mind a szórás érzékeny a szélsőséges értékekre (akár nagyon magas, akár nagyon alacsony). Ez azt jelenti, hogy ha olyan adatsort írunk le, amelyben az összes adat nagyon hasonló, kivéve egyet, amely sokkal nagyobb vagy kisebb, mint a többi, sem a szórás, sem a szórás nem fogja jól reprezentálni az adatok terjedését (mindkettő nagy értékeket ad annak ellenére, hogy az adatok túlnyomó többsége nagyon csekély szórást mutat).
Ha azonban a szórást a szórással hasonlítjuk össze, a szórás sokkal érzékenyebb ezekre a kiugró értékekre, mivel minden eltérés négyzetes, míg a szórás nem.
7. Matematikai tulajdonságaikban különböznek
Az utolsó különbség, amelyet megvizsgálunk, valójában több, sokkal mélyebb különbséget is magában foglal, amelyek elsősorban a statisztikusok (vagy a statisztikát tanulmányozók) számára fontosak.
Mivel a matematikai függvények, a variancia és a szórás különbözik az adatok állandóval való szorzásának, az állandók összeadásának, a valószínűségi változók összeadásának, a hatványozásnak stb.
Ezek a különbségek azonban kívül esnek e cikk hatókörén.
Variancia és szórás számítási példa
Tegyük fel, hogy egy helyi termelőtől származó 12 bikából álló mintát mértek le. A súlyok kilogrammban az alábbiakban láthatók:
507 | 497 | 510 | 508 | 491 | 510 |
500 | 509 | 496 | 491 | 505 | 503 |
Meg kell határoznia ennek a mintának a szórását és szórását.
MEGOLDÁS
Ahogy fentebb említettük, adatsorok esetén célszerű először a szórást, majd a szórást meghatározni.
A minta variancia kiszámítása (S 2 )
A második minta varianciaképletet fogjuk használni, mivel az praktikusabb. Ehhez a következő lépéseket kell végrehajtani:
- 1. lépés: Függőleges lista készül az összes adatból
- 2. lépés: Kiszámolja az egyes adatok négyzetét, és egy új oszlopba írja mellé.
- 3. lépés: Az összes adatot hozzáadja, és az eredményt rögzíti az első oszlop végén.
- 4. lépés: Adja össze az összes négyzetet, és írja le az eredményt a második oszlop aljára.
Ezt az első 5 lépést a következő táblázat foglalja össze:
X i | x i 2 |
500 | 250 000 |
509 | 259081 |
496 | 246016 |
491 | 241081 |
505 | 255025 |
503 | 253009 |
507 | 257049 |
497 | 247009 |
510 | 260100 |
508 | 258064 |
491 | 241081 |
510 | 260100 |
∑Xi_ _ | ∑X i 2 |
6027 | 3027615 |
- 5. lépés: Az eltérés kiszámításához a képletet használják:
Tehát a minta szórása megközelítőleg S 2 = 50 kg 2 .
A minta szórásának (S) kiszámítása
Most, hogy megvan a szórás, a szórás kiszámítása olyan egyszerű, mint az első négyzetgyökének felvétele:
Mint látható, a 7 kilós szórás összehasonlítása a bikák átlagos súlyával (külön számolva 502,25 kg) arra enged következtetni, hogy ennek a mintának a szórása alacsony, mivel ez csak a bikák átlagos súlyának 1,4%-a.
Hivatkozások
Espinoza, CI és Echecopar, AL (2020). Statisztikai alkalmazások MS Excel használatával lépésről lépésre példákkal (spanyol kiadás) (1. kiadás ). Lima, Peru: Luis Felipe Arizmendi Echecopar és Duo Negocios SAC.
Investopedia. (2021, április 16.). Ismerje meg, hogyan határozható meg a szórás a variancia használatával. Letöltve 2021. július 24-én a https://www.investopedia.com/ask/answers/021215/what-difference-between-standard-deviation-and-variance.asp webhelyről
Lopez, JF (2017. november 18.). Variancia . Letöltve: https://economipedia.com/definiciones/varianza.html
Nemzeti Szabványügyi és Technológiai Intézet. (nd). A bizonytalanság alapvető definíciói. Letöltve 2021. július 24-én, innen: https://physics.nist.gov/cuu/Uncertainty/basic.html
Webster, A. (2001). Vállalkozásra és gazdaságra vonatkozó statisztikák (spanyol kiadás) . Toronto, Kanada: Irwin Professional Publishing.