Mi a különbség a variancia és a szórás között?

Artículo revisado y aprobado por nuestro equipo editorial, siguiendo los criterios de redacción y edición de YuBrain.

A variancia és a szórás két nagy jelentőségű fogalom, mind a statisztikában, mind a tudomány és a műszaki tudomány minden ágában. Mindkettő a diszperzió mértéke egy központi értékhez képest, de attól függően, hogy milyen kontextusban használják őket, különböző módon definiálhatók.

A statisztika és a valószínűség területén a variancia és a szórás azt mérik, hogy egy valószínűségi változó értékei (majdnem mindig X betűvel jellemezve) mennyire térnek el a középértéküktől.

Ha azonban ezeket a kifejezéseket a tudományban vagy a mérnöki területen használják, a variancia és a szórás egy adatsor szórására vonatkozik, akár egy teljes sokaságra, akár egy mintára, a sokaság vagy a minta átlaga körül. Ugyanazon mérőműszerrel végzett ismétlődő mérések sorozatának szórását is gyakran használják arra, hogy képet adjunk az adott műszer pontossági szintjéről.

Az ismétlődő mérések sorozatának szórása képet ad a mérőműszer pontossági szintjéről.

Az első esetben a variancia és a szórás egy valószínűségi változó variabilitását, míg a második esetben a kísérleti adatok szórását mérik. Mindkét esetben a nulla szórása vagy szórása azt jelzi, hogy egyáltalán nem változik (a valószínűségi változó valójában állandó, vagy az adatok teljesen azonosak), míg a magas érték az ellenkezőjét jelzi.

Ez a két kifejezés szorosan összefügg, és néha összetéveszthető egymással, azonban vannak kulcsfontosságú különbségek a kettő között, amelyekre azonnal rátérünk.

A variancia és a szórás közötti különbségek

1. Különböző definícióik vannak

Az első különbség e két statisztikai kifejezés között a definíciójuk:

A variancia definíciója

A statisztikában a variancia a valószínűségi változó értéke és az átlagértéke közötti különbség négyzetének várható értéke.

Matematikailag ez így van leírva:

A variancia statisztikai meghatározása

Kicsit kevésbé formális módon egy adatsor (populáció vagy minta) egyedi adatai és átlagértéke közötti különbségek négyzeteinek átlagaként is definiálható.

Szórás definíció

Függetlenül attól, hogy milyen környezetben használják, a szórást, más néven szórást a variancia pozitív négyzetgyökeként határozzuk meg.

Matematikailag ez így van leírva:

A szórás statisztikai meghatározása.

2. Különböző szimbólumokkal vannak ábrázolva

A szórást és a szórást különböző módon ábrázolják mind a statisztikai szövegekben, mind a képletekben és egyenletekben:

Variancia:

  • σ 2 , ha a populációs varianciára hivatkozunk
  • S 2 a minta varianciájára hivatkozva
  • Var(X), amikor egy valószínűségi változó, ebben az esetben X, varianciájára hivatkozunk.

Szórás:

  • σ a sokaság szórására hivatkozva
  • S ha a minta szórására hivatkozunk
  • SD(X), amikor egy valószínűségi változó szórására hivatkozunk, ebben az esetben X.

3. Különböző képletekkel rendelkeznek

Mind a variancia, mind a szórás esetében két képlet létezik, attól függően, hogy az adatsor, amelyre a variancia vagy a szórás számít, egy sokaságból vagy egy mintából származó adatok.

Populációs variancia képlet (σ 2 )

Képletek a varianciapopuláció varianciájához

A populációs variancia két képletében a μ a sokaság átlagát, X i az i-edik populáció adatértékét, N pedig a sokaság méretét vagy az adatpontok teljes számát jelenti.

Minta varianciaképlet (S 2 )

képletek a minta szórására

Itt az x-bar a mintaadatok átlagát (mintaátlagot), az x i az i-edik mintaadatok értékét, az n pedig a mintában lévő adatok méretét vagy teljes számát jelenti.

Populációs szórás képlete (σ)

A szórás esetében háromféleképpen számítható ki:

A sokaság szórásának képlete.

Egy másik képlet a sokaság szórására

A sokaság szórásának gyakorlati képlete.

Minta szórási képlet(ek)

Itt is a három különböző mód egyike használható:

A minta szórásának képlete.

Egy másik képlet a minta szórására.

A minta szórásának gyakorlati képlete.

Az utolsó két képletre vonatkozóan megjegyzést kell tenni. Gyakori, hogy a szórás kiszámításakor először a szórást számítják ki, majd a négyzetgyököt veszik. A szórást ritkán határozzuk meg az utóbbi egyenletekkel anélkül, hogy először kiszámolnánk a szórást, így az előbbi szinte mindig megelőzi az utóbbit.

4. Különböző egységeik vannak

Mind a variancia, mind a szórás mértékegységei függenek az adatok vagy a valószínűségi változó jellegétől és mértékegységeitől, amelyre vonatkoznak, azonban az egységek minden esetben eltérőek.

A szórásnak ugyanazok az egységei, mint az eredeti adatoknak vagy a valószínűségi változónak, míg a variancia ezekben az egységekben négyzetes.

Példa:

Ha egy adott oktatási intézmény 8. osztályos tanulóinak mintájának kilogrammban (kg) kifejezett súlyának adataival rendelkezünk, akkor az adatok szórása kg 2, míg a szórása kg-ban lesz megadva .

5. Értelmezésükben különböznek

Mind a variancia, mind a szórás esetében az értelmezés megegyezik a már említettel: ha nullát érnek, akkor nincs szóródás, és minden adat pontosan egyenlő egymással; ha kis értékek, akkor kicsi lesz a szóródás, ha pedig nagyok, akkor sok lesz a szóródás.

variancia és szórás értelmezése.

Azonban, ha megértjük, mit jelent nagy vagy kicsi értéknek lenni, a szórásértékek sokkal könnyebben értelmezhetők, mint a varianciaértékek, mivel az adatokkal azonos egységekben vannak. Ez szórások esetén nem ilyen egyszerű.

6. Különböznek a szélsőséges értékekre való érzékenységükben

A diszperzió mértékeként mind a variancia, mind a szórás érzékeny a szélsőséges értékekre (akár nagyon magas, akár nagyon alacsony). Ez azt jelenti, hogy ha olyan adatsort írunk le, amelyben az összes adat nagyon hasonló, kivéve egyet, amely sokkal nagyobb vagy kisebb, mint a többi, sem a szórás, sem a szórás nem fogja jól reprezentálni az adatok terjedését (mindkettő nagy értékeket ad annak ellenére, hogy az adatok túlnyomó többsége nagyon csekély szórást mutat).

Ha azonban a szórást a szórással hasonlítjuk össze, a szórás sokkal érzékenyebb ezekre a kiugró értékekre, mivel minden eltérés négyzetes, míg a szórás nem.

7. Matematikai tulajdonságaikban különböznek

Az utolsó különbség, amelyet megvizsgálunk, valójában több, sokkal mélyebb különbséget is magában foglal, amelyek elsősorban a statisztikusok (vagy a statisztikát tanulmányozók) számára fontosak.

Mivel a matematikai függvények, a variancia és a szórás különbözik az adatok állandóval való szorzásának, az állandók összeadásának, a valószínűségi változók összeadásának, a hatványozásnak stb.

Ezek a különbségek azonban kívül esnek e cikk hatókörén.

Variancia és szórás számítási példa

Tegyük fel, hogy egy helyi termelőtől származó 12 bikából álló mintát mértek le. A súlyok kilogrammban az alábbiakban láthatók:

507 497 510 508 491 510
500 509 496 491 505 503

Meg kell határoznia ennek a mintának a szórását és szórását.

MEGOLDÁS

Ahogy fentebb említettük, adatsorok esetén célszerű először a szórást, majd a szórást meghatározni.

A minta variancia kiszámítása (S 2 )

A második minta varianciaképletet fogjuk használni, mivel az praktikusabb. Ehhez a következő lépéseket kell végrehajtani:

  • 1. lépés: Függőleges lista készül az összes adatból
  • 2. lépés: Kiszámolja az egyes adatok négyzetét, és egy új oszlopba írja mellé.
  • 3. lépés: Az összes adatot hozzáadja, és az eredményt rögzíti az első oszlop végén.
  • 4. lépés: Adja össze az összes négyzetet, és írja le az eredményt a második oszlop aljára.

Ezt az első 5 lépést a következő táblázat foglalja össze:

X i x i 2
500 250 000
509 259081
496 246016
491 241081
505 255025
503 253009
507 257049
497 247009
510 260100
508 258064
491 241081
510 260100
∑Xi_ _ ∑X i 2
6027 3027615
  • 5. lépés: Az eltérés kiszámításához a képletet használják:
Minta variancia számítási példa

Tehát a minta szórása megközelítőleg S 2 = 50 kg 2 .

A minta szórásának (S) kiszámítása

Most, hogy megvan a szórás, a szórás kiszámítása olyan egyszerű, mint az első négyzetgyökének felvétele:

Minta szórás számítási példa

Mint látható, a 7 kilós szórás összehasonlítása a bikák átlagos súlyával (külön számolva 502,25 kg) arra enged következtetni, hogy ennek a mintának a szórása alacsony, mivel ez csak a bikák átlagos súlyának 1,4%-a.

Hivatkozások

Espinoza, CI és Echecopar, AL (2020). Statisztikai alkalmazások MS Excel használatával lépésről lépésre példákkal (spanyol kiadás) (1. kiadás ). Lima, Peru: Luis Felipe Arizmendi Echecopar és Duo Negocios SAC.

Investopedia. (2021, április 16.). Ismerje meg, hogyan határozható meg a szórás a variancia használatával. Letöltve 2021. július 24-én a https://www.investopedia.com/ask/answers/021215/what-difference-between-standard-deviation-and-variance.asp webhelyről

Lopez, JF (2017. november 18.). Variancia . Letöltve: https://economipedia.com/definiciones/varianza.html

Nemzeti Szabványügyi és Technológiai Intézet. (nd). A bizonytalanság alapvető definíciói. Letöltve 2021. július 24-én, innen: https://physics.nist.gov/cuu/Uncertainty/basic.html

Webster, A. (2001). Vállalkozásra és gazdaságra vonatkozó statisztikák (spanyol kiadás) . Toronto, Kanada: Irwin Professional Publishing.

Israel Parada (Licentiate,Professor ULA)
Israel Parada (Licentiate,Professor ULA)
(Licenciado en Química) - AUTOR. Profesor universitario de Química. Divulgador científico.

Artículos relacionados