Mi az ötös szám összegzése a statisztikában?

Artículo revisado y aprobado por nuestro equipo editorial, siguiendo los criterios de redacción y edición de YuBrain.

A leíró statisztikák lehetővé teszik számunkra, hogy egy adathalmazt néhány számban vagy mértékben összegezzünk, amelyek az adatok eloszlásának leírására szolgálnak. Az adatok központi tendenciájának, szórásának és az eloszlási görbék alakjának leírására különböző mérőszámok szolgálnak, amelyek közül néhány megtalálható az ötszámos összefoglalóban.

Mi az öt szám összegzése?

A fentiek alapján az öt szám összegzése úgy definiálható, mint egy adathalmazhoz kapcsolódó öt mérőszám vagy statisztika halmaza, amely lehetővé teszi a halmaz amplitúdójának, szórásának nagyon egyszerű leírását. Központi tendenciájának mértékét is mutatja. Ezenkívül az öt számból álló összefoglaló grafikusan is ábrázolható, így könnyen láthatóvá válik az adathalmaz ezen jellemzői, miközben könnyen összehasonlítható más kapcsolódó adatkészletekkel.

Mi az az öt szám és mit jelentenek?

Az öt számból álló összesítés egy statisztikai adatsor minimális értékéből, három kvartiliséből és maximális értékéből tevődik össze. A kvartilisek azok az adatok vagy értékek, amelyek az összes adat rendezett halmazát négy alcsoportra osztják, azonos számú elemmel . Így, ha van egy 100 adatból álló halmazunk, akkor a kvartilisek azok az adatok vagy értékek, amelyek a halmazt 4, egyenként 25 adatból álló részhalmazra osztják.

A kvartiliseket a megjelenésük sorrendjében nevezik el, a legalacsonyabbtól a legmagasabbig, például az első, a második és a harmadik kvartilis. Ezenkívül a nagy Q betűvel és a sorszámukat jelző számmal jelölik. Definíciója szerint a második kvartilis, a Q2, az adatok mediánjaként vagy felezőpontjaként is ismert . Nem szabad összetéveszteni az átlaggal, amely az adatok számtani átlaga.

Az öt számból álló összesítés a három kvartilis (Q1, Q2 és Q3) mellett tartalmazza az adatok legkisebb értékét a legkisebbtől a legnagyobbig rendezve, valamint a maximális értéket is. Más szavakkal, ebben az összefoglalóban az öt szám a következő:

  • Minimum. – A statisztikai adatok halmazának első értéke a legalacsonyabbtól a legmagasabbig. Ez a legalacsonyabb értékű adat.
  • Q1 vagy első kvartilis. – Ez az adat vagy érték, amely felosztja az adathalmazt, 25%-a (vagy negyede) alatta, a másik 75%-a felül marad.
  • Q2 vagy második kvartilis. – Az az adat vagy érték, amely az adathalmazt két egyenlő csoportra osztja. Ez az az érték, amely alatta és felette is az adatok 50%-át hagyja, tehát az adatok mediánját vagy felezőpontját is jelenti.
  • 3. negyedév vagy harmadik kvartilis. – Ez az az adat vagy érték, amely az adatok 75%-át, azaz háromnegyedét lent, a másik 25%-át pedig felül hagyja.
  • Maximum.– Ahogy a neve is mutatja, a teljes adatsor közül ez a legmagasabb értékű adat. Vagyis ez az utolsó adat, amikor a legalacsonyabbtól a legmagasabbig vannak rendezve.

Az ötszámú összegzés értelmezésekor a minimális és a maximális érték különbsége adja az adatsor szélességének nevezett értékét. Másrészt a harmadik és az első kvartilis közötti különbség, az úgynevezett Interkvartilis tartomány (RIC), megmutatja, mennyire szórt az adatok, mivel azt az értéktartományt jelzi, amely a központi adatok 50%-át tartalmazza.

Másrészt a második kvartilis vagy medián a központi tendencia mérőszáma, amely felhasználható a sorozat összes adatának egyetlen számban történő megjelenítésére. Bár az átlagot gyakran használják a központi tendencia mérőszámaként sok helyzetben, a medián előnye, hogy nem érzékeny a szélsőséges értékekre (túl magas vagy túl alacsony).

Box plots: az öt szám összegzés grafikus ábrázolása

Az öt számból álló összegzés gyakorlatias módja az úgynevezett box plot vagy Box Plot . Az ilyen típusú ábrázolásban az interkvartilis tartományt (IQR) egy téglalapként vagy dobozként ábrázoljuk, amely Q1-től Q3-ig terjed, és a Q2-ben, azaz a mediánban elhelyezkedő mérési tengelyre merőleges egyenessel ketté van osztva.

Végül a doboz mindkét oldalán a mérési tengellyel párhuzamos vonalakat húzunk, amelyek a minimumtól a Q1-ig és a Q3-tól a maximumig terjednek, mindaddig, amíg a minimum és maximum nem haladja meg az 1,5 RIC távolságot a bal és Q1 és Q3 jobbra. Ezeket az oldalsó vonalakat a doboz bajuszának nevezik. Ha vannak adatok a Q1 – 1.5.RIC és Q3 + 1.5.RIC által határolt tartományon kívül, akkor az oldalak (ezeket néha whiskereknek nevezik) a benne lévő doboztól legtávolabbi adatokig terjednek, a többi pedig meg van jelölve. mint kiugró értékek.

Példa egy adatsor öt szám összegzésének elkészítésére

Ezt követően lépésről lépésre bemutatjuk a statisztikai adathalmazból öt számból álló összegzés elkészítésének eljárását. Ezenkívül elmagyarázza, hogyan kell felépíteni a doboz diagramot az összefoglaló grafikus formában történő megjelenítéséhez.

Az adatok egy áruház női részlegében eladott cikkek számának felelnek meg egy 10 hetes időszak alatt. A tanulmány eredményeit az alábbiakban mutatjuk be:

hétfő kedd szerda csütörtök péntek szombat vasárnap
1. hét 158 145 156 156 164 167 147
hét 2 161 146 157 152 162 160 153
3. hét 152 150 157 155 164 166 152
hét 4 150 149 153 162 169 162 149
hét 5 157 152 154 155 168 161 155
hét 6 157 145 160 164 164 168 149
hét 7 160 152 151 152 168 163 145
hét 8 157 152 155 156 162 169 155
hét 9 160 148 157 150 164 170 154
hét 10 158 146 163 158 165 169 150

1. lépés: Rendezze az összes adatot a legkisebbtől a legnagyobbig, és rendeljen hozzájuk egy indexet, amely 1-gyel kezdődik.

Ennek a lépésnek az eredménye az alábbiakban látható:

Index Érdemes Index Érdemes Index Érdemes Index Érdemes
1 145 22 152 43 158 64 168
2 145 23 153 44 160 65 168
3 145 24 153 Négy öt 160 66 168
4 146 25 154 46 160 67 169
5 146 26 154 47 160 68 169
6 147 27 155 48 161 69 169
7 148 28 155 49 161 70 170
8 149 29 155 ötven 162
9 149 30 155 51 162
10 149 31 155 52 162
tizenegy 150 32 156 53 162
12 150 33 156 54 163
13 150 3. 4 156 55 163
14 150 35 157 56 164
tizenöt 151 36 157 57 164
16 152 37 157 58 164
17 152 38 157 59 164
18 152 39 157 60 164
19 152 40 157 61 165
húsz 152 41 158 62 166
huszonegy 152 42 158 63 167

2. lépés: Határozza meg a Q1 és Q3 kvartiliseket

A Q1, Q2 és Q3 kvartilis meghatározásához kezdjük az egyes kvartilisekhez tartozó adatok indexének kiszámításával. A képlet a következő:

Öt szám összefoglaló

Öt szám összefoglaló

Öt szám összefoglaló

Ahol N az adatok teljes száma. Ez a számítás lehet egész vagy nem, ezért az eljárás két esetre oszlik:

1. eset: Egész számú eredmény

Ha az eredmény egész szám, akkor a megfelelő kvartilis annak az adatnak az értéke lesz, amelynek az index megfelel. Például, ha a Q1 indexe 10-et ad, ez azt jelenti, hogy Q1 a 10-es számú adat értéke lesz (példánkban 149).

2. eset: Tizedes eredmény

Ha az index egy decimális szám, akkor a kvartilis nem fog pontosan megfelelni a sorozat egyik adatának. Ebben az esetben az eredményt lefelé kerekítjük, és ebből és az azt követő adatból a következő képlet segítségével számítjuk ki a kvartilist:

Öt szám összefoglaló

Ahol d az index decimális részét jelöli, x i a lefelé kerekített indexű adat, x i+1 pedig a következő adatpont.

Példánkban ez a három kvartilis indexeinek kiszámításának eredménye:

Öt szám összefoglaló

Öt szám összefoglaló

Öt szám összefoglaló

Az eredmény minden esetben decimális szám volt, ezért most a 2. eset képletét alkalmazzuk az egyes kvartilisek értékének meghatározásához:

Öt szám összefoglaló

Öt szám összefoglaló

Öt szám összefoglaló

3. lépés: Határozza meg az öt számot

Most, hogy megvannak az adatok sorrendben, és a három kvartilis értékeit is meghatároztuk, az öt szám összegzése a következő:

Minimális: 145
Q1: 152
Q2 vagy medián: 157
Q3: 162,25
Maximális: 170

4. lépés: Készítse el a boxplotot

A RIC kivételével már mindennel megvan, ami a boxplot megépítéséhez szükséges. Az előző lépésben kapott eredmény alapján a Q3 és a Q1 közötti különbség:

Öt szám összefoglaló

Annak megállapításához, hogy vannak-e kiugró értékek, kiszámítjuk a Q1 – 1,5 IQR és a Q3 + 1,5 IQR értékeket, és összehasonlítjuk a minimummal és a maximummal:

Öt szám összefoglaló

Öt szám összefoglaló

Amint látjuk, nincsenek kiugró értékek, mivel a minimum, 140 nagyobb, mint 136 625. Szintén nincsenek kiugró értékek, mivel a maximum, 170 kevesebb, mint 177 625.

A következő ábra a példának megfelelő dobozos telek felépítésének eredményét mutatja:

Öt szám összefoglaló

Hivatkozások

Hogyan állítsunk össze egy statisztikai minta ötszámú összegzését ? (nd). FaqSalex.info. https://faqsalex.info/educaci%C3%B3n/21361-c%C3%B3mo-reunir-a-un-resumen-de-cinco-n%C3%BAmeros-de-una.html

McAdams, D. (2009, március 4.). Öt szám összefoglalása. Az élet egy történet, Problem.org. https://lifeisastoryproblem.tripod.com/en/f/fivenumbersummary.html

Serra, BR (2020, november 22). medián . Univerzum képletek. https://www.universoformulas.com/estadistica/descriptiva/mediana/#calculo

Serra, BR (2021, augusztus 4.). kvartilis . Univerzum képletek. https://www.universoformulas.com/estadistica/descriptiva/cuartiles/#example

Zentica Global. (nd). Brutalk – Hogyan lehet kiszámítani az adatok 5 számból álló összegzését Pythonban . Brutalk. https://www.brutalk.com/en/news/brutalk-blog/view/how-to-calculate-the-summary-of-5-numbers-for-your-data-in-python-6047097da7d56

Israel Parada (Licentiate,Professor ULA)
Israel Parada (Licentiate,Professor ULA)
(Licenciado en Química) - AUTOR. Profesor universitario de Química. Divulgador científico.

Artículos relacionados