Tabla de Contenidos
A leíró statisztikák lehetővé teszik számunkra, hogy egy adathalmazt néhány számban vagy mértékben összegezzünk, amelyek az adatok eloszlásának leírására szolgálnak. Az adatok központi tendenciájának, szórásának és az eloszlási görbék alakjának leírására különböző mérőszámok szolgálnak, amelyek közül néhány megtalálható az ötszámos összefoglalóban.
Mi az öt szám összegzése?
A fentiek alapján az öt szám összegzése úgy definiálható, mint egy adathalmazhoz kapcsolódó öt mérőszám vagy statisztika halmaza, amely lehetővé teszi a halmaz amplitúdójának, szórásának nagyon egyszerű leírását. Központi tendenciájának mértékét is mutatja. Ezenkívül az öt számból álló összefoglaló grafikusan is ábrázolható, így könnyen láthatóvá válik az adathalmaz ezen jellemzői, miközben könnyen összehasonlítható más kapcsolódó adatkészletekkel.
Mi az az öt szám és mit jelentenek?
Az öt számból álló összesítés egy statisztikai adatsor minimális értékéből, három kvartiliséből és maximális értékéből tevődik össze. A kvartilisek azok az adatok vagy értékek, amelyek az összes adat rendezett halmazát négy alcsoportra osztják, azonos számú elemmel . Így, ha van egy 100 adatból álló halmazunk, akkor a kvartilisek azok az adatok vagy értékek, amelyek a halmazt 4, egyenként 25 adatból álló részhalmazra osztják.
A kvartiliseket a megjelenésük sorrendjében nevezik el, a legalacsonyabbtól a legmagasabbig, például az első, a második és a harmadik kvartilis. Ezenkívül a nagy Q betűvel és a sorszámukat jelző számmal jelölik. Definíciója szerint a második kvartilis, a Q2, az adatok mediánjaként vagy felezőpontjaként is ismert . Nem szabad összetéveszteni az átlaggal, amely az adatok számtani átlaga.
Az öt számból álló összesítés a három kvartilis (Q1, Q2 és Q3) mellett tartalmazza az adatok legkisebb értékét a legkisebbtől a legnagyobbig rendezve, valamint a maximális értéket is. Más szavakkal, ebben az összefoglalóban az öt szám a következő:
- Minimum. – A statisztikai adatok halmazának első értéke a legalacsonyabbtól a legmagasabbig. Ez a legalacsonyabb értékű adat.
- Q1 vagy első kvartilis. – Ez az adat vagy érték, amely felosztja az adathalmazt, 25%-a (vagy negyede) alatta, a másik 75%-a felül marad.
- Q2 vagy második kvartilis. – Az az adat vagy érték, amely az adathalmazt két egyenlő csoportra osztja. Ez az az érték, amely alatta és felette is az adatok 50%-át hagyja, tehát az adatok mediánját vagy felezőpontját is jelenti.
- 3. negyedév vagy harmadik kvartilis. – Ez az az adat vagy érték, amely az adatok 75%-át, azaz háromnegyedét lent, a másik 25%-át pedig felül hagyja.
- Maximum.– Ahogy a neve is mutatja, a teljes adatsor közül ez a legmagasabb értékű adat. Vagyis ez az utolsó adat, amikor a legalacsonyabbtól a legmagasabbig vannak rendezve.
Az ötszámú összegzés értelmezésekor a minimális és a maximális érték különbsége adja az adatsor szélességének nevezett értékét. Másrészt a harmadik és az első kvartilis közötti különbség, az úgynevezett Interkvartilis tartomány (RIC), megmutatja, mennyire szórt az adatok, mivel azt az értéktartományt jelzi, amely a központi adatok 50%-át tartalmazza.
Másrészt a második kvartilis vagy medián a központi tendencia mérőszáma, amely felhasználható a sorozat összes adatának egyetlen számban történő megjelenítésére. Bár az átlagot gyakran használják a központi tendencia mérőszámaként sok helyzetben, a medián előnye, hogy nem érzékeny a szélsőséges értékekre (túl magas vagy túl alacsony).
Box plots: az öt szám összegzés grafikus ábrázolása
Az öt számból álló összegzés gyakorlatias módja az úgynevezett box plot vagy Box Plot . Az ilyen típusú ábrázolásban az interkvartilis tartományt (IQR) egy téglalapként vagy dobozként ábrázoljuk, amely Q1-től Q3-ig terjed, és a Q2-ben, azaz a mediánban elhelyezkedő mérési tengelyre merőleges egyenessel ketté van osztva.
Végül a doboz mindkét oldalán a mérési tengellyel párhuzamos vonalakat húzunk, amelyek a minimumtól a Q1-ig és a Q3-tól a maximumig terjednek, mindaddig, amíg a minimum és maximum nem haladja meg az 1,5 RIC távolságot a bal és Q1 és Q3 jobbra. Ezeket az oldalsó vonalakat a doboz bajuszának nevezik. Ha vannak adatok a Q1 – 1.5.RIC és Q3 + 1.5.RIC által határolt tartományon kívül, akkor az oldalak (ezeket néha whiskereknek nevezik) a benne lévő doboztól legtávolabbi adatokig terjednek, a többi pedig meg van jelölve. mint kiugró értékek.
Példa egy adatsor öt szám összegzésének elkészítésére
Ezt követően lépésről lépésre bemutatjuk a statisztikai adathalmazból öt számból álló összegzés elkészítésének eljárását. Ezenkívül elmagyarázza, hogyan kell felépíteni a doboz diagramot az összefoglaló grafikus formában történő megjelenítéséhez.
Az adatok egy áruház női részlegében eladott cikkek számának felelnek meg egy 10 hetes időszak alatt. A tanulmány eredményeit az alábbiakban mutatjuk be:
hétfő | kedd | szerda | csütörtök | péntek | szombat | vasárnap | |
1. hét | 158 | 145 | 156 | 156 | 164 | 167 | 147 |
hét 2 | 161 | 146 | 157 | 152 | 162 | 160 | 153 |
3. hét | 152 | 150 | 157 | 155 | 164 | 166 | 152 |
hét 4 | 150 | 149 | 153 | 162 | 169 | 162 | 149 |
hét 5 | 157 | 152 | 154 | 155 | 168 | 161 | 155 |
hét 6 | 157 | 145 | 160 | 164 | 164 | 168 | 149 |
hét 7 | 160 | 152 | 151 | 152 | 168 | 163 | 145 |
hét 8 | 157 | 152 | 155 | 156 | 162 | 169 | 155 |
hét 9 | 160 | 148 | 157 | 150 | 164 | 170 | 154 |
hét 10 | 158 | 146 | 163 | 158 | 165 | 169 | 150 |
1. lépés: Rendezze az összes adatot a legkisebbtől a legnagyobbig, és rendeljen hozzájuk egy indexet, amely 1-gyel kezdődik.
Ennek a lépésnek az eredménye az alábbiakban látható:
Index | Érdemes | Index | Érdemes | Index | Érdemes | Index | Érdemes |
1 | 145 | 22 | 152 | 43 | 158 | 64 | 168 |
2 | 145 | 23 | 153 | 44 | 160 | 65 | 168 |
3 | 145 | 24 | 153 | Négy öt | 160 | 66 | 168 |
4 | 146 | 25 | 154 | 46 | 160 | 67 | 169 |
5 | 146 | 26 | 154 | 47 | 160 | 68 | 169 |
6 | 147 | 27 | 155 | 48 | 161 | 69 | 169 |
7 | 148 | 28 | 155 | 49 | 161 | 70 | 170 |
8 | 149 | 29 | 155 | ötven | 162 | ||
9 | 149 | 30 | 155 | 51 | 162 | ||
10 | 149 | 31 | 155 | 52 | 162 | ||
tizenegy | 150 | 32 | 156 | 53 | 162 | ||
12 | 150 | 33 | 156 | 54 | 163 | ||
13 | 150 | 3. 4 | 156 | 55 | 163 | ||
14 | 150 | 35 | 157 | 56 | 164 | ||
tizenöt | 151 | 36 | 157 | 57 | 164 | ||
16 | 152 | 37 | 157 | 58 | 164 | ||
17 | 152 | 38 | 157 | 59 | 164 | ||
18 | 152 | 39 | 157 | 60 | 164 | ||
19 | 152 | 40 | 157 | 61 | 165 | ||
húsz | 152 | 41 | 158 | 62 | 166 | ||
huszonegy | 152 | 42 | 158 | 63 | 167 |
2. lépés: Határozza meg a Q1 és Q3 kvartiliseket
A Q1, Q2 és Q3 kvartilis meghatározásához kezdjük az egyes kvartilisekhez tartozó adatok indexének kiszámításával. A képlet a következő:
Ahol N az adatok teljes száma. Ez a számítás lehet egész vagy nem, ezért az eljárás két esetre oszlik:
1. eset: Egész számú eredmény
Ha az eredmény egész szám, akkor a megfelelő kvartilis annak az adatnak az értéke lesz, amelynek az index megfelel. Például, ha a Q1 indexe 10-et ad, ez azt jelenti, hogy Q1 a 10-es számú adat értéke lesz (példánkban 149).
2. eset: Tizedes eredmény
Ha az index egy decimális szám, akkor a kvartilis nem fog pontosan megfelelni a sorozat egyik adatának. Ebben az esetben az eredményt lefelé kerekítjük, és ebből és az azt követő adatból a következő képlet segítségével számítjuk ki a kvartilist:
Ahol d az index decimális részét jelöli, x i a lefelé kerekített indexű adat, x i+1 pedig a következő adatpont.
Példánkban ez a három kvartilis indexeinek kiszámításának eredménye:
Az eredmény minden esetben decimális szám volt, ezért most a 2. eset képletét alkalmazzuk az egyes kvartilisek értékének meghatározásához:
3. lépés: Határozza meg az öt számot
Most, hogy megvannak az adatok sorrendben, és a három kvartilis értékeit is meghatároztuk, az öt szám összegzése a következő:
Minimális: | 145 |
Q1: | 152 |
Q2 vagy medián: | 157 |
Q3: | 162,25 |
Maximális: | 170 |
4. lépés: Készítse el a boxplotot
A RIC kivételével már mindennel megvan, ami a boxplot megépítéséhez szükséges. Az előző lépésben kapott eredmény alapján a Q3 és a Q1 közötti különbség:
Annak megállapításához, hogy vannak-e kiugró értékek, kiszámítjuk a Q1 – 1,5 IQR és a Q3 + 1,5 IQR értékeket, és összehasonlítjuk a minimummal és a maximummal:
Amint látjuk, nincsenek kiugró értékek, mivel a minimum, 140 nagyobb, mint 136 625. Szintén nincsenek kiugró értékek, mivel a maximum, 170 kevesebb, mint 177 625.
A következő ábra a példának megfelelő dobozos telek felépítésének eredményét mutatja:
Hivatkozások
Hogyan állítsunk össze egy statisztikai minta ötszámú összegzését ? (nd). FaqSalex.info. https://faqsalex.info/educaci%C3%B3n/21361-c%C3%B3mo-reunir-a-un-resumen-de-cinco-n%C3%BAmeros-de-una.html
McAdams, D. (2009, március 4.). Öt szám összefoglalása. Az élet egy történet, Problem.org. https://lifeisastoryproblem.tripod.com/en/f/fivenumbersummary.html
Serra, BR (2020, november 22). medián . Univerzum képletek. https://www.universoformulas.com/estadistica/descriptiva/mediana/#calculo
Serra, BR (2021, augusztus 4.). kvartilis . Univerzum képletek. https://www.universoformulas.com/estadistica/descriptiva/cuartiles/#example
Zentica Global. (nd). Brutalk – Hogyan lehet kiszámítani az adatok 5 számból álló összegzését Pythonban . Brutalk. https://www.brutalk.com/en/news/brutalk-blog/view/how-to-calculate-the-summary-of-5-numbers-for-your-data-in-python-6047097da7d56