Tabla de Contenidos
Kuvaavien tilastojen avulla voimme tiivistää tietojoukon pieneen määrään lukuja tai mittoja, jotka kuvaavat tietojen jakautumista. Aineiston keskeistä suuntausta, sen hajoamista ja jakautumiskäyrien muotoa kuvaavat erilaiset mittarit, joista osa löytyy viisinumeroisesta yhteenvedosta.
Mikä on viiden numeron yhteenveto?
Edellä esitetyn perusteella viiden luvun yhteenveto voidaan määritellä viiden aineiston joukoksi tai tilastoksi, jotka liittyvät tietojoukkoon, jotka mahdollistavat joukon amplitudin, sen hajonnan kuvaamisen hyvin yksinkertaisella tavalla. Se myös mittaa sen keskeistä suuntausta. Lisäksi viiden numeron yhteenveto voidaan esittää myös graafisesti, jolloin tietojoukon nämä ominaisuudet on helppo visualisoida ja verrata muihin vastaaviin tietokokonaisuuksiin.
Mitä ovat viisi numeroa ja mitä ne tarkoittavat?
Viiden numeron yhteenveto koostuu tilastotietojen sarjan vähimmäisarvosta, kolmesta kvartiilista ja enimmäisarvosta. Kvartiilit ovat niitä tietoja tai arvoja, jotka jakavat järjestetyn joukon kaikista tiedoista neljään alaryhmään, joissa on sama määrä elementtejä . Näin ollen, jos meillä on 100 datan joukko, kvartiilit ovat niitä tietoja tai arvoja, jotka jakavat joukon neljään 25 datan osajoukkoon.
Kvartiilit nimetään siinä järjestyksessä, jossa ne esiintyvät, alimmasta korkeimpaan, kuten ensimmäinen, toinen ja kolmas kvartiili. Lisäksi niitä edustaa iso kirjain Q, jota seuraa numero, joka ilmaisee niiden järjestyspaikan. Määritelmänsä mukaan toinen kvartiili, Q2, tunnetaan myös datan mediaani- tai keskipisteenä . Sitä ei pidä sekoittaa keskiarvoon, joka on tietojen aritmeettinen keskiarvo.
Viiden numeron yhteenveto sisältää kolmen kvartiilin (Q1, Q2 ja Q3) lisäksi myös datan vähimmäisarvon, joka on järjestetty pienimmästä suurimpaan, ja maksimiarvon. Toisin sanoen tämän yhteenvedon viisi numeroa ovat:
- Minimi.– Se on tilastotietojen joukon ensimmäinen arvo, joka on järjestetty pienimmästä suurimpaan. Se on pienimmän arvon data.
- Q1 eli ensimmäinen kvartiili. – Se data tai arvo, joka jakaa tietojoukon, jättäen niistä 25 % (tai neljänneksen) alapuolelle ja loput 75 % yläpuolelle.
- Q2 tai toinen kvartiili. – Se on data tai arvo, joka jakaa tietojoukon kahteen yhtä suureen ryhmään. Eli se on arvo, joka jättää 50 % tiedoista sekä sen ala- että yläpuolelle, joten se edustaa myös datan mediaania tai keskipistettä.
- Q3 tai kolmas kvartiili. – Tämä on data tai arvo, joka jättää 75 % eli kolme neljäsosaa tiedoista alle ja loput 25 % yläpuolelle.
- Maksimi. – Kuten sen nimi osoittaa, se on data, jolla on suurin arvo koko tietosarjasta. Toisin sanoen se on viimeinen data, kun ne on järjestetty alimmasta korkeimpaan.
Viiden numeron yhteenvetoa tulkittaessa minimi- ja maksimiarvon ero antaa ns. tietosarjan leveyden. Toisaalta ero kolmannen ja ensimmäisen kvartiilin välillä, nimeltään Interquartile Range (RIC), näyttää meille, kuinka hajaantuneita tiedot ovat, koska se osoittaa arvoalueen, joka sisältää 50% keskeisestä tiedosta.
Toisaalta toinen kvartiili tai mediaani on keskeisen taipumuksen mitta, jota voidaan käyttää kuvaamaan sarjan kaikkien tietojen arvoa yhdessä numerossa. Vaikka keskiarvoa käytetään usein keskeisen taipumuksen mittarina monissa tilanteissa, mediaanilla on se etu, että se ei ole herkkä ääriarvoille (liian korkea tai liian matala).
Laatikkokaaviot: graafinen esitys viiden numeron yhteenvedosta
Käytännöllinen tapa visualisoida viiden luvun yhteenveto on niin kutsuttu laatikkokaavio tai laatikkokaavio . Tämän tyyppisessä esitysmuodossa kvartiilialue (IQR) esitetään suorakulmiona tai laatikkona, joka ulottuu Q1:stä Q3:een ja on jaettu kahteen viivalla, joka on kohtisuorassa Q2:ssa sijaitsevaan mittausakseliin nähden, eli mediaanissa.
Lopuksi laatikon kummallekin puolelle piirretään mittausakselin suuntaiset viivat, jotka ulottuvat minimistä Q1:een ja Q3:sta maksimiin, kunhan minimi ja maksimi ovat enintään 1,5.RIC:n etäisyydellä vasemmalle ja Q1:n ja Q3:n oikealla puolella. Nämä sivuviivat ovat niin sanottuja laatikon viiksiä. Jos dataa on Q1 – 1.5.RIC ja Q3 + 1.5.RIC rajaaman alueen ulkopuolella, sivut (joskus kutsutaan viiksiksi) ulottuvat kauimpana sisällä olevasta laatikosta oleviin tietoihin, ja loput on merkitty poikkeavina.
Esimerkki viiden luvun yhteenvedon laatimisesta tietosarjalle
Seuraavaksi esitetään vaihe vaiheelta menetelmä viiden luvun yhteenvedon laatimiseksi tilastotietojoukosta. Lisäksi se selittää, kuinka laatikkokaavio rakennetaan tämän yhteenvedon visualisointia varten graafisessa muodossa.
Tiedot vastaavat tavaratalon naisten osastolla myytyjen tuotteiden määrää 10 viikon aikana. Tutkimuksen tulokset on esitetty alla:
maanantai | tiistai | keskiviikko | torstai | perjantai | lauantai | sunnuntai | |
Viikko 1 | 158 | 145 | 156 | 156 | 164 | 167 | 147 |
viikko 2 | 161 | 146 | 157 | 152 | 162 | 160 | 153 |
Viikko 3 | 152 | 150 | 157 | 155 | 164 | 166 | 152 |
viikko 4 | 150 | 149 | 153 | 162 | 169 | 162 | 149 |
viikko 5 | 157 | 152 | 154 | 155 | 168 | 161 | 155 |
viikko 6 | 157 | 145 | 160 | 164 | 164 | 168 | 149 |
viikko 7 | 160 | 152 | 151 | 152 | 168 | 163 | 145 |
viikko 8 | 157 | 152 | 155 | 156 | 162 | 169 | 155 |
viikko 9 | 160 | 148 | 157 | 150 | 164 | 170 | 154 |
viikko 10 | 158 | 146 | 163 | 158 | 165 | 169 | 150 |
Vaihe 1: Lajittele kaikki tiedot pienimmästä suurimpaan ja määritä niille indeksi alkaen 1.
Tämän vaiheen tulos on esitetty alla:
Indeksi | Kannattaa | Indeksi | Kannattaa | Indeksi | Kannattaa | Indeksi | Kannattaa |
1 | 145 | 22 | 152 | 43 | 158 | 64 | 168 |
2 | 145 | 23 | 153 | 44 | 160 | 65 | 168 |
3 | 145 | 24 | 153 | Neljä viisi | 160 | 66 | 168 |
4 | 146 | 25 | 154 | 46 | 160 | 67 | 169 |
5 | 146 | 26 | 154 | 47 | 160 | 68 | 169 |
6 | 147 | 27 | 155 | 48 | 161 | 69 | 169 |
7 | 148 | 28 | 155 | 49 | 161 | 70 | 170 |
8 | 149 | 29 | 155 | viisikymmentä | 162 | ||
9 | 149 | 30 | 155 | 51 | 162 | ||
10 | 149 | 31 | 155 | 52 | 162 | ||
yksitoista | 150 | 32 | 156 | 53 | 162 | ||
12 | 150 | 33 | 156 | 54 | 163 | ||
13 | 150 | 3. 4 | 156 | 55 | 163 | ||
14 | 150 | 35 | 157 | 56 | 164 | ||
viisitoista | 151 | 36 | 157 | 57 | 164 | ||
16 | 152 | 37 | 157 | 58 | 164 | ||
17 | 152 | 38 | 157 | 59 | 164 | ||
18 | 152 | 39 | 157 | 60 | 164 | ||
19 | 152 | 40 | 157 | 61 | 165 | ||
kaksikymmentä | 152 | 41 | 158 | 62 | 166 | ||
kaksikymmentäyksi | 152 | 42 | 158 | 63 | 167 |
Vaihe 2: Määritä Q1- ja Q3-kvartiilit
Q1-, Q2- ja Q3-kvartiilien määrittämiseksi aloitamme laskemalla indeksin kutakin kvartiilia vastaaville tiedoille. Kaava on seuraava:
Missä N on tietojen kokonaismäärä. Tämä laskenta voi olla kokonaisluku tai ei, joten menettely on jaettu kahteen tapaukseen:
Tapaus 1: Kokonaislukutulos
Jos tulos on kokonaisluku, vastaava kvartiili on sen datan arvo, jota indeksi vastaa. Jos esimerkiksi indeksi Q1 antaa arvon 10, tämä tarkoittaa, että Q1 on datanumeron 10 arvo (esimerkissämme 149).
Tapaus 2: Desimaalitulos
Jos indeksi on desimaaliluku, kvartiili ei vastaa täsmälleen mitään sarjassa olevaa dataa. Tässä tapauksessa tulos pyöristetään alaspäin ja kvartiili lasketaan tästä ja sitä seuraavasta tiedosta seuraavan kaavan avulla:
Kun d edustaa indeksin desimaaliosaa, x i on data, jonka indeksi on pyöristetty alaspäin, ja x i+1 on seuraava datapiste.
Esimerkkimme tapauksessa tämä on tulos kolmen kvartiilin indeksien laskemisesta:
Kaikissa tapauksissa tulos oli desimaaliluku, joten käytämme nyt tapauksen 2 kaavaa määrittääksemme kunkin kvartiilin arvon:
Vaihe 3: Tunnista viisi numeroa
Nyt kun meillä on tiedot järjestetty ja olemme myös määrittäneet kolmen kvartiilin arvot, viiden luvun yhteenveto on:
Minimi: | 145 |
Q1: | 152 |
Q2 tai mediaani: | 157 |
Q3: | 162,25 |
Enimmäismäärä: | 170 |
Vaihe 4: Rakenna boxplot
Meillä on jo kaikki tarvittava boxplotin rakentamiseen paitsi RIC. Edellisessä vaiheessa saadun tuloksen perusteella ero Q3:n ja Q1:n välillä on:
Määrittääksemme, onko poikkeavuuksia, laskemme Q1 – 1,5 IQR ja Q3 + 1,5 IQR ja vertaamme niitä minimiin ja maksimiin:
Kuten näemme, poikkeamia ei ole, koska minimi, 140, on suurempi kuin 136 625. Poikkeuksia ei myöskään ole, koska enimmäisarvo, 170, on alle 177 625.
Seuraavassa kuvassa näkyy esimerkkiä vastaavan laatikkokaavion rakentamisen tulos:
Viitteet
Kuinka koota viiden numeron yhteenveto tilastollisesta otoksesta . (nd). FaqSalex.info. https://faqsalex.info/educaci%C3%B3n/21361-c%C3%B3mo-reunir-a-un-resumen-de-cinco-n%C3%BAmeros-de-una.html
McAdams, D. (2009, 4. maaliskuuta). Yhteenveto viidestä numerosta. Life is a Story Problem.org. https://lifeisastoryproblem.tripod.com/es/f/fivenumbersummary.html
Serra, BR (2020, 22. marraskuuta). mediaani . Universumin kaavat. https://www.universoformulas.com/estadistica/descriptiva/mediana/#calculo
Serra, BR (2021, 4. elokuuta). kvartiilit . Universumin kaavat. https://www.universoformulas.com/estadistica/descriptiva/cuartiles/#example
Zentica Global. (nd). Brutalk – Kuinka laskea 5 numeron yhteenveto tiedoille Pythonissa . Brutalk. https://www.brutalk.com/en/news/brutalk-blog/view/how-to-calculate-the-summary-of-5-numbers-for-your-data-in-python-6047097da7d56