Mikä on viiden numeron yhteenveto tilastoissa?

Artículo revisado y aprobado por nuestro equipo editorial, siguiendo los criterios de redacción y edición de YuBrain.


Kuvaavien tilastojen avulla voimme tiivistää tietojoukon pieneen määrään lukuja tai mittoja, jotka kuvaavat tietojen jakautumista. Aineiston keskeistä suuntausta, sen hajoamista ja jakautumiskäyrien muotoa kuvaavat erilaiset mittarit, joista osa löytyy viisinumeroisesta yhteenvedosta.

Mikä on viiden numeron yhteenveto?

Edellä esitetyn perusteella viiden luvun yhteenveto voidaan määritellä viiden aineiston joukoksi tai tilastoksi, jotka liittyvät tietojoukkoon, jotka mahdollistavat joukon amplitudin, sen hajonnan kuvaamisen hyvin yksinkertaisella tavalla. Se myös mittaa sen keskeistä suuntausta. Lisäksi viiden numeron yhteenveto voidaan esittää myös graafisesti, jolloin tietojoukon nämä ominaisuudet on helppo visualisoida ja verrata muihin vastaaviin tietokokonaisuuksiin.

Mitä ovat viisi numeroa ja mitä ne tarkoittavat?

Viiden numeron yhteenveto koostuu tilastotietojen sarjan vähimmäisarvosta, kolmesta kvartiilista ja enimmäisarvosta. Kvartiilit ovat niitä tietoja tai arvoja, jotka jakavat järjestetyn joukon kaikista tiedoista neljään alaryhmään, joissa on sama määrä elementtejä . Näin ollen, jos meillä on 100 datan joukko, kvartiilit ovat niitä tietoja tai arvoja, jotka jakavat joukon neljään 25 datan osajoukkoon.

Kvartiilit nimetään siinä järjestyksessä, jossa ne esiintyvät, alimmasta korkeimpaan, kuten ensimmäinen, toinen ja kolmas kvartiili. Lisäksi niitä edustaa iso kirjain Q, jota seuraa numero, joka ilmaisee niiden järjestyspaikan. Määritelmänsä mukaan toinen kvartiili, Q2, tunnetaan myös datan mediaani- tai keskipisteenä . Sitä ei pidä sekoittaa keskiarvoon, joka on tietojen aritmeettinen keskiarvo.

Viiden numeron yhteenveto sisältää kolmen kvartiilin (Q1, Q2 ja Q3) lisäksi myös datan vähimmäisarvon, joka on järjestetty pienimmästä suurimpaan, ja maksimiarvon. Toisin sanoen tämän yhteenvedon viisi numeroa ovat:

  • Minimi.– Se on tilastotietojen joukon ensimmäinen arvo, joka on järjestetty pienimmästä suurimpaan. Se on pienimmän arvon data.
  • Q1 eli ensimmäinen kvartiili. – Se data tai arvo, joka jakaa tietojoukon, jättäen niistä 25 % (tai neljänneksen) alapuolelle ja loput 75 % yläpuolelle.
  • Q2 tai toinen kvartiili. – Se on data tai arvo, joka jakaa tietojoukon kahteen yhtä suureen ryhmään. Eli se on arvo, joka jättää 50 % tiedoista sekä sen ala- että yläpuolelle, joten se edustaa myös datan mediaania tai keskipistettä.
  • Q3 tai kolmas kvartiili. – Tämä on data tai arvo, joka jättää 75 % eli kolme neljäsosaa tiedoista alle ja loput 25 % yläpuolelle.
  • Maksimi. – Kuten sen nimi osoittaa, se on data, jolla on suurin arvo koko tietosarjasta. Toisin sanoen se on viimeinen data, kun ne on järjestetty alimmasta korkeimpaan.

Viiden numeron yhteenvetoa tulkittaessa minimi- ja maksimiarvon ero antaa ns. tietosarjan leveyden. Toisaalta ero kolmannen ja ensimmäisen kvartiilin välillä, nimeltään Interquartile Range (RIC), näyttää meille, kuinka hajaantuneita tiedot ovat, koska se osoittaa arvoalueen, joka sisältää 50% keskeisestä tiedosta.

Toisaalta toinen kvartiili tai mediaani on keskeisen taipumuksen mitta, jota voidaan käyttää kuvaamaan sarjan kaikkien tietojen arvoa yhdessä numerossa. Vaikka keskiarvoa käytetään usein keskeisen taipumuksen mittarina monissa tilanteissa, mediaanilla on se etu, että se ei ole herkkä ääriarvoille (liian korkea tai liian matala).

Laatikkokaaviot: graafinen esitys viiden numeron yhteenvedosta

Käytännöllinen tapa visualisoida viiden luvun yhteenveto on niin kutsuttu laatikkokaavio tai laatikkokaavio . Tämän tyyppisessä esitysmuodossa kvartiilialue (IQR) esitetään suorakulmiona tai laatikkona, joka ulottuu Q1:stä Q3:een ja on jaettu kahteen viivalla, joka on kohtisuorassa Q2:ssa sijaitsevaan mittausakseliin nähden, eli mediaanissa.

Lopuksi laatikon kummallekin puolelle piirretään mittausakselin suuntaiset viivat, jotka ulottuvat minimistä Q1:een ja Q3:sta maksimiin, kunhan minimi ja maksimi ovat enintään 1,5.RIC:n etäisyydellä vasemmalle ja Q1:n ja Q3:n oikealla puolella. Nämä sivuviivat ovat niin sanottuja laatikon viiksiä. Jos dataa on Q1 – 1.5.RIC ja Q3 + 1.5.RIC rajaaman alueen ulkopuolella, sivut (joskus kutsutaan viiksiksi) ulottuvat kauimpana sisällä olevasta laatikosta oleviin tietoihin, ja loput on merkitty poikkeavina.

Esimerkki viiden luvun yhteenvedon laatimisesta tietosarjalle

Seuraavaksi esitetään vaihe vaiheelta menetelmä viiden luvun yhteenvedon laatimiseksi tilastotietojoukosta. Lisäksi se selittää, kuinka laatikkokaavio rakennetaan tämän yhteenvedon visualisointia varten graafisessa muodossa.

Tiedot vastaavat tavaratalon naisten osastolla myytyjen tuotteiden määrää 10 viikon aikana. Tutkimuksen tulokset on esitetty alla:

maanantai tiistai keskiviikko torstai perjantai lauantai sunnuntai
Viikko 1 158 145 156 156 164 167 147
viikko 2 161 146 157 152 162 160 153
Viikko 3 152 150 157 155 164 166 152
viikko 4 150 149 153 162 169 162 149
viikko 5 157 152 154 155 168 161 155
viikko 6 157 145 160 164 164 168 149
viikko 7 160 152 151 152 168 163 145
viikko 8 157 152 155 156 162 169 155
viikko 9 160 148 157 150 164 170 154
viikko 10 158 146 163 158 165 169 150

Vaihe 1: Lajittele kaikki tiedot pienimmästä suurimpaan ja määritä niille indeksi alkaen 1.

Tämän vaiheen tulos on esitetty alla:

Indeksi Kannattaa Indeksi Kannattaa Indeksi Kannattaa Indeksi Kannattaa
1 145 22 152 43 158 64 168
2 145 23 153 44 160 65 168
3 145 24 153 Neljä viisi 160 66 168
4 146 25 154 46 160 67 169
5 146 26 154 47 160 68 169
6 147 27 155 48 161 69 169
7 148 28 155 49 161 70 170
8 149 29 155 viisikymmentä 162
9 149 30 155 51 162
10 149 31 155 52 162
yksitoista 150 32 156 53 162
12 150 33 156 54 163
13 150 3. 4 156 55 163
14 150 35 157 56 164
viisitoista 151 36 157 57 164
16 152 37 157 58 164
17 152 38 157 59 164
18 152 39 157 60 164
19 152 40 157 61 165
kaksikymmentä 152 41 158 62 166
kaksikymmentäyksi 152 42 158 63 167

Vaihe 2: Määritä Q1- ja Q3-kvartiilit

Q1-, Q2- ja Q3-kvartiilien määrittämiseksi aloitamme laskemalla indeksin kutakin kvartiilia vastaaville tiedoille. Kaava on seuraava:

Viiden numeron yhteenveto

Viiden numeron yhteenveto

Viiden numeron yhteenveto

Missä N on tietojen kokonaismäärä. Tämä laskenta voi olla kokonaisluku tai ei, joten menettely on jaettu kahteen tapaukseen:

Tapaus 1: Kokonaislukutulos

Jos tulos on kokonaisluku, vastaava kvartiili on sen datan arvo, jota indeksi vastaa. Jos esimerkiksi indeksi Q1 antaa arvon 10, tämä tarkoittaa, että Q1 on datanumeron 10 arvo (esimerkissämme 149).

Tapaus 2: Desimaalitulos

Jos indeksi on desimaaliluku, kvartiili ei vastaa täsmälleen mitään sarjassa olevaa dataa. Tässä tapauksessa tulos pyöristetään alaspäin ja kvartiili lasketaan tästä ja sitä seuraavasta tiedosta seuraavan kaavan avulla:

Viiden numeron yhteenveto

Kun d edustaa indeksin desimaaliosaa, x i on data, jonka indeksi on pyöristetty alaspäin, ja x i+1 on seuraava datapiste.

Esimerkkimme tapauksessa tämä on tulos kolmen kvartiilin indeksien laskemisesta:

Viiden numeron yhteenveto

Viiden numeron yhteenveto

Viiden numeron yhteenveto

Kaikissa tapauksissa tulos oli desimaaliluku, joten käytämme nyt tapauksen 2 kaavaa määrittääksemme kunkin kvartiilin arvon:

Viiden numeron yhteenveto

Viiden numeron yhteenveto

Viiden numeron yhteenveto

Vaihe 3: Tunnista viisi numeroa

Nyt kun meillä on tiedot järjestetty ja olemme myös määrittäneet kolmen kvartiilin arvot, viiden luvun yhteenveto on:

Minimi: 145
Q1: 152
Q2 tai mediaani: 157
Q3: 162,25
Enimmäismäärä: 170

Vaihe 4: Rakenna boxplot

Meillä on jo kaikki tarvittava boxplotin rakentamiseen paitsi RIC. Edellisessä vaiheessa saadun tuloksen perusteella ero Q3:n ja Q1:n välillä on:

Viiden numeron yhteenveto

Määrittääksemme, onko poikkeavuuksia, laskemme Q1 – 1,5 IQR ja Q3 + 1,5 IQR ja vertaamme niitä minimiin ja maksimiin:

Viiden numeron yhteenveto

Viiden numeron yhteenveto

Kuten näemme, poikkeamia ei ole, koska minimi, 140, on suurempi kuin 136 625. Poikkeuksia ei myöskään ole, koska enimmäisarvo, 170, on alle 177 625.

Seuraavassa kuvassa näkyy esimerkkiä vastaavan laatikkokaavion rakentamisen tulos:

Viiden numeron yhteenveto

Viitteet

Kuinka koota viiden numeron yhteenveto tilastollisesta otoksesta . (nd). FaqSalex.info. https://faqsalex.info/educaci%C3%B3n/21361-c%C3%B3mo-reunir-a-un-resumen-de-cinco-n%C3%BAmeros-de-una.html

McAdams, D. (2009, 4. maaliskuuta). Yhteenveto viidestä numerosta. Life is a Story Problem.org. https://lifeisastoryproblem.tripod.com/es/f/fivenumbersummary.html

Serra, BR (2020, 22. marraskuuta). mediaani . Universumin kaavat. https://www.universoformulas.com/estadistica/descriptiva/mediana/#calculo

Serra, BR (2021, 4. elokuuta). kvartiilit . Universumin kaavat. https://www.universoformulas.com/estadistica/descriptiva/cuartiles/#example

Zentica Global. (nd). Brutalk – Kuinka laskea 5 numeron yhteenveto tiedoille Pythonissa . Brutalk. https://www.brutalk.com/en/news/brutalk-blog/view/how-to-calculate-the-summary-of-5-numbers-for-your-data-in-python-6047097da7d56

-Mainos-

Israel Parada (Licentiate,Professor ULA)
Israel Parada (Licentiate,Professor ULA)
(Licenciado en Química) - AUTOR. Profesor universitario de Química. Divulgador científico.

Artículos relacionados