Tabla de Contenidos
Kuvaavissa tilastoissa on joukko toimenpiteitä, joiden avulla voimme havaita erilaisia yleisiä näkökohtia väestön tiedoista. Joillakin mitataan tiedon keskeistä suuntausta, kun taas toisilla pyritään antamaan käsitys tiedon vaihtelevuudesta tai hajaantumisesta eli tavasta, jolla data jakautuu mainitun keskeisen suuntauksen ympärille.
Kaksi tärkeää vaihtelevuuden tai dispersion mittaa ovat varianssi ja keskihajonta. Nämä kaksi mittaria liittyvät läheisesti toisiinsa, mutta varianssista on kaksi versiota ja keskihajonnasta kaksi vastaavaa versiota, eli populaatio ja otos.
Väestö vs. tilastolliset yhteenvedot
On syytä huomata eräs erittäin tärkeä seikka, nimittäin se, että tilastoissa kustakin mittarista on yleensä kaksi versiota, jotka tiivistävät tietosarjan käyttäytymisen ja joita käytetään eri yhteyksissä.
Aluksi meidän on erotettava populaation tiedot (tai populaatiotiedot) ja tiedot tämän populaation osajoukosta, jota kutsutaan otokseksi. Vaikka populaatiotiedot ja otantatiedot ovat matemaattisesti erottamattomia, ne ovat käsitteellisesti hyvin erilaisia.
väestölaskennat
Väestödata on tilastollisen väestönlaskennan kautta saatua tietoa, eli jokaista populaation muodostavaa elementtiä tai yksilöä mittaamalla tai analysoimalla (niin kauan kuin se on tietysti äärellinen). Kun laskemme väestötiedon keskeisen trendin tai hajonnan mittareita, saamme mittareita, jotka tekevät yhteenvedon väestön yleisestä käyttäytymisestä, joita kutsumme populaatioparametreiksi ja jotka ovat populaation kiinteitä arvoja (eli populaatiolla on vain yksi keskiarvo , yksi tila, yksi standardipoikkeama jne. tiettynä ajankohtana). Tässä tapauksessa käytämme kuvaavia tilastoja .
Näytteenotto
Toisaalta useissa eri tilanteissa teemme otantaprosessin analysoidaksemme vain joitakin perusjoukon elementtejä, jolloin saadaan näytedataa. Näissä tapauksissa voimme myös käyttää kuvailevien tilastojen työkaluja näiden tietojen yleisen käyttäytymisen havainnointiin, mutta emme varsinaisesti tee kuvaavaa tilastoa perusjoukosta, vain otoksesta.
Otoksen numeeriset yhteenvedot eivät ole parametreja, vaan niitä kutsutaan tilastoiksi (vaikka jotkut kutsuvat niitä myös tilastoiksi). Toisin kuin parametrit, tilastot vaihtelevat otoksesta toiseen , vaikka näytteet olisi otettu samasta populaatiosta. Tämä johtuu siitä, että perusjoukon osajoukkoa valittaessa on olemassa monia mahdollisia elementtien yhdistelmiä, jotka voivat muodostaa otoksen. Tästä syystä otokset koostuvat yleensä eri aiheista, yksilöistä tai elementeistä, mikä johtaa erilaisiin tilastoihin.
Näiden tilastojen laskemisen otoksen perimmäisenä tavoitteena on voida käyttää niitä vastaavien perusjoukon parametrien estimaattoreina. Tämä prosessi, jossa päättelee tai arvioi populaatiotietojen käyttäytymistä otostiedoista, on se, mistä päättelytilastot ovat vastuussa . Tämä tekee populaatiosta ja otosvarianssista ja keskihajonnasta olennaisesti erilaisia.
Mutta mitä varianssi ja keskihajonta oikein ovat ?
Mikä on varianssi?
Varianssi on dispersion mitta tietojoukon keskiarvosta. Se määritellään kaikkien tietojen neliöityjen poikkeamien keskiarvona. Koska se on neliöityjen erojen keskiarvo, se on aina positiivinen suure.
Mikä on keskihajonta?
Toisaalta standardipoikkeama on yksinkertaisesti varianssin positiivinen neliöjuuri. Se mittaa myös hajontaa keskiarvon ympärillä, mutta se tekee sen samoilla datayksiköillä ja keskiarvolla. Tämä tekee siitä helpompi ymmärtää ja tulkita kuin varianssi.
Koska keskihajonta lasketaan varianssin neliöjuurena, ei ole järkevää puhua perusjoukosta ja otoksen keskihajonnasta puhumatta perusjoukosta ja otosvarianssista.
Tärkeimmät erot näiden yleisten hajontamittausten välillä keskiarvon ympärillä kuvataan yksityiskohtaisesti seuraavissa osioissa.
Ero 1: Populaatioiden ja otosten keskihajonnat ja varianssit esitetään eri symboleilla
Ensimmäinen ero, joka on otettava huomioon verrattaessa perusjoukon ja otoksen varianssia sekä perusjoukon ja otoksen keskihajontaa , on niitä edustava symboli. Tilastoissa populaation numeeriset yhteenvedot tai parametrit esitetään yleensä kreikkalaisilla kirjaimilla , kun taas otos- tai tilastoversiot esitetään latinalaisten aakkosten vastaavilla kirjaimilla .
Tässä mielessä varianssi ja populaation keskihajonna liittyvät molemmat pieneen kreikkalaiseen sigmaan, kun taas otosversioita edustaa kirjain s . Toisin sanoen populaation varianssi on σ 2 ja perusjoukon keskihajonna on σ , kun taas otosvarianssia edustaa s 2 ja otoksen keskihajontaa s .
Ero 2: Ne lasketaan eri kaavojen avulla
Sekä populaatio että otoksen keskihajonta lasketaan vastaavan varianssin positiivisena neliöjuurena, joka on:
Populaatio- ja otosvarianssit lasketaan kuitenkin hieman erilaisilla kaavoilla. Perusjoukon varianssin tapauksessa tämä lasketaan kunkin perusluvun neliöityjen poikkeamien keskiarvona suhteessa perusjoukon keskiarvoon. Eli se lasketaan jollakin seuraavista vastaavista lausekkeista:
Kun x i edustaa perusjoukon kunkin tietokohteen arvoa, μ edustaa perusjoukon keskiarvoa ja N on populaation koko. Siksi populaation keskihajonna lasketaan seuraavasti:
Sen sijaan, että n jakattaisiin datapisteiden lukumäärällä, kuten olisi odotettavissa, otosvarianssi lasketaan jakamalla otoksen keskiarvon neliöityjen poikkeamien summa n – 1:llä . Toisin sanoen otosvarianssi lasketaan seuraavasti:
Kun x i edustaa kunkin näytteen tietokohteen arvoa, x̄ edustaa otoksen keskiarvoa ja n on otoksen koko. Edellä esitetyn perusteella otoksen keskihajonnan lasketaan seuraavasti:
Perustelu jakamiseen n:llä – 1 n:n sijaan
Yleisin kysymys, joka herää verrattaessa perusjoukon ja otoksen keskihajontoja, on, miksi jakaa n – 1: llä eikä n :llä ? Syy on hyvin yksinkertainen.
Kuten aiemmin mainittiin, tilastojen, kuten otoksen keskihajonnan, laskennassa pyritään muodostamaan estimaatit, jotka ovat mahdollisimman lähellä vastaavia perusjoukon parametreja. Tämä tarkoittaa, että otoksen keskihajonna tulee laskea siten, että tulos on mahdollisimman lähellä perusjoukon keskihajontaa.
Tämä viittaa siihen, että ne pitäisi laskea vastaavilla kaavoilla, mutta näin ei aina ole. Ongelmana on, että otoksen keskihajonta mittaa hajautta otoksen keskiarvon ympärillä, ei perusjoukon keskiarvoa. Vaikka otoskeskiarvo on tilasto, jota käytetään perusjoukon keskiarvon estimaattorina, se ei ole täsmälleen sama kuin se. Tämä aiheuttaa sen, että kunkin näytteen yksittäiset arvot ovat lähempänä otoksen keskiarvoa (joka on itse asiassa kyseisen datan keskeisen taipumuksen mitta) kuin populaation keskiarvoa. Erään,
Tämän poikkeaman korjaamiseksi nimittäjästä vähennetään yksi yksikkö, jotta otoksen keskihajonna on suurempi ja siten lähempänä perusjoukon keskihajontaa.
Ero 3: Ne ovat harvoin samoja
Riippumatta korjauksista, joita otoksen keskihajontaan voidaan tehdä, se on harvoin yhtä suuri kuin perusjoukon keskihajonna. Tämä johtuu siitä, että populaation sisällä tiedot voivat vaihdella satunnaisesti, joten erilaiset näytteet johtavat erilaisiin otosten keskihajontaan. Itse asiassa näytteen keskihajonnan mahdollisista arvoista on olemassa koko jakauma näytteen koosta riippuen.
Ero 4: Otosten keskihajonnan voi aina tietää tai määrittää, kun taas populaation keskihajontaa ei tunneta lähes koskaan varmasti.
Toinen tärkeä ero näiden kahden hajontamitan välillä on se, että populaation keskihajonna (ja itse asiassa mikä tahansa populaatioparametri) tunnetaan harvoin. Tämä johtuu joissakin tapauksissa teknisistä tai taloudellisista rajoituksista, koska se on erittäin kallista ja lisäksi on epätodennäköistä, että sillä pystytään mittaamaan ehdottomasti kaikkia väestön tietoja. Muissa tapauksissa populaatioparametrien määrittäminen on yksinkertaisesti mahdotonta joko siksi, että populaatio on ääretön, tai yksinkertaisesti siksi, että meillä ei ole pääsyä kaikkiin sen muodostaviin elementteihin.
Toisin sanoen emme melkein koskaan tiedä kaikkia x i:n N- arvoja populaatiossa, mikä tekee mahdottomaksi laskea perusjoukon keskiarvoa, varianssia ja laajemmin keskihajontaa. Paras, jonka voimme tietää, on pisteestimaatti parametrista, kuten keskihajonnasta, tai arvoväli, jonka sisällä meillä on jonkin verran luottamusta keskihajonnan tai muun populaatioparametrin olevan.
Toisaalta näytteiden tapauksessa tiedämme kaikki tiedot, joten voimme aina laskea minkä tahansa näytteen keskihajonnan, oli sen koko mikä tahansa.
Yhteenveto populaation ja otoksen keskihajonnan eroista
Seuraavassa taulukossa on yhteenveto edellisissä osioissa käsitellyn perusjoukon keskihajonnan ja otoksen keskihajonnan välisistä eroista:
Ominaista | Populaation keskihajonna | Esimerkki keskihajonnasta |
Symboli | σ | Joo |
Se on laskettu | väestötiedot | näytetiedot |
Tilastoala, jossa sitä käytetään | Kuvailevia tilastoja | päättelytilastot |
Toimen tyyppi | Parametri | Tilastollinen |
Kaava | Jaa N:llä, populaation koolla | Jaa n – 1:llä, missä n on otoksen koko |
Vaihtuvuus | Se on kiinteä tietylle väestölle tiettynä aikana | Vaihtelee näytteestä toiseen riippumatta siitä, ovatko näytteet samankokoisia ja otettu samasta populaatiosta |
Varmuus arvossaan | Se on yleensä tuntematon. Siitä on saatavilla vain arvio. | Se tunnetaan jokaisesta näytteestä |
Viitteet
Yhteisön oppimiskeskukset. (nd). Standardipoikkeama . http://www.cca.org.mx/cca/cursos/estadistica/html/m11/desviacion_estandar.htm
Levy Sarfin, R. (sf). Mitä eroa on otoksen ja perusjoukon keskihajonnan välillä ? Ääni. https://pyme.lavoztx.com/what-is-the-difference-entre-la-sample-and-the-standard-viation-of-the-population-5641.html
MateMobile. (2021, 1. tammikuuta). Varianssi ja keskihajonta, esimerkkejä ja harjoituksia . https://matemovil.com/varianza-y-desviacion-estandar-ejemplos-y-ejercicios/
Molina, M. (2016, 27. tammikuuta). Miksi jättää yksi? Väestön parametrien arviointi . Nukuta. https://anestesiar.org/2016/por-que-sobra-uno-estimando-parametros-de-la-poblacion/
Serra, BR (2020, 26. lokakuuta). Tyypillinen tai standardipoikkeama . Universumin kaavat. https://www.universoformulas.com/estadistica/descriptiva/desviacion-típica/