Differenze tra popolazione e deviazioni standard campionarie

Artículo revisado y aprobado por nuestro equipo editorial, siguiendo los criterios de redacción y edición de YuBrain.


Nella statistica descrittiva sono presenti una serie di misure che permettono di osservare diversi aspetti generali dei dati di una popolazione. Alcuni servono a misurare la tendenza centrale dei dati, mentre altri cercano di dare un’idea della variabilità o dispersione dei dati, cioè del modo in cui i dati sono distribuiti attorno a detta tendenza centrale.

Due importanti misure di variabilità o dispersione sono la varianza e la deviazione standard. Queste due misure sono strettamente correlate tra loro, tuttavia esistono due versioni della varianza e due versioni corrispondenti della deviazione standard, vale a dire la popolazione e il campione.

Riepiloghi statistici della popolazione rispetto ai campioni

Vale la pena notare un fatto di grande importanza e cioè che, in statistica, esistono generalmente due versioni di ciascuna delle misure che riassumono il comportamento di una serie di dati e che vengono utilizzate in contesti diversi.

Per cominciare, dobbiamo distinguere tra dati di una popolazione (o dati di popolazione) e dati di un sottoinsieme di quella popolazione, chiamato campione. Sebbene i dati sulla popolazione e i dati del campione siano matematicamente indistinguibili, concettualmente sono molto diversi.

censimenti della popolazione

I dati sulla popolazione sono dati ottenuti attraverso un censimento statistico, cioè misurando o analizzando ogni elemento o individuo che compone una popolazione (sempre che sia finita, ovviamente). Quando calcoliamo le misure di tendenza centrale o dispersione per i dati della popolazione, otteniamo misure che riassumono il comportamento generale della popolazione, che chiamiamo parametri della popolazione e che sono valori fissi per una popolazione (ovvero, una popolazione ha solo una media , una modalità, una deviazione standard, ecc. in un dato momento). In questo caso, stiamo facendo uso di statistiche descrittive .

Campionamento

D’altra parte, in molte situazioni diverse, svolgiamo un processo di campionamento per analizzare solo alcuni elementi della popolazione, ottenendo così dati campionari. In questi casi possiamo utilizzare anche gli strumenti della statistica descrittiva per osservare il comportamento generale di questi dati, ma in realtà non stiamo facendo statistiche descrittive sulla popolazione, solo sul campione.

I riepiloghi numerici del campione non sono parametri, ma sono chiamati statistiche (sebbene alcuni li chiamino anche statistiche). A differenza dei parametri, le statistiche variano da campione a campione , anche se i campioni provengono dalla stessa popolazione. Questo perché, quando si seleziona un sottoinsieme della popolazione, sono molte le possibili combinazioni di elementi che possono comporre il campione. Per questo motivo, in genere, i campioni sono composti da soggetti, individui o elementi diversi, dando origine a statistiche diverse.

L’obiettivo finale del calcolo di queste statistiche sul campione è quello di poterle utilizzare come stimatori dei rispettivi parametri della popolazione. Questo processo di deduzione o stima del comportamento dei dati della popolazione dai dati del campione è ciò di cui è responsabile la statistica inferenziale . Ciò rende la popolazione e le varianze campionarie e le deviazioni standard essenzialmente diverse.

Ma cosa sono esattamente la varianza e la deviazione standard?

Qual è la varianza?

La varianza è una misura della dispersione rispetto alla media di un set di dati. È definito come la media delle deviazioni al quadrato di tutti i dati dalla media. Essendo una media delle differenze al quadrato, è sempre una quantità positiva.

Qual è la deviazione standard?

D’altra parte, la deviazione standard è semplicemente la radice quadrata positiva della varianza. Misura anche la dispersione attorno alla media, solo che lo fa in termini delle stesse unità dei dati e della media. Questo rende più facile da capire e interpretare rispetto alla varianza.

Poiché la deviazione standard è calcolata come radice quadrata della varianza, non ha senso parlare di popolazione e deviazione standard campionaria senza parlare di popolazione e varianza campionaria.

Le differenze più importanti tra queste misure comuni di dispersione attorno alla media saranno descritte in dettaglio nelle sezioni seguenti.

Differenza 1: le deviazioni standard e le varianze della popolazione e del campione sono rappresentate da simboli diversi

La prima differenza da considerare quando si confrontano la popolazione e la varianza campionaria e la popolazione e la deviazione standard campionaria è il simbolo utilizzato per rappresentarle. Nelle statistiche, i riepiloghi oi parametri numerici della popolazione sono solitamente rappresentati utilizzando lettere greche , mentre le versioni campione o statistiche sono rappresentate dalle lettere equivalenti dell’alfabeto latino .

In questo senso, la varianza e la deviazione standard della popolazione sono entrambe associate alla lettera greca minuscola sigma mentre le versioni esemplificative sono rappresentate dalla lettera s . Cioè , la varianza della popolazione è σ2 e la deviazione standard della popolazione è σ , mentre la varianza campionaria è rappresentata da s2 e la deviazione standard campionaria è rappresentata da s .

Differenza 2: Sono calcolati mediante diverse formule

Sia la popolazione che la deviazione standard campionaria sono calcolate come radice quadrata positiva della rispettiva varianza, ovvero:

Differenze tra popolazione e deviazioni standard campionarie

Tuttavia, le varianze della popolazione e del campione vengono calcolate utilizzando formule leggermente diverse. Nel caso della varianza della popolazione, questa è calcolata come media dei quadrati degli scarti di ciascun dato rispetto alla media della popolazione. Cioè, è calcolato da una delle seguenti espressioni equivalenti:

Differenze tra popolazione e deviazioni standard campionarie

Dove x i rappresenta il valore di ciascun elemento di dati nella popolazione, μ rappresenta la media della popolazione e N è la dimensione della popolazione. Pertanto, la deviazione standard della popolazione è calcolata come:

Differenze tra popolazione e deviazioni standard campionarie

Invece, invece di dividere per il numero di punti dati, n , come ci si aspetterebbe, la varianza campionaria viene calcolata dividendo la somma delle deviazioni al quadrato dalla media campionaria per n – 1 . In altre parole, la varianza campionaria è calcolata come:

Differenze tra popolazione e deviazioni standard campionarie

Dove x i rappresenta il valore di ciascun elemento di dati nel campione, x̄ rappresenta la media campionaria e n è la dimensione del campione. In considerazione di quanto sopra, la deviazione standard del campione è calcolata come:

Differenze tra popolazione e deviazioni standard campionarie

Giustificazione per dividere per n – 1 invece di n

Una domanda comune che sorge quando si confrontano le deviazioni standard della popolazione e del campione è perché dividere per n – 1 e non per n ? La ragione è molto semplice.

Come accennato in precedenza, il calcolo di statistiche come la deviazione standard campionaria cerca di stabilire stimatori il più vicino possibile ai rispettivi parametri della popolazione. Ciò significa che la deviazione standard del campione dovrebbe essere calcolata in modo tale che il risultato sia il più vicino possibile alla deviazione standard della popolazione.

Ciò suggerirebbe di calcolarli con formule equivalenti, ma non è sempre così. Il problema è che la deviazione standard campionaria misura lo spread intorno alla media campionaria, non alla media della popolazione. Sebbene la media campionaria sia una statistica utilizzata come stima della media della popolazione, non è esattamente uguale ad essa. Ciò fa sì che i valori individuali in ciascun campione siano più vicini alla media campionaria (che è, in effetti, la misura della tendenza centrale per quei dati) che alla media della popolazione. Dovuto,

Per correggere questa discrepanza, viene sottratta un’unità dal denominatore per aumentare la deviazione standard del campione e quindi avvicinarla alla deviazione standard della popolazione.

Differenza 3: Raramente sono uguali

Indipendentemente dalle correzioni che possono essere apportate alla deviazione standard del campione, raramente è uguale alla deviazione standard della popolazione. Questo perché, all’interno di una popolazione, i dati possono variare in modo casuale, quindi campioni diversi risulteranno in deviazioni standard del campione diverse. In effetti, esiste un’intera distribuzione di possibili valori delle deviazioni standard del campione a seconda della dimensione del campione.

Differenza 4: la deviazione standard del campione può sempre essere nota o determinata, mentre la deviazione standard della popolazione non è quasi mai nota con certezza.

Un’altra importante differenza tra queste due misure di dispersione è che la deviazione standard della popolazione (e in effetti qualsiasi parametro della popolazione) è raramente nota. Ciò è dovuto, in alcuni casi, a limitazioni tecniche o economiche, in quanto è molto costoso e, inoltre, difficilmente si riesce a misurare assolutamente tutti i dati di una popolazione. In altri casi, determinare i parametri della popolazione è semplicemente impossibile, o perché la popolazione è infinita, o semplicemente perché non abbiamo accesso a tutti gli elementi che la compongono.

In altre parole, non conosciamo quasi mai tutti gli N valori di x i in una popolazione, rendendo impossibile il calcolo della media, della varianza e, per estensione, della deviazione standard della popolazione. Il meglio che possiamo conoscere è una stima puntuale di un parametro come la deviazione standard, o un intervallo di valori all’interno del quale abbiamo un certo livello di fiducia che si trovi la deviazione standard o un altro parametro della popolazione.

Nel caso dei campioni, invece, conosciamo tutti i dati, quindi possiamo sempre calcolare la deviazione standard di qualsiasi campione, qualunque sia la sua dimensione.

Sintesi delle differenze tra la popolazione e le deviazioni standard del campione

La tabella seguente riassume le differenze tra la deviazione standard della popolazione e la deviazione standard del campione discusse nelle sezioni precedenti:

Caratteristica Deviazione standard della popolazione Deviazione standard del campione
Simbolo σ
È calcolato per dati sulla popolazione dati campione
Filiale della statistica in cui viene utilizzato Statistiche descrittive statistica inferenziale
Tipo di misura Parametro Statistico
Formula Dividi per N, la dimensione della popolazione Dividi per n – 1, dove n è la dimensione del campione
Variabilità È fissato per una data popolazione in un dato momento Varia da campione a campione, indipendentemente dal fatto che i campioni siano della stessa dimensione e tratti dalla stessa popolazione
Certezza nel suo valore È generalmente sconosciuto. Ne è disponibile solo una stima. È noto per ogni campione

Riferimenti

Centri di apprendimento comunitario. (nd). La deviazione standard . http://www.cca.org.mx/cca/cursos/estadistica/html/m11/desviacion_estandar.htm

Levy Sarfin, R. (sf). Qual è la differenza tra il campione e la deviazione standard della popolazione . La voce. https://pyme.lavoztx.com/what-is-the-difference-entre-la-sample-and-the-standard-deviation-of-the-population-5641.html

MateMobile. (2021, 1 gennaio). Varianza e deviazione standard, esempi ed esercizi . https://matemovil.com/varianza-y-desviacion-estandar-ejemplos-y-ejercicios/

Molina, M. (2016, 27 gennaio). Perché risparmiarne uno? Stima dei parametri della popolazione . Anestetizzare. https://anestesiar.org/2016/por-que-sobra-uno-estimando-parametros-de-la-poblacion/

Serra, BR (2020, 26 ottobre). Deviazione tipica o standard . Formule dell’universo. https://www.universoformulas.com/estadistica/descriptiva/desviacion-típica/

-Annuncio-

Israel Parada (Licentiate,Professor ULA)
Israel Parada (Licentiate,Professor ULA)
(Licenciado en Química) - AUTOR. Profesor universitario de Química. Divulgador científico.

Artículos relacionados