Tabla de Contenidos
La deviazione standard di un set di dati o di un campione di una certa popolazione è un parametro statistico descrittivo che misura la diffusione dei valori in quel set. Se viene calcolata la media di un insieme di valori, la deviazione standard valuta la differenza dei valori nell’insieme rispetto alla media.
La deviazione standard è un numero reale non negativo. Poiché zero è un numero reale non negativo, vale la pena chiedersi quando la deviazione standard sarà uguale a zero e cosa significa. Questo accade solo in un caso molto particolare, ovvero quando tutti i valori nel set di dati sono esattamente gli stessi.
deviazione standard
Quando si ha un data set, sia esso un campione di una certa popolazione o un insieme di valori prodotti da un certo sistema, sorgono subito due domande: a quale valore definito possiamo associare il data set che abbiamo e qual è la dispersione del set di dati? set di dati che analizziamo.
Nelle cosiddette statistiche descrittive ci sono diversi parametri che cercano di rispondere a queste due domande. Per valutare il valore a cui possiamo associare il set di dati, si può calcolare la media o media aritmetica, la media geometrica, la media armonica, la moda, l’intervallo medio o la mediana. In questo caso useremo la media o media aritmetica: la media di un insieme di n valori è la somma di tutti loro divisa per il numero di valori n .
La diffusione dei valori in un insieme può essere valutata calcolando la deviazione standard, l’intervallo o l’intervallo interquartile. La figura seguente mostra la formula generale utilizzata per calcolare la deviazione standard σ . Espresso in parole: sottraiamo da ogni valore dell’insieme che analizziamo, che annotiamo con il pedice i , la media di tutti i valori; equazioniamo ciascuna di queste differenze e le sommiamo; Dividiamo il risultato per il numero di valori nell’insieme meno 1 e calcoliamo la radice quadrata di questo valore.
La deviazione standard ha due definizioni diverse, a seconda del tipo di dati che stiamo analizzando. Questa differenza implica un calcolo leggermente diverso. La deviazione standard può essere calcolata su una popolazione o su un campione.
Se i dati vengono raccolti da tutti i membri di una popolazione o di un insieme, deve essere utilizzata la deviazione standard di una popolazione. Se si analizzano dati che rappresentano un campione di una popolazione più ampia, è necessario utilizzare la deviazione standard di un campione. La differenza nel calcolo è che nel caso della deviazione standard di un campione, la differenza tra ciascun valore e la media al quadrato viene divisa per il numero di valori meno 1 ( n – 1) , come mostrato in figura . Per la deviazione standard di una popolazione, dividi per n .
La deviazione standard è uguale a zero.
La deviazione standard σ calcolata in questo modo valuta lo spread dei valori nell’insieme: maggiore è il suo valore, maggiore è lo spread. Y è sempre un numero positivo, poiché è la somma di valori al quadrato che, quindi, saranno tutti positivi. Quindi intuitivamente, se il valore della deviazione standard è zero lo spread dovrebbe essere zero. E questo avviene quando tutti i valori dell’insieme coincidono: non c’è dispersione.
A sua volta, se tutti i valori dell’insieme corrispondono, anche la media corrisponde a quel valore. Secondo la precedente definizione di media, se gli n valori dell’insieme sono uguali, la somma degli n valori si traduce nel moltiplicare quel valore per n ; dividendolo per n per calcolare la media si eliminano entrambi i valori di n e si ha quindi che la media è uguale al valore univoco dell’insieme. Sviluppando questa descrizione in un’equazione, se ci sono n valori uguali, espressi come x , la media viene calcolata come
( x + x + x + x + x +…+ x )/ n = nx / n = x
Vediamo cosa succede con il calcolo della deviazione standard con la formula descritta in precedenza. In quella formula, ogni valore x i è uguale a x e, a sua volta, è uguale alla media. Pertanto, quando la media viene sottratta da ciascun valore x i , il risultato è zero. Avendo una somma con tutti i suoi addendi pari a zero, anche il risultato sarà zero. E poi il risultato finale della deviazione standard sarà zero.
Abbiamo già visto allora che quando tutti i valori in un insieme sono uguali, la media è uguale a quel valore e la deviazione standard è zero. Considera la situazione inversa: la deviazione standard è zero solo se tutti i valori nell’insieme sono uguali?
Per verificarlo, vediamo cosa succede se solo un valore è diverso. Ciò implicherebbe che la media non è più uguale a tutti i valori dell’insieme e quindi almeno uno degli addendi del calcolo della deviazione standard sarebbe diverso da zero: quindi la deviazione standard non sarebbe zero. Poiché questa sommatoria si sviluppa su valori elevati al quadrato, tutti gli addendi sono positivi e non è possibile che vengano compensati in una sottrazione. L’unico modo perché la somma dei numeri positivi sia zero è che tutti gli addendi siano zero; pertanto, l’unico modo affinché la deviazione standard sia zero è che tutti i valori nel gruppo siano uguali alla media, e quindi uguali tra loro.
Entrambi gli argomenti costituiscono una condizione necessaria e sufficiente: la deviazione standard di un insieme di valori è zero solo se tutti i valori nell’insieme sono uguali.
Fontana
Yadolah Dodge. L’enciclopedia concisa delle statistiche . New York: Springer, 2010.