¿Qué pasa cuando la desviación estándar es igual a cero?

Artículo revisado y aprobado por nuestro equipo editorial, siguiendo los criterios de redacción y edición de YuBrain.

La desviación estándar de un conjunto de datos o de una muestra de una cierta población es un parámetro estadístico descriptivo que mide la dispersión de los valores de ese conjunto. Si se calcula el promedio de un conjunto de valores, la desviación estándar evalúa la diferencia de los valores del conjunto respecto del promedio.

La desviación estándar es un número real no negativo. Dado que el cero es un número real no negativo cabe preguntarse cuándo la desviación estándar será igual a cero y qué significado tiene. Esto sucede solo en un caso muy particular, que es cuando todos los valores del conjunto de datos son exactamente iguales.

La desviación estándar

Cuando se tiene un conjunto de datos, ya sea una muestra de una cierta población o un conjunto de valores producidos por un sistema determinado, surgen inmediatamente dos preguntas: a qué valor definido podemos asociar el conjunto de datos que tenemos y cuál es la dispersión del conjunto de datos que analizamos.

En la denominada estadística descriptiva existen diferentes parámetros que buscan responden a estas dos preguntas. Para evaluar el valor al que podemos asociar el conjunto de datos se puede calcular el promedio o media aritmética, la media geométrica, la media armónica, la moda, el rango medio o la mediana. En este caso usaremos el promedio o media aritmética: el promedio de un conjunto de n valores es la suma de todos ellos dividido la cantidad de valores n.

La dispersión de los valores de un conjunto se puede evaluar calculando la desviación estándar, el rango o el rango intercuartil. La figura siguiente muestra la fórmula general que se utiliza para calcular la desviación estándar σ. Expresado en palabras: restamos de cada valor del conjunto que analizamos, que notamos con el subíndice i, el promedio de todos los valores; elevamos al cuadrado cada una de estas diferencias y las sumamos; dividimos el resultado entre el número de valores del conjunto menos 1 y calculamos la raíz cuadrada de éste valor.

Desviación estándar σ de una muestra.
Desviación estándar σ de una muestra.

La desviación estándar tiene dos definiciones diferentes, dependiendo del tipo de datos que estemos analizando. Esta diferencia implica un cálculo levemente diferente. La desviación estándar se puede calcular sobre una población o sobre una muestra.

Si se recopilan datos de todos los miembros de una población o de un conjunto, se tiene que utilizar la desviación estándar de una población. Si se analizan datos que representan una muestra de una población mayor, se tiene que utilizar la desviación estándar de una muestra. La diferencia en el cálculo es que en el caso de la desviación estándar de una muestra se divide la diferencia entre cada valor y el promedio al cuadrado entre número de valores menos 1 (n – 1), como muestra la figura. En el caso de la desviación estándar de una población, se divide entre n.

La desviación estándar igual a cero

La desviación estándar σ calculada de esta forma evalúa la dispersión de los valores del conjunto: cuanto mayor sea su valor, mayor es la dispersión. Y es un número siempre positivo, ya que es la suma de valores elevados al cuadrado que, por lo tanto, serán todos positivos. Entonces, intuitivamente, si el valor de la desviación estándar es cero la dispersión debería ser cero. Y esto se produce cuando todos los valores del conjunto coinciden: no hay dispersión.

A su vez, si todos los valores del conjunto coinciden, el promedio también coincide con ese valor. Según la definición anterior de promedio, si los n valores del conjunto son iguales la suma de los n valores se traduce en multiplicar ese valor por n; al dividirlo entre n para calcular el promedio se eliminan ambos valores de n y tenemos entonces que el promedio es igual al valor único del conjunto. Desarrollando esta descripción en una ecuación, si se tienen n valores iguales, expresados como x, el promedio se calcula como

(x + x + x + x + x +…+ x)/n = n.x/n = x

Veamos qué sucede con el cálculo de la desviación estándar con la fórmula descrita previamente. En esa fórmula, cada valor xi es igual a x, y a su vez es igual al promedio. Por lo tanto, cuando se hace la resta del promedio respecto de cada valor xi, el resultado es cero. Al tener una suma con todos sus sumandos iguales a cero, el resultado también será cero. Y entonces el resultado final de la desviación estándar será cero.

Ya vimos entonces que cuando todos los valores de un conjunto son iguales, el promedio es igual a ese valor y la desviación estándar es cero. Pensemos en la situación inversa: ¿la desviación estándar es cero solo si todos los valores del conjunto son iguales?

Para comprobarlo veamos qué pasa si solo un valor fuese diferente. Eso implicaría que el promedio ya no es igual a todos los valores del conjunto y entonces al menos uno de los sumandos del cálculo de la desviación estándar sería distinto de cero: por lo tanto, la desviación estándar no sería cero. Como esta sumatoria se desarrolla sobre valores elevados al cuadrado todos los sumandos son positivos y no es posible que se compensen en una resta. La única forma de que la suma de números positivos sea cero es que todos los sumandos sean cero; por ende, la única forma de que la desviación estándar sea cero es que todos los valores del grupo sean iguales al promedio, y por lo tanto iguales entre sí.

Ambos razonamientos constituyen una condición necesaria y suficiente: la desviación estándar de un conjunto de valores es cero solo si todos los valores del conjunto son iguales.

Fuente

Yadolah Dodge. The Concise Encyclopaedia of Statistics. New York: Springer, 2010.

Sergio Ribeiro Guevara (Ph.D.)
Sergio Ribeiro Guevara (Ph.D.)
(Doctor en Ingeniería) - COLABORADOR. Divulgador científico. Ingeniero físico nuclear.

Artículos relacionados