Desviaciones estándar: diferencia entre muestra y población

Tabla de Contenidos

En el cálculo de la desviación estándar hay que contemplar dos situaciones: la desviación estándar de una población o de un conjunto de valores, y la desviación estándar de una muestra.

Recordemos, antes de avanzar en las dos definiciones, que la desviación estándar σ es un parámetro que permite evaluar la dispersión de un conjunto de valores. Si se calcula el promedio de un conjunto de valores, la desviación estándar evalúa la diferencia de los valores del conjunto respecto del promedio. Y el promedio de un conjunto de valores n se define como la suma de todos ellos dividido la cantidad de valores n. La fórmula general que se utiliza para calcular la desviación estándar σ se muestra a continuación; consiste en restar de cada valor del conjunto que analizamos, que notamos con el subíndice i, el promedio de todos los valores; elevamos al cuadrado cada una de estas diferencias y las sumamos; dividimos el resultado entre el número de valores del conjunto menos 1, y calculamos la raíz cuadrada de éste valor.

Si bien ambas definiciones de desviación estándar evalúan la variabilidad, hay diferencias conceptuales entre hacer el cálculo sobre una población y sobre una muestra. La diferencia tiene que ver con la distinción entre una variable estadística y un parámetro matemático. Si se recopilan datos de todos los miembros de una población o se estudia un conjunto de datos definido, se trata del cálculo de la desviación estándar de una población. Si se analizan datos que representan una muestra de una población mayor, se trata del cálculo de la desviación estándar de una muestra. La figura siguiente ilustra gráficamente la diferencia. La desviación estándar de una población es un parámetro matemático con un valor definido; la desviación estándar de una muestra es un parámetro estadístico que evalúa un grupo de datos cuyo resultado se proyecta en un conjunto mayor. Esta evaluación depende de la muestra, no es un valor definido, como lo es en el caso de una población.

Cualitativamente la diferencia en la definición implica un cálculo levemente diferente; en el caso de la desviación estándar de una muestra se divide la diferencia entre cada valor y el promedio al cuadrado entre número de valores menos 1 (n – 1), como muestra la fórmula anterior. En el caso de la desviación estándar de una población se divide entre n.

Ejemplo

Veamos un ejemplo para fijar ideas. Tomemos un conjunto de valores y calculemos la desviación estándar de acuerdo a las dos definiciones. El grupo es el siguiente, y contiene 5 valores (n = 5), que son los siguientes:

1, 2, 4, 5, 8

El promedio de estos valores tiene la siguiente expresión

(1 + 2 + 4 + 5 + 8)/5 = 20/5 = 4

Las diferencias de cada valor y el promedio elevadas al cuadrado se representan con la siguiente secuencia

(1 – 4)² = 9

(2 – 4)² = 4

(4 – 4)² = 0

(5 – 4)² = 1

(8 – 4)² = 16

La suma de los cinco valores es 30.

En el caso del cálculo de la desviación estándar de la población hay que dividir este valor entre n, 5 en este ejemplo y el resultado es 6. En el caso de la desviación estándar de la muestra hay que dividir entre n – 1; 4 en este caso y el resultado es 7.5. Para completar el cálculo debemos obtener la raíz cuadrada; aproximadamente 2.4495 si se tratase de una población, y aproximadamente 2.7386 si se tratase de una muestra.

Fuente

Yadolah Dodge. The Concise Encyclopaedia of Statistics. New York: Springer, 2010.

Diferencia entre las desviaciones estándar de una muestra y una población

Definamos que es una mezcla y todo lo hay que saber.

La voz chirriante, ¿Qué significa este término?

¿Qué es la competencia intraespecífica en ecología?

¿La leche un ácido o una base?

¿Quién fue Perseo en la mitología griega?

Ejemplo

Fuente

Artículos relacionados

Practica el cálculo de la desviación estándar muestral

Intervalos de confianza para la diferencia de dos proporciones poblacionales

Ejemplo del cálculo de la desviación estándar de la población

La pendiente de la línea de regresión y el coeficiente de correlación

Diferencias entre las desviaciones estándar de la población y la muestra

Diez pasos para crear un histograma

¿Cuáles son los resultados posibles de lanzar tres dados simultáneamente?

Determinación de valores críticos con una tabla chi cuadrado, ji cuadrado o χ2

¿Qué pasa cuando la desviación estándar es igual a cero?

Ejemplos de cálculo de puntuación Z

¿Qué son los momentos en estadística?

La importancia del teorema central del límite

La regla del complemento en estadística

Cómo calcular el margen de error

Cómo construir un intervalo de confianza de una proporción de población

Cómo calcular el valor esperado en la ruleta

Grados de libertad en estadística y matemáticas

Probabilidad de unión de tres o más conjuntos

¿Qué es el resumen de cinco números en estadística?

Cómo se calcula la varianza de una distribución de Poisson

Cómo utilizar una tabla de números aleatorios

Cómo utilizar la función PRUEBA.Z en Excel

Cómo calcular la mediana de la distribución exponencial

Cómo calcular la desviación estándar con la regla del rango

Ejemplos de cálculo de puntuación Z

Regla de multiplicación para eventos independientes

¿Qué significa la asimetría en las estadísticas?

Cómo calcular el valor esperado o esperanza matemática

Hipótesis nula: definición y ejemplos

Cómo calcular la desviación estándar relativa

Diferencia entre las desviaciones estándar de una muestra y una población

Ejemplo

Fuente

Artículos Relacionados:

Artículos relacionados