Tabla de Contenidos
La desviación estándar muestral, representada con el símbolo s, es una estadística utilizada como medida de la dispersión para datos muestrales y al mismo tiempo como estimador de la desviación estándar poblacional, o σ. Su fórmula es muy similar a la del mencionado parámetro poblacional, con la única diferencia de que, en lugar de dividirse entre el número de datos, se divide entre este número menos la unidad.
Fórmulas de la desviación estándar muestral
Dependiendo de los datos con los que se cuente, se puede determinar la desviación estándar por medio de tres fórmulas diferentes.
Definición matemática de la desviación estándar muestral
La primera fórmula es la definición de la desviación estándar muestral. Esta se define como la raíz cuadrada de la varianza muestral o s2. Por lo que, si contamos con la varianza muestral, podemos determinar la desviación estándar muestral por medio de la siguiente fórmula:
Combinación de la definición de s con la fórmula de varianza muestral
Si, en lugar de conocer la varianza muestral, contamos con un conjunto de datos muestrales individuales, podemos calcular primero la varianza y luego aplicar la fórmula anterior. Adicionalmente, podemos combinar ambas ecuaciones para obtener la fórmula mejor conocida para la desviación estándar de la muestra:
La fórmula anterior implica calcular la media muestral para luego restarla de cada dato individual, elevar la resta al cuadrado, dividir entre n – 1 y finalmente calcular la raíz cuadrada de dicho resultado.
Versión simplificada de la fórmula de desviación estándar muestral
En último lugar, la sumatoria de las desviaciones cuadradas de la media de la fórmula anterior puede manipularse algebraicamente para obtener una segunda fórmula equivalente que resulta más fácil de implementar, en especial si se cuenta con un gran número de datos. Eta fórmula es:
Pasos para el cálculo de la desviación estándar muestral
En caso de que conozcamos la varianza muestral, calcular la desviación estándar es una cuestión de un simple cálculo de raíz cuadrada. Pero cuando se tienen datos individuales muestrales, resulta conveniente llevar a cabo los cálculos de manera ordenada. Dependiendo de la ecuación que se planea utilizar, este proceso involucra distintos pasos.
Método 1
Si deseamos calcular la desviación estándar muestral utilizando la fórmula de la ecuación 2, los pasos son los siguientes:
Paso 1: Determinar la media muestral
La fórmula requiere determinar la desviación de cada dato individual respecto a la media, razón por la cual debemos comenzar por calcular la media de la muestra. Esta se calcula mediante la siguiente fórmula:
Es decir, debemos sumar todos los datos muestrales (xi) y dividir entre el número de datos o tamaño de la muestra, n.
Paso 2: Restar la media a cada dato muestral para determinar las desviaciones respecto a la media
En este paso, tomamos cada dato individual, xi, y le restamos el valor de la media que acabamos de calcular, x̅. Obtendremos así una lista de desviaciones de la media o valores de (xi – x̅). Algunos de estos valores serán positivos mientras que otros serán negativos.
Paso 3: Elevar todas las desviaciones de la media al cuadrado
Con esto se obtienen todas las desviaciones cuadras de la media o (xi – x̅)2. A diferencia de las desviaciones de la media, las desviaciones cuadráticas son todas positivas (ya que se está elevando a un exponente par).
Paso 4: Sumar todas las desviaciones cuadradas
Cada uno de los valores positivos obtenidos en el paso anterior ahora se suman para obtener el denominador de la fracción, ∑(xi – x̅)2.
Paso 5: Aplicar la fórmula de la ecuación 2
Esto implica primero dividir la suma anterior entre n-1. Con este paso, obtenemos la cantidad subradical de la fórmula cuyo valor es, en efecto, la varianza muestral. Luego, tomando la raíz cuadrada obtenemos la desviación estándar de la muestra.
Método 2
La ecuación 3 para determinar la desviación estándar muestral es equivalente a la ecuación 2 y proporciona, por lo tanto, el mismo resultado. Sin embargo, es más práctica para el cálculo de la desviación estándar ya que permite llevar a cabo todos los cálculos repetitivos de multiplicación directamente sobre los datos individuales, sin necesidad de calcular primero la media muestral y de llevar a cabo múltiples restas.
De hecho, solo hace falta llevar a cabo una resta cerca del final del proceso, mientras que todas las demás operaciones consisten en multiplicaciones o sumas. Esto a su vez permite evitar errores asociados a los signos de los números.
Los pasos para utilizar esta fórmula son los siguientes:
Paso 1: Calcular el cuadrado de cada dato individual
Este paso y los siguientes se hacen más fáciles si organizamos los datos en una columna vertical. Así podemos colocar el cuadrado de cada dato a su lado.
Paso 2: Sumar todos los cuadrados
Con este paso se obtiene el término ∑ xi2.
Paso 3: Sumar todos los datos individuales
Con este paso se obtiene el término ∑ xi.
Paso 4: Aplicar la fórmula de la ecuación 3
Luego del paso 3, ya tenemos todo lo que necesitamos para calcular la desviación estándar de la muestra por medio de la fórmula 3. Todo lo que debemos hacer ahora es sustituir en la fórmula y ¡Listo! Al llevar a cabo los cálculos, debemos primero dividir el cuadrado de la suma entre n, luego llevar a cabo la resta de la suma de los cuadrados menos el resultado anterior. Seguidamente, dividimos todo entre n – 1, obteniendo así la varianza muestral, y terminamos calculando la raíz cuadrada del último valor.
Método 3: Uso de hojas de cálculo
El uso de hojas de cálculo facilita enormemente el cálculo de la desviación estándar de la muestra. Por un lado, podemos utilizar una hoja de cálculo para llevar a cabo todas las restas, cálculos de medias, potencias y sumatorias sobre cada dato con tan solo un par de clics del ratón para luego utilizar los resultados en la fórmula.
Sin embargo, nada de esto es necesario, ya que todas las hojas de cálculo ya incluyen una función para determinar la desviación estándar de un conjunto de datos de manera directa. Los pasos en este último caso son los siguientes:
Paso 1: Introducir los datos en la hoja de cálculo
Esto es una simple cuestión de transcribir los datos en las celdas de la hoja de cálculo uno a uno si no se tienen ya en formato digital, o de copiar y pegar todos los datos si se cuenta con una tabla de datos digitalizada. Los datos se pueden introducir en forma de fila, columna o incluso en forma de una matriz con cualquier dimensión que se desee (10×5, 5×10, 25×2, etc.).
Paso 2: Calcular la desviación estándar en una celda aparte
Hacemos clic en cualquier celda vacía e introducimos un signo de igualdad (=) seguido del nombre de la función de desviación estándar muestral correspondiente a la hoja de cálculo que estemos utilizando.
Las dos hojas de cálculo más comunes son Excel de Microsoft y Sheets de Google. En Excel en español, la fórmula de desviación estándar muestral es una función llamada DESVEST.M mientras que las versiones en inglés la función se llama STDEV.S. En el caso de Google Sheets, para la muestra se utiliza la función DESVEST. Para las versión en inglés, la función es STDEV
Así que, después del signo = escribimos DESVEST.M (o cualquiera de las otras tres opciones, según sea el caso) seguido de un paréntesis. Luego del paréntesis debemos poner el argumento de la función que corresponde a los datos. Podemos escribirlos uno por uno separados por un punto y coma, o podemos seleccionar las celdas donde se encuentran los datos.
Así que, ahora, seleccionamos con el ratón los datos haciendo clic en la celda de una esquina y arrastrando hasta la esquina opuesta. Cerramos el paréntesis, presionamos INTRO (o ENTER) y ¡Listo! Inmediatamente aparecerá la desviación estándar de la muestra en la celda.
Ejemplo de problema del cálculo de la desviación estándar muestral
Se desea estudiar la variabilidad de la estatura de los jugadores de tenis de mesa que asisten a una competencia internacional. Para ello, se selecciona una muestra aleatoria de 20 jugadores y se determina su estatura en metros. Los datos obtenidos se presentan a continuación:
1,67 | 1,93 | 1,62 | 1,79 | 1,57 | 1,55 | 1,88 | 1,65 | 1,61 | 1,63 |
1,69 | 1,85 | 1,62 | 1,62 | 1,55 | 1,86 | 1,75 | 1,97 | 1,77 | 1,93 |
La variabilidad o dispersión de los datos se calcula en función de la desviación estándar. A continuación, veremos cómo calcular esta estadística para los datos anteriores siguiendo los tres métodos presentados anteriormente:
Método 1
Paso 1: Determinar la media muestral
Aplicando la ecuación 4 para la media, tenemos:
Paso 2: Restar la media a cada dato muestral para determinar las desviaciones respecto a la media
Este paso implica calcular las restas (xi – x̅). Por ejemplo:
x1 – x̅ = 1,67m – 1,7255m = – 0,0555
x2 – x̅ = 1,93m – 1,7255m = 0,2045
x3 – x̅ = 1,62m – 1,7255m = – 0,1055
…
X20 – x̅ = 1,93m – 1,7255m = 0,2045
Los resultados se presentan en la siguiente tabla:
xi | xi – x̅ |
1,67 | -0,0555 |
1,93 | 0,2045 |
1,62 | -0,1055 |
1,79 | 0,0645 |
1,57 | -0,1555 |
1,55 | -0,1755 |
1,88 | 0,1545 |
1,65 | -0,0755 |
1,61 | -0,1155 |
1,63 | -0,0955 |
1,69 | -0,0355 |
1,85 | 0,1245 |
1,62 | -0,1055 |
1,62 | -0,1055 |
1,55 | -0,1755 |
1,86 | 0,1345 |
1,75 | 0,0245 |
1,97 | 0,2445 |
1,77 | 0,0445 |
1,93 | 0,2045 |
Paso 3: Elevar todas las desviaciones de la media al cuadrado
(x1 – x̅)2 = (– 0,0555)2 = 0,00308025
(x2 – x̅)2 = (0,2045)2 = 0,04182025
(x3 – x̅)2 = –( 0,1055)2 = 0,01113025
…
(x20 – x̅)2 = (0,2045)2 = 0,04182025
Los resultados se presentan en la siguiente tabla:
xi | xi – x̅ | (xi – x̅)2 |
1,67 | -0,0555 | 0,00308025 |
1,93 | 0,2045 | 0,04182025 |
1,62 | -0,1055 | 0,01113025 |
1,79 | 0,0645 | 0,00416025 |
1,57 | -0,1555 | 0,02418025 |
1,55 | -0,1755 | 0,03080025 |
1,88 | 0,1545 | 0,02387025 |
1,65 | -0,0755 | 0,00570025 |
1,61 | -0,1155 | 0,01334025 |
1,63 | -0,0955 | 0,00912025 |
1,69 | -0,0355 | 0,00126025 |
1,85 | 0,1245 | 0,01550025 |
1,62 | -0,1055 | 0,01113025 |
1,62 | -0,1055 | 0,01113025 |
1,55 | -0,1755 | 0,03080025 |
1,86 | 0,1345 | 0,01809025 |
1,75 | 0,0245 | 0,00060025 |
1,97 | 0,2445 | 0,05978025 |
1,77 | 0,0445 | 0,00198025 |
1,93 | 0,2045 | 0,04182025 |
Paso 4: Sumar todas las desviaciones cuadradas
Paso 5: Aplicar la fórmula de la ecuación 2
Ahora que tenemos esta sumatoria, solo falta reemplazar este valor, así como el número de datos, que es 20, en la ecuación 2:
Así, obtenemos que la desviación estándar de la muestra es de aproximadamente 0,138 m.
Método 2
Ahora llevaremos a cabo el cálculo de la misma desviación estándar, pero siguiendo el segundo método:
Paso 1: Calcular el cuadrado de cada dato individual
(x1)2 = (1,67)2 = 2,7889 m2
(x2)2 = (1,92)2 = 3,7249 m2
(x3)2 = (1,62)2 = 2,6244 m2
…
(x20)2 = (1,93)2 = 3,7249 m2
Los resultados se presentan en la siguiente tabla:
xi | xi2 |
1,67 | 2,7889 |
1,93 | 3,7249 |
1,62 | 2,6244 |
1,79 | 3,2041 |
1,57 | 2,4649 |
1,55 | 2,4025 |
1,88 | 3,5344 |
1,65 | 2,7225 |
1,61 | 2,5921 |
1,63 | 2,6569 |
1,69 | 2,8561 |
1,85 | 3,4225 |
1,62 | 2,6244 |
1,62 | 2,6244 |
1,55 | 2,4025 |
1,86 | 3,4596 |
1,75 | 3,0625 |
1,97 | 3,8809 |
1,77 | 3,1329 |
1,93 | 3,7249 |
Paso 2: Sumar todos los cuadrados
Paso 3: Sumar todos los datos individuales
Paso 4: Aplicar la fórmula de la ecuación 3
Ahora, simplemente introducimos estos dos valores y el número de datos en la ecuación 3 para obtener la desviación estándar muestral:
Método 3: Uso de hojas de cálculo
A continuación, se muestra este problema de cálculo de la desviación estándar muestral utilizando Excel. El procedimiento es prácticamente idéntico para el caso de Google Sheets.
Paso 1: Introducir los datos en la hoja de cálculo
Los mismos datos que utilizamos anteriormente se pegan en la hoja de cálculo (Puede copiar y pegar la tabla de datos original presentada arriba en cualquier hoja de cálculo, si desea practicar).
Paso 2: Calcular la desviación estándar en una celda aparte
Una vez añadidos los datos, utilizamos la función DESVEST.M para calcular la desviación estándar de la muestra. La siguiente imagen muestra cómo se debería ver la función, luego de seleccionar los datos arrastrando con el ratón. También se puede introducir el rango donde se encuentran los datos de manera manual escribiendo la dirección de la celda de la esquina superior izquierda y la de la esquina inferior derecha separadas por : como se muestra a continuación:
Al presionar ENTER y correr la función, esta calcula la desviación estándar de la muestra y la presenta en la respectiva celda, como se muestra a continuación:
Como podemos observar, cualquiera de los métodos aquí practicados produce el mismo resultado. Se trata simplemente de distintas maneras de hacer lo mismo.
Referencias
Bhandari, P. (2021, 21 enero). Understanding and calculating standard deviation. Recuperado de https://www.scribbr.com/statistics/standard-deviation/
DESVESTA (función DESVESTA). Soporte de Microsoft Office. Recuperado de https://support.microsoft.com/es-es/office/desvesta-funci%C3%B3n-desvesta-5ff38888-7ea5-48de-9a6d-11ed73b29e9d.
Devore, J. L. (2019). Probabilidad y estadística (1.a ed.). Cengage Learning.
Soporte técnico de Google. (s. f.). DESVEST (STDEV) – Ayuda de Editores de Documentos de Google. Google – Ayuda de Editores de Documentos de Google. https://support.google.com/docs/answer/3094054?hl=es-419
Superprof. (s. f.). Desviación estándar. Diccionario de Matemáticas | Superprof. https://www.superprof.es/diccionario/matematicas/estadistica/desviacion-estandar.html