Tabla de Contenidos
La desviación estándar poblacional es uno de los parámetros poblacionales más importantes para medir la variabilidad o dispersión de los datos dentro de la población. Como todo parámetro en estadística, se representa con una letra griega, en este caso, la letra σ (sigma). Esto permite diferenciarla fácilmente de la desviación estándar de la muestra (s) la cual, si bien es similar, no es igual ni se calcula con las mismas fórmulas.
A continuación, veremos, por medio de un ejemplo, distintas maneras de calcular la desviación estándar de una población. Cabe resaltar que, para el cálculo de la desviación estándar poblacional, es indispensable conocer todos los datos poblacionales. Esto rara vez ocurre en contextos reales, pero de igual manera es importante entender cómo se calcula, ya que eso ayuda a comprender algunas de las características matemáticas de este importante parámetro.
Fórmulas de la desviación estándar poblacional
Dependiendo de los datos con los que se cuente, se puede determinar la desviación estándar de la población por medio de tres fórmulas diferentes.
Definición matemática de la desviación estándar poblacional
La desviación estándar se define como la raíz cuadrada de la varianza, σ2. Es decir, si conocemos la varianza de la población, podemos calcular la desviación estándar por medio la siguiente ecuación:
Este caso rara vez se presenta, pero es bueno tenerlo en cuenta.
Otras fórmulas de desviación estándar de la población
Si en lugar de conocer la varianza de una población, conocemos todos los N datos que la conforman, entonces podemos calcular la desviación estándar poblacional como la raíz cuadrada del promedio de las desviaciones cuadradas de la media. Es decir:
En esta ecuación, xi representa el valor de cada dato en la población, N representa el número de datos en la población (o el tamaño de la población, que es lo mismo) y μ es la media poblacional. Nótese que la media de la población también se representa con una letra griega por tratarse de otro parámetro poblacional y el tamaño de la población se representa con N (mayúscula) para distinguirlo de n que se suele asociar al tamaño de una muestra.
La media poblacional, μ, viene dada por:
La ecuación 2 puede expandirse, reordenarse y simplificarse para obtener:
En caso de no disponer de datos individuales de la población sino de datos agrupados en una tabla de frecuencias, las fórmulas anteriores quedan levemente modificada para dar:
En las ecuaciones anteriores, la cantidad que se encuentra dentro de la raíz no es más que la varianza poblacional. La ecuación 4 tiene la ventaja de estar establecida exclusivamente en términos de los datos poblacionales y no de algún parámetro poblacional como en el caso de las ecuaciones 2 y 5.
Ejemplo del cálculo de la desviación estándar poblacional
Supongamos que queremos determinar la variabilidad en el peso de un modelo particular de automóvil del cual se sabe que solo existen 20 ejemplares en todo el mundo. Los datos de los pesos en kilogramos de estos 20 autos se presentan en la siguiente tabla:
410 | 408 | 408 | 405 | 391 | 390 | 402 | 397 | 397 | 395 |
390 | 404 | 397 | 394 | 399 | 397 | 405 | 408 | 410 | 400 |
Como sabemos que solo existen 20 autos de este modelo, estos representan la población completa, por lo que contamos con todos los datos necesarios para determinar la desviación estándar poblacional. Veamos tres maneras distintas de determinar esta desviación estándar.
Método 1: Cálculo basado en la definición de la varianza
Este método se basa en el uso de la ecuación 2 presentada arriba. Como podemos ver, la ecuación requiere el uso de la media poblacional y otra serie de cálculos que se detallan a continuación:
Paso 1: Determinar la media poblacional
La media poblacional o μ se calcula por medio de la ecuación 3, sumando todos los datos y dividiendo entre el número total de datos que es, en este caso, 20.
Paso 2: Calcular las desviaciones respecto a la media
Este paso implica calcular las restas (xi – μ). Por ejemplo:
x1 – μ = 410 – 400,35kg = 9,65kg
x2 – μ = 408 – 400,35kg = 7,65kg
x3 – μ = 408 – 400,35kg = 7,65kg
…
X20 – μ = 400 kg – 400,35kg = – 0,35
Los resultados se presentan en la siguiente tabla:
xi | xi – μ |
410 | 9,65 |
408 | 7,65 |
408 | 7,65 |
405 | 4,65 |
391 | -9,35 |
390 | -10,35 |
402 | 1,65 |
397 | -3,35 |
397 | -3,35 |
395 | -5,35 |
390 | -10,35 |
404 | 3,65 |
397 | -3,35 |
394 | -6,35 |
399 | -1,35 |
397 | -3,35 |
405 | 4,65 |
408 | 7,65 |
410 | 9,65 |
400 | -0,35 |
Paso 3: Elevar todas las desviaciones de la media al cuadrado
(x1 – μ)2 = (9,65)2 = 93,1225 kg2
(x2 – μ)2 = (7,65)2 = 58,5225 kg2
(x3 – μ)2 = (7,65)2 = 58,5225 kg2
…
(x20 – μ)2 = (– 0,35)2 = 0,1225 kg2
Los resultados se presentan en la siguiente tabla:
xi/ kg | (xi – μ)/ kg | (xi – μ)2/ kg2 |
410 | 9,65 | 93,1225 |
408 | 7,65 | 58,5225 |
408 | 7,65 | 58,5225 |
405 | 4,65 | 21,6225 |
391 | -9,35 | 87,4225 |
390 | -10,35 | 107,1225 |
402 | 1,65 | 2,7225 |
397 | -3,35 | 11,2225 |
397 | -3,35 | 11,2225 |
395 | -5,35 | 28,6225 |
390 | -10,35 | 107,1225 |
404 | 3,65 | 13,3225 |
397 | -3,35 | 11,2225 |
394 | -6,35 | 40,3225 |
399 | -1,35 | 1,8225 |
397 | -3,35 | 11,2225 |
405 | 4,65 | 21,6225 |
408 | 7,65 | 58,5225 |
410 | 9,65 | 93,1225 |
400 | -0,35 | 0,1225 |
Paso 4: Sumar todas las desviaciones cuadradas
Paso 5: Aplicar la fórmula de la ecuación 2
Ahora que tenemos esta sumatoria, solo falta reemplazar este valor, así como el número de datos, que es 20, en la ecuación 2:
Así, obtenemos que la desviación estándar del peso de la pobalción de 20 autos es de aprox. 6,5 kg.
Método 2: Uso de la ecuación reordenada
Ahora llevaremos a cabo el mismo cálculo, pero utilizando la ecuación 4, la cual es equivalente a la ecuación que acabamos de utilizar, pero es más práctica, en especial si se está trabajando con un mayor número de datos. El principal beneficio es que no hace falta calcular un parámetro adicional (la media poblacional) para poder calcular las desviaciones, sino que todo se calcula en función de los datos individuales originales. Además, en ningún momento se necesita trabajar con número negativos, los cuales son una fuente importante de error entre los estudiantes.
Paso 1: Calcular el cuadrado de cada dato individual
Es decir, se llevan a cabo los siguientes cálculos:
(x1)2 = (410)2 = 168.100 kg2
(x2)2 = (408)2 = 166.464 kg2
(x3)2 = (408)2 = 166.464 kg2
…
(x20)2 = (400)2 = 160.000 kg2
Los resultados se presentan en la siguiente tabla:
xi | xi2 |
410 | 168.100 |
408 | 166.464 |
408 | 166.464 |
405 | 164.025 |
391 | 152.881 |
390 | 152.100 |
402 | 161.604 |
397 | 157.609 |
397 | 157.609 |
395 | 156.025 |
390 | 152.100 |
404 | 163.216 |
397 | 157.609 |
394 | 155.236 |
399 | 159.201 |
397 | 157.609 |
405 | 164.025 |
408 | 166.464 |
410 | 168.100 |
400 | 160.000 |
Paso 2: Sumar todos los datos individuales
Paso 3: Sumar todos los cuadrados
Paso 4: Aplicar la fórmula de la ecuación 4
El último paso es introducir estos dos valores y el número de datos en la ecuación 4 para obtener la desviación estándar poblacional:
Método 3: Uso de hojas de cálculo
Las hojas de cálculo como Excel de Microsoft, Numbers de Apple o Sheets de Google incluyen entre sus funciones básicas el cálculo directo de la desviación estándar (tanto muestral como poblacional). Estas funciones toman como argumento un conjunto de datos y llevan a cabo todos los cálculos mostrados en el método anterior para arrojar directamente la desviación estándar en la celda donde se introduce la fórmula.
El procedimiento es el siguiente:
Paso 1: Introducir los datos en la hoja de cálculo
Podemos introducir los datos en forma de columna, fila o matriz en cualquier parte de la hoja de cálculo. La siguiente captura de pantalla muestra cómo se ven los datos del presente problema en Excel 2016.
Paso 2: Utilizar la fórmula para calcular la desviación estándar
Una vez añadidos los datos, utilizamos la función de desviación estándar colocándole como argumentos las celdas donde se encuentran los datos.
Para llamar a una función en una hoja de cálculo, por lo general se comienza escribiendo el signo de igualdad (=) seguido del nombre de la función que queremos utilizar. Los nombres cambian levemente de una aplicación a otra y en algunos casos también cambian según el idioma en el que se esté trabajando.
En el caso de Excel (versión en español), la función para calcular la desviación estándar poblacional se llama DESVEST.P, mientras que en Google Sheets es DESVESTP (sin el punto). Luego se debe introducir el (o los) argumento (argumentos) de la función entre paréntesis. En nuestro ejemplo, colocamos como argumento el rango de celdas en el que se encuentran los datos (que van desde la celda A3 hasta la J4).
Al presionar ENTER, el programa correr la función y calcula la desviación estándar de la población, presentando el resultado en la respectiva celda, como se muestra a continuación:
Como podemos observar, cualquiera de los tres métodos aquí practicados produce el mismo resultado. Se trata simplemente de distintas maneras de hacer lo mismo.
Otros métodos
Además de los tres métodos citados anteriormente, las calculadoras científicas y financieras también suelen tener una función para determinar la desviación estándar de un conjunto de datos, sean estos muestrales o poblacionales. La forma cómo se introducen los datos y se obtienen los resultados varía de un fabricante a otro, e incluso de un modelo de calculadora a otra, por lo que resulta poco práctico mostrar aquí los pasos específicos para hacerlo.
En su lugar, plantearemos los pasos generales más importantes sin ahondar en ellos. El que desee utilizar esta función en su calculadora científica deberá referirse al manual del usuario que vino con la calculadora o buscarlo por internet para determinar la combinación de teclas específicas en cada caso.
Paso 1: Limpiar la memoria
En muchas calculadoras, los datos almacenados con anterioridad no son visibles. Si introducimos datos sobre otros que ya estaban almacenados sin darnos cuenta, la calculadora arrojará un resultado equivocado. Para asegurar que esto no ocurra, es aconsejable borrar toda la memoria de la calculadora (o por lo menos del modo de análisis estadístico) antes de comenzar a introducir datos nuevos.
Paso 2: Acceder al modo de estadística
Las funciones para calcular la desviación estándar forman parte del modo «Estadística,» «Statistics» o simplemente «S» en la mayoría de las calculadoras, así que debemos comenzar ingresando a este modo de funcionamiento.
Paso 3: Introducir los datos
Esto varía de una calculadora a otra. En algunos casos se puede agregar datos en forma de tabla, mientras que en otros se introducen los datos uno a uno luego de presionar la tecla DT (o DAT). Es importante verificar el número de datos ingresados al finalizar este paso para asegurarnos de que no haya faltado ninguno.
Paso 4: Calcular la desviación estándar de la población
Una vez introducidos los datos, solo falta pedir a la calculadora el resultado que estamos buscando. En muchas calculadoras, tanto la desviación estándar muestral como la poblacional se representan con el símbolo σ (a pesar de ser un error en el caso de la desviación muestral). Sin embargo, podemos distinguir la desviación muestral de la poblacional porque la muestral está acompañada de n-1 (es decir, aparece como σn-1) mientras que la poblacional aparece como sn. Esto hace referencia a que en el cálculo de la desviación estándar muestral se divide entre n-1 en lugar de n como en la poblacional.
Referencias
Devore, J. L. (2019). Probabilidad y estadística (1.a ed.). Cengage Learning.
MateMovil. (2021, 1 enero). Varianza y desviación estándar para datos agrupados por intervalos | Matemóvil. https://matemovil.com/varianza-y-desviacion-estandar-para-datos-agrupados-por-intervalos/
Soporte técnico de Google. (s. f.). DESVEST (STDEV) – Ayuda de Editores de Documentos de Google. Google – Ayuda de Editores de Documentos de Google. https://support.google.com/docs/answer/3094054?hl=es-419
Superprof. (s. f.). Desviación estándar. Diccionario de Matemáticas | Superprof. https://www.superprof.es/diccionario/matematicas/estadistica/desviacion-estandar.html
TOMi.digital. (s. f.). Desviación Estándar para datos agrupados. https://tomi.digital/en/52202/desviacion-estandar-para-datos-agrupados?utm_source=google&utm_medium=seo