Ejemplo del cálculo de la desviación estándar de la población

Artículo revisado y aprobado por nuestro equipo editorial, siguiendo los criterios de redacción y edición de YuBrain.

La desviación estándar poblacional es uno de los parámetros poblacionales más importantes para medir la variabilidad o dispersión de los datos dentro de la población. Como todo parámetro en estadística, se representa con una letra griega, en este caso, la letra σ (sigma). Esto permite diferenciarla fácilmente de la desviación estándar de la muestra (s) la cual, si bien es similar, no es igual ni se calcula con las mismas fórmulas.

A continuación, veremos, por medio de un ejemplo, distintas maneras de calcular la desviación estándar de una población. Cabe resaltar que, para el cálculo de la desviación estándar poblacional, es indispensable conocer todos los datos poblacionales. Esto rara vez ocurre en contextos reales, pero de igual manera es importante entender cómo se calcula, ya que eso ayuda a comprender algunas de las características matemáticas de este importante parámetro.

Fórmulas de la desviación estándar poblacional

Dependiendo de los datos con los que se cuente, se puede determinar la desviación estándar de la población por medio de tres fórmulas diferentes.

Definición matemática de la desviación estándar poblacional

La desviación estándar se define como la raíz cuadrada de la varianza, σ2. Es decir, si conocemos la varianza de la población, podemos calcular la desviación estándar por medio la siguiente ecuación:

Ejemplo del cálculo de cálculo de la desviación estándar de la población

Este caso rara vez se presenta, pero es bueno tenerlo en cuenta.

Otras fórmulas de desviación estándar de la población

Si en lugar de conocer la varianza de una población, conocemos todos los N datos que la conforman, entonces podemos calcular la desviación estándar poblacional como la raíz cuadrada del promedio de las desviaciones cuadradas de la media. Es decir:

Ejemplo del cálculo de cálculo de la desviación estándar de la población

En esta ecuación, xi representa el valor de cada dato en la población, N representa el número de datos en la población (o el tamaño de la población, que es lo mismo) y μ es la media poblacional. Nótese que la media de la población también se representa con una letra griega por tratarse de otro parámetro poblacional y el tamaño de la población se representa con N (mayúscula) para distinguirlo de n que se suele asociar al tamaño de una muestra.

La media poblacional, μ, viene dada por:

Ejemplo del cálculo de cálculo de la desviación estándar de la población

La ecuación 2 puede expandirse, reordenarse y simplificarse para obtener:

Ejemplo del cálculo de cálculo de la desviación estándar de la población

En caso de no disponer de datos individuales de la población sino de datos agrupados en una tabla de frecuencias, las fórmulas anteriores quedan levemente modificada para dar:

Ejemplo del cálculo de cálculo de la desviación estándar de la población

En las ecuaciones anteriores, la cantidad que se encuentra dentro de la raíz no es más que la varianza poblacional. La ecuación 4 tiene la ventaja de estar establecida exclusivamente en términos de los datos poblacionales y no de algún parámetro poblacional como en el caso de las ecuaciones 2 y 5.

Ejemplo del cálculo de la desviación estándar poblacional

Supongamos que queremos determinar la variabilidad en el peso de un modelo particular de automóvil del cual se sabe que solo existen 20 ejemplares en todo el mundo. Los datos de los pesos en kilogramos de estos 20 autos se presentan en la siguiente tabla:

410408408405391390402397397395
390404397394399397405408410400

Como sabemos que solo existen 20 autos de este modelo, estos representan la población completa, por lo que contamos con todos los datos necesarios para determinar la desviación estándar poblacional. Veamos tres maneras distintas de determinar esta desviación estándar.

Método 1: Cálculo basado en la definición de la varianza

Este método se basa en el uso de la ecuación 2 presentada arriba. Como podemos ver, la ecuación requiere el uso de la media poblacional y otra serie de cálculos que se detallan a continuación:

Paso 1: Determinar la media poblacional

La media poblacional o μ se calcula por medio de la ecuación 3, sumando todos los datos y dividiendo entre el número total de datos que es, en este caso, 20.

Ejemplo del cálculo de cálculo de la desviación estándar de la población

Paso 2: Calcular las desviaciones respecto a la media

Este paso implica calcular las restas (xi – μ). Por ejemplo:

x1 – μ = 410 – 400,35kg = 9,65kg

x2 – μ = 408 – 400,35kg = 7,65kg

x3 – μ = 408 – 400,35kg = 7,65kg

X20 – μ = 400 kg – 400,35kg  = – 0,35

Los resultados se presentan en la siguiente tabla:

xixi – μ
4109,65
4087,65
4087,65
4054,65
391-9,35
390-10,35
4021,65
397-3,35
397-3,35
395-5,35
390-10,35
4043,65
397-3,35
394-6,35
399-1,35
397-3,35
4054,65
4087,65
4109,65
400-0,35

Paso 3: Elevar todas las desviaciones de la media al cuadrado

(x1 – μ)2 = (9,65)2 = 93,1225 kg2

(x2 – μ)2 = (7,65)2 = 58,5225 kg2

(x3 – μ)2 = (7,65)2 = 58,5225 kg2

(x20 – μ)2 = (– 0,35)2 = 0,1225 kg2

Los resultados se presentan en la siguiente tabla:

xi/ kg(xi – μ)/ kg(xi – μ)2/ kg2
4109,6593,1225
4087,6558,5225
4087,6558,5225
4054,6521,6225
391-9,3587,4225
390-10,35107,1225
4021,652,7225
397-3,3511,2225
397-3,3511,2225
395-5,3528,6225
390-10,35107,1225
4043,6513,3225
397-3,3511,2225
394-6,3540,3225
399-1,351,8225
397-3,3511,2225
4054,6521,6225
4087,6558,5225
4109,6593,1225
400-0,350,1225

Paso 4: Sumar todas las desviaciones cuadradas

Ejemplo del cálculo de cálculo de la desviación estándar de la población

Paso 5: Aplicar la fórmula de la ecuación 2

Ahora que tenemos esta sumatoria, solo falta reemplazar este valor, así como el número de datos, que es 20, en la ecuación 2:

Ejemplo del cálculo de cálculo de la desviación estándar de la población

Así, obtenemos que la desviación estándar del peso de la pobalción de 20 autos es de aprox. 6,5 kg.

Método 2: Uso de la ecuación reordenada

Ahora llevaremos a cabo el mismo cálculo, pero utilizando la ecuación 4, la cual es equivalente a la ecuación que acabamos de utilizar, pero es más práctica, en especial si se está trabajando con un mayor número de datos. El principal beneficio es que no hace falta calcular un parámetro adicional (la media poblacional) para poder calcular las desviaciones, sino que todo se calcula en función de los datos individuales originales. Además, en ningún momento se necesita trabajar con número negativos, los cuales son una fuente importante de error entre los estudiantes.

Paso 1: Calcular el cuadrado de cada dato individual

Es decir, se llevan a cabo los siguientes cálculos:

(x1)2 = (410)2 = 168.100 kg2

(x2)2 = (408)2 = 166.464 kg2

(x3)2 = (408)2 = 166.464 kg2

(x20)2 = (400)2 = 160.000 kg2

Los resultados se presentan en la siguiente tabla:

xixi2
410168.100
408166.464
408166.464
405164.025
391152.881
390152.100
402161.604
397157.609
397157.609
395156.025
390152.100
404163.216
397157.609
394155.236
399159.201
397157.609
405164.025
408166.464
410168.100
400160.000

Paso 2: Sumar todos los datos individuales

Ejemplo del cálculo de cálculo de la desviación estándar de la población

Paso 3: Sumar todos los cuadrados

Ejemplo del cálculo de cálculo de la desviación estándar de la población

Paso 4: Aplicar la fórmula de la ecuación 4

El último paso es introducir estos dos valores y el número de datos en la ecuación 4 para obtener la desviación estándar poblacional:

Ejemplo del cálculo de cálculo de la desviación estándar de la población

Método 3: Uso de hojas de cálculo

Las hojas de cálculo como Excel de Microsoft, Numbers de Apple o Sheets de Google incluyen entre sus funciones básicas el cálculo directo de la desviación estándar (tanto muestral como poblacional). Estas funciones toman como argumento un conjunto de datos y llevan a cabo todos los cálculos mostrados en el método anterior para arrojar directamente la desviación estándar en la celda donde se introduce la fórmula.

El procedimiento es el siguiente:

Paso 1: Introducir los datos en la hoja de cálculo

Podemos introducir los datos en forma de columna, fila o matriz en cualquier parte de la hoja de cálculo. La siguiente captura de pantalla muestra cómo se ven los datos del presente problema en Excel 2016.

Ejemplo del cálculo de cálculo de la desviación estándar de la población

Paso 2: Utilizar la fórmula para calcular la desviación estándar

Una vez añadidos los datos, utilizamos la función de desviación estándar colocándole como argumentos las celdas donde se encuentran los datos.

Para llamar a una función en una hoja de cálculo, por lo general se comienza escribiendo el signo de igualdad (=) seguido del nombre de la función que queremos utilizar. Los nombres cambian levemente de una aplicación a otra y en algunos casos también cambian según el idioma en el que se esté trabajando.

En el caso de Excel (versión en español), la función para calcular la desviación estándar poblacional se llama DESVEST.P, mientras que en Google Sheets es DESVESTP (sin el punto). Luego se debe introducir el (o los) argumento (argumentos) de la función entre paréntesis. En nuestro ejemplo, colocamos como argumento el rango de celdas en el que se encuentran los datos (que van desde la celda A3 hasta la J4).

Ejemplo del cálculo de cálculo de la desviación estándar de la población

Al presionar ENTER, el programa correr la función y calcula la desviación estándar de la población, presentando el resultado en la respectiva celda, como se muestra a continuación:

Ejemplo del cálculo de cálculo de la desviación estándar de la población

Como podemos observar, cualquiera de los tres métodos aquí practicados produce el mismo resultado. Se trata simplemente de distintas maneras de hacer lo mismo.

Otros métodos

Además de los tres métodos citados anteriormente, las calculadoras científicas y financieras también suelen tener una función para determinar la desviación estándar de un conjunto de datos, sean estos muestrales o poblacionales. La forma cómo se introducen los datos y se obtienen los resultados varía de un fabricante a otro, e incluso de un modelo de calculadora a otra, por lo que resulta poco práctico mostrar aquí los pasos específicos para hacerlo.

En su lugar, plantearemos los pasos generales más importantes sin ahondar en ellos. El que desee utilizar esta función en su calculadora científica deberá referirse al manual del usuario que vino con la calculadora o buscarlo por internet para determinar la combinación de teclas específicas en cada caso.

Paso 1: Limpiar la memoria

En muchas calculadoras, los datos almacenados con anterioridad no son visibles. Si introducimos datos sobre otros que ya estaban almacenados sin darnos cuenta, la calculadora arrojará un resultado equivocado. Para asegurar que esto no ocurra, es aconsejable borrar toda la memoria de la calculadora (o por lo menos del modo de análisis estadístico) antes de comenzar a introducir datos nuevos.

Paso 2: Acceder al modo de estadística

Las funciones para calcular la desviación estándar forman parte del modo «Estadística,» «Statistics» o simplemente «S» en la mayoría de las calculadoras, así que debemos comenzar ingresando a este modo de funcionamiento.

Paso 3: Introducir los datos

Esto varía de una calculadora a otra. En algunos casos se puede agregar datos en forma de tabla, mientras que en otros se introducen los datos uno a uno luego de presionar la tecla DT (o DAT). Es importante verificar el número de datos ingresados al finalizar este paso para asegurarnos de que no haya faltado ninguno.

Paso 4: Calcular la desviación estándar de la población

Una vez introducidos los datos, solo falta pedir a la calculadora el resultado que estamos buscando. En muchas calculadoras, tanto la desviación estándar muestral como la poblacional se representan con el símbolo σ (a pesar de ser un error en el caso de la desviación muestral). Sin embargo, podemos distinguir la desviación muestral de la poblacional porque la muestral está acompañada de n-1 (es decir, aparece como σn-1) mientras que la poblacional aparece como sn. Esto hace referencia a que en el cálculo de la desviación estándar muestral se divide entre n-1 en lugar de n como en la poblacional.

Referencias

Devore, J. L. (2019). Probabilidad y estadística (1.a ed.). Cengage Learning.

MateMovil. (2021, 1 enero). Varianza y desviación estándar para datos agrupados por intervalos | Matemóvil. https://matemovil.com/varianza-y-desviacion-estandar-para-datos-agrupados-por-intervalos/

Soporte técnico de Google. (s. f.). DESVEST (STDEV) – Ayuda de Editores de Documentos de Google. Google – Ayuda de Editores de Documentos de Google. https://support.google.com/docs/answer/3094054?hl=es-419

Superprof. (s. f.). Desviación estándar. Diccionario de Matemáticas | Superprof. https://www.superprof.es/diccionario/matematicas/estadistica/desviacion-estandar.html

TOMi.digital. (s. f.). Desviación Estándar para datos agrupados. https://tomi.digital/en/52202/desviacion-estandar-para-datos-agrupados?utm_source=google&utm_medium=seo

Israel Parada (Licentiate,Professor ULA)
Israel Parada (Licentiate,Professor ULA)
(Licenciado en Química) - AUTOR. Profesor universitario de Química. Divulgador científico.

Artículos relacionados