Ejemplo del cálculo de la desviación estándar de la población

Tabla de Contenidos

La desviación estándar poblacional es uno de los parámetros poblacionales más importantes para medir la variabilidad o dispersión de los datos dentro de la población. Como todo parámetro en estadística, se representa con una letra griega, en este caso, la letra σ (sigma). Esto permite diferenciarla fácilmente de la desviación estándar de la muestra (s) la cual, si bien es similar, no es igual ni se calcula con las mismas fórmulas.

A continuación, veremos, por medio de un ejemplo, distintas maneras de calcular la desviación estándar de una población. Cabe resaltar que, para el cálculo de la desviación estándar poblacional, es indispensable conocer todos los datos poblacionales. Esto rara vez ocurre en contextos reales, pero de igual manera es importante entender cómo se calcula, ya que eso ayuda a comprender algunas de las características matemáticas de este importante parámetro.

Fórmulas de la desviación estándar poblacional

Dependiendo de los datos con los que se cuente, se puede determinar la desviación estándar de la población por medio de tres fórmulas diferentes.

Definición matemática de la desviación estándar poblacional

La desviación estándar se define como la raíz cuadrada de la varianza, σ². Es decir, si conocemos la varianza de la población, podemos calcular la desviación estándar por medio la siguiente ecuación:

Ejemplo del cálculo de cálculo de la desviación estándar de la población

Este caso rara vez se presenta, pero es bueno tenerlo en cuenta.

Otras fórmulas de desviación estándar de la población

Si en lugar de conocer la varianza de una población, conocemos todos los N datos que la conforman, entonces podemos calcular la desviación estándar poblacional como la raíz cuadrada del promedio de las desviaciones cuadradas de la media. Es decir:

En esta ecuación, x_i representa el valor de cada dato en la población, N representa el número de datos en la población (o el tamaño de la población, que es lo mismo) y μ es la media poblacional. Nótese que la media de la población también se representa con una letra griega por tratarse de otro parámetro poblacional y el tamaño de la población se representa con N (mayúscula) para distinguirlo de n que se suele asociar al tamaño de una muestra.

La media poblacional, μ, viene dada por:

La ecuación 2 puede expandirse, reordenarse y simplificarse para obtener:

En caso de no disponer de datos individuales de la población sino de datos agrupados en una tabla de frecuencias, las fórmulas anteriores quedan levemente modificada para dar:

En las ecuaciones anteriores, la cantidad que se encuentra dentro de la raíz no es más que la varianza poblacional. La ecuación 4 tiene la ventaja de estar establecida exclusivamente en términos de los datos poblacionales y no de algún parámetro poblacional como en el caso de las ecuaciones 2 y 5.

Ejemplo del cálculo de la desviación estándar poblacional

Supongamos que queremos determinar la variabilidad en el peso de un modelo particular de automóvil del cual se sabe que solo existen 20 ejemplares en todo el mundo. Los datos de los pesos en kilogramos de estos 20 autos se presentan en la siguiente tabla:

410	408	408	405	391	390	402	397	397	395
390	404	397	394	399	397	405	408	410	400

Como sabemos que solo existen 20 autos de este modelo, estos representan la población completa, por lo que contamos con todos los datos necesarios para determinar la desviación estándar poblacional. Veamos tres maneras distintas de determinar esta desviación estándar.

Método 1: Cálculo basado en la definición de la varianza

Este método se basa en el uso de la ecuación 2 presentada arriba. Como podemos ver, la ecuación requiere el uso de la media poblacional y otra serie de cálculos que se detallan a continuación:

Paso 1: Determinar la media poblacional

La media poblacional o μ se calcula por medio de la ecuación 3, sumando todos los datos y dividiendo entre el número total de datos que es, en este caso, 20.

Paso 2: Calcular las desviaciones respecto a la media

Este paso implica calcular las restas (x_i – μ). Por ejemplo:

x₁ – μ = 410 – 400,35kg = 9,65kg

x₂ – μ = 408 – 400,35kg = 7,65kg

x₃ – μ = 408 – 400,35kg = 7,65kg

…

X₂₀ – μ = 400 kg – 400,35kg = – 0,35

Los resultados se presentan en la siguiente tabla:

x_i	x_i – μ
410	9,65
408	7,65
408	7,65
405	4,65
391	-9,35
390	-10,35
402	1,65
397	-3,35
397	-3,35
395	-5,35
390	-10,35
404	3,65
397	-3,35
394	-6,35
399	-1,35
397	-3,35
405	4,65
408	7,65
410	9,65
400	-0,35

Paso 3: Elevar todas las desviaciones de la media al cuadrado

(x₁ – μ)² = (9,65)² = 93,1225 kg²

(x₂ – μ)² = (7,65)² = 58,5225 kg²

(x₃ – μ)² = (7,65)² = 58,5225 kg²

…

(x₂₀ – μ)² = (– 0,35)² = 0,1225 kg²

Los resultados se presentan en la siguiente tabla:

x_i/ kg	(x_i – μ)/ kg	(x_i – μ)²/ kg²
410	9,65	93,1225
408	7,65	58,5225
408	7,65	58,5225
405	4,65	21,6225
391	-9,35	87,4225
390	-10,35	107,1225
402	1,65	2,7225
397	-3,35	11,2225
397	-3,35	11,2225
395	-5,35	28,6225
390	-10,35	107,1225
404	3,65	13,3225
397	-3,35	11,2225
394	-6,35	40,3225
399	-1,35	1,8225
397	-3,35	11,2225
405	4,65	21,6225
408	7,65	58,5225
410	9,65	93,1225
400	-0,35	0,1225

Paso 4: Sumar todas las desviaciones cuadradas

Paso 5: Aplicar la fórmula de la ecuación 2

Ahora que tenemos esta sumatoria, solo falta reemplazar este valor, así como el número de datos, que es 20, en la ecuación 2:

Así, obtenemos que la desviación estándar del peso de la pobalción de 20 autos es de aprox. 6,5 kg.

Método 2: Uso de la ecuación reordenada

Ahora llevaremos a cabo el mismo cálculo, pero utilizando la ecuación 4, la cual es equivalente a la ecuación que acabamos de utilizar, pero es más práctica, en especial si se está trabajando con un mayor número de datos. El principal beneficio es que no hace falta calcular un parámetro adicional (la media poblacional) para poder calcular las desviaciones, sino que todo se calcula en función de los datos individuales originales. Además, en ningún momento se necesita trabajar con número negativos, los cuales son una fuente importante de error entre los estudiantes.

Paso 1: Calcular el cuadrado de cada dato individual

Es decir, se llevan a cabo los siguientes cálculos:

(x₁)² = (410)² = 168.100 kg²

(x₂)² = (408)² = 166.464 kg²

(x₃)² = (408)² = 166.464 kg²

…

(x₂₀)² = (400)² = 160.000 kg²

Los resultados se presentan en la siguiente tabla:

x_i	x_i²
410	168.100
408	166.464
408	166.464
405	164.025
391	152.881
390	152.100
402	161.604
397	157.609
397	157.609
395	156.025
390	152.100
404	163.216
397	157.609
394	155.236
399	159.201
397	157.609
405	164.025
408	166.464
410	168.100
400	160.000

Paso 2: Sumar todos los datos individuales

Paso 3: Sumar todos los cuadrados

Paso 4: Aplicar la fórmula de la ecuación 4

El último paso es introducir estos dos valores y el número de datos en la ecuación 4 para obtener la desviación estándar poblacional:

Método 3: Uso de hojas de cálculo

Las hojas de cálculo como Excel de Microsoft, Numbers de Apple o Sheets de Google incluyen entre sus funciones básicas el cálculo directo de la desviación estándar (tanto muestral como poblacional). Estas funciones toman como argumento un conjunto de datos y llevan a cabo todos los cálculos mostrados en el método anterior para arrojar directamente la desviación estándar en la celda donde se introduce la fórmula.

El procedimiento es el siguiente:

Paso 1: Introducir los datos en la hoja de cálculo

Podemos introducir los datos en forma de columna, fila o matriz en cualquier parte de la hoja de cálculo. La siguiente captura de pantalla muestra cómo se ven los datos del presente problema en Excel 2016.

Paso 2: Utilizar la fórmula para calcular la desviación estándar

Una vez añadidos los datos, utilizamos la función de desviación estándar colocándole como argumentos las celdas donde se encuentran los datos.

Para llamar a una función en una hoja de cálculo, por lo general se comienza escribiendo el signo de igualdad (=) seguido del nombre de la función que queremos utilizar. Los nombres cambian levemente de una aplicación a otra y en algunos casos también cambian según el idioma en el que se esté trabajando.

En el caso de Excel (versión en español), la función para calcular la desviación estándar poblacional se llama DESVEST.P, mientras que en Google Sheets es DESVESTP (sin el punto). Luego se debe introducir el (o los) argumento (argumentos) de la función entre paréntesis. En nuestro ejemplo, colocamos como argumento el rango de celdas en el que se encuentran los datos (que van desde la celda A3 hasta la J4).

Al presionar ENTER, el programa correr la función y calcula la desviación estándar de la población, presentando el resultado en la respectiva celda, como se muestra a continuación:

Como podemos observar, cualquiera de los tres métodos aquí practicados produce el mismo resultado. Se trata simplemente de distintas maneras de hacer lo mismo.

Otros métodos

Además de los tres métodos citados anteriormente, las calculadoras científicas y financieras también suelen tener una función para determinar la desviación estándar de un conjunto de datos, sean estos muestrales o poblacionales. La forma cómo se introducen los datos y se obtienen los resultados varía de un fabricante a otro, e incluso de un modelo de calculadora a otra, por lo que resulta poco práctico mostrar aquí los pasos específicos para hacerlo.

En su lugar, plantearemos los pasos generales más importantes sin ahondar en ellos. El que desee utilizar esta función en su calculadora científica deberá referirse al manual del usuario que vino con la calculadora o buscarlo por internet para determinar la combinación de teclas específicas en cada caso.

Paso 1: Limpiar la memoria

En muchas calculadoras, los datos almacenados con anterioridad no son visibles. Si introducimos datos sobre otros que ya estaban almacenados sin darnos cuenta, la calculadora arrojará un resultado equivocado. Para asegurar que esto no ocurra, es aconsejable borrar toda la memoria de la calculadora (o por lo menos del modo de análisis estadístico) antes de comenzar a introducir datos nuevos.

Paso 2: Acceder al modo de estadística

Las funciones para calcular la desviación estándar forman parte del modo «Estadística,» «Statistics» o simplemente «S» en la mayoría de las calculadoras, así que debemos comenzar ingresando a este modo de funcionamiento.

Paso 3: Introducir los datos

Esto varía de una calculadora a otra. En algunos casos se puede agregar datos en forma de tabla, mientras que en otros se introducen los datos uno a uno luego de presionar la tecla DT (o DAT). Es importante verificar el número de datos ingresados al finalizar este paso para asegurarnos de que no haya faltado ninguno.

Paso 4: Calcular la desviación estándar de la población

Una vez introducidos los datos, solo falta pedir a la calculadora el resultado que estamos buscando. En muchas calculadoras, tanto la desviación estándar muestral como la poblacional se representan con el símbolo σ (a pesar de ser un error en el caso de la desviación muestral). Sin embargo, podemos distinguir la desviación muestral de la poblacional porque la muestral está acompañada de n-1 (es decir, aparece como σ_n-1) mientras que la poblacional aparece como s_n. Esto hace referencia a que en el cálculo de la desviación estándar muestral se divide entre n-1 en lugar de n como en la poblacional.

Referencias

Devore, J. L. (2019). Probabilidad y estadística (1.^a ed.). Cengage Learning.

MateMovil. (2021, 1 enero). Varianza y desviación estándar para datos agrupados por intervalos | Matemóvil. https://matemovil.com/varianza-y-desviacion-estandar-para-datos-agrupados-por-intervalos/

Soporte técnico de Google. (s. f.). DESVEST (STDEV) – Ayuda de Editores de Documentos de Google. Google – Ayuda de Editores de Documentos de Google. https://support.google.com/docs/answer/3094054?hl=es-419

Superprof. (s. f.). Desviación estándar. Diccionario de Matemáticas | Superprof. https://www.superprof.es/diccionario/matematicas/estadistica/desviacion-estandar.html

TOMi.digital. (s. f.). Desviación Estándar para datos agrupados. https://tomi.digital/en/52202/desviacion-estandar-para-datos-agrupados?utm_source=google&utm_medium=seo

Ejemplo del cálculo de la desviación estándar de la población

Fórmulas de la desviación estándar poblacional

Definición matemática de la desviación estándar poblacional

Otras fórmulas de desviación estándar de la población

Ejemplo del cálculo de la desviación estándar poblacional

Método 1: Cálculo basado en la definición de la varianza

Paso 1: Determinar la media poblacional

Paso 2: Calcular las desviaciones respecto a la media

Paso 3: Elevar todas las desviaciones de la media al cuadrado

Paso 4: Sumar todas las desviaciones cuadradas

Paso 5: Aplicar la fórmula de la ecuación 2

Método 2: Uso de la ecuación reordenada

Paso 1: Calcular el cuadrado de cada dato individual

Paso 2: Sumar todos los datos individuales

Paso 3: Sumar todos los cuadrados

Paso 4: Aplicar la fórmula de la ecuación 4

Método 3: Uso de hojas de cálculo

Paso 1: Introducir los datos en la hoja de cálculo

Paso 2: Utilizar la fórmula para calcular la desviación estándar

Otros métodos

Paso 1: Limpiar la memoria

Paso 2: Acceder al modo de estadística

Paso 3: Introducir los datos

Paso 4: Calcular la desviación estándar de la población

Referencias

Artículos Relacionados:

Artículos relacionados