Tabla de Contenidos
La puntuación Z, también denominada puntuación estándar, es una medida de la distancia de un dato estadístico o del valor de una variable aleatoria con respecto a la media de dicha variable en términos de un número de desviaciones estándar. Esto quiere decir que, si la puntuación Z de una observación es de 1, entonces dicha observación se encuentra a una desviación estándar por encima de la media poblacional, y si la puntuación Z es – 2, entonces la observación está a una distancia de dos desviaciones estándar por debajo de la media.
Las puntuaciones Z son de gran importancia en estadística y en prácticamente cualquier ciencia. Esto se debe a que muchas variables estadísticas aleatorias siguen una distribución normal. Además, incluso en los casos en los que una variable aleatoria no siga una distribución normal, el teorema central del límite asegura que la media de una muestra aleatoria lo suficientemente grande (casi siempre con n > 30) seguirá una distribución normal, independientemente de la distribución que siga la variable aleatoria. Esto permite llevar a cabo cálculos de probabilidad sobre muestras aleatorias, lo cual representa una de las principales aplicaciones de estadística en la ciencia.
Aplicaciones de la puntuación Z
La puntuación Z se puede calcular para cualquier conjunto de datos estadísticos, pero solo tiene significado para variables que sigan una distribución normal. Esto se debe a que el valor de Z de una observación corresponde al valor equivalente de esta observación en una distribución normal estándar, es decir, una distribución normal de media cero y de desviación estándar unitaria. Esto, a su vez, permite relacionar los valores de las distintas observaciones con los valores de probabilidad de la distribución normal estándar (que podemos encontrar en una tabla Z o por medio de paquetes de software estadístico). Entre otras cosas, esto permite:
- Identificar datos atípicos dentro de una serie de datos estadísticos.
- Calcular probabilidades de error.
- Establecer intervalos de confianza.
- Llevar a cabo contrastes de hipótesis.
Dada la importancia de la distribución normal en campos tan variados como las finanzas, la física cuántica y las humanidades, a continuación, mostramos ejemplos del cálculo de la puntuación Z para distintas variables en distintos contextos.
¿Cómo se calcula el puntaje Z?
La puntuación Z de una variable aleatoria con distribución normal se calcula a partir de los valores conocidos o estimados de la media poblacional de la variable (μ) y de su desviación estándar (σ), por medio de la siguiente fórmula:
En esta ecuación, X representa el valor de la variable aleatoria u observación. Dependiendo de las características de la variable a la que se le calcula el puntaje Z, los términos de la fórmula anterior como X, la media poblacional y la desviación estándar se sustituyen por otras expresiones, obteniéndose fórmulas ligeramente distintas pero que, en esencia, son la misma fórmula mostrada aquí.
Las unidades de Z
Tanto la variable X como su media y su desviación estándar son cantidades que poseen las mismas unidades. Como la fórmula de Z implica dividir la resta entre X y la media entre la desviación estándar, las unidades del numerador, sean cuales sean, siempre se cancelan con las del denominador por lo que Z es una cantidad adimensional (no posee unidades).
Ejemplos del cálculo de puntuación Z
Ejemplo 1 – Cálculo de la puntuación Z de una variable con distribución normal
Este es el caso más simple del cálculo de la puntuación Z, ya que implica la aplicación directa de la fórmula anteriormente citada. Supongamos que un fabricante de arandelas toma una arandela al azar y mide su diámetro. El fabricante sabe que el diámetro de las arandelas que fabrica sigue una distribución normal con promedio de 2,54 cm y desviación estándar de 0,01 cm. Al medir una arandela al azar, esta mide 2,52 cm. El fabricante desea saber si esta medida está significativamente alejada del promedio.
Este tipo de problema se puede resolver determinando el valor del puntaje Z de la observación, para luego determinar la probabilidad de que la diferencia con la media sea aleatoria.
Los datos proporcionados son:
Por lo que el puntaje Z de la observación es:
Este resultado significa que la medida de la arandela se encuentra 2 desviaciones estándar por debajo de la media. Con este valor y una tabla de distribución normal, es posible determinar la probabilidad de que este sea un valor atípico en función de un nivel de confianza preestablecido; sin embargo, esto es materia para otro artículo.
Ejemplo 2 – Cálculo de la puntuación Z de una muestra de tamaño n de valores de una variable aleatoria con distribución normal
Supongamos que el mismo fabricante de arandelas anterior se preocupó porque el valor del diámetro de la arandela que midió resultó demasiado pequeño para ser atribuido únicamente a variaciones aleatorias del diámetro. Entonces decide investigar más a fondo ,por lo que toma una muestra aleatoria de arandelas y mide el diámetro de cada una de ellas para luego calcular la media muestral y ver si las evidencias experimentales sugieren que hay un problema con la línea de producción. En este caso, se desea llevar a cabo el mismo cálculo del puntaje Z anterior, pero utilizando el valor medio de la muestra de 100 arandelas en lugar del valor del diámetro de una sola arandela, la cual es poco probable que sea representativa de todas las arandelas que produce la fábrica. La media de la muestra resultó ser 2,53 cm.
En esta situación, se sabe que la media muestral (X̅) también sigue una distribución normal cuya media es la misma media poblacional (μ) pero que tiene una desviación estándar igual a la desviación estándar poblacional dividida entre la raíz cuadrada del tamaño muestral.
Por esta razón, la fórmula para el cálculo de Z cambia a:
Los datos aportados son:
Por lo que el valor de Z para la media de la muestra es:
Este resultado significa que el valor observado de la media muestral está diez desviaciones estándar muestrales por debajo de la media poblacional. Un análisis más profundo de las probabilidades confirmaría que esto sugiere la presencia de un problema con los diámetros de las arandelas.
Referencias
Devore, J. L. (1998). PROBABILIDAD Y ESTADISTICA PARA INGENIERIA Y CIENCIAS. International Thomson Editores, S.A.
Echegoyen O., J. (s. f.). Puntuación Z. Diccionario de Psicología Científica y Filosófica. https://www.e-torredebabel.com/Psicologia/Vocabulario/Puntuacion-Z.htm
El teorema del límite central. (2019). Minitab, LLC. https://support.minitab.com/es-mx/minitab/18/help-and-how-to/statistics/basic-statistics/supporting-topics/data-concepts/about-the-central-limit-theorem/
Esri. (2018). ¿Qué es una puntuación z? ¿Qué es un valor P? ArcGIS Desktop. https://desktop.arcgis.com/es/arcmap/10.3/tools/spatial-statistics-toolbox/what-is-a-z-score-what-is-a-p-value.htm
Olofsson, O. (s. f.). Calculador del Puntaje Z. World Class Manufacturing. https://world-class-manufacturing.com/es/Sigma/z.html
Puntuación Z. (2021, 27 enero). Traders Studio. https://traders.studio/puntuacion-z/