Tema 8. Análisis Estadístico I; Presentación de Resultados


3.2. Medidas de dispersión


3.2.1. Variabilidad

Los estadísticos de tendencia central nos pueden indicar cuáles son los valores que más se repiten en la muestra, sus valores centrales y cuál es el valor medio, pero esa información no es suficiente. Además de conocer el valor medio de una serie de mediciones, es importante tener una idea acerca de su variación alrededor de la media. La variabilidad habitualmente se mide respecto a una medida de posición central pretendiendo conocer la representatividad de los valores centrales de la distribución Así, generalmente cuanta mayor sea la variabilidad, menor será la representatividad de las medidas centrales, ya que habrá más valores que se alejen de las medidas centrales.


Por ejemplo, las distribuciones A y B representan las estaturas en cm de dos muestras distintitas de 500 personas cada una. “A simple vista”, se aprecia que en la distribución A hay menos valores extremos y menos que se alejan del centro, por lo que la variabilidad o dispersión es menor. Lo contrario ocurre en la distribución B.

Hay tres maneras de presentar la variabilidad de los datos alrededor de la media. Estos son el intervalo o rango, la desviación estándar y el coeficiente de variación.

  • El intervalo o rango proporciona los valores máximo y mínimo, pero no da mucha indicación de la dispersión de las observaciones alrededor de la media. Esta dispersión la proporciona la desviación estándar. 
  • La desviación estándar (DE) se calcula con una fórmula que suma los cuadrados de las diferencias entre la media del grupo y cada valor individual. Esta suma total se conoce como varianza y se representa como S2.

 

La raíz cuadrada de la varianza proporciona la desviación estándar

 



Cuanto mayores sean las diferencias entre los valores, tanto más diseminada estará la distribución y la desviación estándar será mayor. Los matemáticos han calculado que si las observaciones siguen una distribución “normal” (valores con una dispersión uniforme alrededor de la media), un intervalo cubierto por una desviación estándar por encima y por debajo de la media abarcará cerca de 68% de las observaciones.

Un intervalo de ± 2 DE comprenderá aproximadamente el 95% de las observaciones, y un intervalo de ± 3 DE abarcará alrededor del 99,73%. El cálculo de la media y de la desviación estándar nos proporciona un buen resumen de los datos.


3.2.1. Coeficiente de variación

Es la razón entre la desviación típica y la media. Mide la desviación típica en forma de “qué tamaño tiene con respecto a la media”. También se la denomina variabilidad relativa. Este estadístico es interesante para comparar la variabilidad de diferentes variables.

Es frecuente mostrarla en porcentajes. Si la media es 80 y la desviación típica 20, entonces CV=20/80=0,25=25% (variabilidad relativa).

Por ejemplo, si el peso tiene CV=30% y la altura tiene CV=10%, los individuos presentan más dispersión en peso que en altura.



3.3. Medidas de forma

Existen distribuciones que presentan el mismo valor central e igual grado de dispersión, pero difieren en la forma o aspecto de sus representaciones gráficas, cuantificables con las medidas de asimetría y de apuntamiento o curtosis.

Si la asimetría es 0, la curva o distribución es simétrica. Cuando es positiva, quiere decir que hay más valores agrupados hacia la izquierda de la curva. Cuando es negativa, significa que los valores tienden a agruparse hacia la derecha.

La curtosis es un indicador de lo plana o “picuda” que es una curva. Cuando es 0 (curtosis = 0) se denomina mesocurtosis, y significa que puede tratarse de una curva normal. Si es positiva, quiere decir que la curva, la distribución o el polígono es más “picuda(o)” o elevada(o). Si la curtosis es negativa indica que es más plana la curva.