Tema 10. Análisis y Discusión de los resultados


1. ESTADÍSTICA DESCRIPTIVA

La Estadística Descriptiva organiza y describe de forma resumida los datos obtenidos en la muestra, de forma que podamos comprenderlos y manejarlos. Primeramente analizaremos la frecuencia con que cada valor aparece en los sujetos de la muestra, por ejemplo la edad.

La frecuencia absoluta sería el número de personas que tienen una determinada edad, mientras que la frecuencia relativa sería el producto de dividir la frecuencia absoluta por el total de la muestra. El porcentaje sería la frecuencia relativa multiplicada por 100.

 

 

En nuestro caso, el rango de edad y su distribución en la muestra nos permite trabajar con los datos en conjunto. Pero podría darse el caso de que las edades de los participantes fuesen muy dispersas y su distribución muy irregular, lo que podría aconsejar trabajar este valor en forma de rangos o intervalos (en el caso de la edad suelen usarse rangos de 5 años). Dentro de los criterios estadísticos descriptivos, tienen suma importancia por su utilidad para comparar muestras los de centralidad y dispersión.

 

Centralidad
Los criterios estadísticos de centralidad son valores que tienden a situarse en el centro del conjunto de datos. Ordenados respecto a su magnitud pueden ser:

  • De tamaño, como las diversas medias aritmética, geométrica, armónica, etc.
  • De posición, como la mediana, cuartiles, deciles y percentiles.
  • De frecuencia, como la moda.

Que estos valores coincidan o no, nos informa ya sobre si la distribución de los valores es simétrica o no.

 

Dispersión
Para poder realizar un completo análisis de la muestra, es fundamental conocer si los datos de cada variable están más o menos agrupados. De esto nos informan los valores de dispersión.

El Recorrido o Rango, marca los límites de la muestra para la variable en cuestión, pero es más útil añadir al rango total el rango intercuartílico, que es el marcado entre el 1º y el 3º cuartil.

La Desviación Media es la media aritmética de las desviaciones de cada valor de la muestra, respecto a la media de la misma. Sin embargo, son la varianza y la desviación típica los valores estadísticos clave en las medidas de dispersión.

La Varianza. De cada valor de la muestra, se halla su desviación respecto a la media, se eleva al cuadrado y se halla la media. Se denomina como S2.

La Desviación Típica es la raíz cuadrada de la varianza y expresa la medida de dispersión de los valores alrededor de su valor central. En un informe de investigación, salvo que la muestra no se ajuste a lo que se llama “distribución normal”, siempre que se exprese un valor medio de la muestra, se acompañará de su desviación típica. Por ejemplo, la edad de la población fue de 49 (+/- 3) años.

La relación entre la desviación típica y la media se denomina Coeficiente de Variación y nos da una medida de dispersión relativa.

Estos valores estadísticos debemos hallarlos e informarlos para cada una de las variables incluidas en el estudio, esto nos permitirá localizar datos erróneos y valores extremos que podremos corregir o tener en cuenta a la hora de realizar los análisis de inferencia (si fuera el caso).

El estudio de la asociación entre variables o inferencia estadística, constituye el siguiente escalón y trata de analizar la relación entre dos variables generalmente entre la dependiente y alguna de las independientes.

Pero antes de pasar de lleno a estos análisis es preciso conocer aunque sea someramente qué es la Distribución Normal, también conocida como la Campana de Gauss. La Distribución Normal es la forma de distribución de una gran mayoría de los valores de variables biológicas en las que media, moda y mediana coinciden y una mayoría (63%) de los valores se hallan dentro de la desviación típica y casi todos (95%) dentro de 2 desviaciones típicas.

En el caso de las variables que sólo adoptan dos valores (por ejemplo Fumador Si/No), estaremos ante una Distribución Binominal, pero estas generalmente se adaptan a una distribución normal a medida que se aumenta la muestra, de modo que a partir de 30 observaciones ya se asume que tiene la distribución normal.

Otro concepto fundamental lo constituye la conocida como Significación Estadística. Representada como “p”, nos ayuda a aseverar que las relaciones observadas entre las variables sean ciertas y no debidas al azar. El límite para tal afirmación está relacionado con el llamado Nivel de Confianza que predeterminamos para nuestro estudio (generalmente un 95%).