Tema 8. Análisis Estadístico I; Presentación de Resultados


Los resultados de un estudio deben resumirse claramente para permitir su análisis e interpretación adecuados. La primera tarea es describir los datos, los valores o las puntuaciones obtenidas para cada variable. No obstante, es necesario una comprensión previa del proceso para poder realizarlo. Necesitamos por lo tanto:

  • Conocer detalladamente cada una de las variables utilizadas. Estamos hablando de Estadística descriptiva.
  • El análisis de las relaciones entre variables. Esto es Estadística inferencial o bivariante.
  • El análisis multivariante. 

En los estudios epidemiológicos el análisis se realiza utilizando la estadística, mientras que en los estudios cualitativos se utiliza principalmente un análisis inductivo.

1. ETAPAS DEL ANÁLISIS DE DATOS
Las etapas del análisis de datos son cuatro:

  1. Definir qué pruebas son apropiadas para analizar los datos. 
  2. Preparar la base de datos para que se encuentren en el formato adecuado para el programa estadístico que utilizaremos. 
  3. Realizar los análisis requeridos. 
  4. Interpretar los análisis.

2. TABULACIÓN; REALIZACIÓN DE LA BASE DE DATOS
El proceso a seguir en la tabulación o preparación de la base datos:

  • Detallar e identificar las variables que serán objeto de estudio.
  • Determinar las variables que van ser analizadas individualmente o presentadas en cuadros simples.
  • Determinar las variables que deben cruzarse.
  • Hacer listado de cuadros y gráficos que deben presentarse.

El primer paso para resumir los datos, consiste habitualmente en agruparlos en tablas o cuadros de resumen. Los principales cuadros son:

  • Cuadros de distribución de frecuencias. 
  • Cuadros de tabulación múltiple. 
  • Los polígonos de frecuencias. 

Una herramienta de recogida de datos bien elaborada nos servirá para desarrollar la base de datos necesaria para trabajar con el software informático. Los pasos sucesivos en el diseño y manejo de base de datos son los siguientes:

  1. Diseño de la estructura y creación de la Base de Datos (operacionalización de variables y codificación del cuestionario). 
  2. Apertura de la base o bases de datos (Nombre y área de trabajo).
  3. Organización de la base de datos (Índices).
  4. Consultar y/o modificar los registros (Tablas y formularios).
  5. Listados e informes (Estadísticos).

3. CÁLCULOS; ESTADÍSTICA DESCRIPTIVA
La Estadística Descriptiva, describe, analiza y representa un grupo de datos utilizando métodos numéricos y gráficos que resumen y presentan la información contenida en ellos.
Los datos numéricos pueden resumirse por el cálculo de sus medidas de posición y de dispersión

3.1. Medidas de posición

3.1.1. Medidas de tendencia central
La medida de la tendencia central usada con mayor frecuencia es la media aritmética. Otras determinaciones de la tendencia central menos conocidas, pero también útiles, son la mediana y la moda.

3.1.2. Medidas de tendencia no central
Las medidas de tendencia central más usados en Ciencias de la Salud son los cuartiles y los percentiles.

3.2. Medidas de dispersión 

3.2.1. Variabilidad
Además de conocer el valor medio de una serie de mediciones, es importante tener una idea acerca de su variación alrededor de la media. Así, generalmente cuanta mayor sea la variabilidad, menor será la representatividad de las medidas centrales, ya que habrá más valores que se alejen de las medidas centrales.

Hay tres maneras de presentar la variabilidad de los datos alrededor de la media. Estos son el intervalo o rango, la desviación estándar y el coeficiente de variación.

3.2.1. Coeficiente de variación
Otra medida de dispersión es el coeficiente de variación, que hace referencia a la razón entre la desviación típica y la media. Este estadístico es interesante para comparar la variabilidad de diferentes variables.

4. CORRELACIÓN; RELACIÓN ENTRE VARIABLES
El objetivo de la correlación es descubrir la existencia de relaciones entre variables y si es posible predecir el valor de una variable a partir de otras.

En el contexto de la correlación, los datos se clasifican como variables independientes o dependientes.
En la epidemiología, las variables independientes se llaman a menudo factores de riesgo o variables de exposición.

4.1. Diagrama de dispersión
Cuando un investigador ha recopilado dos conjuntos de observaciones y desea ver si hay una relación entre ellos, lo mejor es construir primero un diagrama de dispersión.

4.2. Coeficiente de correlación
Cuando la relación entre dos variables puede expresarse gráficamente por una línea recta, la correlación puede expresarse como el coeficiente de correlación, y puede ser positiva o negativa. Cuando una variable aumenta a medida que la otra también aumenta, la correlación es positiva. Cuando una variable disminuye conforme la otra aumenta, es negativa.

4.2.1. Coeficiente de Correlación Lineal de Pearson
Por otro lado, el coeficiente de correlación lineal de Pearson de dos variables nos indica si los puntos tienen una tendencia a disponerse alineadamente.
Es útil para determinar si hay una relación lineal entre dos variables, pero no servirá para otro tipo de relaciones.

4.2.2. Otros Coeficientes de Correlación
Cuando las variables en vez de ser numéricas son ordinales, es posible preguntarse sobre si hay algún tipo de correlación entre ellas. Disponemos para estos casos de dos estadísticos:

  • ? (‘ro’) de Spearman
  • t (‘tau’) de Kendall

Son estadísticos análogos al coeficiente de Pearson.

4.3. Ecuación de regresión
El Coeficiente de regresión es el término usado para significar la cantidad por la cual debe multiplicarse un cambio en una variable (variable independiente), para obtener el cambio promedio correspondiente en otra variable (variable dependiente). Representa el grado en que la recta de regresión se inclina hacia arriba o hacia abajo.


5. GRÁFICOS Y FIGURAS
Las figuras mejoran la legibilidad de los resultados. Las representaciones gráficas permiten captar visualmente las características de los datos de forma rápida. Hay varios tipos de gráficas que se escogen según el tipo de variables del estudio. Veremos a continuación las principales gráficas según el tipo de variable.

5.1. Gráficas para variables cualitativas o nominales

  • Diagrama de barras. 
  • Diagrama de sectores. 
  • Pictogramas.

5.2. Gráficos para variables cuantitativas discretas

  • Diagrama de barras. 
  • Diagrama en escalera o acumulado. Se usa para construir una gráfica integral.

5.3. Gráficos para variables cuantitativas continuas

  • Histograma. 
  • Polígono de frecuencias. 
  • Polígono de frecuencias acumulado u ojiva.

5.4. Diagramas Especiales
Son diagramas diferentes a los anteriores y suelen utilizarse con bastante frecuencia. Estos son:

  • Gráfica de dispersión
  • Gráficos Box plots (de caja “box” y bigotes “whisker plots”). 
  • Diagrama de barras de error. 
  • Pirámide de población.
  • Curvas ROC. 
  • Perfil radial.