Tema 7. Errores y Sesgos en Investigación


1.2. Error sistemático, Sesgos de selección y clasificación, e Interacción y Confusión

Por error sistemático entendemos la falta de validez en la medición. También se le denomina sesgo. La validez se refiere al concepto de "medir lo que se quiere realmente medir". La validez es por tanto, la carencia de error sistemático. El error sistemático o sesgo es atribuible a errores metodológicos, que a diferencia del error aleatorio, no se reducen aumentando el tamaño muestral.

En la mayoría de los estudios de investigación clínica o epidemiológica es difícil obtener la suficiente información como para cuantificar apropiadamente la magnitud de los sesgos. Sin embargo, sí es posible conocer la dirección de estos errores, lo que resulta de extraordinaria importancia para el investigador, pues si encontramos una fuerte asociación entre variables, es crucial conocer si potenciales sesgos pudieron modificar hacia más o hacia menos dicha estimación.

La validez de un estudio de investigación suele distinguir entre dos conceptos: validez interna y validez externa.

  • Por validez interna se entiende la propiedad de que los resultados del estudio son válidos entre los propios sujetos del estudio. Por otra parte, la existencia de validez interna es un requisito previo para que pueda darse la validez externa.

  • Por validez externa se entiende la capacidad de generalización de los resultados, es decir, la capacidad de extender y aplicar las inferencias obtenidas a partir de ellos a una población diana (o población objetivo, también llamada externa) de referencia. 

Aunque una muestra mayor consigue una mayor precisión en las estimaciones disminuyendo el error aleatorio, la representatividad de una muestra no puede definirse en un sentido estadístico, requiere un juicio racional sobre el parecido de la muestra a la población.

 

Podemos clasificar los sesgos, en sesgos de selección, sesgos de información (o clasificación) y sesgos de análisis (confusión e interacción).

  • Existe un sesgo de selección cuando se produce una distorsión del efecto estimado como consecuencia de errores en el proceso de selección de los sujetos. Si la elección de los grupos a comparar no es apropiada se producirá un sesgo de selección. Es un sesgo que se comete con frecuencia en los estudios caso-control y ante el que se debe estar especialmente alerta. Son ejemplos de sesgo de selección:

    o Sesgo de autoselección. La inclusión de sujetos voluntarios puede hacer que la población no esté debidamente representada en la muestra, pueden hacerlo por factores que pueden influir con la relación que se estudia.

    o Falacia de Berkson. Ocurre en los estudios casos-control cuando los controles se seleccionan entre sujetos hospitalizados ya que en los sujetos expuestos al factor de riesgo aumentaría el riesgo de ser ingresados.

    o Falacia de Neyman o falacia de supervivencia. Ocurre en los estudios casos-control cuando la exposición está muy relacionada con la supervivencia. Cuando la enfermedad produce muertes precoces, los sujetos no expuestos, al ser los que sobreviven son los que se incluyen en el estudio, y por eso puede parecer que tienen mayor prevalencia que los expuestos.

    o Sesgo de membresía o pertenencia. Puede ocurrir cuando se trabaja con grupos preexistentes, es decir, grupos no formados de manera aleatoria, como ocurre por ejemplo en el caso de estudios cuasiexperimentales.

    o Sesgo del trabajador sano. Este sesgo se identificó cuando los trabajadores sometidos a ambientes peligrosos parecían tener tasas de supervivencia mayores que las de la población general. Lo que en realidad sucede, es que precisamente se requiere una buena salud para poder trabajar en esos ambientes (algo que no ocurre en la población general), no que la exposición a ambientes peligrosos proteja a los trabajadores.


  • Los sesgos de información o clasificación consisten en la distorsión del efecto estimado por errores en la medición y/o clasificación de los sujetos en una o más variables. Algunos ejemplos son los instrumentos de medición no válidos o no calibrados, criterios diagnósticos inapropiados o cambiantes, pérdidas de información, seguimiento desigual entre los grupos de estudio, inconsistencia entre los entrevistadores, ausencia de interpretación ciega de la exposición o del efecto, etc. La influencia de estos errores en la clasificación del nivel de exposición o en el efecto puede distorsionar nuestros resultados, especialmente cuando los errores sean diferenciales.

    o Entendemos por error de clasificación diferencial, el producido cuando el criterio de clasificación en uno de los grupos que se comparan es diferente del criterio utilizado en el otro grupo. El efecto de este error suele traducirse en que los sujetos de un grupo sean clasificados incorrectamente y los del otro correctamente. La estimación del efecto puede verse aumentada o disminuida, produciéndose una distorsión en contra o a favor de la hipótesis nula.

    o El error de clasificación no diferencial es el cometido cuando se clasifica incorrectamente a los dos grupos por igual. La clasificación de exposición o de enfermedad es errónea para iguales proporciones de sujetos en los dos grupos de comparación. Este error tiende a producir una subestimación del efecto, esto es, una distorsión a favor de la hipótesis nula y en consecuencia genera resultados más conservadores. Por ello, el error no diferencial ocasiona menos problemas que el error diferencial.

    Otros ejemplos de sesgo de información:

    o Sesgo de memoria (recall-biass). Ocurre en los estudios casos-control, donde la información se recoge retrospectivamente y el sujeto puede haber olvidado aspectos relativos a la exposición o relevantes para el factor de estudio. Este sesgo es más frecuente en los sujetos sanos (controles), porque los que presentan la enfermedad (casos) pueden recordar mejor la exposición si esta les originó un cuadro agudo.

    o Efecto Hawthorne o sesgo de atención. Es un tipo de sesgo de información que puede ocurrir al no tener grupo control. Se produce cuando al saber los participantes que están siendo observados, alteran su comportamiento.

    o Sesgo del entrevistador. El entrevistador puede emplear preguntas o frases que condicionen la respuesta del individuo.

    o Sesgo de deseabilidad social u obsequiosidad. Ocurre cuando los participantes orientan sus respuestas para dar una buena imagen de sí mismos al entrevistador, de modo que los encuestados pueden modificar la respuesta que realmente refleja sus sentimientos u opiniones a favor de la que se considera más positivamente valorada.

    o Sesgo de respuesta invariable. Ocurre por la tendencia del individuo a responder siempre de la misma manera.

    o Sesgo de aprendizaje o proximidad. Sucede al aplicar en más de una ocasión el mismo instrumento de medida. Se minimiza dejando pasar al menos 6 meses entre una medición y otra.

    o Sesgo de falseamiento. Ocurre cuando de forma premeditada o inconsciente, los participantes dan respuestas falsas o incompletas a preguntas consideradas íntimas o traumáticas.

    o Sesgo de cuestionario. Aparece si el cuestionario no está correctamente diseñado y contiene preguntas ambiguas.

    o Sesgo de no respuesta. Aparece debido al abandono o fallecimiento de los sujetos que participan en el estudio.


  • Sesgos de análisis. Mientras los sesgos de selección o clasificación, sólo pueden ser previstos y corregidos en la fase de diseño, otros errores pueden ser controlados en la fase de análisis. De estos sesgos de análisis los principales son la confusión y la interacción.
    Cuando el efecto estimado de la relación exposición-enfermedad está distorsionado por la presencia de algún factor extraño en el análisis de los datos, decimos que existe confusión. El estimador del efecto de interés está distorsionado por estar mezclado con el efecto producido por un factor extraño que llamamos factor o variable de confusión. La presencia de tal factor de confusión altera los resultados y puede producir un aumento o disminución del efecto, o incluso cambiar la dirección del mismo. Para que un factor sea de confusión necesita cumplir unos requisitos:

    o Debe ser un factor de riesgo independiente de la enfermedad tanto para los expuestos como para los no expuestos en la población.

    o Debe estar asociado al factor de exposición que estudiamos en la población de donde provienen los casos.

    o No debe ser una consecuencia de dicha exposición, es decir, no ser un paso intermedio en la cadena o secuencia de causalidad entre la exposición y la enfermedad.

    Un sesgo de confusión puede corregirse previamente al inicio del estudio durante el diseño del mismo, empleando técnicas de restricción, pero también puede corregirse en el análisis, mediante técnicas de ajuste. Hablamos fundamentalmente del análisis estratificado y del análisis multivariante.
    El otro sesgo de análisis que debemos controlar es el de modificación del efecto o interacción. Este sesgo ocurre cuando el efecto producido por una determinada variable se ve modificado en presencia de una tercera variable, produciéndose efectos de distinta intensidad, en la misma o distinta dirección. Este fenómeno debe ser distinguido del de confusión y también controlado en el análisis.

 

1.3. Diferencias entre el Error Aleatorio y el Error Sistemático.