2. LO QUE LAS PRUEBAS ESTADÍSTICAS NOS DICEN
2.1. Probabilidad
En la ciencia no hay ninguna certidumbre, hay probabilidades. Lo que es cierto acerca de la ciencia es la incertidumbre. En la metodología científica, tratamos de reducir al mínimo la probabilidad de encontrar una asociación cuando en realidad no existe ninguna, y de reducir al mínimo la probabilidad de pasar por alto u omitir una asociación cuando en realidad sí existe.
No podemos eliminar esta probabilidad de error, sin embargo, la estadística analítica puede darnos un cálculo de su magnitud. La probabilidad de cometer un error depende del tamaño de la muestra estudiada para probar la hipótesis de nulidad. Cuanto mayor es el tamaño de la muestra, tanto menos probable será la probabilidad de cometer un error. Esta es la razón por la cual la determinación del tamaño de la muestra es una parte fundamental del diseño de investigación.
2.2. Significación estadística
Las pruebas de significación estadística se basan en la lógica y en el sentido común.
Una prueba de significación estadística calcula la probabilidad de que un resultado observado de un estudio, por ejemplo, una diferencia entre dos grupos o una asociación, se deba al azar y por consiguiente, de que no pueda obtenerse ninguna inferencia del mismo.
Que una diferencia tenga la probabilidad de ser real y no debida al azar se basa en gran parte en tres criterios:
- Magnitud de la diferencia observada. Es razonable esperar que cuanto mayor sea la diferencia, tanto más probable es que no se deba al azar.
- Grado de variaciones de los valores obtenidos en el estudio. Si los valores se sitúan dentro de un intervalo demasiado amplio, es más probable que las diferencias de las medias se deban a las variaciones del azar.
- Tamaño de la muestra estudiada. Cuanto mayor es el tamaño de la muestra, es más probable que el resultado obtenido refleje los resultados en la población.
Lo que los estadísticos hacen es convertir esta lógica sencilla, mediante las matemáticas, en una fórmula cuantitativa para describir el grado de probabilidad.
Cuando se analizan los datos, fijamos un valor arbitrario para lo que podemos aceptar como alfa o grado de significación estadística. Luego, las pruebas estadísticas determinan el valor P, que es la probabilidad de que una diferencia o una asociación tan grande como la observada puedan haber ocurrido solo por efecto del azar.
Habitualmente, se considera que un resultado tiene poca probabilidad de deberse al azar, o de ser estadísticamente significativo, si el valor P es inferior a 5% (P inferior a 0,05) y se dice que es sumamente significativa si el valor P es inferior a 0,01.
Es importante tener presente que la magnitud de P o la probabilidad de que un resultado se haya producido por el azar depende de dos valores. Estos son la magnitud de la diferencia y el tamaño de la muestra estudiada.
2.3. Intervalos de confianza
La significación estadística del resultado nos da una indicación de que era improbable que la diferencia se explicara por el azar. Sin embargo, no nos da una indicación de la magnitud de esa diferencia en la población a partir de la cual se estudió la muestra. Para ello, se ha creado el concepto de intervalo de confianza (IC).
El IC proporciona un intervalo de posibilidades correspondiente al valor de la población y nos permite calcular si las pruebas obtenidas en el estudio son robustas o débiles, y si el estudio es definitivo o se precisarán otros. Si el intervalo de confianza es estrecho, las pruebas obtenidas serán robustas. Un estadístico puede calcular los intervalos de confianza del resultado de casi cualquier prueba estadística.
Cuando se emplea la notificación del intervalo de confianza (IC), se proporciona un cálculo de un punto del resultado, además de un intervalo de valores que son compatibles con los datos y dentro del cual puede esperarse que se sitúe el verdadero valor de la población. Por lo tanto, esto contrasta con la significación estadística, que solo indica si el resultado puede explicarse o no por el azar.
Como en las pruebas estadísticas, los investigadores deben seleccionar el grado de confianza o certidumbre que aceptan que se asocie a un intervalo de confianza. El 95% es la elección más habitual, así como 5% es el grado de significación estadística más usado.
En general, cuando un IC de 95% contiene una diferencia igual a cero, significa que no es posible rechazar la hipótesis de nulidad en el nivel de 5%.
Por ejemplo; Se observa que la concentración de hemoglobina (Hb) parece diferir entre los hombres y las mujeres. En hombres, la concentración media de Hb era de 13,2 g/dl; en las mujeres, el valor era de 11,7 g/dl.
Una prueba de significación estadística basada en un valor P, nos dirá qué probabilidad hay de que esta diferencia sea real o de que sea un resultado de la casualidad. Sin embargo, la prueba estadística no nos dice nada acerca del intervalo de la diferencia que puede esperarse a partir de los datos, entre las concentraciones medias de hemoglobina de los hombres y de las mujeres en la población general, si se obtuviesen y estudiasen otras muestras. En este estudio en particular, la diferencia entre las dos medias es de 1,5 g/dl.
Si en el ejemplo anterior, el IC correspondiente a la diferencia en la concentración de hemoglobina entre los varones y las mujeres es –0,4 a +3, no podemos rechazar la hipótesis de nulidad de que no hay ninguna diferencia, porque el intervalo de confianza contiene el valor 0.
El IC también es útil para el análisis de la correlación, el coeficiente de correlación (r) se mide en una escala que varía entre +1 y –1, pasando por el 0. La correlación completa entre dos variables se expresa como 1.
