La Muestra y la Población de estudio

5. TAMAÑO DE LA MUESTRA

La determinación del tamaño de la muestra tiene por objeto conocer cuál es el número mínimo de sujetos o unidades de análisis necesarias para nuestro propósito. Por lo tanto, el tamaño muestral hace referencia al número de elementos de la población que hay que seleccionar para extraer de ella la información que después se va a generalizar

Según Fisher, el tamaño de la muestra debe definirse partiendo de dos criterios:

Los recursos disponibles, que fijan el tamaño máximo de la muestra. La recomendación es siempre tomar la muestra mayor posible. La lógica nos indica que entre más grande sea esta, mayor posibilidad tendrá de ser más representativa y menor será el error de muestreo, el cual siempre existe.
Los requerimientos del plan de análisis que fija el tamaño mínimo de la muestra. El tamaño de la muestra deberá ser suficiente para permitir un análisis confiable de los cruces de variables, para obtener el grado de precisión requerido en la estimación de proporciones, y para probar si las diferencias entre proporciones son estadísticamente significativas. Esto significa que al momento de decidir el tamaño de la muestra es necesario tener presente el tipo de cuadros que se elaborarán y las técnicas estadísticas que se emplearán.

Cuando se hace una muestra probabilística, los investigadores deben preguntarse sobre el número mínimo de unidades de análisis (personas, organizaciones, historias clínicas, etc.), que necesito para conformar una muestra (n) que me asegure un error estándar aceptable fijado por el equipo investigador, dado que la población N es aproximadamente de tantos elementos.

Cuanto más homogénea sea la población, su varianza (variabilidad) será más pequeña y por lo tanto, el tamaño maestral que tenemos que elegir será menor. También, a mayor nivel de confianza y precisión (menor error muestral tolerado), más muestra será necesaria. Varianza, nivel de confianza y error muestral están directa y positivamente relacionados.

El tamaño de la muestra variará en función del método de muestreo escogido, dependiendo la elección de la finalidad (que vendrá determinada por los objetivos). Se utilizarán diferentes fórmulas si se pretende estimar una proporción, estimar una media, comparar dos proporciones y comparar dos medias. Al hacer el cálculo final del tamaño de la muestra, deben tenerse también en cuenta los factores como los abandonos, el desgaste y las pérdidas en el seguimiento.
Para calcular el tamaño tenemos que conocer si tratamos de poblaciones finitas o infinitas:

1. Tamaño muestral para poblaciones infinitas:

Donde:

n = El tamaño de la muestra que queremos calcular
N = Tamaño de la población
Z = Es la desviación del valor medio que aceptamos para lograr el nivel de confianza deseado. En función del nivel de confianza que busquemos, usaremos un valor determinado. Los valores más frecuentes son:
o Nivel de confianza 90% -> Z=1,645
o Nivel de confianza 95% -> Z=1,96
o Nivel de confianza 99% -> Z=2,575
e = Es la precisión o el margen de error máximo que admito (se puede representar también como d)
p = Es la proporción que esperamos encontrar. Como regla general, usaremos p=50% si no tengo ninguna información sobre el valor que espero encontrar. (p= 0.5)
Ejemplo: ¿a cuántas personas tendríamos que estudiar para conocer la prevalencia de diabetes?
n = 1,962 x 0,05 x 0,95 / 0,032 = 202

En el ejemplo, determinamos una seguridad del 95%, una precisión (e) del 3%, y una proporción esperada del 5%. Asumimos que puede ser próxima al 5%, si no tuviésemos ninguna idea utilizaríamos el valor de p=0,5 (50%) que maximiza el tamaño muestral

2. Tamaño muestral para poblaciones finitas:

En el ejemplo anterior ¿A cuántas personas tendría que estudiar de una población de 15.000 habitantes para conocer la prevalencia de diabetes?
n = 15.000 x 1,962 x 0,05 x 0,95 / 0,032 x (15.000-1) + 1,962 x 0,05 x 0,95 = 207
Existen en la web varias calculadoras y programas para calcular la muestra:
- Fisterra: https://www.fisterra.com/mbe/investiga/9muestras/9muestras2.asp
- Epi Info 3.5.4 es un programa de software gratis del dominio público desarrollado por los Centros para el Control y la Prevención de Enfermedades de los Estados Unidos (CDC) descarga gratuita aquí: http://www.who.int/chp/steps/resources/EpiInfo/es/

La tendencia de los investigadores que se inician es querer aplicar una fórmula que indique cuál será el número de sujetos que deben incluir en la muestra. Sin embargo, no es esto lo más importante. Una muestra, probabilística o no, dependerá de muchos aspectos como los recursos disponibles, la heterogeneidad de las variables y sujetos a estudiar, la técnica que se emplee en el muestreo, el tipo de análisis que se utilizará, el grado de precisión que deben tener los datos, entre otros.

6. ASIGNACIÓN A LOS GRUPOS DE ESTUDIO

La asignación de los individuos a los diferentes grupos debe asegurar la comparabilidad de los grupos, es decir, que no haya diferencias entre las variables generales.

La asignación según el tipo de estudio es:

Estudios de casos y controles. La asignación se realiza en función de la existencia o no de enfermedad.
Estudios de cohortes. La asignación se realiza en función de la presencia o no de exposición.
Estudios experimentales. La más utilizada es la asignación aleatoria o randomización.

6.1. Asignación Aleatoria al grupo de tratamiento o al grupo control

La aleatorización es una de las formas de evitar los sesgos de selección. Su propósito es posibilitar las comparaciones en los grupos de asignación de los tratamientos. Su principal ventaja está en que permite enmascarar a los pacientes en la asignación de tratamiento antes del inicio del ensayo clínico, de manera que no se sepa ni quiénes son los pacientes, ni en qué orden aparecen, ni qué tratamiento se les asigna.

Cada participante tendrá una probabilidad conocida y fijada de antemano de recibir la intervención o el placebo. Su función principal es conseguir la mayor imparcialidad posible al asignar la intervención y el control. La asignación aleatoria o randomización consigue que, con muestras suficientemente grandes, las características de ambos grupos tiendan a ser iguales, con lo que las variables que pudieran interferir (o confundir) en los resultados, conocidas o fundamentalmente desconocidas, se distribuyan con la misma probabilidad en ambos grupos. De esta forma, los resultados que se encuentren tras la intervención se deberán a ésta y no a las diferencias que inicialmente existen entre los grupos. La randomización, por tanto, facilita la realización de inferencias causales en relación a las intervenciones estudiadas.

Tema 5. La Muestra y la Población de estudio