marca.wmf (758 bytes)
Regresar

Conceptos básicos sobre pruebas estadísticas
Las pruebas estadísticas forman parte de la teoría de la decisión. Esencialmente emplean métodos inductivos para, a partir de la información de las muestras, establecer o estimar características generales de las poblaciones de origen. En este artículo se comentan algunos de los elementos más importantes de los pruebas estadísticas.

Construcción de Hipótesis estadísticas

Todo comienza con la formulación de las hipótesis. Las hipótesis conceptuales del estudio deben traducirse en hipótesis estadísticas o logísticas. Un ejemplo de hipótesis conceptual sería: "Esta relacionado el parámetro bioquímico con la aparición más frecuente de la enfermedad B". Las hipótesis conceptuales se fórmulan de manera natural y suelen ser fácilmente comprensibles, pero al contrario de la hipótesis estadísticas, no permiten avanzar mucho más allá, ¿ cómo se construyen éstas?

Las hipótesis estadísticas se establecen mediante características de las poblaciones de origen. Las poblaciones de origen están definidas por parámetros, que son valores de la distribución fijos pero desconocidos. Los parámetros poblacionales se asemejan a los estadísticos muestrales y se estiman a partir de estos últimos.

Mediante los datos muestrales podremos aceptar o rechazar, con cierto grado de confianza determinado numéricamente, una hipótesis hecha sobre una población determinada. Tal proceso se conoce como contraste de hipótesis estadísticas o aplicación de una prueba estadística. Muy relacionado con esta metodología está la estimación de parámetros poblacionales mediante estimación por intervalos de confianza.

En la práctica es necesario la formulación de dos hipótesis estadísticas complementarias:

La hipótesis nula (Ho) y

La hipótesis alternativa (H1).

La hipótesis nula está relacionada con una concepción parsimoniosa de la realidad. Corresponde al estado actual de conocimiento, por el cual, si no se hiciese el estudio sería la que prevalecería. La hipótesis alternativa, por contra, está relacionada con el objetivo del estudio. Es la hipótesis que necesita la evidencia experimental y la recogida de evidencia para ser aceptada.

En el ejemplo anterior, la hipótesis nula Ho sería " el coeficiente de la variable A en la ecuación de regresión que modeliza la aparición de la enfermedad B es cero" y la hipótesis alternativa H1 se formularía como " el coeficiente de la variable A en la ecuación de regresión que modeliza la aparición de la enfermedad B es diferente de cero". Es necesario que ambas hipótesis sean complementarias y que el estado de la naturaleza no pueda ser compatible con ambas hipótesis. También las hipótesis deben formularse de forma exhaustiva de tal manera que la realidad siempre tenga cabida en una de ellas.

Las hipótesis conjeturan acerca de cómo es la población de origen. Posteriormente se decidirá cual de las dos hipótesis es más compatible con los datos muestrales. Pero este proceso no está exento de riesgo puesto que nada garantiza que la decisión final está 100% exenta de error. Hay que aceptar el hecho de que podemos errar en la decisión. Afortunadamente este riesgo se puede definir y cuantificar.

 

Riesgos alfa, beta

Las pruebas estadísticas se construyen para decidir si aceptamos o rechazamos la hipótesis de trabajo o la hipótesis alternativa. Conceptualmente no se pueden aplicar para aceptar las hipótesis nulas, puesto que son temporalmente aceptadas hasta que se reúna evidencia en algún estudio que las rechace definitivamente. Durante este periodo las hipótesis nulas son sencillamente "no rechazadas".

En cualquier caso existe el riesgo en la decisión sobre la hipótesis alternativa. Se dan dos supuestos no deseados:

1.- Que la hipótesis alternativa sea falsa y que la decisión sea aceptarla

2.- Que la hipótesis alternativa sea verdadera y que la decisión sea rechazarla

Existe un riesgo de que ocurra el primer supuesto, o riego de cometer un error de tipo I, o error tipo alfa.

Asimismo, existe un riesgo de que se produzca el segundo supuesto, o riesgo de cometer un error en la decisión de tipo II o error beta.

No podremos cometer los dos errores al mismo tiempo, puesto que la decisión tiene que inclinarse por alguna de las dos hipótesis. Una de las grandeza del método científico es que, además de admitir la posibilidad de error en las decisiones, permite la cuantificación de esa posibilidad y su control mediante el cálculo del tamaño muestral en el diseño de estudios.

 

Por qué se producen errores en la toma de Decisiones

Naturaleza de las muestra

Las muestra, si son aleatorias, contienen en teoría las características de las poblaciones a las que representan. Sin embargo, y precisamente por ser aleatorias no todas las posibles muestras son iguales. Es más, algunas muestras, extraídas de la población con procedimientos aleatorios, contienen características diferentes de la población a la que pertenecen. Esto ocurre muy pocas veces, pero estadísticamente es posible. El problema es que no se pueden identificar ni tan siquiera sospechar que las muestras están sesgadas. Normalmente tampoco se descubre el sesgo de la muestra cuando se ha tomado la decisión. El tiempo no corrobora nuestra decisión. Otros estudios aparecen con resultados diferentes a los nuestros.

 

 

Técnicas de muestreo inapropiadas

No hay posibilidad de protección frente a la variabilidad muestral. Tan solo las técnicas de muestreo aleatorio y adecuadas, minimizan, a lo largo de una serie de experimentos la aparición de muestras sesgadas y de los consiguientes errores en la decisión.

El muestreo opinático, el más utilizado en la historia de la ciencia, es el que mayores probabilidades tiene de introducir sesgos en las muestras. Muestreos secuenciales o basados en procedimientos aparentemente aleatorios tales como el empleo de dados o monedas, son todavía mas perjudiciales porque están camuflados por metodologias aparentemente correctas.

 

Empleo de técnicas estadísticas inapropiadas

El empleo de pruebas estadísticas conservadoras, inapropiadas para los datos o sencillamente que no aprovechan todas la información disponible, es la segunda causa mas frecuente de sesgos después de los problemas de muestreo. No hay protección para esto. Afortunadamente es el problema mas fácilmente detectable y subsanable. Un estudio estadístico puede repetirse sin salirse del estudio, la muestra no.

 

Tamaño muestral inadecuado

Muestras demasiado grandes para los objetivos del estudio consumen recursos valiosos y generalmente escasos, por no mencionar los riegos para los sujetos expuestos innecesariamente al ensayo.

Por contra muestras demasiado pequeñas aumentan la probabilidad de riesgo beta: no se acepta la hipótesis alternativa, aun siendo verdadera. El estudio es poco sensible a la realidad. Si con muestras demasiado grandes, se desperdiciaba parte de los recursos, con muestras pequeñas, normalmente se desperdician todos.

Las técnicas estadísticas para el cálculo del tamaño muestral, permiten dimensionar el estudio para adecuarlo a los riesgos máximos admisibles y a los recursos disponibles. Estas técnicas, asimismo, toman en consideración un aspecto importante de las pruebas estadísticas: si la aproximación es uni o bilateral. De esto también depende el que se produzca un tercer tipo de error gamma.

Tipos de contraste y error gamma fatal

La interpretación de la pruebas estadísticas está condicionada por la construcción de las hipótesis. Se pueden formular hipótesis alternativas en una o dos direcciones en relación a la hipótesis nula. Consideremos el caso en donde se comparan dos tratamientos. Con un tipo de contraste unilateral se establecerían supuestos de superioridad o inferioridad de un tratamiento con respecto al otro. Por contra en un aproximación bilateral se establecerían diferencias entre ambos tratamientos, no importa en que sentido.

Consideramos una aproximación bilateral en la comparación de dos tratamientos S y P.

La hipótesis nula establece que la diferencia es cero Ho : S-P=0.

La hipótesis alternativa H1 : S-P<>0, la diferencia entre ambos tratamientos es diferente de cero.

La hipótesis alternativa se aceptará tanto si A>B como si B>A. Supongamos que la realidad es A>B. La variabilidad muestral puede causarnos una mala jugada. Aún con el empleo de técnicas de muestreo adecuadas, es improbable pero posible que en nuestra muestra resulte que b>>a. La decisión será aceptar la hipótesis alternativa ¡pero justo en la dirección errónea, declarando que B<A ! . La probabilidad de cometer este error en la decisión es el riesgo gamma. Este es muy pequeño pero comparativamente mucho mas importante y dramático. Como siempre nada hará sospechar de la fiabilidad de los resultados y de la bondad de la muestra.