marca.wmf (758 bytes)
Regresar

Como elegir la prueba estadística adecuada
La elección de la prueba estadística es uno de los primeros pasos que hay que realizar cuando se quiere hacer un análisis estadístico, mucho antes incluso que la recogida experimental de los datos. Se presenta en este artículo ciertas consideraciones que nos pueden servir de ayuda para llevar a cabo dicha elección.

 Variable Explicativa y Variable Respuesta

A menudo nos encontramos con un papel en blanco y con unos deseos de realizar un estudio. Lo primero que tenemos que hacer es identificar en esos deseos cuáles son nuestras variables y de qué tipo son. Básicamente cualquier información que se recoge en un formulario es una variable. Las variables que con mayor frecuencia aparecen en esos formularios son el peso, edad, sexo, tratamiento, resultado, etc. Cuando estemos diseñando un formulario tenemos que pensar que la información que recojamos en ellos se tiene que poder disponer en una cuadrícula donde en las columnas aparezcan las variables y en las filas ellos individuos. En la intersección de las filas y columnas (celdas) aparecerá por tanto el resultado que toma una variable para un individuo en concreto. La práctica clínica tiene una óptica horizontal: se fija en los individuos, la estadística tiene una óptica vertical: se fija en las variables.

En la mayoría de los estudios se suele considerar una variable explicativa y una variable respuesta. La variable explicativa por excelencia en los estudios experimentales es el tratamiento y en los estudios observacionales el factor de exposición. La variable explicativa, también llamada variable independiente, intenta explicar, servir de posible explicación a la variable respuesta, también llamada resultado o variable dependiente. En los estudios donde es posible establecer una variable explicativa y una variable respuesta se está configurando un modelo.

 

Tipos de Variables

Los valores que puede tomar cualquier variable, ya sea explicativa o respuesta, constituyen los niveles de las variables. La naturaleza de estos niveles es lo que determina el tipo de las variables. Así se tiene los siguientes tipos de variables:

 

Dicotómica: aquella variable que sólo puede tomar dos posibles valores

 

Nominal: aquella variable que puede tomar varios valores

 

Ordinal: aquella variable que puede tomar varios valores y en los que se puede establecer un orden entre las categorías

 

Cuantitativa: aquella variable que puede tomar un rango numérico de valores

 

Censurada: aquella variable cuantitativa que puede tener información parcial o no completa (tiempo hasta que ocurre algo en Análisis de Supervivencia)

Es una buena práctica codificar las variables a priori en el cuestionario y usar siempre números, incluso en aquellas ocasiones donde se suela usar letras. Así, en vez de codificar el Sexo como V / F, usar p.ej. 1 / 0, ó en el caso de Tratamiento con tres posibles categorías o niveles A / B / C usar 1 / 2 / 3. Es evidente que sólo en las variables cuantitativas los números funcionan como tales y así el 2 significa el doble que el 1.

 

Elección de la técnica estadística apropiada

Con los elementos definidos en los párrafos anteriores se pueden establecer árboles de decisión para la ayuda en la elección de la técnica o prueba estadística apropiada. Existen más de 300 pruebas estadísticas básicas, con lo que es difícil poder abordarlas todas de forma exhaustiva en este artículo. Nos ceñiremos a las más representativas y emblemáticas:

 

Variable Respuesta Variable Explicativa Prueba

Cuantitativa Cuantitativa Regresión Lineal

Cuantitativa Dicotómica t de Student

Cuantitativa Nominal ANOVA

Dicotómica Cuantitativa Regresión Logística

Dicotómica Dicotómica z, Chi-2, Fisher

Dicotómica Nominal z, Chi-2, Metha-Patel

Nominal Cuantitativa Regresión Discriminante

Nominal Dicotómica z, Chi-2, Metha-Patel

Ordinal Cuantitativa Regresión Odds Proporcional

Dicotómica Ordinal Mann-Whitney / Wilcoxon

Ordinal Nominal Kruskal-Wallis

Censurada Cuantitativa Regresión de Cox

Censurada Dicotómica Log-Rank Ponderados

Censurada Nominal Log-Rank Ponderados Matriciales

Más de dos variables

Durante este artículo hemos estado hablando de una variable explicativa y de una variable respuesta: por tanto teníamos dos variables. En la práctica se suele tener muchas más de dos variables involucradas en un estudio. Normalmente se suele tener una única variable respuesta y varias explicativas. Es necesario utilizar análisis estadísticos multivariantes. Lejos de ser más difícil la elección de la prueba estadística, es justo lo contrario. Surgen los modelos de regresión multivariante que mediante la elaboración de variables ficticias o dummy, a partir de las variables originales, nos facilitan dicha elección. Así:

 

Variable Respuesta Variable Explicativas Modelo de Regresión

Cuantitativa Cualesquiera Regresión Lineal Multivariante

Dicotómica Cualesquiera Regresión Logística Multivariante

Nominal Cualesquiera Regresión Discriminante Multivariante

Ordinal Cualesquiera Regresión Odds Proporcional Multivariante

Censurada Cualesquiera Regresión Cox Multivariante

Comentario Final

La elección de la técnica estadística apropiada debe hacerse en el momento de diseño del estudio y en realidad debería ser el primer paso y la primera línea que se escribiera en el borrador de un protocolo. El diseño del formulario está condicionado por la técnica estadística que se va a emplear. El cálculo del tamaño muestral está también condicionado por ella.