| Como elegir la prueba estadística adecuada | |
| La elección de la prueba estadística es uno
de los primeros pasos que hay que realizar cuando se quiere hacer un análisis
estadístico, mucho antes incluso que la recogida experimental de los datos. Se presenta
en este artículo ciertas consideraciones que nos pueden servir de ayuda para llevar a
cabo dicha elección. Variable Explicativa y Variable Respuesta A menudo nos encontramos con un papel en blanco y con unos deseos de realizar un estudio. Lo primero que tenemos que hacer es identificar en esos deseos cuáles son nuestras variables y de qué tipo son. Básicamente cualquier información que se recoge en un formulario es una variable. Las variables que con mayor frecuencia aparecen en esos formularios son el peso, edad, sexo, tratamiento, resultado, etc. Cuando estemos diseñando un formulario tenemos que pensar que la información que recojamos en ellos se tiene que poder disponer en una cuadrícula donde en las columnas aparezcan las variables y en las filas ellos individuos. En la intersección de las filas y columnas (celdas) aparecerá por tanto el resultado que toma una variable para un individuo en concreto. La práctica clínica tiene una óptica horizontal: se fija en los individuos, la estadística tiene una óptica vertical: se fija en las variables. En la mayoría de los estudios se suele considerar una variable explicativa y una variable respuesta. La variable explicativa por excelencia en los estudios experimentales es el tratamiento y en los estudios observacionales el factor de exposición. La variable explicativa, también llamada variable independiente, intenta explicar, servir de posible explicación a la variable respuesta, también llamada resultado o variable dependiente. En los estudios donde es posible establecer una variable explicativa y una variable respuesta se está configurando un modelo.
Tipos de Variables Los valores que puede tomar cualquier variable, ya sea explicativa o respuesta, constituyen los niveles de las variables. La naturaleza de estos niveles es lo que determina el tipo de las variables. Así se tiene los siguientes tipos de variables:
Dicotómica: aquella variable que sólo puede tomar dos posibles valores
Nominal: aquella variable que puede tomar varios valores
Ordinal: aquella variable que puede tomar varios valores y en los que se puede establecer un orden entre las categorías
Cuantitativa: aquella variable que puede tomar un rango numérico de valores
Censurada: aquella variable cuantitativa que puede tener información parcial o no completa (tiempo hasta que ocurre algo en Análisis de Supervivencia) Es una buena práctica codificar las variables a priori en el cuestionario y usar siempre números, incluso en aquellas ocasiones donde se suela usar letras. Así, en vez de codificar el Sexo como V / F, usar p.ej. 1 / 0, ó en el caso de Tratamiento con tres posibles categorías o niveles A / B / C usar 1 / 2 / 3. Es evidente que sólo en las variables cuantitativas los números funcionan como tales y así el 2 significa el doble que el 1.
Elección de la técnica estadística apropiada Con los elementos definidos en los párrafos anteriores se pueden establecer árboles de decisión para la ayuda en la elección de la técnica o prueba estadística apropiada. Existen más de 300 pruebas estadísticas básicas, con lo que es difícil poder abordarlas todas de forma exhaustiva en este artículo. Nos ceñiremos a las más representativas y emblemáticas:
Variable Respuesta Variable Explicativa Prueba Cuantitativa Cuantitativa Regresión Lineal Cuantitativa Dicotómica t de Student Cuantitativa Nominal ANOVA Dicotómica Cuantitativa Regresión Logística Dicotómica Dicotómica z, Chi-2, Fisher Dicotómica Nominal z, Chi-2, Metha-Patel Nominal Cuantitativa Regresión Discriminante Nominal Dicotómica z, Chi-2, Metha-Patel Ordinal Cuantitativa Regresión Odds Proporcional Dicotómica Ordinal Mann-Whitney / Wilcoxon Ordinal Nominal Kruskal-Wallis Censurada Cuantitativa Regresión de Cox Censurada Dicotómica Log-Rank Ponderados Censurada Nominal Log-Rank Ponderados Matriciales Más de dos variables Durante este artículo hemos estado hablando de una variable explicativa y de una variable respuesta: por tanto teníamos dos variables. En la práctica se suele tener muchas más de dos variables involucradas en un estudio. Normalmente se suele tener una única variable respuesta y varias explicativas. Es necesario utilizar análisis estadísticos multivariantes. Lejos de ser más difícil la elección de la prueba estadística, es justo lo contrario. Surgen los modelos de regresión multivariante que mediante la elaboración de variables ficticias o dummy, a partir de las variables originales, nos facilitan dicha elección. Así:
Variable Respuesta Variable Explicativas Modelo de Regresión Cuantitativa Cualesquiera Regresión Lineal Multivariante Dicotómica Cualesquiera Regresión Logística Multivariante Nominal Cualesquiera Regresión Discriminante Multivariante Ordinal Cualesquiera Regresión Odds Proporcional Multivariante Censurada Cualesquiera Regresión Cox Multivariante Comentario Final La elección de la técnica estadística apropiada debe hacerse en el momento de diseño del estudio y en realidad debería ser el primer paso y la primera línea que se escribiera en el borrador de un protocolo. El diseño del formulario está condicionado por la técnica estadística que se va a emplear. El cálculo del tamaño muestral está también condicionado por ella. |