Técnicas Estadísticas Multivariantes

 

En esta monografía se desarrollan algunos de los métodos estadísticos multivariantes más usuales. Esta documentación sirve de complemento teórico a la información que generalmente se impartiría en cursos de estadística avanzados. Está presentada desde un punto de vista intuitivo, a partir del desarrollo de ejemplos prácticos y comentarios de los resultados de los  mismos.
 

Contenido

Primera Parte: Desarrollo Teórico del Análisis Múltiple de la Covarianza

Seguna Parte: Cálculo del RRmh y de su IC95% en g estratos

Tercera Parte: Cálculo del ORmh y de su IC95% en g estratos

Cuarta Parte: Cálculo de los parámetros del modelo de regresión logística

Resumenes de los capitulos

1. Ejercicios preliminares de "Introducción a la Estadística"
Generalizando, se podría decir que las técnica estadísticas resuelven problemas en tres tipos de situaciones:
a) Cuando se trata de resumir o describir un conjunto de datos (Estadística Descriptiva)
b) Cuando tratamos de "conocer" alguna característica de las poblaciones o fenómenos de donde proceden o se derivan nuestros datos experimentales (Técnicas de Estimación)
c) Y, finalmente, cuando tratamos de decidir entre dos opciones o hipótesis. Analizamos los datos de nuestra muestra, y mediante técnicas de Contraste de Hipótesis decidimos qué hipótesis es la más compatible con nuestors datos

2. Descriptiva
La Estadística Descriptiva se encarga de las muestras. La Estadística descriptiva genera estadísticos, índices o medidas de las variables sobre las que opera. Dependiendo del tipo de variable, se emplean y calculan diferentes tipos de estadísticos. Así, por ejemplo, las frecuencias se utilizan con profusión en variables nominales o dicotómicas, y los estadísticos media, varianza o curtosis en variables continuas. Todas las propiedades de la muestra, o lo que es lo mismo, todas sus características, se pueden cuantificar por medio de algún estadístico. La Estadística Descriptiva es un paso inicial y obligatorio en cualquier tipo de análisis estadístico. Resume y presenta los resultados de manera comprensible, independientemente de la toma de decisiones que se derive de la información recogida.

3. Técnicas de Estimación
Los paramétros poblacionales caracterizan las distribuciones poblacionales. Son equivalentes a los estadísticos en las muestras. Con las técnicas estadísticas de estimación se intenta conocer el valor de estos parámetros.A la estimación de parámetros mediante un único valor se la conoce como estimación puntual. Es bastante arriesgada, puesto que no conocemos ni la imprecisión, ni se establece el grado de confianza que nos merece el resultado. Estos dos inconvenientes se obvian con la estimación por intervalos confidenciales. Por un lado, proporcionan un valor de la imprecisión que viene dado por la longitud del intervalo de confianza; por otro, proporcionan un valor de la fiabilidad que nos debería merecer nuestra estimación, o nivel de confianza.

4. Contraste de Hipótesis
No se trata ahora tanto de tener información, cómo de tomar decisiones a partir de la información disponible. El proceso de decisión se realiza eligiendo una de las dos hipótesis previamente formuladas. Las técncias estad´siticas que sirven de ayuda en el proceso de decidir se denomina técnicas de contraste de hipótesis, también llamdas pruebas estadísticas. Las hipótesis de partida se formulan en relación con alguna característica de la población (parámetros). La hipótesis nula está asociada a la opción menos comprometida; la hipótesis alternativa por contra, está asociada a la opción que es objeto de interés para la investigación, es decir, a la opción más comprometida. En las pruebas estad´siticas se utiliza la información suministrada por la muestra (estadísticos) y se intenta decidir si esta información, por definición incompleta es compatible con alguna de las hipótesis.

5. Técnicas de Regresión y Correlación
Cuando, simultáneamente, contemplamos dos variables continuas surgen preguntas y problemas específicos. Esencialmente, se emplearán estadísticos descriptivos y técncias de estimación para contestar esas preguntas, y técncias de contraste de hipótesis para resolver dichos problemas. La nube de puntos, o el diagrama de dispersión, resultante de la representación gráfica de los datos está "concentrada" en la recta de regresión de mejor ajuste obtenida por el método de mínimos cuadrados. Es posible, que estudiando una variable bidimensional, no se desee establecer ninguna relación de subordinación de una variable con respecto a otra. En este supuesto, se intenta cuantificar la asociación entre las dos características. entramos en las técnicas de correlación lineal. Es posible definir otro estadístico muestral a partir del producto de las dos pendientes teóricas de las dos posibles rectas de regresión. Este estadístico es el coeficiente de correlación r. Su cuadrado es el coeficiente de determianción y da una medida entre 0 y 1 de la cantidad de información compartida por dos características o varibales continuas en  los datos muestrales.

6. Análisis de la Varianza (ANOVA)
El análisis de la varianza (ANOVA) es una técnica estadística de contraste de hipótesis. Tradicionalmente estas técnicas, conjuntamente con las técncias de regresión lineal múltiple, de las que prácticamente son una extensión natural, marcan el comienso de las técnicas multivariantes. Con estas técnicas se manejan simultáneamente más de dos variables, y la complejidad del aparato matemático se incrementa porporcionalmente con el número de variables en juego.El análisis de la varianza de un factor es el modelo más simple: una única variable nominal independiente, con tres o más niveles, explica una variable dependiente continua.

7. Análisis de la varianza (ANOVA)
Este tipo de técnicas estadísticas se centran en el análisis de la variable "tiempo hasta" como variable dpendiente. En una serie de casos se mide el tiempo hasta que ocurre un suceso, como: fallo, muerte, curación, desaparición de un síntoma, cambio de un parámetro, etc. La característica principal de este tipo de análisis se deriva del hecho de que la información puede ser incompleta. Es posible que en algunos sujetos se desconozca el tiempo real y sólo se disponga de un período en donde, por el momento, no se produjo el suceso. Estos datos reciben el nombre de datos censurados.

8. Técnicas de Diagnóstico
Supongamos que una parte de los individuos de una población tiene una determinada característica. Un dispositivo diagnóstico podría dictaminar, en esa población, si cada individuo tiene o no la característica. El dispositivo no es infalible y fallará en algunos casos, tanto por exceso - falsos positivos - como por defecto - falsos negativos -. Queremos evaluar cuan fiable es ese dispositivo diagnóstico, para lo cual tomamos una muestra de n elementos. Diagnosticaremos a los individuos con dicho dispositivo, obteniendo un resultado positivo o negativo. Excepcionalmente, y sólo por motivos de nuestra evaluación, conoceremos realmente si cada elemento de la muestra tiene o no la característica.

Ediciones realizadas
La primera edición de este libro se editaron 2000 ejemplares

Autores
Emilio Letón Molina y Alejandro Pedromino Marino

Volver   atras8.gif (1072 bytes)