martes, 7 de mayo de 2013

Seminario 2: Cómo rescatar una base de datos/ Seminario 3: Analizar los datos

En el segundo seminario hemos aprendido a rescatar una base de datos. Para ello hemos usado unos comandos para poder analizar dichos datos. El programa que hemos utilizado sigue siendo Epi- info y nos guiamos con el caso anterior del cumpleaños como ejemplo.
Hemos manejado la estadística básica (tabla de frecuencia, que nos muestra los datos pero que no nos dice si existe relación causa-efecto). 

En la carpeta estadística básica aparece la base de datos guardado, buscamo view oswego.¿Para qué sirve?
View Oswego es donde se almacena los registros, es decir, los sujetos de estudio total; pero esto no sirve para esclarecer nada.
Vamos a listar la variable sexo y va a aparecer por orden de registro; después volvemos a listar todo menos la variable sexo(*) y nos va a a parecer toda a base de datos por orden de registro. Esto nos sirve para percibir valores perdidos- missing.

También hemos usado la frecuencia con la variable sexo y nos apareció una tabla con la frecuencia absoluta, la frecuencia relativa en % y la relativa acumulada con representación gráfica incluida.
  Hicimos lo mismo con la variable enfermedad y con la variable edad, y en esta última había mucha dispersión, así que la recodificamos por grupo de edad e hicimos tres grupos: uno personas menores de edad, otro adultos, y el último ancianos. Nos aparece a continuación una tabla con la agrupación ya aplicada.
Todo esto que estamos viendo es útil para aplicarlo en los estudios descriptivos.
Por último, hemos visto gráficos, eligiendo el adecuado para cada variable como por ejemplo, para el sexo utilizamos sectores y para las distintas comidas que había en el caso del cumpleños utilizamos un diagrama de barras.

En el seminario 3 nos dedicamos a analizar los datos obtenidos (por View Oswego), para averiguar cual era el alimento responsable del cuadro diarréico. 

El programa mostraba pulsando estadística básica e introduciendo los datos: tablas de frecuencia según la edad, la media, la varianza, desviación típica...
Después mediante el test de hipótesis  analizamos si se aceptaba o se rechazaba la hipótesis nula relacionando dos variables cualitativas (causa-efecto).
Vimos lo que es el valor de significación estadístico: mide el error que podemos cometer con un margen de un 5% (nivel de confiana de un 5%). Si la p es menor que 0,05 significa que las variables tienen relación causa- efecto y por lo tanto rechazamos la hipótesis nula. Si la p es mayor, no se asegura que la relación no se deba al azar, por lo tanto aceptamos la hipótesis nula.
Mediante una tabla de contingencia con una variable de exposición (sexo) y una variable de resultado (enfermedad) pudimos observar las relaciones que existían entre estas variables; en el programa si el cuadro está más acentuado quiere decir que existe relación. 
Llegamos a la conclusión que el helado de vainilla era el causante del cuadro diarréico en la fiesta de cumpleaños.

El profesor nos explicó para que se utilizaba la T de student, sirve para cuando se relaciona una variable cualitativa dicotómica con una variable cuantitativa continua. En el programa, mediante View Smoke analizamos los datos para ver si existía relación entre el peso y el tabaquismo.(Fue un ejemplo para que lo entendiéramos).

No hay comentarios:

Publicar un comentario