En este tema hemos comenzado aclarando que es parámetro- que se refiere a la población- y se representa en letras griegas, y que es estadístico- que se refiere a la muestra.
Las medidas de tendencia central se calculan para variables cuantitativas, y miden el tamaño de los datos. Dentro de las medidas de tendencia central está la media, mediana y moda.
El estudio de medidas de posición son los cuantiles (para variables cuantitativas) y sólo tienen en cuenta la posición de los valores en la muestra. Los más utilizados son los percentiles (divide la muestra en 100 partes), deciles (divide a la muestra en 10 partes) y cuartiles (dividen a la muestra en 4 partes).
Las medidas de dispersión aportan información sobre la heterogeneidad de los datos. Para poder calcular la dispersión está el rango o recorrido (que es la diferencia entre el valor mayor y el menor), la desviación media, la desviación típica, la varianza, el recorrido intercuartílico y el coeficiente de variación. Estos conceptos se acompañan de unas fórmulas matemáticas que aún no hemos aplicado en clase y por tanto hasta que no comience a hacer ejercicios y prácticarlos no sabré el grado de dificultad que tiene.
En este tema también estudiamos las distribuciones normales, también llamada distribución de Gauss(campana de Gauss) y se aplica para variables continuas. Vimos las asimetrías(asimetría simétrica, asimétrica positiva- hacia la izquierda- y asimétrica negativa- hacia la derecha) y curtosis (distribución mesocúrtica- = 0, distribución leptocúrtica-mayor que 0 y distribución platicúrtica- menor que 0), cuanto más dispersión, más ancha es la campana.
lunes, 20 de mayo de 2013
martes, 7 de mayo de 2013
Seminario 2: Cómo rescatar una base de datos/ Seminario 3: Analizar los datos
En el segundo seminario hemos aprendido a rescatar una base de datos. Para ello hemos usado unos comandos para poder analizar dichos datos. El programa que hemos utilizado sigue siendo Epi- info y nos guiamos con el caso anterior del cumpleaños como ejemplo.
Hemos manejado la estadística básica (tabla de frecuencia, que nos muestra los datos pero que no nos dice si existe relación causa-efecto).
En la carpeta estadística básica aparece la base de datos guardado, buscamo view oswego.¿Para qué sirve?
View Oswego es donde se almacena los registros, es decir, los sujetos de estudio total; pero esto no sirve para esclarecer nada.
Vamos a listar la variable sexo y va a aparecer por orden de registro; después volvemos a listar todo menos la variable sexo(*) y nos va a a parecer toda a base de datos por orden de registro. Esto nos sirve para percibir valores perdidos- missing.
También hemos usado la frecuencia con la variable sexo y nos apareció una tabla con la frecuencia absoluta, la frecuencia relativa en % y la relativa acumulada con representación gráfica incluida.
Hicimos lo mismo con la variable enfermedad y con la variable edad, y en esta última había mucha dispersión, así que la recodificamos por grupo de edad e hicimos tres grupos: uno personas menores de edad, otro adultos, y el último ancianos. Nos aparece a continuación una tabla con la agrupación ya aplicada.
Todo esto que estamos viendo es útil para aplicarlo en los estudios descriptivos.
Por último, hemos visto gráficos, eligiendo el adecuado para cada variable como por ejemplo, para el sexo utilizamos sectores y para las distintas comidas que había en el caso del cumpleños utilizamos un diagrama de barras.
En el seminario 3 nos dedicamos a analizar los datos obtenidos (por View Oswego), para averiguar cual era el alimento responsable del cuadro diarréico.
El programa mostraba pulsando estadística básica e introduciendo los datos: tablas de frecuencia según la edad, la media, la varianza, desviación típica...
Después mediante el test de hipótesis analizamos si se aceptaba o se rechazaba la hipótesis nula relacionando dos variables cualitativas (causa-efecto).
Vimos lo que es el valor de significación estadístico: mide el error que podemos cometer con un margen de un 5% (nivel de confiana de un 5%). Si la p es menor que 0,05 significa que las variables tienen relación causa- efecto y por lo tanto rechazamos la hipótesis nula. Si la p es mayor, no se asegura que la relación no se deba al azar, por lo tanto aceptamos la hipótesis nula.
Mediante una tabla de contingencia con una variable de exposición (sexo) y una variable de resultado (enfermedad) pudimos observar las relaciones que existían entre estas variables; en el programa si el cuadro está más acentuado quiere decir que existe relación.
Llegamos a la conclusión que el helado de vainilla era el causante del cuadro diarréico en la fiesta de cumpleaños.
El profesor nos explicó para que se utilizaba la T de student, sirve para cuando se relaciona una variable cualitativa dicotómica con una variable cuantitativa continua. En el programa, mediante View Smoke analizamos los datos para ver si existía relación entre el peso y el tabaquismo.(Fue un ejemplo para que lo entendiéramos).
Hemos manejado la estadística básica (tabla de frecuencia, que nos muestra los datos pero que no nos dice si existe relación causa-efecto).
En la carpeta estadística básica aparece la base de datos guardado, buscamo view oswego.¿Para qué sirve?
View Oswego es donde se almacena los registros, es decir, los sujetos de estudio total; pero esto no sirve para esclarecer nada.
Vamos a listar la variable sexo y va a aparecer por orden de registro; después volvemos a listar todo menos la variable sexo(*) y nos va a a parecer toda a base de datos por orden de registro. Esto nos sirve para percibir valores perdidos- missing.
También hemos usado la frecuencia con la variable sexo y nos apareció una tabla con la frecuencia absoluta, la frecuencia relativa en % y la relativa acumulada con representación gráfica incluida.
Hicimos lo mismo con la variable enfermedad y con la variable edad, y en esta última había mucha dispersión, así que la recodificamos por grupo de edad e hicimos tres grupos: uno personas menores de edad, otro adultos, y el último ancianos. Nos aparece a continuación una tabla con la agrupación ya aplicada.
Todo esto que estamos viendo es útil para aplicarlo en los estudios descriptivos.
Por último, hemos visto gráficos, eligiendo el adecuado para cada variable como por ejemplo, para el sexo utilizamos sectores y para las distintas comidas que había en el caso del cumpleños utilizamos un diagrama de barras.
En el seminario 3 nos dedicamos a analizar los datos obtenidos (por View Oswego), para averiguar cual era el alimento responsable del cuadro diarréico.
El programa mostraba pulsando estadística básica e introduciendo los datos: tablas de frecuencia según la edad, la media, la varianza, desviación típica...
Después mediante el test de hipótesis analizamos si se aceptaba o se rechazaba la hipótesis nula relacionando dos variables cualitativas (causa-efecto).
Vimos lo que es el valor de significación estadístico: mide el error que podemos cometer con un margen de un 5% (nivel de confiana de un 5%). Si la p es menor que 0,05 significa que las variables tienen relación causa- efecto y por lo tanto rechazamos la hipótesis nula. Si la p es mayor, no se asegura que la relación no se deba al azar, por lo tanto aceptamos la hipótesis nula.
Mediante una tabla de contingencia con una variable de exposición (sexo) y una variable de resultado (enfermedad) pudimos observar las relaciones que existían entre estas variables; en el programa si el cuadro está más acentuado quiere decir que existe relación.
Llegamos a la conclusión que el helado de vainilla era el causante del cuadro diarréico en la fiesta de cumpleaños.
El profesor nos explicó para que se utilizaba la T de student, sirve para cuando se relaciona una variable cualitativa dicotómica con una variable cuantitativa continua. En el programa, mediante View Smoke analizamos los datos para ver si existía relación entre el peso y el tabaquismo.(Fue un ejemplo para que lo entendiéramos).
Suscribirse a:
Entradas (Atom)