Poner en práctica los conceptos aprendidos en el curso de estadística descriptiva e inferencial,a través de la realización de un trabajo escrito del tema de preferencia.
Repasar conceptos de estadística descriptiva
Aplicar los conceptos de estadística inferencial
Usar las diferentes funciones del software excel y de R
Número de integrantes: Máximo 2 personas
Fechas de entrega del trabajo escrito: Según lo acordado en el compromiso académico
La calificación de esta actividad se realizará con la siguiente rúbrica:
subtema | Ítem | puntos | Excelente | Bueno | Regular |
---|---|---|---|---|---|
______________ | _______________ | _________ | ____________ | ___________ | __________ |
1. Introducción | 3 | Realiza una descripción de la base de datos (3 puntos) | no lo hace | ||
2. Clasificación de variables | 3 | Realiza la clasificación de las variables (3 puntos) | no lo hace | ||
Descriptiva | 3. Boxplot | 3 | comparativo de los niveles de factor de una variable cualitativa con una cuantitativa y su respectivo análisis (3 puntos) | de una sola variable cuantitativa sin comparar nada y sin analisis (1 punto) | no lo hace |
4. Torta | 3 | Con su respectivo análisis (3 pts) | Sin análisis (1 puntos) | no lo hace (0 pts) | |
5. Grafico de barras con top 5 | 3 | Con su respectivo análisis (3 pts) | Sin análisis (1 pts) | no lo hace (0 pts) | |
Descriptiva | 6. Histograma | 3 | Con su respectivo análisis (3 pts) | Sin análisis (1 pts) | no lo hace (0 pts) |
7. Gráfico de series de tiempo | 3 | cuando sea el caso, si tiene la variable tiempo con su respectivo análisis (3 pts) | Sin análisis (1 pts) | no lo hace (0 pts) | |
______________ | _______________ | _________ | ____________ | ___________ | __________ |
Tamaño de muestra (TM) | 8. | 3 | Estima un TM estratificado para los datos que está tratando (3 pts) | Estima un TM para población finita para los datos que está tratando (2 pto) | Estima un TM para población infinita para los datos que está tratando (1 pto) |
______________ | _______________ | _________ | _________________ | ___________ | __________ |
Intervalos de confianza para una muestra(IC) | 9 | 3 | Para la media de una muestra, con editor de texto digital | ||
10 | 3 | Para la varianza de una muestra, con editor de texto digital | |||
______________ | _______________ | _________ | ____________ | ___________ | __________ |
Intervalos de confianza para dos muestras(IC) | 11 | 3 | Para la diferencia de medias,con editor de texto digital | ||
12 | 3 | Para la razón de varianzas, con editor de texto digital | |||
______________ | _______________ | _________ | _________________ | ___________ | __________ |
Pruebas de hipótesis (PH) | 13. PH | 3 | Para la proporción | ||
14. | 3 | Para la diferencia de proporciones | |||
______________ | _______________ | _________ | _________________ | ___________ | __________ |
Pruebas no paramétricas | 15. Grafico qqnorm | 3 | No lo hace | ||
Elija una variable continua y realice lo siguiente | 16. Grafico densidad | 3 | No lo hace | ||
17.Prueba de normalidad | 3 | Verifica la normalidad con la prueba de shapiro wilk en R sobre la variable respuesta, escribe la PH de normalidad (3 pts) | No verifica normalidad | ||
______________ | _______________ | _________ | _________________ | ___________ | __________ |
Con dos variables cualitativas | 18. | Tabla de contingencia | construye una tabla de doble entrada (conteo de variables) con totales de columnas y filas | ||
En Rstudio | 19.Prueba chi-2 | 3 | escribe prueba de hipotesis y verifica la independencia con R (3 pts) | ||
RStudio | 20.Estima una matriz de correlaciones entre por lo menos 3 variables cuantitativas | 3 | Estima una matriz de correlaciones entre por lo menos 3 variables cuantitativas, con los respectivos graficos de dispersión usando la función “chart.Correlation” de la librería performance analytics | ||
______________ | _______________ | _________ | _________________ | ___________ | __________ |
Regresión lineal simple en excel teniendo en cuenta la mejor correlación entre variables cuantitativas constuye lo siguiente | 21. Diagrama de dispersión (DD) entre dos variables cuantitativas, discriminendo con colores los niveles de una variable cualitativa, superpone cada una de las lineas estimadas | 3 | Contiene el DD discriminando con colores los niveles de una variable cualitativa, sin la línea recta superpuesta | Contiene el DD sin discriminar los niveles de una variable cualitativa, superpone una línea recta (1 puntos) | Contiene el DD sin línea recta superpuesta(0 punto) |
en excel | 22. Construye un modelo de regresión lineal simple entre dos variables cuantitativas, para cada uno de los niveles de factor de una variable cualitativa, reporta ecuaciones, valor de \(R^2\) y valor de R | 3 | |||
en excel | 23. Interpretar el valor de intercepto, pendiente y \(R^2\) de cada una de las ecuaciones | 3 | |||
______________ | _______________ | _________ | _________________ | ___________ | __________ |
Regresión multivariada en Rstudio | 24. Diagrama de dispersión discriminando con colores los niveles de una variable cualitativa superponiendo las lineas rectas estimadas del modelo de regresión con variables indicadoras (3 pts) | 3 | |||
25. Ajuste de la recta del modelo de regresión lineal multivariado, muestra la salida de R, escribe y analiza las rectas de regresión (3 pts) | Ajusta un modelo de regresión lineal multivariado con variables indicadoras y lo interpreta (3 pts) | No ajusta ningún modelo | |||
26. Escribe la recta multivariada general, asi como las rectas ajustadas de cada uno de los niveles y las interpreta | 3 | Escribe la recta multivariada general, asi como las rectas ajustadas de cada uno de los niveles | No ajusta ningún modelo | ||
Regresión multivariada | 27. validación de la significancia de los parametros estimados, | 3 | escribe la prueba de hipotesis y construye el estadístico (3 pts) | ||
______________ | _______________ | _________ | ________________ | ___________ | __________ |
Validación de los supuestos de normalidad sobre residuales | 25.Prueba de normalidad | 4 | Escribe la PH de normalidad sobre los residuales y la verifica con la prueba de shapiro wilk en R (3 pts) | Escribe la PH de normalidad sobre los residuales ó la verifica con la prueba de shapiro wilk en R | No verifica normalidad |
28.Prueba de varianza constante | 3 | ||||
29. graficas de comportamiento de residuales | 3 | grafica y analisis de comportamiento de residuales (3 pts) | solo grafica de residuales (1 pts) | ||
______________ | _______________ | _________ | ____________ | ___________ | __________ |
Observaciones
Para el punto de PH e IC recordar verificación de igualdad de varianzas, para elaborar este punto debe de realizar una tabla con el resumen de las medidas de tendencia central y de variabilidad de las variables que vaya a analizar.
Los gráficos deben tener títulos de ejes
Cada gráfico debe tener su respectivo análisis.
Por cada tílde a corregir se baja la nota 0.1
En los casos que aplique hacer un top 5
Ejemplo
Se puede apoyar en el siguiente ejemplo: Ejercicio en excel
Videos de interés para la construcción del poster
Video de regresión lineal en excel
Video de tablas dinámicas en excel
Video de gráficos en excel
Video de boxplot