Objetivo general:

Poner en práctica los conceptos aprendidos en el curso de estadística descriptiva e inferencial,a través de la realización de un trabajo escrito del tema de preferencia.

Objetivos específicos:

  • Repasar conceptos de estadística descriptiva

  • Aplicar los conceptos de estadística inferencial

  • Usar las diferentes funciones del software excel y de R

  • Número de integrantes: Máximo 2 personas

  • Fechas de entrega del trabajo escrito: Según lo acordado en el compromiso académico

Pasos a realizar:

  1. Escoger una base de datos de su preferencia que contenga 3 variables cuantitativas y dos variables cualitativas, mínimo 100 datos, algunos de las bases de datos de donde se pueden obtener datos son:

Calificación

  • Cada punto vale 3 puntos

  • Depende de como usted lo realice asi será su calificación

  • Si no hace uno de los puntos su calificación será 0

  • La calificación de esta actividad se realizará con la siguiente rúbrica:

subtema Ítem Excelente (3) Bueno(2) Regular(1)
___________ ________ _________________ ____________ ______________
1.Introducción Realiza una descripción de la base de datos
Estadistica 2.Clasificación de variables Realiza la clasificación de las variables
Descriptiva 3.Boxplot Con dos variables cualitativas y una cuantitativa, con el análisis Con una variable cualitativa y una cuantitativa, con el análisis De una variable cuantitativa con el análisis
4. Torta Con la tabla y el análisis Con la tabla y sin análisis solo el grafico
Estadistica 5. Grafico de barras con top 5 Con la tabla y el análisis Con la tabla y sin analisis solo el grafico
Descriptiva 6. Histograma Con la tabla y el análisis Con la tabla y sin analisis solo el grafico
Si tiene la variable tiempo 7. Gráfico de series de tiempo con análisis Sin análisis (1.5)
______________ _______________ _________ ____________ ___________
Intervalos de confianza para una muestra(IC) 8.Para la media
Usa editor de ecuaciones word 9. Para la varianza
______________ _______________ _________ ____________ ___________
IC para dos muestras 10. Para la diferencia de medias
Usa editor de ecuaciones word 11. Para la razón de varianzas
______________ _______________ _________ _________________ ___________
Pruebas de hipótesis (PH) 12. PH Para la proporción
Usa editor de ecuaciones word 13. PH Para la diferencia de proporciones
______________ _______________ _________ _________________ ___________
Elija una variable continua y realice lo siguiente 14. Grafico qqnorm con análisis Sin análisis (1.5)
Pruebas no paramétricas 15. Grafico densidad Con analisis sin analisis (1.5)
En Rstudio 16.Prueba de normalidad Escribe el juego de hipotesis y acepta o rechaza normalidad con la prueba de shapiro wilk en R
__________________ _________ _________________ ___________ __________
Con dos variables cualitativas 17.Tabla de contingencia Construye una tabla de doble entrada (conteo de variables) con totales de columnas y filas
En Rstudio 18.Prueba de independecia con test exacto de fisher o chi-2 escribe prueba de hipotesis y verifica la independencia con R
______________ _______________ _________ _________________ ___________
Regresión lineal 19.Estima una matriz de correlaciones entre por lo menos 3 variables cuantitativas Estima la matriz de correlaciones con los graficos de dispersión usando la función “chart.Correlation” de la librería performance analytics Estima una matriz de correlaciones entre por lo menos 3 variables cuantitativas(1.5)
_____________________ _________ _________________ ___________ __________
Teniendo en cuenta la mejor correlación entre variables cuantitativas construye lo siguiente 20. Diagrama de dispersión (DD) entre dos variables cuantitativas con la linea superpuesta Contiene el DD sin la línea recta superpuesta
Regresión lineal simple RLS 21. Construye un modelo de RLS entre dos variables cuantitativas, reporta ecn, valor de \(R^2\) y valor de r.
en excel 22. Interpretacion del modelo
_____________ ________________________________ ___________ _________ ____
Regresión lineal multivariada RLM 23. Ajuste del Modelo de regresión lineal multivariada (MRLM) Ajuste un MRLM entre por lo menos 3 variables cuantitativas y una cualitativa,incluya tanto variables significativas como no significativas, reporte la salida de R y ANOVA
En Rstudio 24. Ajuste un MRLM entre por lo menos 2 variables cuantitativas y una cualitativa,incluyendo solo aquellas que son significativas, reporte la salida de R, asi como la tabla ANOVA
RLM 25.Ecuaciones de regresión A partir del modelo anterior, escriba la recta multivariada general, asi como las rectas ajustadas de cada uno de los niveles y las interpreta
En Rstudio 26. Diagrama de Dispersión (DD) DD discriminando con colores los niveles de una variable cualitativa, superpone las lineas rectas estimadas del modelo de regresión con variables indicadoras
RLM 27. Test lineal general A partir del ANOVA ajusta el test lineal general mediante la prueba F, para validar significancia de la regresión, escriba prueba de hipotesis y el estadístico
En Rstudio 28. validación de la significancia de los parametros estimados Escribe la prueba de hipotesis y construye el estadístico
______________ _______________ _________ ________________ _________________
29.4 Graficas de residuales Grafica y analisis de comportamiento de residuales solo grafica
Analisis de residuales 29.Prueba de normalidad Escribe la PH de normalidad sobre los residuales y la verifica con la prueba de shapiro wilk en R
30.Prueba de varianza constante Escribe la PH y muestra salida de R
______________ _______________ _________ ________________ _________________
Del modelo resultante en 24. son los residuales Normales ? 31.Transformaciones Ajuste el MRLM con transformacion sobre la variable respuesta, reporte la salida de R
RLM 32.Ecuaciones de regresión A partir del modelo anterior, escriba la recta multivariada general
33.4 Graficas de residuales Grafica y analisis de comportamiento de residuales solo grafica
Analisis de residuales 34.Prueba de normalidad Escribe la PH de normalidad sobre los residuales y la verifica con la prueba de shapiro wilk en R
35.Prueba de varianza constante Escribe la PH y muestra salida de R
______________ _______________ _________ ____________ ___________________
Tamaño de muestra (TM) 36. Estima un TM estratificado para los datos que está tratando Estima un TM para población finita para los datos que está tratando Estima un TM para población infinita para los datos que está tratando
______________ _______________ _________ _________________ ___________

Entregables

  • Trabajo escrito en word o pdf

Observaciones

  • Para el punto de PH e IC recordar verificación de igualdad de varianzas, para elaborar este punto debe de realizar una tabla con el resumen de las medidas de tendencia central y de variabilidad de las variables que vaya a analizar.

  • Los gráficos deben tener títulos de ejes

  • Cada gráfico debe tener su respectivo análisis.

  • Por cada tílde a corregir se baja la nota 0.1

  • En los casos que aplique hacer un top 5

Ejemplo

Se puede apoyar en el siguiente ejemplo: Ejercicio en excel

Videos de interés para la construcción del poster

Video de regresión lineal en excel

Video de tablas dinámicas en excel

Video de gráficos en excel

Video de boxplot



Copyright © 2019, webpage made with Rmarkdown.