Objetivo general:

Poner en práctica los conceptos aprendidos en el curso de estadística descriptiva e inferencial,a través de la realización de un trabajo escrito del tema de preferencia.

Objetivos específicos:

  • Repasar conceptos de estadística descriptiva

  • Aplicar los conceptos de estadística inferencial

  • Usar las diferentes funciones del software excel y de R

  • Número de integrantes: Máximo 2 personas

  • Fechas de entrega del trabajo escrito: Según lo acordado en el compromiso académico

Pasos a realizar:

  1. Escoger una base de datos de su preferencia que contenga 3 variables cuantitativas y dos variables cualitativas, mínimo 100 datos, algunos de las bases de datos de donde se pueden obtener datos son:

Calificación

La calificación de esta actividad se realizará con la siguiente rúbrica:

subtema Ítem puntos Excelente Bueno Regular
______________ _______________ _________ ____________ ___________ __________
1. Introducción 3 Realiza una descripción de la base de datos (3 puntos) no lo hace
2. Clasificación de variables 3 Realiza la clasificación de las variables (3 puntos) no lo hace
Descriptiva 3. Boxplot 3 comparativo de los niveles de factor de una variable cualitativa con una cuantitativa y su respectivo análisis (3 puntos) de una sola variable cuantitativa sin comparar nada y sin analisis (1 punto) no lo hace
4. Torta 3 Con su respectivo análisis (3 pts) Sin análisis (1 puntos) no lo hace (0 pts)
5. Grafico de barras con top 5 3 Con su respectivo análisis (3 pts) Sin análisis (1 pts) no lo hace (0 pts)
Descriptiva 6. Histograma 3 Con su respectivo análisis (3 pts) Sin análisis (1 pts) no lo hace (0 pts)
7. Gráfico de series de tiempo 3 cuando sea el caso, si tiene la variable tiempo con su respectivo análisis (3 pts) Sin análisis (1 pts) no lo hace (0 pts)
______________ _______________ _________ ____________ ___________ __________
Tamaño de muestra (TM) 8. 3 Estima un TM estratificado para los datos que está tratando (3 pts) Estima un TM para población finita para los datos que está tratando (2 pto) Estima un TM para población infinita para los datos que está tratando (1 pto)
______________ _______________ _________ _________________ ___________ __________
Intervalos de confianza para una muestra(IC) 9 3 Para la media de una muestra, con editor de texto digital
10 3 Para la varianza de una muestra, con editor de texto digital
______________ _______________ _________ ____________ ___________ __________
Intervalos de confianza para dos muestras(IC) 11 3 Para la diferencia de medias,con editor de texto digital
12 3 Para la razón de varianzas, con editor de texto digital
______________ _______________ _________ _________________ ___________ __________
Pruebas de hipótesis (PH) 13. PH 3 Para la proporción
14. 3 Para la diferencia de proporciones
______________ _______________ _________ _________________ ___________ __________
Pruebas no paramétricas 15. Grafico qqnorm 3 No lo hace
Elija una variable continua y realice lo siguiente 16. Grafico densidad 3 No lo hace
17.Prueba de normalidad 3 Verifica la normalidad con la prueba de shapiro wilk en R sobre la variable respuesta, escribe la PH de normalidad (3 pts) No verifica normalidad
______________ _______________ _________ _________________ ___________ __________
Con dos variables cualitativas 18. Tabla de contingencia construye una tabla de doble entrada (conteo de variables) con totales de columnas y filas
En Rstudio 19.Prueba chi-2 3 escribe prueba de hipotesis y verifica la independencia con R (3 pts)
RStudio 20.Estima una matriz de correlaciones entre por lo menos 3 variables cuantitativas 3 Estima una matriz de correlaciones entre por lo menos 3 variables cuantitativas, con los respectivos graficos de dispersión usando la función “chart.Correlation” de la librería performance analytics
______________ _______________ _________ _________________ ___________ __________
Regresión lineal simple en excel teniendo en cuenta la mejor correlación entre variables cuantitativas constuye lo siguiente 21. Diagrama de dispersión (DD) entre dos variables cuantitativas, discriminendo con colores los niveles de una variable cualitativa, superpone cada una de las lineas estimadas 3 Contiene el DD discriminando con colores los niveles de una variable cualitativa, sin la línea recta superpuesta Contiene el DD sin discriminar los niveles de una variable cualitativa, superpone una línea recta (1 puntos) Contiene el DD sin línea recta superpuesta(0 punto)
en excel 22. Construye un modelo de regresión lineal simple entre dos variables cuantitativas, para cada uno de los niveles de factor de una variable cualitativa, reporta ecuaciones, valor de \(R^2\) y valor de R 3
en excel 23. Interpretar el valor de intercepto, pendiente y \(R^2\) de cada una de las ecuaciones 3
______________ _______________ _________ _________________ ___________ __________
Regresión multivariada en Rstudio 24. Diagrama de dispersión discriminando con colores los niveles de una variable cualitativa superponiendo las lineas rectas estimadas del modelo de regresión con variables indicadoras (3 pts) 3
25. Ajuste de la recta del modelo de regresión lineal multivariado, muestra la salida de R, escribe y analiza las rectas de regresión (3 pts) Ajusta un modelo de regresión lineal multivariado con variables indicadoras y lo interpreta (3 pts) No ajusta ningún modelo
26. Escribe la recta multivariada general, asi como las rectas ajustadas de cada uno de los niveles y las interpreta 3 Escribe la recta multivariada general, asi como las rectas ajustadas de cada uno de los niveles No ajusta ningún modelo
Regresión multivariada 27. validación de la significancia de los parametros estimados, 3 escribe la prueba de hipotesis y construye el estadístico (3 pts)
______________ _______________ _________ ________________ ___________ __________
Validación de los supuestos de normalidad sobre residuales 25.Prueba de normalidad 4 Escribe la PH de normalidad sobre los residuales y la verifica con la prueba de shapiro wilk en R (3 pts) Escribe la PH de normalidad sobre los residuales ó la verifica con la prueba de shapiro wilk en R No verifica normalidad
28.Prueba de varianza constante 3
29. graficas de comportamiento de residuales 3 grafica y analisis de comportamiento de residuales (3 pts) solo grafica de residuales (1 pts)
______________ _______________ _________ ____________ ___________ __________

Entregables

  • Trabajo escrito en word o pdf

Observaciones

  • Para el punto de PH e IC recordar verificación de igualdad de varianzas, para elaborar este punto debe de realizar una tabla con el resumen de las medidas de tendencia central y de variabilidad de las variables que vaya a analizar.

  • Los gráficos deben tener títulos de ejes

  • Cada gráfico debe tener su respectivo análisis.

  • Por cada tílde a corregir se baja la nota 0.1

  • En los casos que aplique hacer un top 5

Ejemplo

Se puede apoyar en el siguiente ejemplo: Ejercicio en excel

Videos de interés para la construcción del poster

Video de regresión lineal en excel

Video de tablas dinámicas en excel

Video de gráficos en excel

Video de boxplot



Copyright © 2019, webpage made with Rmarkdown.