Regresión Logística

Este ejercicio es para practicar como hacer una Regresión logística

Los temas incluye.

  • Construir un modelo de una regresión logística
  • Determinar si los coeficientes son diferentes de cero
  • Construir un gráfico de la relación logística usando ggplot2
  • Determinar los valores de probabilidades especifico para algunos valores “X”

Ejercicio

Karn and Penrose data Set

Los Datos

Los datos provienen de un estudio realizado por Mary N. Karn and L. S. Penrose publicado en Annals of Eugenics, titulado Birth Weight and gestation time in relation to maternal age, parity and infant survival publicado en 1951. Estaremos usando solamente una parte de los datos. El periodo de gestación y el peso de los bebés varones al nacer y su supervivencia (fallecio= 0 y sobrevivio= 1). Para facilitar el trabajo he modificado los datos un poco para cumplir con las tareas asignada.

En el archivo “Karn_Penrose_infant_survivorship.csv” tiene datos sobre 7036 nacimientos entre los años 1935 y 1946. El archivo tiene 4 columnas:

  • Line_number = la secuencia de los datos
  • Gestation_Time_days = El periodo de gestación en días
  • Weigth_lb = El peso del bebe en libras
  • Surv_Index = “0” o “1”
library(ggplot2)
library(readr)
Karn_Penrose_infant_survivorship <- read_csv("Data_files_csv/Karn_Penrose_infant_survivorship.csv")
## Rows: 4052 Columns: 4
## ── Column specification ──────────
## Delimiter: ","
## dbl (4): row_num, Survival, Weigth_lb, Gestation_Time_days
## 
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
KPdata=Karn_Penrose_infant_survivorship

  1. Pregunta: Explique en sus propias palabras cuales son las hipótesis que se pueden probar. Especificamente mencione si la hipótesis es una hipótesis nula o alterna. (4 puntos)

  1. Pregunta: Graficar la variable de respuesta (2 puntos)

  1. Pregunta: Grafique las variables explicativas
    • Periodo de gestación (2 puntos)
    • Peso de los varones al nacer (2 puntos)

Evaluando la distribución de la variable de respuesta


  1. Pregunta: Usando la prueba correcta evalúa la relación entre la supervivencia y:
  • periodo de gestación (2 puntos)
  • peso de los varones al nacer (2 puntos)
  • determina si los coeficientes son significativos de cada una de las pruebas y explica que quiere decir la prueba (4 puntos)

  1. Graficar la Relación entre la supervivencia y el peso de los bebes (2 puntos)

  1. Cual es la probabilidad de un bebe de 4 lbs sobrevivir (2 puntos)
  2. Cual es la probabilidad de un bebe de 7 lbs sobrevivir (2 puntos)
  3. Preguntar a su familia cual era el peso de nacer cuando Ud. nacio, calcula la probabilidad de sobrevivir (3 puntos)