Ejercicio I de Modelos Lineales

Author
Affiliation

Mtro. Santiago Ríos

A continuación, desarrollaremos un ejercicio práctico utilizando R para ajustar un modelo lineal simple. Usaremos un conjunto de datos donde analizaremos la relación entre el índice de masa corporal (IMC) y presión arterial sistólica (PAS).

Ejemplo: Relación entre IMC y Presión Arterial

Queremos ajustar un modelo lineal que prediga la presión arterial sistólica (PAS) en función del índice de masa corporal (IMC) de los pacientes.

Paso 1: Cargar los datos y preparar el entorno

  • Los datos ya están cargados en el entorno de R de esta página. Se encuentran en la variable datos_IMC.
Paso 2: Visualización preliminar
  • Antes de ajustar el modelo, es útil visualizar los datos para identificar posibles patrones.
  • Como nos interesan las relaciones entre dos variables numéricas, haremos un gráfico de dispersión entre el IMC y la PAS. Vamos a ajustar una línea de regresión lineal para visualizar la tendencia.
Solución

Gráfico de dispersión entre IMC y PAS

ggplot(datos_IMC, aes(x = IMC, y = PAS)) +
  geom_point() +
  geom_smooth(method = "lm", col = "blue") +
  labs(title = "Relación entre IMC y Presión Arterial Sistólica",
       x = "Índice de Masa Corporal (IMC)",
       y = "Presión Arterial Sistólica (PAS)")
Paso 3: Ajustar el modelo lineal

Ahora ajustamos un modelo lineal simple donde la variable dependiente es la presión arterial sistólica (PAS) y la variable independiente es el índice de masa corporal (IMC). - Después de especificar el modelo, vamos a correr la función summary() para obtener información sobre los coeficientes y la calidad del ajuste. - Veremos más adelante esta función de summary() a detalle ya que nos da mucha información sobre el modelo ajustado. En el siguiente paso, veremos cómo interpretar algunos de estos resultados.

Solución

Gráfico de dispersión entre IMC y PAS

# Ajustar el modelo lineal
modelo <- lm(PAS ~ IMC, data = datos_IMC)

# Resumen del modelo
summary(modelo)
Paso 4: Interpretar los resultados del modelo

El resumen del modelo nos proporciona información sobre:

  • Coeficiente de IMC: Indica el cambio esperado en la presión arterial sistólica por cada unidad de incremento en el IMC. En el outout, el coeficiente es 0.5688, lo que significa que por cada unidad de incremento en el IMC, la PAS aumenta en 0.5688 mmHg.
  • Valor-p: Nos indica si la relación entre IMC y PAS es estadísticamente significativa. Aunque todavía no vemos este tema, identifica que el valor p asociado con el coeficiente de IMC es 0.0358. En general, un valor p inferior a 0.05 se considera estadísticamente significativo. En este caso, dado que el valor p es 0.0358, podemos decir que la relación entre IMC y PAS es estadísticamente significativa al nivel de significación del 5%. Esto indica que hay evidencia suficiente para afirmar que existe una relación entre el IMC y la PAS.
  • R-cuadrado: Nos dice qué proporción de la variabilidad en la presión arterial sistólica es explicada por el índice de masa corporal. Esto todavía no lo vemos, pero identifica que el valor de ( R^2 ) es 0.0442, lo que significa que aproximadamente el 4.42% de la variabilidad en la presión arterial sistólica (PAS) se explica por el índice de masa corporal (IMC) en el modelo. Este valor indica un ajuste del modelo relativamente bajo, sugiriendo que hay otros factores importantes no considerados en este modelo que también afectan la presión arterial sistólica.
Paso 5: Conclusión
  • Con esta información, podríamos concluir lo siguiente:

El IMC tiene una relación significativa con la presión arterial sistólica en nuestro conjunto de datos, pero el modelo solo explica una pequeña parte de la variabilidad total en la presión arterial sistólica. Otros factores no considerados en este modelo también pueden influir en la presión arterial sistólica.

  • Es importante tener en cuenta que este es un modelo simple y que la presión arterial sistólica puede verse afectada por una variedad de factores, como la edad, el género, la actividad física, la dieta, entre otros.
Paso 6: Validación del modelo

Es importante verificar los supuestos del modelo lineal, como la normalidad de los residuos y la homocedasticidad (varianza constante de los errores). - Para esto, podemos hacer gráficos de diagnóstico, como el gráfico de residuos vs. valores ajustados y el gráfico Q-Q de los residuos. - Observa el código y los gráficos a continuación para validar el modelo lineal.

  • Qué opinas de los gráficos de diagnóstico? ¿El modelo cumple con los supuestos del modelo lineal?
  • tal vez el supuesto de normalidad de los residuos no se cumple, pero todavía no hemos visto cómo realizar una prueba formal para evaluar normalidad. Lo veremos en futuras lecciones.

Ejercicios Prácticos

Ajustar un modelo lineal entre el peso y la altura de un grupo de pacientes. Usa el conjunto de datos datos_peso_altura que ya está cargado en el entorno.

  • Con este conjunto de datos, realiza todos los pasos anteriores para ajustar un modelo lineal entre el peso y la altura de los pacientes:
    • Grafica la relación entre peso y altura
    • ajusta el modelo lineal
    • interpreta los resultados: ¿Es significativa la relación entre la altura y el peso? ¿Cómo interpretarías el coeficiente de la altura en este modelo?
    • valida el modelo.

Conclusión

Los modelos lineales son una herramienta poderosa y fundamental en tanto en las ciencias de la salud como en las ciencias biológicas. Al entender la simplicidad subyacente de los modelos lineales, podemos aplicar este conocimiento a una amplia variedad de pruebas estadísticas y situaciones prácticas. Si ya entendiste cómo ajustar un modelo lineal simple, ¡estás listo para explorar modelos más complejos en futuras lecciones! Verás que todas las pruebas estadísticas y modelos más avanzados se basan en los mismos principios fundamentales de los modelos lineales.