Transformación de Rango y Correlaciones Pearson y Spearman
Transformación de Rango y Correlación de Spearman
En este punto, introducimos la transformación de rango, que es la base de la correlación de Spearman. La transformación de rango simplemente toma una lista de números y los reemplaza con enteros que indican su orden (el número más pequeño es el 1, el siguiente más pequeño es el 2, etc.). Esta transformación convierte un conjunto de datos en una representación ordenada, lo que permite calcular la correlación sin hacer suposiciones sobre la distribución de los datos.
Puntos clave:
Rango de una lista de números: El rango de una lista de números los organiza de menor a mayor, asignando un valor entero a cada uno. Por ejemplo, si tenemos los números
c(3.6, 3.4, -5.0, 8.2)
, los rangos serían3, 2, 1, 4
.Correlación de Spearman: Es simplemente la correlación de Pearson aplicada a los rangos de los datos.
Ejemplo en R: Visualización de Pearson vs Spearman
A continuación, vamos a visualizar cómo se comportan las correlaciones de Pearson y Spearman al comparar los valores originales con los rangos.
Paso 1: Visualización de la Correlación de Spearman
Primero calculamos la intersección (\(\beta_0\)) para la correlación de Spearman y luego visualizamos los datos en una gráfica donde se muestran las etiquetas correspondientes a los rangos.
- En el siguiente gráfico, la línea azul representa el intercepto de Spearman (\(\beta_0\)) y la línea roja representa la pendiente (\(\beta_1\)).
- Los puntos en la gráfica están etiquetados con sus rangos correspondientes. Estos puntos tienen 2 valores: el rango de la variable X1 y el rango de la variable X2. Observa que en X1, el rango va de izquierda a derecha, mientras que en X2, el rango va de abajo hacia arriba.
Paso 2: Mostrar Pearson y Spearman juntos
Teoría: Transformación de Rango
La transformación de rango, como se mencionó anteriormente, toma una lista de números y reemplaza cada valor con su posición relativa (orden) dentro de la lista. Esta técnica es la base de muchos tests no paramétricos, ya que permite trabajar con datos que no necesariamente siguen una distribución normal.
En R, podemos calcular el rango de un vector de números usando la función
rank()
.Ejemplo de transformación de rango:
Ejemplo: Calcular Spearman con rangos
- Usaremos el conjunto de datos
mtcars
para calcular la correlación de Spearman entre el peso del vehículo (wt) y el consumo de combustible (mpg). - Recuerda que podemos usar la función
cor.test()
con el métodospearman
para calcular la correlación de Spearman. - En este caso, obtenemos el valor estimado de la correlación, llamado
rho
.
- Observa que podemos calcular la correlación de Spearman con la función
lm()
(modelo lineal), solo que tenemos que transformar los datos a rangos: - En este caso, la correlación de Spearman es simplemente la pendiente del modelo lineal ajustado a los rangos de los datos. Observa que el coeficiente del rango de
mpg
es el mismo que el valor derho
obtenido anteriormente.
- Compara ambos enfoques para calcular la correlación de Spearman: como una prueba de correlación y como un modelo lineal con rangos.
- ¿Son los mismos resultados?
Conclusión
La correlación de Pearson y Spearman son herramientas esenciales para evaluar relaciones entre variables. Al comprender que ambas correlaciones son casos especiales de un modelo lineal simple, los estudiantes pueden aplicar estos conocimientos de manera más efectiva. La transformación de rango es una técnica poderosa que permite convertir pruebas paramétricas en sus contrapartes no paramétricas, proporcionando una mayor flexibilidad al analizar datos no normales o con valores atípicos.