Introducción a las Estadísticas Descriptivas
A continuación, se presentan algunas de las funciones más utilizadas en R para calcular estadísticas descriptivas:
Media (`mean()`):
Mediana (median()):
Determina el valor central de un conjunto de datos ordenados.
median(c(1, 3, 3, 6, 7, 8, 9)) # Devuelve 6
Desviación Estándar (sd()):
Mide la cantidad de variación o dispersión de un conjunto de datos.
sd(c(1, 2, 3, 4, 5)) # Calcula la desviación estándar
Varianza (var()):
Representa la media de las desviaciones al cuadrado respecto a la media.
var(c(1, 2, 3, 4, 5)) # Calcula la varianza
Máximo y Mínimo (max(), min()):
Identifican los valores más alto y más bajo de un conjunto de datos.
max(c(1, 2, 3, 4, 5)) # Devuelve 5
min(c(1, 2, 3, 4, 5)) # Devuelve 1
count (length()):
Cuenta el número de elementos en un vector.
length(c(1, 2, 3, 4, 5)) # Devuelve 5
Resumen (summary()):
Proporciona un resumen estadístico completo, incluyendo mínimo, mediana, media, máximo y cuartiles.
summary(c(1, 2, 3, 4, 5))
Para entender mejor estas funciones, utilizarémos el conjunto de datos mtcars, que está incorporado en R:
Ejercicio: Cálculo de Estadísticas Descriptivas
Calcula la media y mediana del número de cilindros (cyl) en mtcars.
Determina la desviación estándar del consumo de gasolina (mpg).
Encuentra el valor máximo y mínimo de relaciones de transmisión (gear).
Proporciona un resumen completo para el desplazamiento del motor (disp).
Código del Ejercicio:
¿Cómo te ayudan estas medidas a entender mejor tu conjunto de datos?
Piensa en cómo podrías utilizar estas herramientas para analizar otros conjuntos de datos con los que trabajes en el futuro.
Esta lección introductoria sobre estadísticas descriptivas en R te prepara para abordar el análisis cuantitativo con confianza, dándote las herramientas necesarias para obtener rápidamente conclusiones significativas de tus datos.