ERRORES COMUNES - MAYOR TAMAÑO MUESTRAL NO IMPLICA MENOR DESVIACIÓN TÍPICA DE LA MUESTRA
DESV TIPICA MUESTRA
Eduardo Abril Avellanas
2023-03-31
ERRORES COMUNES - MAYOR TAMAÑO MUESTRAL NO IMPLICA MENOR DESVIACIÓN TÍPICA DE LA MUESTRA
Es común pensar que si tomas dos muestras, pongamos por ejemplo, una de tamaño n=100 y la otra de tamaño N=100.000, la segunda, por ser mayor, tendrá menor desviación típica que la primera.
No es cierto.
La desviación típica de la muetra, al contrario de lo que ocurre con el error estandard, no baja al subir el tamaño muestral. En realidad, la desviación típica muestral es, en sí misma, una variable aleatoria que toma valores cercanos a la desviación típica de la población.
Pero, por el hecho de ser una variable aleatoria, nada dice que tomemos dos muestras, de tamaños respectivos n y N, y la segunda tenga que tener una desviación típica menor que la primera ya que N>n.
Por otro lado, recordemos que estamos hablando de la desviación típica de la muestra en sí - que es la variabilidad dentro de la propia muestra - no del error estándard del estadístico “media muestral”. Son cosas completamente diferentes y no debemos confundirlas.
EJEMPLO GRÁFICO - MUESTRAS DE UNA NORMAL
Nada mejor que visualizar las cosas para entenderlas.
Vamos a tomar muestras de distintos tamaños de la normal estándard, desde n=100 hasta N=10.000, que ya es una muestra muy grande. Como podremos comprobar en el gráfico posterior, sí que es cierto que la desviación típica está en torno a su valor esperado, que en el límite es uno (la desv. típica es un estimador sesgado pero consistente). Pero, en lugar de bien crecer bien decrecer indefinidamente, va oscilando una y otra vez.
Esto deja claro que, al contrario de lo que uno “intuiría”, la desviación típica de una muestra de tamaño 1.000.000 no tiene porqué ser menor que la de una muestra muy pequeña.
set.seed(12345)
n_min<-1
n_max<-1000
n_cuts<-1000
sizes<-sequence(n_cuts,n_min,n_max)
sdev<-rep(0,length(sizes))
for(i in 1:length(sizes))
{
x<- rnorm(sizes[i]) #generar muestra
sdev[i]<-sd(x) # guardar desv.tipica muetra
}
#crear gráfico, suprimimos la escala para mayor claridad
plot(sizes,sdev,type="l",col="red",main="desviaciones típicas",xlab="tamaño de la muestra",ylab="sdev",lwd=1)
abline(h=1,col="black")
Vemos como la desviación típica, conforme aumenta el tamaño, oscila impredectiblemente una y otra vez sin descanso, tal y como comentábamos al principio.
Así pues, mucho cuidado con confundir la desviación típica de la propia muestra - que converge a la de la población pero es una variable aleatoria - con el error estándard del estimador - que tiende a cero.
Comentarios
Publicar un comentario