EL PROBLEMA DE LOS "GAPS" EN LOS P-VALORES DISCRETOS

INTRODUCCIÓN

Los p-valores son una de las herramientas estadísticas más usadas. Dan una idea de lo extrema que es la muestra obtenida, supuesta una distribución de datos. De hecho, un p-valor, no es más que la probabilidad de obtener una muestra igual de rara o más que la que nos ha salido, aceptada la distribución de la hipótesis nula (H0).

Hoy en día se han convertido en una ley no escrita: cualquier cosa con un p-valor pequeño (p-valor<0.05) es falsa y, en otro caso (p-Valor>0.05), suele darse por hecho que es verdadera (más exacto es decir que “no se puede descartar que sea falsa”).

Esta forma de trabajar, con un cierto valor de corte “mágico” en 0.05, da por hecho que existe un “contínuo” de p-valores en torno a 0.05. Pero, ¿Y si no es así? ¿Y si los p-valores saltaran abruptamente en torno a 0.05? ¿Qué sentido tiene hablar de grande o pequeño si no hay una continuidad en sus valores?

Es lícito pues, y necesario, plantearse cuán común es esto y qué es lo que implica.

P-VALORES EN EL CASO DISCRETO

Supongamos que lanzamos una moneda no trucada n veces, la distribución de probabilidad del número de caras obtenido, que denotaremos por P(X=k), es una Bin(n,1/2). En este caso, el p-valor asociado a sacar k-caras, asumiendo nuestra distribución binomial, sería 2(P(X=k)+P(X=k+1)+…+P(X=n)), donde el factor 2 es porque hay que tomar nota también de los eventos k cruces, k+1 cruces, … hasta n cruces; al fin y al cabo igual de raro es sacar 99/100 caras que 99/100 cruces.

Por simplicidad, para quitar ese factor dos tan feo, supondremos que en nuestro caso lo que pensamos es que la probabilidad de cara es “a lo sumo 1/2”, por lo tanto la hipótesis nula sería H0: p<=1/2, frente a la alternativa p>1/2.

El experimento consisitirá en lanzar n monedas y contar el número de caras. Y, salvo que sea muy alto, deberemos concluir que “no podemos descartar que sea verdad p<1/2”. Evidentemente, si la lanzamos 100 veces y salen 99 caras la conclusión será la contraria, dado que la probabilidad de sacar al menos 99 caras es practicamente cero. Este número es el p-valor y lo anteriormente descrito es un test de hipótesis.

Ejemplo cálculo del p-valor en R

Así pues, el p-valor asociado a k-caras lo calcularíamos en R como:

#definiciones de parámetros
n= 6
p<-1/2

k<-n; p_valor <- sum(dbinom(k:n, size = n, prob =p)) 
cat("pvalor para k=",k,p_valor,"\n")
## pvalor para k= 6 0.015625
k<-n-1; p_valor <- sum(dbinom(k:n, size = n, prob =p)) 
cat("pvalor para k=",k,p_valor,"\n")
## pvalor para k= 5 0.109375
k<-n-2; p_valor <- sum(dbinom(k:n, size = n, prob =p)) 
cat("pvalor para k=",k,p_valor,"\n")
## pvalor para k= 4 0.34375

Aquí vemos el problema: 4 y 5 caras lo daríamos por bueno sin pestañear, pero con 6 sin duda pensaríamos que nos están timando, ¡es sólo algo más del 1%!

Además, si, por no verificarlo antes, pidiéramos nivel de significancia 0.01 estaríamos haciendo un experimento sin sentido, dado que es imposible obtener ese resultado.

Esta situación se da, en general, en las distribuciones discretas, sobre todo para valores pequeños (cuando son grandes se aproximan por continuas), y supone un dilema que hace muy difícil concretar un nivel de significancia adecuado para el experimento.

EL CASO GENÉRICO

Veamos qué sucede para distintos valores de k y de n.

n_ini<-2
n_fin<-12
p<-1/2

for(n in n_ini:n_fin)

        {
              pvalores<-rep(0,n) #vector de p-valores inicializado a ceros
         
              for(k in 1:n)
              {
                  pvalores[k]<- dbinom(0,n,p)+sum(dbinom(k:n, size = n, prob =p)) 
              }
      
            plot(pvalores,lwd=1,xlim=c(1,n_fin),ylim=c(0,1.0),xlab="valores de n",col=n,type="b",ylab="nivel de significancia",main="caída de los p-valores")
            par(new=T)
                  
}      
           
 abline(h=0.05,col="red",lwd=3)
 text(2,0.1,col="red","p-valor=0.05")

Como puede verse en la gráfica, los distintos p-valores caen abruptamente conforme k aumenta, dando lugar a situaciones en las que rechazaríamos para un cierto k pero aceptaríamos sin dudarlo para k-1. Y otras en las que nunca podríamos rechazar la hipótesis nula.

Hay que andarse con pies de plomo al establecer los niveles de significancia en el caso discreto. Según lo que pongamos, puede resultar imposible obtener un p-valor por debajo del nivel de significancia.

También puede ocurrir que aceptemos la hipótesis nula por los pelos pero el siguiente p-valor posible sea tan pequeño que estemos incurriendo en un posible error.

Comentarios

Entradas populares de este blog

UNA BREVE EXPLICACIÓN DE LA LEY DE LAS ESPERANZAS ITERADAS

UN EJEMPLO DETALLADO DE PRE-PROCESAMIENTO EN R - IMPUTACIÓN DE DATOS FALTANTES

Un mundo de sucesos imposibles - El "tongo" de la Bonoloto.