Comparación de muestras ordinales mediante el test de Wilcoxon de la Suma de Rangos - el efecto placebo.
Introducción al problema
En este pequeño artículo, vamos a usar un test no paramétrico para ver si el efecto de un medicamento es significativamente diferente del efecto ‘placebo’.
El número de datos en esta ocasión es tan pequeño, unos 15, que tiene sentido no usar test paramétricos.
Mediante el test de la suma de rangos con signos de Wilcoxon (también llamado test U de Mann-Whitney), veremos que, aunque aparentemente diferentes, nuestros datos pueden venir de la misma distribución, con lo que descartaremos el uso del medicamento al ser indistinguible del placebo.
En el caso de que hubiera más de dos muestras - medicamento1, medicamento2,…., medicamentoK (placebo) - tendríamos que usar el test de Kruskal–Wallis.
Cargamos los datos
Leemos los ficheros de datos:
medicamento <- read.csv("medicamento.csv", sep="")
Y les echamos un vistazo
nrow(medicamento) # 14 individuos en la muestra
## [1] 14
head(medicamento)
## Subject Placebo Drug
## 1 1 2 7
## 2 2 0 5
## 3 3 5 8
## 4 4 1 19
## 5 5 4 6
## 6 6 5 7
Un primer vistazo a los datos del problema
Las medianas de cada grupo son:
median(medicamento$Placebo)
## [1] 5
median(medicamento$Drug)
## [1] 7.5
Las medianas son claramente diferentes, pero esto no quiere decir que no pueda deberse al azar. De hecho, para muestras tan pequeñas, es bastante fácil que no podamos concluir que son diferentes.
Una forma más precisa de apreciarlo es mediante los boxplot
boxplot(medicamento$Placebo, medicamento$Drug, main="Placebo vs Drug")
Las distribuciones no se parecen demasiado. A simple vista, descartaríamos rapidamente que son iguales y consideraríamos que el medicamento sí está teniendo efecto significativo. Pero, ¿es así?
El test de los signos con rangos
El test de los signos con rango es un test no paramétrico para datos ordinales - como es nuestro caso. Para ejecutarlo, basta con pasarle los valores de ambos grupos (que no necesitan tener la misma longitud).
La hipótesis nula es que la mediana de ambas muestras es la misma. La alternativa que son diferentes. Veamos el resultado:
wilcox.test(medicamento$Placebo,medicamento$Drug,exact=FALSE, alternative = "two.sided")
##
## Wilcoxon rank sum test with continuity correction
##
## data: medicamento$Placebo and medicamento$Drug
## W = 74, p-value = 0.2781
## alternative hypothesis: true location shift is not equal to 0
Conclusiones y algunas notas
El p-valor que hemos obtenido, 0.2781, es demasiado grande y no podemos descartar que ambas muestras tengan la misma mediana. Con lo cual, visto el estudio, no tendría sentido confiar en el medicamento al no poder diferenciarlo del efecto placebo.
En contra de lo que esperábamos, esto sucede porque la potencia de los test no-paramétricos es, en general, menor que la de los paramétricos. Tienden a no descartar la hipótesis nula con mucha frecuencia.
Para poder aplicar test paramétricos (t-student para muestras no pareadas en este caso), necesitaríamos tener normalidad y no es el caso.
Comentarios
Publicar un comentario