Comparación de muestras ordinales mediante el test de Wilcoxon de la Suma de Rangos - el efecto placebo.

Test de los signos con Rango - Distinguiendo el efecto placebo

Introducción al problema

En este pequeño artículo, vamos a usar un test no paramétrico para ver si el efecto de un medicamento es significativamente diferente del efecto ‘placebo’.

El número de datos en esta ocasión es tan pequeño, unos 15, que tiene sentido no usar test paramétricos.

Mediante el test de la suma de rangos con signos de Wilcoxon (también llamado test U de Mann-Whitney), veremos que, aunque aparentemente diferentes, nuestros datos pueden venir de la misma distribución, con lo que descartaremos el uso del medicamento al ser indistinguible del placebo.

En el caso de que hubiera más de dos muestras - medicamento1, medicamento2,…., medicamentoK (placebo) - tendríamos que usar el test de Kruskal–Wallis.

Cargamos los datos

Leemos los ficheros de datos:

medicamento <- read.csv("medicamento.csv", sep="")

Y les echamos un vistazo

nrow(medicamento) # 14 individuos en la muestra
## [1] 14
head(medicamento)
##   Subject Placebo Drug
## 1       1       2    7
## 2       2       0    5
## 3       3       5    8
## 4       4       1   19
## 5       5       4    6
## 6       6       5    7

Un primer vistazo a los datos del problema

Las medianas de cada grupo son:

median(medicamento$Placebo)
## [1] 5
median(medicamento$Drug)
## [1] 7.5

Las medianas son claramente diferentes, pero esto no quiere decir que no pueda deberse al azar. De hecho, para muestras tan pequeñas, es bastante fácil que no podamos concluir que son diferentes.

Una forma más precisa de apreciarlo es mediante los boxplot

boxplot(medicamento$Placebo, medicamento$Drug, main="Placebo vs Drug")

Las distribuciones no se parecen demasiado. A simple vista, descartaríamos rapidamente que son iguales y consideraríamos que el medicamento sí está teniendo efecto significativo. Pero, ¿es así?

El test de los signos con rangos

El test de los signos con rango es un test no paramétrico para datos ordinales - como es nuestro caso. Para ejecutarlo, basta con pasarle los valores de ambos grupos (que no necesitan tener la misma longitud).

La hipótesis nula es que la mediana de ambas muestras es la misma. La alternativa que son diferentes. Veamos el resultado:

wilcox.test(medicamento$Placebo,medicamento$Drug,exact=FALSE, alternative = "two.sided")
## 
##  Wilcoxon rank sum test with continuity correction
## 
## data:  medicamento$Placebo and medicamento$Drug
## W = 74, p-value = 0.2781
## alternative hypothesis: true location shift is not equal to 0

Conclusiones y algunas notas

El p-valor que hemos obtenido, 0.2781, es demasiado grande y no podemos descartar que ambas muestras tengan la misma mediana. Con lo cual, visto el estudio, no tendría sentido confiar en el medicamento al no poder diferenciarlo del efecto placebo.

En contra de lo que esperábamos, esto sucede porque la potencia de los test no-paramétricos es, en general, menor que la de los paramétricos. Tienden a no descartar la hipótesis nula con mucha frecuencia.

Para poder aplicar test paramétricos (t-student para muestras no pareadas en este caso), necesitaríamos tener normalidad y no es el caso.

Comentarios

Entradas populares de este blog

UNA BREVE EXPLICACIÓN DE LA LEY DE LAS ESPERANZAS ITERADAS

UN EJEMPLO DETALLADO DE PRE-PROCESAMIENTO EN R - IMPUTACIÓN DE DATOS FALTANTES

Un mundo de sucesos imposibles - El "tongo" de la Bonoloto.