Professional Documents
Culture Documents
de inferencia
estadística
Ramon Alemany Leira
Joan Baró Llinàs
Josep Gibergans Bàguena
PID_00212763
© FUOC • PID_00212763 Ampliación de inferencia estadística
Ninguna parte de esta publicación, incluido el diseño general y la cubierta, puede ser copiada,
reproducida, almacenada o transmitida de ninguna forma, ni por ningún medio, sea éste eléctrico,
químico, mecánico, óptico, grabación, fotocopia, o cualquier otro, sin la previa autorización escrita
de los titulares del copyright.
© FUOC • PID_00212763 Ampliación de inferencia estadística
Índice
2. Contrastación no paramétrica....................................................... 21
2.1. 2
Prueba χ de ajuste de una distribución teórica ......................... 22
2.2. 2
Prueba χ de independencia ....................................................... 25
2.3. Prueba de las rachas .................................................................... 28
2.4. Prueba de los signos .................................................................... 33
2.5. Prueba de Wilcoxon .................................................................... 37
2.6. Prueba U de Mann-Whitney ....................................................... 42
© FUOC • PID_00212763 5 Ampliación de inferencia estadística
AUTOR:
Josep�Gibergans�Bàguena
• Hipótesis nula: las bombillas de la marca A tienen una vida media igual a
la vida media de las bombillas de la marca B:
contrastes, es decir, seis comparaciones de dos medias. Después hay que ana-
lizar y comparar todos los resultados. Evidentemente, no es una tarea fácil.
Todo esto nos indica que esta manera de proceder no es la más adecuada para
tratar este tipo de problemas. Utilizaremos una nueva técnica que se conoce
como el análisis de la varianza, que sirve para estudiar la generalización de
este problema en caso de que tengamos más de dos muestras.
c) Comparación de las cualificaciones entre estudiantes que han cursado una asignatura
con profesores diferentes.
Se dan muchas situaciones experimentales en las que hay dos o más factores
de interés al mismo tiempo. Por ejemplo, se podrían analizar tres tipos de
gasolina fijándonos en dos factores: el consumo y el nivel de contaminación.
Para tratar este problema se utiliza el� análisis� de� la� varianza� con� factores
múltiples, pero aquí no lo estudiaremos.
Subíndices
No existe ningún motivo para que las muestras tengan el mismo tamaño, de
manera que con nj indicaremos el tamaño de la muestra j-ésima. Calcularemos
la media de la muestra j-ésima mediante la expresión siguiente:
n = n1 + n2 + ... + nk
© FUOC • PID_00212763 8 Ampliación de inferencia estadística
Y de este conjunto global también podemos calcular la media global: Media global y media de
las medias
Es importante no confundir la
media global con la media de
las medias. Sólo son lo mismo
en caso de que las muestras
tengan el mismo tamaño.
Consideremos que se lleva a cabo un experimento para comparar el tiempo que tardan
tres marcas de ordenadores de diferente marca en cargar un mismo sistema operativo.
Se toma una muestra de cuatro ordenadores de la marca A, es decir, se mide el tiempo (en
segundos) que tardan en cargar el sistema operativo cuatro ordenadores de esta marca.
De la marca B se toman seis medidas y cinco de la marca C. La tabla siguiente registra
los resultados del experimento:
Observando estos resultados, podemos pensar que las muestras de los ordenadores A y
B pueden provenir de poblaciones con la misma media, dado que las medias muestrales
12,35 y 12,90, respectivamente, son bastante cercanas. La media muestral de la marca C
es 14,18; ésta está más alejada de las otras, pero presenta una mayor dispersión que las
© FUOC • PID_00212763 9 Ampliación de inferencia estadística
anteriores; no es tan fácil, pues, pensar si esta muestra proviene de una población con la
misma media que los ordenadores de las marcas A y B.
Observación
Es posible representar esta situación mediante los diagramas de caja de las tres muestras:
Hemos visto que podemos considerar el conjunto global formado por todos los
elementos de las muestras y, después, calcular la media de este conjunto global.
A continuación intentaremos explicar a qué se deben las diferencias entre los
valores de las observaciones xij y el valor de la media global Entenderemos
por variabilidad la diferencia entre los valores observados y la media. Veremos
que esta variabilidad se debe a dos factores:
Si existe mucha variabilidad entre las muestras, podremos pensar que este he- Observación
cho se debe a que se trata de muestras extraídas de poblaciones diferentes o
Las medias muestrales pueden
simplemente al origen aleatorio de las muestras. A continuación veremos có- ser diferentes por el hecho de
mo podemos separar estos dos efectos provocados por la variabilidad dentro que provienen de poblaciones
con medias diferentes o sim-
de cada muestra y por la variabilidad entre las muestras. plemente por el origen aleato-
rio de las muestras.
ya que:
• La Suma de Cuadrados Totales (SCT) nos informa de la variabilidad de la Es inmediato ver que si dividi-
muestra global. mos SCT/(n – 1), tenemos la
varianza de la muestra global.
Para poder llevar a cabo un análisis de este tipo, hay que tener las hipótesis
siguientes:
2
tiene una distribución χ con n – 1 grados de libertad.
Y dado que son independientes, una importante consecuencia es que el co- Cociente de variables
ciente entre estos estadísticos: aleatorias
b) A partir del valor crítico Fα,k–1,n–k, que separa la región de aceptación de la No rechazar la H0 no significa
exactamente que aceptemos
región de rechazo: la hipótesis, sino simplemen-
te que nada se opone a pensar
que la H0 pueda ser cierta.
• Si f > Fα,k–1,n–k, se rechaza la hipótesis nula H0. Rechazar la H0 no significa ne-
cesariamente que todas las
medias sean diferentes, sino
que significa que alguna (quizá
• Si f ≤ Fα,k–1,n–k, no se rechaza la hipótesis nula H0. todas) es diferente de otra.
© FUOC • PID_00212763 13 Ampliación de inferencia estadística
Si queremos determinar cuáles son los grupos que presentan unas diferencias
lo bastante significativas, haremos pruebas t de Student para comparación de
medias, tal como se planteaba al inicio de la sesión.
Podemos escribir las sumas de cuadrados que necesitamos para calcular el es-
tadístico de contraste de la manera siguiente:
Ya habíamos calculado:
Estadístico de contraste:
F0,05;2;12 = 3,89
Si comparamos este valor con el estadístico de contraste, f = 1,24, tenemos que 1,24 <
3,89 y, por tanto, no rechazamos la hipótesis nula.
Así pues, podemos concluir que no hay una diferencia significativa entre los tiempos que
tardan las tres marcas de ordenadores en cargar el sistema operativo.
1.6. Resumen
Ejercicio�1
© FUOC • PID_00212763 16 Ampliación de inferencia estadística
Ejercicio�2
Ejercicio�1
© FUOC • PID_00212763 17 Ampliación de inferencia estadística
Estadístico de contraste:
Calculamos el p-valor:
de manera que rechazamos H0. Con una confianza del 95%, existe diferencia
significativa entre las cuatro compañías.
Ejercicio�2
a) Para poder aplicar esta técnica con fiabilidad, son necesarias las restricciones
previas que presentamos a continuación:
Para realizar la tabla del análisis de la varianza, en primer lugar calculamos las
medias y las varianzas de cada muestra:
Estadístico de contraste:
2. Contrastación no paramétrica
AUTORES:
Ramon�Alemany�Leira
Joan�Baró�Llinàs
A menudo hemos planteado problemas del tipo: los coches que cada minuto
pasan por un peaje de autopista siguen una ley de Poisson, el peso neto de
los botes de mermelada de una determinada marca sigue una ley normal, etc.
Para todos estos casos ya sabemos calcular probabilidades pero, en la práctica,
un paso previo que habría que hacer sería comprobar la validez de aquellos
modelos teóricos antes de continuar. El test se basa en que la χ2 es una de las
diferentes pruebas no paramétricas que se pueden utilizar.
Lo que ahora nos cuestionamos es saber si las divergencias entre las frecuencias
observadas ni y las frecuencias esperadas se deben al azar o son tan grandes
que responden a una especificación incorrecta del modelo de probabilidad.
Para contrastar la hipótesis:
© FUOC • PID_00212763 23 Ampliación de inferencia estadística
H0: hay una buena adherencia del modelo teórico a los datos,
– 1 grados de libertad (si hiciésemos un estudio más completo de este test, ve- Cuando se dice que “acep-
tamos” una hipótesis, quere-
ríamos que los grados de libertad pueden llegar a cambiar) que compararemos mos decir que no la rechaza-
con el estadístico de contraste. Si éste es mayor que el punto crítico, rechaza- mos, que sería el sentido más
correcto de la conclusión del
remos la hipótesis nula, y si es más pequeño que el punto crítico, aceptaremos contraste.
la hipótesis nula.
Ejemplo
Accidentes 0 1 2 3 4 5 6 7 8 más de 8
2
En las tablas χ , con m – 1 = 7 – 1 = 6 grados de libertad y α = 0,1, encontramos
el punto crítico = 10,6 y, en consecuencia:
Actividades
1. Si después de observar a 120 clientes de unos grandes almacenes, vemos que 26 han
pagado en la caja 1, 17 en la caja 2, 18 en la 3, 19 en la 4, 25 en la 5 y 15 en la 6,
¿estamos en condiciones de afirmar que las seis cajas que hay para ir a pagar operan a
un mismo ritmo de trabajo? Se entiende que la muestra ha sido elegida al azar y que es
representativa del movimiento que hay en los grandes almacenes.
2. De una muestra de 150 amas de casa, se comprobó qué número de paquetes de deter-
gente de medida estándar se habían utilizado durante el último mes. Los datos que se
obtuvieron son los que vemos a continuación:
0 14
1 38
2 40
3 52
© FUOC • PID_00212763 25 Ampliación de inferencia estadística
4 4
5 2
más de 5 0
¿Se puede afirmar que, con una significación del 10%, la muestra procede de una ley de
Poisson de parámetro λ = 2?
Veréis cómo, después de agrupar la información, las frecuencias observadas y las frecuen-
cias teóricas son demasiado grandes para poder aceptar el modelo de Poisson.
14 38 40 52 6
Ejemplo en que se
Esta prueba permite detectar la independencia entre atributos o la ho- utilizaría esta prueba
mogeneidad de una población que ha sido estratificada.
• Para detectar la indepen-
dencia entre atributos: en
el caso de estudiar la rela-
ción entre el estado civil y
Se trata, a partir de una tabla de contingencia, de comparar las frecuencias los hábitos de ahorro.
observadas nij con las que, en teoría, se tendrían que dar si hubiese indepen-
• Para detectar la homoge-
dencia entre las dos clasificaciones . neidad de la estratificación
de una población: en el ca-
so de querer determinar si
la estructura de voto en las
La siguiente tabla de doble entrada recopila resultados muestrales: elecciones es la misma en
cada comarca.
B1 B2 ... Bk
2
donde el punto crítico resulta del modelo χ de Pearson con significación α y
(L – 1) (K – 1) grados de libertad. Si el estadístico de contraste es superior al
punto crítico, rechazaremos la hipótesis nula de independencia y si es inferior,
no rechazaremos la hipótesis nula.
Ejemplo
Suponed que hemos tomado una muestra de las empresas medias y grandes
dedicadas al sector de servicios, que hemos dividido en comercio, hostelería,
transportes y comunicaciones y otros servicios. De manera simultánea, hemos
calculado la relación:
Menor�de�8 11 35 24 12
8-16 17 19 18 19
Mayor�de�16 46 12 6 54
© FUOC • PID_00212763 27 Ampliación de inferencia estadística
Queremos determinar, con una significación del 5%, si en las empresas de ser-
vicios la rentabilidad alcanzada es independiente del subsector al que perte-
necen.
Menor�de�8 11 35 24 12 82
22,23 19,82 14,42 25,53
8-16 17 19 18 19 73
19,79 17,65 12,84 22,73
Mayor�de�16 46 12 6 54 118
31,98 28,53 20,74 36,74
Total 74 66 48 85 273
Actividades
3. Suponemos cuatro tipos de defectos de pinturas detectados en los bajos de los coches:
PVC (defecto 1), SGC (defecto 2), sellado (defecto 3) y cataforesis (defecto 4) y una mues-
tra de 1.525 coches, con alguno de estos defectos, tratados en los turnos de trabajo de
mañana, tarde y noche. Los resultados han sido:
Queremos saber si hay alguna relación entre el tipo de defecto detectado y el turno de
trabajo responsable, utilizando un nivel 0,1 de significación. Tenéis que llegar a la con-
clusión de que no hay ninguna razón que nos impida admitir la independencia entre las
dos características que hemos tenido en cuenta al comparar las frecuencias observadas
y las frecuencias teóricas.
© FUOC • PID_00212763 28 Ampliación de inferencia estadística
4. A partir de una muestra de 400 obreros no cualificados del sector del metal, construi-
mos la tabla de frecuencias conjuntas de antigüedad y de salarios que hallamos a conti-
nuación:
Antigüedad Salarios
Poca 124 28 4
Media 20 76 18
Mucha 4 24 102
Este test nos permite determinar si los resultados de una muestra se pueden Rachas
considerar aleatorios. Lógicamente, si el método de selección muestral es alea-
Secuencia de rúbricas iguales.
torio, hay que esperar que también lo sean los resultados; pero, ¿qué pasa
cuando sabemos que la muestra no ha sido elegida al azar?, ¿podemos consi-
derar que los resultados no son aleatorios?
CCC++C++++CC+C
El sistema de asignar rúbricas para discutir la aleatoriedad puede ser tan varia-
do como se quiera y puede cambiar el resultado de la prueba.
Por ejemplo, hemos pedido al encuestador que tomase una muestra de quince
compradores en unos grandes almacenes y que anotase sus edades siguiendo
el orden en que hacía la encuesta. Éstas podrían ser:
43 27 45 51 62 36 29 40 18 62 76 40 51 22 47
Una clasificación podría venir fijada teniendo en cuenta si la edad de los en-
cuestados se corresponde con el número par (P) o con el impar (I), lo cual nos
daría un total de siete rachas:
IIIIPPIPPPPPIPI
DEEEDDDDEEDEDE
ISSSIISISSISIS
© FUOC • PID_00212763 30 Ampliación de inferencia estadística
Esta prueba también se podría aplicar para determinar si dos colectivos pre-
sentan o no diferencias significativas, de manera que ahora sólo un número
de rachas pequeño nos hará pensar en colectivos diferenciados.
Si, por ejemplo, hemos ordenado la muestra de clientes por el tíquet de com-
pra, de más a menos dinero gastado, y por sexos: hombre (H) y mujer (M),
deberíamos entender que hay diferencia en la cantidad que gastan hombres y
mujeres si el resultado de la ordenación fuese:
HHHHHMMMMMMMMM
MMHMMHMHMHMMHM
donde R1 – α/2 y Rα/2 son puntos encontrados en la tabla de las rachas corres-
pondiente, conociendo sólo los elementos que pertenecen a cada rúbrica y el
nivel de significación (en nuestro caso, del 5%).
Ejemplo
LLALLLALAALLALLLA
Actividad
87.215, 76.050, 41.119, 11.236, 45.778, 67.108, 32.511, 24.216, 8.000, 88.214, 12.300,
53.721, 44.520, 14.323, 29.680, 38.423.
Fijaos en que para los cinco cargos superiores a las 50.000 pesetas salen ocho rachas,
mientras que el intervalo de no-rechazo queda acotado entre 4 y 11, cuestión que hace
admisible la hipótesis de la aleatoriedad.
De hecho, si las muestras son suficientmente grandes (n1, n2 > 10), podemos
utilizar la distribución normal para el test, teniendo en cuenta la asintoticidad
del estadístico R:
para cualquier nivel de significación α, es decir, sin las limitaciones vistas an-
teriormente.
Ejemplo
M M M T M M T ... T T T
Si contamos con que las muestras son suficientemente grandes (n1 = n2 = 20),
podemos utilizar la prueba asintótica:
Si la H0 es cierta, tendremos:
con R* = 14
por lo cual rechazamos la H0. Es más verosímil creer que existe una diferencia
de salarios entre los turnos de mañana y de tarde.
Este test nos tiene que ser útil para comparar los resultados de dos mues-
tras aparejadas o para comparar los resultados de dos experimentos he-
chos en una misma muestra.
Cine de noche 7 5
Todo el deporte 8 9
Un ejemplo en el que se utilizaría la prueba de los signos sería para comparar la velocidad
que se consigue con dos máquinas de escribir después de calcular las pulsaciones conse-
guidas por un equipo de mecanógrafos:
1 219 228
2 246 247
3 185 180
Prueba 1 Prueba 2
X1 Y1
X2 Y2
... ...
XN YN
Xi > Yi signo +
Xi < Yi signo –
Xi = Yi anulación del elemento
Ejemplo
Trabajador 1.
er
control 2.º control
1 23 21
2 36 33
3 19 20
4 25 22
5 24 22
6 27 28
7 30 31
8 25 25
9 21 20
10 28 31
11 18 16
Ejemplo
© FUOC • PID_00212763 37 Ampliación de inferencia estadística
León Empeoramiento
Badajoz Mejora
Cuenca Mejora
Tarragona Empeoramiento
... ...
Almería Mejora
Este hecho nos lleva a rechazar la hipótesis de una misma situación económica
en los dos periodos, con un nivel de significación del 5%.
Igual que el test de signos que acabamos de estudiar, esta prueba permite dis-
cutir si hay o no suficiente parecido entre parejas de datos.
El test de Wilcoxon
El test de Wilcoxon también calcula las diferencias y su signo, pero la
ventaja añadida es que ordena estas diferencias asignando rangos a cada “Wilcoxon matched pairs signed
rank test” es la mejor prueba
una de ellas. Wilcoxon resulta una prueba más potente y, por tanto, más no paramétrica para analizar
las diferencias entre parejas de
fiable que la de los signos. datos. La prueba de Wilcoxon
ha inspirado otros tests que es-
tudiaremos posteriormente,
como el de Mann y Whitney o
Si observásemos el consumo semanal de leche de seis familias en verano y en el de Kruskall y Wallis.
1 2,35 2,29
2 1,25 3,12
3 1,96 2,74
4 3,44 3,43
5 4,17 4,14
6 2,56 4,09
veríamos que los signos están repartidos, pero que las diferencias son mayores
para un signo que para el otro.
1 0,06 + 3
2 –1,87 – 6
3 –0,78 – 4
4 0,01 + 1
5 0,03 + 2
6 –1,53 – 5
La prueba de los signos nos diría que en verano y en invierno los consumos
de leche son parecidos, pero si analizamos con detalle las diferencias, veremos
que los signos negativos corresponden a diferencias mayores que los signos
positivos; Wilcoxon tiene en cuenta esta circunstancia en el momento de ha-
cer la contrastación. Veamos los pasos que hay que seguir para su aplicación.
A partir de aquí obtendremos la suma T(+) de los rangos de las diferencias po-
sitivas y T(–) de las negativas; se puede comprobar que T(+) + T(–) = n(n + 1)/2,
donde n equivale al número de parejas de datos para las cuales las diferencias
son no nulas.
Ejemplo
1 62,1 66,5
2 67,4 68,9
3 71,6 70,9
4 57,5 57,5
5 59,1 63,9
6 62,2 64,2
7 43,9 43,0
8 82,0 80,0
9 71,4 71,4
10 74,1 77,8
11 80,3 84,3
© FUOC • PID_00212763 40 Ampliación de inferencia estadística
–4,4 8,0
–1,5 3,0
0,7 1,0
0,0 –
–4,8 9,0
–2,0 4,5
0,9 2,0
2,0 4,5
0,0 –
–3,7 6,0
–4,0 7,0
Observad que:
Actividades
6. Resolved este mismo problema aplicando la prueba de los signos y comprobad que el
resultado es contrario al obtenido aplicando la prueba de Wilcoxon.
7. Dado que la prueba de Wilcoxon es más potente que la de los signos, es decir, tiene una
probabilidad mayor de rechazar la hipótesis falsa, ¿qué sentido tiene el test de los signos?
¿Existe algún caso donde no sea posible aplicar Wilcoxon y tengamos que recurrir al test
de los signos? Inventad un ejercicio que sólo pueda ser resuelto mediante la prueba de
los signos.
© FUOC • PID_00212763 41 Ampliación de inferencia estadística
Ejemplo
1 211,4 218,3
2 207,5 209,0
30 224,2 224,6
Notad que ahora los datos no están emparejados y que, por tanto, las muestras
pueden ser de medida diferente (n1 y n2).
Esto exige una ordenación combinada de las dos muestras con rangos asigna-
dos:
Rangos 1 ... n1 + n2
Ejemplo
Orden A A A B A A B B
Posición 1 2 3 4 5 6 7 8
Notad que U1 + U2 = n1 × n2 = 15
Con una significación α = 0,25, encontramos en las tablas los puntos críticos
que permiten contrastar la hipótesis planteada. Éstos son U1 –α/2 = 3 y Uα/2 = 12
y, dado que (2,13) ∉ (3,12), no podemos aceptar que las dos máquinas corten
láminas de longitud parecida.
Actividades
Para comprobar si existen diferencias significativas entre los ratios que presentan las in-
dustrias alimenticias y los productos químicos, se han seleccionado dos muestras repre-
sentativas de estas dos actividades. Los resultados que se han obtenido son los siguientes:
0,005 0 24
0,010 1 23
0,019 2 22
0,033 3 21
0,057 4 20
Así pues, para niveles de significación α ≤ 0,1(α/2 ≤ 0,05), tenemos que admitir que los
ratios de autofinanciación son parecidos en los dos sectores.
(De hecho, la conclusión sería admisible hasta un nivel de significación tan alto como
es el de 0,476).
9. Un taller de madera trabaja con una determinada marca de cola de impacto y ha reci-
bido la oferta de una nueva marca, por este motivo se plantea la posibilidad de utilizarla.
Dado que las características de precio, color y conservación son parecidas, el único crite-
rio decisivo tiene que ser el tiempo necesario para conseguir una adherencia completa.
© FUOC • PID_00212763 45 Ampliación de inferencia estadística
Una primera prueba con la marca vieja, con diferentes tipos de madera (siete observacio-
nes), proporciona la secuencia de tiempo: 43 39 45 62 29 46 71.
Otra prueba con la marca nueva proporciona, después de seis observaciones, obtiene los
resultados: 38 51 54 48 68 37.
Una vez ordenados los datos, encontraréis que U1 = 23 y que U2 = 19. Estos resultados
hacen admisible la hipótesis de tiempos de secado igual para las dos colas a los niveles
habituales del 5%, del 10% y de otros porcentajes.
Si las muestras son suficientemente grandes (n1, n2 > 10), podemos utilizar la
ley normal para hacer la prueba:
Ejemplo
A A A A A B A A A B A B B A A B B B B A B B B B B
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
tendríamos:
*
λ = 3,1 ∉ ± 1,15
Actividad
10. Con facilidad os podéis dar cuenta de que el ejercicio anterior se podía resolver me-
diante una prueba unilateral de rachas. A pesar de que este último test es menos potente,
intentad resolver la cuestión planteada utilizando la prueba de las rachas.
Resolved el problema con el mismo nivel α = 0,25, lo cual exige la aproximación asin-
tótica a la normal, y veréis que en este caso la prueba unilateral de las rachas también
rechaza la igualdad de longitudes de las piezas que salen de las dos máquinas.