You are on page 1of 9
CheckAcet Cuando, ya,se estiman ‘mediante s,s sews Ta lisribucint para hacer Inferencias sobre ka diferencia etre dos medias poblacionaes, Capitulo 10 nferencia estaditica acerca de medias y de proparciones con dos poblaciones Inferencias acerca de la diferencia entre dos medias poblacionales: o, y , desconocidas En esta seccidn el estudio de las inferencias sobre la diferencia entre dos medias pobfacionales Se extiende al caso en el que las dos desviaciones estindar poblacionales, 0, ¥ 60 se conocen. En este caso, para estimar las desviaciones estindar poblacionales desconocidas se emplean las desviaciones estindar muesrales, 5, ¥ 5; Cuando se usan las desviaciones estandar muestrales en fas estimaciones por intervalo y en las pruebas de hipstesis, se emplea la distribucién en lu- gar de la distribucién normal esténdar. Estimacién por intervalo para #1 — j12 En el ejemplo siguiente se muestra cmo calcul el margen deerory obtener una estimacion por intervalo para la ferencia entre dos medias poblacionales cuando oy 2, no se conocen. Clearwater National Bank reaiza un esto pra denficar diferencias ente ls cuentas de che- Ques de us clientes en dos de ss sucursales; toma una muestra aleatora simpe de 28 cuentas de fa sucursal Cherry Grove y otra muss leaorn simple e independiente de 22 cuentas de cheques dea sucursal Beechmont. 1 sldo se registra en las cuentas de cheques. Acontinuacion Se presenta un resumen J los sados en estas cuentas de cheques. “Tamatio de la muestra Media muestra Desviacién estindar muestal 1 banco desea estimar la diferencia entre el saldo medio en las cuentas de cheques de la po- blacién de clientes de Cherry Grove y el saldo medio en las cuentas de cheques de la poblacién de clientes de Becchmont. A continuaci6n se calcular el margen de error y se dar una estima- cin por intervalo para fa diferencia entre estas dos medias poblacionales. En la seccién 10.1 se proporcion6 la estimacidn por intevalo siguiente para el caso en el que se conocen las dos desviaciones estindar poblacionales 6, y 0. a ty Cuando no se conocen ay 0, se emplean s, y sy para estimar oy 0 ¥ zy Se SUSIIUYe Por fy Entonces, la estimacin por intervalo para fa diferencia entre dos medias poblacionales queda dada por la expresin siguiente: ESTIMACION POR INTERVALO PARA LA DIFERENCIA ENTRE DOS MEDIAS POBLACIONALES: 6, ¥ ¢,DESCONOCIDAS, aq -Rena\e+d (10.6) donde I ~ ees el coeficiente de contianza. Esta sugerenca sit sano se wa a ecuacin (10.7) para catewlar a mano os grades de lier. 10.2. Inferencias acerca de la diferencia entre dos medias poblacioncles: 2 y a; desconecidas 403 En esta expresién el uso de la distribuci6n res una aproximacién, pero proporciona resulta- dos excelentes y es relativamente fécil de usar. La Gnica dificultad que se encuentra al emplear la expresion (10.6) es determinar los grados de libertad para t,.». Los paquetes de software calcu- lan automaticamente tos grados de libertad, La formula que se usa es la siguiente: GRADOS DE LIBERTAD: DISTRIBUCION CON DOS MUESTRAS ALEATORIAS INDEPENDIENTES, (10.7) AA retomat el ejemplo del banco se mostrar emo usar la expresion (10.6) para obiener un imtervalo de confianza de 95% para estimar la diferencia entre las medias poblacionales de los saldos en las cuentas de cheques en sus dos sucursales. Los datos muestrales de la sucursal Cherry Grove son n, = 28, 5, = $1025, = $150 y Tos dela sucursal Beechmont son ny x $125, EI edleulo de los grados de libertad para €3: (i ay 1508 las nh 2s" 22 l= a ae 71508 a = ATS 1 ) __t & I (2 7! (& mtn) mT) BT R-1 Como el resultado no es un ndmero entero, se redondea hacia abajo 47 para tener un valor ¢ mayor y dar una estimacién por intervalo ms prudente, En la tabla de Ia distribucion para 47 grados de libertad, se encuentra fms = 2.012. De acuerdo con la expresin (10.6), el interva- lode confianza de 95% para la diferencia entre las dos medias poblacionales se calcula como sigue. 1025 — 910 « 2.012) 28 115 £78 La estimacién puntual de la diferencia entre las dos medias poblacionales de los saldos en las ‘cuentas de cheques es $115, El margen de error es $78 y la estimacién por intervalo de 95% de confianza para la diferencia entre las dos medias poblacionales es el que va de 115 — 78 = $37 alls + 78 = $193. Elealeuloa mano de os grados de libertad usando fa expres (10.7 es laborioso, pero muy sencllosi se usa un paquete de software. Sin embargo, observe que las expresiones s/n, y s/n, aparecen tanto en la expresiGn (10.6) como en la expresi6n (10.7). Por tanto, s6lo habra que cal- cular estas expresiones una vez para usarlas en ambas expresiones, (10.6) y (10.7). Pruebas de hipétesis acerca de jy — 12 Ahora se estudianin las pruebas de hipstesis acerca de la diferencia entre las medias de dos po- blaciones cuando no se conocen las desviaciones estindar pobl Capitulo 10 nferencia estaditica acerca de medias y de proparciones con dos poblaciones rencia hipotética entre 4, y pen la seccién 10.1 se moste6 que el estadistico de prueba usado cuando se conocen y 0, es el siguiente: El estadistico de prueba sigue la distribucién normal estindar. ‘Cuando no se conocen 0; y 0, se usa s; para estimar 0, y s para estimars, Sustituyendo @, ¥ 0p por estas desviaciones estindar muestrales se obtiene el siguiente estadistico de prueba para el caso en el que no se conocen 6 y 0 ESTADISTICO DE PRUEBA PARA PRUEBAS DE HIPOTESIS ACERCA DE 1, Y #3 2, 0, DESCONOCIDAS @=y- (i+8 ny Los grados de libertad para la distribuci6n ¢ se of yen con la ecuaci6n (10.7). Ahora se demostraré el uso del estadistico de prueba en el ejemplo siguiente. ‘Considere un nuevo software que ayuda a los analistas de sistemas a reducir el tiempo reque- para disefar,elaborar y poner en marcha un sistema de informacién, Para evaluar las venta- jas del nuevo software, se toma una muestra de 24 analistas de sistemas. A cada analista se le da informaci6n sobre un sistema de informacidn hipotético. A 12 de ellos se les pide que elaboren el sistema de informacién usando la tecnologia existente y a los otros 12 analistas se les capaci ta para usar el nuevo sofiwvare y se les pide que lo empleen para elaborar el sistema de informa- ion. En el estudio participan dos poblaciones: una poblaciGn de analistas de sistema que usan la tecnologia ya existente y una poblaciGn de analistas de sistemas que usan el nuevo software. En \érminos del tiempo necesario para el proyecto del sistema de informacion, las medias poblacio- nales son las siguientes: 14, = media del tiempo que necesitan para el proyecto los analistas que emplean la tecnolog(a ya existente, 14, = modia del tiempo que necesitan para el proyecto los analistas que emplean cl nuevo softwar. 1 investigador encargado de la evaluacién del nuevo software espera poder demostrar que con el nuevo software se necesita menos tiempo para el proyecto del sistema de informacién. De ‘manera que el investigador trataré de hallar evidencias que le permitan concluir que es menor que 7, caso en el que la diferencia yy — fy serd mayor que cero. La hipstesis de investigacion 1, — He > Ose establece como la hipdtesis alternativa. Por lo que la prueba de hipstesis sera Hii ~ 30 Hg; — > 0 Como nivel de significan 10.2. Inferencias acerca de la diferencia entre dos medias poblacioncles: 2 y a; desconecidas 405, TABLA 10.1 DATOS Y RESUMEN ESTADISTICO DEL TIEMPO REQUERIDO EN EL. ESTUDIO DE LA PRUEBA DE SOFTWARE Tecnologia existente Software nuevo. 300 m4 280 220 me cp ws 38 Gl yn 198, Softeareost 360 300 288 35 x1 258 376 318 20 30 301 32 283 263 Resumen estadistico Tamaf de a muestra m=12 Media muestal = 286 horas Desviacin esténdar muestra a4 Suponga que fos resultados de los 24 1 estadistico de prueba dado en la ecuacién (10.8) se tiene, ialistas son los que se presentan en la tabla 10.1. Con @=p-2 noe \a+8 De acuerdo con la ecuacién (10.7) los grados de tz) Al redondear hacia abajo, se usar una distribuci6n f con 21 grados de libertad, El renglén co- rrespondiente de la distribuci6n # es: Area en la cola superior 0.05 0.025 0.010.005 Valor (21 gh) L721 2.080, 2518 2.831 227 Matic atabiadela En una prueba de la cola superior, el valorp es el dea en la cola superior a la derecha de 1 dsribwiont, slo xe puede 2.97, De acuerdo con este resultado se ve que el Valorp esté entre 0.025 y 0.01, Por tanto, el va- determina in range Dorp es menor que dt = 0.08 y se rechaza Hy. Los resultados muestrales permiten al investigador elvlorp Si sews Excel Minitab se bene exactament el var o0r7, cconcluir ques; — 4; > 0, © que 4 > #3. La investigacién favorece Ia conclusién de que con el nuevo software el tiempo requerido es menor. 406 Capitulo 10 nferencia estaditica acerca de medias y de proparciones con dos poblaciones FIGURA 10.2. RESULTADO PROPORCIONADO CON MINITAB PARA LA PRUEBA DE HIPOTESIS: USANDO LA TECNOLOGIA EXISTENTE Y EL NUEVO SOFTWARE qwo-sample T for Current vs New Current 12 New N Mean StDev SE Mean. 325.0 40.0 2 12 286.0 44.0 3 Difference = m Current - mu New Estimate for difference: 39.0000 95% lower bound for difference = 9.4643 Test of difference = 0 (vs >): ‘T-value = 2.27 P-Value = 0.017 DP = 21 ‘Se recomiena, sempre que sea posible, sar muesras del iso tama, y= Para las pruebas de hipStesis acerca de la diferencia entre dos medias poblacionales se usan Excel 0 Minitab, En fa tabla 10.1 se presentan los resultados que proporciona Minitab en esta comparacién de la tecnologfa existente y el nuevo software. En la dltima linea se ve quer = 2.27 Yy que el valor-p = 0.017. Observe que Minitab usa fa ecuacisn (10.7) para calcular los 21 gra- dos de libertad. Recomendacién practica Los procedimientos aguf presentados para estimaciones por intervalo y para pruebas de hipste- sis son robustos y pueden usarse con muestras relativamente pequefias. En fa mayor parte de Tas aplicaciones con muestras casi del mismo tamaiio y de manera que el tamafo total de fa mues- tra,m + ny Sea por lo menos 20 se esperan muy buenos resultados, aun cuando las poblaciones no sean normales. Si as distibuciones de las poblaciones son muy sesgadas o contienen valores atipicos se recomienda usar muestras més grandes. Muestras pequefas slo deben usarse cuan- do el analista esté convencido de que las distribuciones de las poblaciones con aproximadamen- te normales. Brine ined tro metodo que se usa para hacer inferencias acerca dela diferencia entre das medias poblacio- nales cuando no se conocen 6 0 se basa en suposicién de que las dos desviaciones estindar son iguales(o, ~ 2; ~ 0}. Cuando se usa esta sv- posi, las dos desviaciones estindar muestrales se combinan para obtener la siguiente varianza ‘nuesiral combinada 2 _ yD + 0-8 % mm 2 El estadistico de prueba es cel cual tiene n, + 1, ~ 2 grados de libertad. A par- lirde aqui, el eéleulo del valor-py Ia interpretacién de los resultados muestraes se hacen de manera idémtica a lo indicado en esta seccién, EL problema con este procedimiento es la dfi- ceultad que suele existr para verificar que las dos desviaciones estindar poblacionales son iguales. Lo mas frecuente es encontrar desviaciones estindar poblacionales que no son iguales, Con el procedi- mento de la varianza combinada pueden no obte- nerse resultados satisfactorios, en especial si los tama de las muestras, 1 15 son muy distintos. EI procedimiento presentado en esta seccién no requiere la suposicion de que las dos desviacio- nes estindar poblacionales son iguales y puede usarse cuando las dos desviaciones estindar pobla- cionales son 0 no iguales. Es un procedimientoy ms general y se recomienda para la mayoria de las aplicaciones. 102 Infrencas acerca dela diferencia entre dos medias poblcionaes: y 0) desconocidas 407 Métodos Los resultados siguientes se obtuvieron de muestras aleatorias independientes tomadas de dos poblaciones. Muestra 2 n= 30 = 201 2-48 {Cl es la estimacién pontual de la diferencia entre las dos medias poblacionales? Dé los grados de libertad para la dstribueién. Con 95% de confianza, cul es el margen de error? Dé el intervalo de 95% de confianza para la diferencia entre las dos medias poblacionales. Considere la prueba de hip6tesis siguiente pT m=0 1mm Los resultados siguientes se obtuvieron de muestras independiente tomadas de dos poblaciones. Muestra 1 35 = 136 so 52 {Cuil es el valor del estadistico de prueba? Dé los grados de libertad para la distribucion t {Cual es el valor-p? Con «= 0.05, ;cual es la conctusisn? Los datos siguientes se obtuvieron de dos muestra aleatoriasindependientes tomadas de dos po- blaciones. Muestral | 107 13-79 8 Muestra2 | 8 7 8 4 6 9 CCaleule las dos medias muestrales. CCaleule las dos desviaciones estindar muestrales, Dé la estimacién puntual de la diferencia entre las dos medias poblacionales. Dé la estimacin por intervalo de 95% de confianza para la diferencia entre las dos medias poblacionales. Aplicaciones ; EI USS. Department of Transportation informa sobre la cantdad de millas que recorren en auto- mévil los habitanes de las 75 principales reas metropolitanas de ese pas. Suponga que ea una muestra aleatora simple de 0 habitantes de Buffalo, la media es 22.5 millas por dia y la devia- Capitulo 10 nferencia estaditica acerca de medias y de proparciones con dos poblaciones ie ‘cargo cidn estindar es 8.4 millas por dia y que en una muestra aleatoria simple independiente de 40 habitantes de Boston la media es 18.6 millas por dia y la desviaciGn estindar es 74 mi- Has por dia. {Cul es la estimacién puntual de la diferencia entre la media de las millas por dia que re- Corre un habitante de Buffalo y la media de las millas por dia que recorre un habitante de Boston? b, Dé un intervalo de confianza de 954 para la diferencia entre las dos medias poblacionales. FedEx y United Parcel Service (LIPS) son las dos empresas de transporte de paqueteria més im= Portantes del mundo en cuanto a volumen ¢ ingresos (The Wall Street Journal, 27 de enero de 2004), De acuerdo con el Consejo Intemacional de Aeropuerto, el aeropuerto internacional {de Memphis (FedEx) y el aeropuerto internacional de Louisville (LIPS) son dos de los 10 mayo- resaeropuertos de carga del mundo, Las muestras aleatorias siguientes muestran las toneladas de carga por dia que pasan por estos aeropuertos. Los datos estin dados en miles de toneladas. Memphis ol 181 8810075105 83 981 60 SBE Louisville 47 500 4203355 220 4102637 1. Calcule la media muestral y la desviacién estindar muestral para cada uno de los aeropuer- tos. b. Délaestimacidn puntual de la diferencia entre las dos medias poblacionales. Inteprete este valor en términos del aeropuerto de mayor volumen y de la diferencia de voliimenes entre los dos aeropuertos. «©. Proporcione un intrvalo de 95% de confianza para la diferencia entre las medias poblacio- nales diarias de los dos aeropuertos. En las zonas costeras de Estados Unidos, Cape Cod, Outer Banks, las Carolinas y la costa det Golfo, hubo, durante los aios noventa, un crecimiento relativamente ripido de la poblacién, Los datos recolectados son sobre las personas que viven tanto en zonas costeras como en Zonas no costeras de todo Estados Unidos (USA Today, 21 de julio de 2000). Suponga que se obtuvieron los resultados muestrales siguientes sobre las edades de estas dos poblaciones de personas. Zona no costera Pruebe la hipétesis de que no hay diferencia entre las dos medias poblacionales. Use a = 0.05. 8. Formule las hipotesis nua yalterativa. b, {Cuil es el valor de estaistico de prueba? ©. {Cuil es el valorp? dA qué conclusién llega? Las esiones entre los jugadores de la Liga Mayor de bésbol han aumentado en os itimos ais. [La expansin dela Liga, de 1992 a 2001, hizo que a lista de nombres aumentara 15%. Sine bargo, la cantidad de jugadores en la lista de inkabilitados por eausa de una lesin aument6 32% en ese mismo petiodo (USA Todas 8 de julio de 2002) La cuestén a investigar es silos ugado- res permanecen en la lista de inabiltados ms iempo que quienes permanecfan en Ia lista una década antes. en SATVerbal cD 102 16. Inferencias acerca de la diferencia entre dot medias pablacionales: = y 2, desconocidas 409 4. Con a media poblacional de la cantidad de das que permanece un jugador en la lista de in habilitados, formule las hip6tesisnula y altemativa que se pueden usar para probar la cues- tign a investigar. b. Tome como datos los siguientes: “Tamatio de la muestra Media muestra Desviveisn estindar muestral {Cuil es la estimacién puntual de la diferencia entre las medias poblacionales de la eanti- dad de dias en la lista de inhabiitados en 2001 y en 1992? {Cua es el porcentaje de inere= mento en el nimero de dias en la lista de inhabilitados? cc. Usea = 0001, ,Cudl es la conclusién acerca de la cantidad de dias en a lista de inhabilita- dos? {Cul es el valorp? 4d, Estos datos indian que la Liga Mayor de Béisbol deberipreocuparse por la situacién? I consejo universitario compara las puntuaciones obtenidas en la prueba de aptitudes escolares (SAT, porsus siglas en inglés) de acuerdo con el nivel de ensefianza de los padres de los estudian- tes que presentan este examen, La hipétesis de investigacién es que los estudiantes cuyos padres tienen un nivel mis alto de estudios obtendrsin mejores puntuaciones en el SAT. En el 2003 la me- dia general en la prucba oral fue 507 (The World Almanac 2004). A continuaciGn se presentan las puntuaciones obtenidas en el examen verbal en dos muestras independientes de estudiantes, La primera muestra correspond a las puntuaciones de estudiantes cuyos padres tienen una licencia- ‘ura, La segunda corresponde a las puntuaciones de estudiantes cuyos padres terminaron la pre- paratoria pero no tienen una liceneiatura. Padres de los estudiantes Con liceneiatura Con preparatoria 485487 42 492 SM 533) 580478. 650526 4 425 534410. 48485 590 SIS 528300 x2 S535) 4748 os) ‘4. Formule las hipstess prtinentes para determinar silos datos muestrales confiman Ia hip6- tesi de que los estudiantes cuyos padres tienen un nivel de enseianza mis alto obtienen me- {ores puntuaciones en el SAT. b, Dé la estimacion puntual de fa diferencia entre kas medias de las dos poblaciones ©. Caleule el valorp en esta prucha de hipétes 4. Cona = 005, zeual es la conelusién? Meill Lynch solicita periédicamente a sus clientes evaluaciones sobre la asesoria financera y los servicios que les presa (2000 Merl Lynch Client Satisation Survey). Puntuaciones més ai- tas indican mejor servicio, 7 es la puntuacién ms alta. A continuacién se presentan en forma re- sumida las puntuaciones dadas a dos consultoresfinaneieros por los miembros de dos muestas leatorias independientes. El consultor A tiene 10 aos de experiencia, mientras que el cansultor B tiene I aio de experiencia, Use a = 0.05 y realice una prucha para determinar si el consul- tor que tiene mis aitos de experiencia obtuvo una puntuacin més alta 410 Capitulo 10 nferencia estaditica acerca de medias y de proparciones con dos poblaciones a Establezca las hipétesis mula y alterativa b. Calcul el valor del estaistico de prucha. © {Cuil es el valorp? dA qué conclusién llega? 18, Las empresas que se dedican dar tutor a estudiantes organizan asesoras, clases y prepaacién para exdmenes cone fin de ayudar los estudiantes a obtener mejores resultados, como en el exa- men de aptitudes escolares (SAT, por sus sgl en inglés). Estas empresas aseguran que sus cur sos ayudan a los estudiantes a mejorar sus puntuaciones en estos eximenes hasta en un promedio de 120 puntos The Wall Street Journal, 23 de enero de 2003). Un investigador duda de esta ase- veraciny eree que 120 puntos es una exageracin de las empresas para motivar los estudiantes : tomar los cursos de preparacin. En un estudio ara evalua un curso de preparacién para dicho examen, los investigadores recogieron datos de las puntuaciones de 35 estudiantes que tomaron un euro y de 48 estudiantes que no tomaron el curso. EL archivo SAT del diseo compacto contc- ne los datos de tal estudio. 8 Formule las hipotess para probar la suposicién de los investigadores de que la mejora en la puntuacin del SAT debe ser menor que 120 puntos. Use « = 0.05, ;Cusl es la conclusion? Cuil es la estimacién puntual de la mejora en la puntuacién promedio del SAT obtenida con los cursos. DE un intervalo de eonfianza de 95% para la estimacién de la mejor. 4. {Qué consejo daria al investigador despues de ver el intervalo de confianza’? Inferencias acerca de la diferencia entre dos medias poblacionales: muestras pareadas Suponga que fos empleados de una fbrica usan dos métodos distintos para realizar una determi- nada tarea. Con objeto de maximizar la produccidn, fa empresa desea identiicar ef método con que la media poblacional del tiempo necesario para realizar esta tarea sea menor. Sea, a me- dia poblacional del tiempo empleando el método I y 4 ka media poblacional del tiempo reque- rido para realizar la tarea con el método 2, Puesto que no hay ninguna indicaci6n de cul sea el mejor método, se empieza por suponer que con los dos métodos se obtiene fa misma media po- blacional del tiempo requerido para realizar fa tarea, De esta manera, fa hipstesis nula es Hy: ay = Hy = 0. Si se rechaza esta hipOtesis se pod concluir que las medias poblacionates de los tiempos requeridos para realizar la tarea son diferentes con los dos métodos. En tal caso se reco- mendaré el método que proporcione et menor tiempo para la realizaciOn de la tarea, Las hipste- sis nuta y alterativa se expresan como sigue. Hy ty = Hy = 0 Hem, #0 En a eleccién del método de muestreo para obtener los datos y probar las hipétesis, se conside- ran dos disefis alternatives. Uno se basa en muestras independientesy el otro en muestras por pares 1. Diseio de muestras independientes: se toma una muestra aleatoria simple de trabajadores ¥y cada uno de ellos usa el método 1. Se toma otra muestra aleatora simple de trabajado-

You might also like