You are on page 1of 213

ESTADÍSTICA INFERENCIA!.

PARA LA INVESTIGACIÓN EN
CIENCIAS DE LA SALUD
Disminución de volumen

Tiempo

***sfcrfp&
Ag» - r*~; .^jr^“terw
flhr.y
CLETO DE LA TORRE DUEÑAS
YENY MARITZA ACCOSTUPA QUISPE
ESTADISTICA INFERENCIAL
PARALA INVESTIGACIÓN EN
CIENCIAS DE LA SALUD
Cleto De La Torre Dueñas
Yeny M. Accostupa Quispe

Prohibida la reproducción total o parcial de este libro en forma idéntica o modifica­


da por cualquier medio mecánico o electrónico, incluyendo fotocopia, grabación o
cualquier sistema de almacenamiento y recuperación de información no autorizada
por los autores.
Decreto Legislativo........................................ ................ : 822
Hecho el Depósito Legal en la Biblioteca Nacional del Perú N° : 2013-08169
International Standard Book Number ISBN....................... : 978-9972-813-76-4

Derechos reservados O
Primera edición: Junio 2013
Tiraje: 1000 ejemplares

Impreso en Perú - Printed in Perú


DEDICATORIA

<Q Á:
DIEGO ALBERTO
Y
SELENE MARIANA
PROLOGO

La estadística en la actualidad es una herramienta imprescindible en


la investigación científica. El papel más destacado de la Estadística
es la recopilación, presentación, análisis y uso de datos experim en­
tales, a partir de los cuales obtener unas conclusiones y tomar deci­
siones, en este sentido el conocimiento de la estadística puede re­
sultar de gran utilidad en las ciencias de la salud.

El presente texto de estadística inferencial para la investigación en


ciencias de la salud, se ha diseñado dando un énfasis primordial a con­
ceptos y aplicaciones de los métodos estadísticos en el área de las
ciencias de la salud, con el fin de proporcionar al estudiante el enlace
necesario entre los conceptos teóricos y las aplicaciones de la vida real;
también pretende que los profesionales de salud utilicen la estadística
como una herramienta de la investigación científica.

El contenido del libro está enfocado a docentes y estudiantes de todos


los niveles que imparten o cursan la materia, y tiene por finalidad mos­
trar las aplicaciones de las herramientas estadísticas inferenciales para
resolver problemas de las ciencias de la salud.

Espero que este texto, haga el estudio de la estadística más satisfacto­


rio, compresible y significativo.

Dr. Cleto De La Torre Dueñas Mgt. Yeny M. Accostupa Quispe


ÍNDICE

CAPÍTULO I ..................................................... 1
DISEÑOS DE INVESTIGACION EN SALUD.... ..... 1
DISEÑOS DE INVESTIGACION EN SALUD............ 2
1.1 SEGÚN EL OBJETIVO DE LA INVESTIGACIÓN ............................... 2
1.1.1 Descriptivo........................................... 2
1.1.2 Analítico............................................................................................. ..3
1.2 SEGÚN EL TIPO DE SEGUIMIENTO......................................................... 3
1.2.1 TRANSVERSAL (SIN SEGUIMIENTO)................................................3
1.2.2 LONGITUDINAL (CON SEGUIMIENTO)........................................... 3
1.3 SEGÚN LA DIRECCION DEL ESTUDIO........................................... 4
1.3.1 PROSPECTIVO.................................................. 4
1.4.1 OBSERVACION AL (SIN INTERVENCIÓN)......................................4
1.4.1.1 ESTUDIO DE COHORTES...................................................................4
1.4.1.2 ESTUDIO DE CASOS Y CONTROLES........................ 7
1.4.1.3 ESTUDIOS TRANSVERSALES................................. 9
1.4.2 EXPERIMENTAL (CON INTERVENCION) ...... 10

CAPÍTULO I I ............................................. ..13


VALIDEZ Y CONFIABILIDAD DE INSTRUMENTOS ............................... 13
2.1. INSTRUMENTOS DE RECOLECCION DE INFORMACION....................14
2.1.1. OBSERVACIÓN......................................................................................14
2.1.2. ENCUESTA.............................................................................................. 15
2.1.3. ENTREVISTA.......................................................................................... 15
2.1.3.1. Entrevista estructurada...........................................................................15
2.1.3.2. Entrevista no estructurada......................................................................15
2.2. VALIDACIÓN DEL INSTRUMENTO .............................. 16
2.2.1. VALIDEZ DE CONTENIDO..................................................................16
2.2.2. CRITERIO DE EXPERTOS.............................. 17
2.3. CONFIABILIDAD DEL INSTRUMENTO........................ ....20
2.3.1. ALFA DE CRONBACH..........................................................................23
2.4. BAREMACIÓN DEL INSTRUMENTO, UTILIZANDO ESCALA DE
INTENSIDAD..................¡........................................... .27

CAPÍTULO I II............................................................... 31
INTRODUCCION AL MUESTREO............................. 31
3.1. INTRODUCCION....................... 32
3.2. DEFINICION DE TÉRMINOS, REVISIÓN DE CONCEPTOS....................32
3.3. ENCUESTA................................. 35
Diseño de la encuesta...............................................................................................35
Diseño de la muestra................................................................................................35
3.4. MUESTREO ALEATORIO SIM PLE............................................. ... 35
Procedimiento de selección............................................ 36
Tamaño de la muestra...................................................... 36
3.5. MUESTREO ESTRATIFICADO.................................. ...38
3.6. MUESTREO SISTEMATICO.................................................... 40
EJERCICIOS DESARROLLADOS............................................................................... 41
EJERCICIOS PROPUESTOS................................................................................. 45

CAPÍTULO IV ........................ 47
ESTIMACION PUNTUAL Y POR INTERVALOS..................... 47
4.1. INFERENCIA ESTADÍSTICA.................................................... 48
4.2. DISTRIBUCIONES EN EL M UESTREO...................... 49
4.2.1. Distribución de la media muestral con varianza poblacional conocida49
4.2.2. Distribución de la media muestral en poblaciones normales con
varianza poblacional desconocida. .........................................................49
4.2.3. Distribución de la proporción muestral...................................................50
4.2.4. Distribución de la diferencia de medias muéstrales de dos poblaciones
normales independientes con varianzas poblacionales conocidas 50
4.2.5. Distribución de la diferencia de medias muéstrales de dos poblaciones
normales independientes con varianzas poblacionales desconocidas,
pero iguales....................................................................................... 51
4.2.6. Distribución de la varianza muestral en poblaciones normales 52
4.2.7. Distribución del cociente de varianzas muéstrales de dos poblaciones
normales.......................................................................... 52
4.3. INTERVALOS DE CONFIANZA.....................................................................53
4.4. RESUMEN DE INTERVALO DE CONFIANZA................... 60
EJERCICIOS DESARROLLADOS............................................................ 62
EJERCICIOS PROPUESTOS ................................................... 76

CAPÍTULO V ................................................................................... 81
PRUEBAS DE HIPOTESIS........................................................................... .......81
5.1. PRUEBAS DE HIPOTESIS..................................................... 82
5.2. PASOS DE UNA PRUEBA DE HIPOTESIS. ....... 84
5.3. PRUEBAS DE HIPOTESIS EN POBLACIONES NORMALES.................. 86
EJERCICIOS DESARROLLADOS................................................................................90
EJERCICIOS PROPUESTOS....................................................................................... 108

CAPÍTULO V I.............................................................................................................. 115


PRUEBA DE CHI-CUADRADO.................................................................................. 115
6.1. TABLA DE CONTINGENCIA.................................................................................116
6.2. PRUEBA DE HOMOGENEIDAD..................................................................118
6.3. PRUEBA DE INDEPENDENCIA................... 120
6.4. APLICACIÓN A ESTUDIOS EPIDEMEOLOGICOS................................. 122
6.4.1. RIESGO RELATIVO............................................................................ 123
6.4.2. ODDS RATIO......................................................................................... 125
EJERCICIOS DESARROLLADOS..............................................................................128
EJERCICIOS PROPUESTOS....................................................................................... 141

CAPÍTULO V I I ........................................................................................................... 149


DISEÑO EXPERIMENTAL......................................................................................... 149
7.1. INTRODUCCION............................................................................................150
FACTOR................................................................................................................. 150
NIVEL .............................................................................................................. 150
UNIDAD EXPERIMENTAL................................................................................ 150
ERROR EXPERIMENTAL...................................................................................150
7.3. DISEÑO UNIFACTORIAL (DISEÑO COMPLETAMENTE ALEATORIO) 152
7.3.1. Análisis de varianza............................................................................... 154
7.4. DISEÑO EXPERIMENTAL DE DOS FACTORES.....................................155
EJERCICIOS DESARROLLADOS..............................................................................159
EJERCICIOS PROPUESTOS........................................................................................173

CAPÍTULO V III........................................................................................................... 181


REGRESION PROBIT................................................................................................... 181
8.1. REGRESIÓN PROBIT.................................................................................... 182
8.2. APLICACIÓN................................................................................................. 183
EJERCICIOS PROPUESTOS...................................................... 188
APENDICE ............................................................................................................... 189
BIBLIOGRAFIA............................................................................................................ 201
CAPITULO I

DISEÑOS DE INVESTIGACIÓN
EN SALUD
,Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

DISEÑOS DE INVESTIGACIÓN EN SALUD

El diseño de una investigación es el conjunto de procedimientos y técnica empleados


en la selección de los sujetos, recogida de información y enfoque del análisis.

El investigador debe elegir y describir el diseño que le permita responder a la pregun­


ta de investigación, haciendo a la vez compatible la pertinencia de la misma con la
viabilidad de contestarla con los recursos disponibles.

1.1 SEGÚN EL OBJETIVO DE LA INVESTIGACIÓN


1.1.1 DESCRIPTIVO
Caracterizan los fenómenos de salud, se basan en la observación de lo que ocu­
rre con la salud en los grupos de población y se aproximan a la explicación de
dichos fenómenos examinando las variables que intervienen. Constituyen el
punto de partida de otros estudios analíticos o experimentales y a que ofrecen
datos de las variables persona, lugar y tiempo. Son el primer peldaño para co­
nocer un problema de salud y para ayudar a priorizar en los servicios sanita­
rios. Los objetivos planteados en estos estudios atienden a las siguientes pre­
guntas: ¿qué ocurre?, ¿cuántos están afectados?, ¿quiénes están afecta­
dos?, ¿qué características tienen (sociodemográflcas, económicas, cultura­
les, hábitos de salud, antecedentes de salud...)?, ¿dónde ocurre? y ¿cuándo
ocurre?
Este estudio permite:
- Constatar hechos y generar hipótesis.
- Estudiar la distribución de los problemas de salud
- Describir las características generales de la distribución de una enfermedad
en relación de las personas, lugares y tiempos.

- 2 -
Capítulo I Diseños de Investigación en Salud

Dentro de los estudios descriptivos están:


Reporte de casos
Serie de casos
Corte transversal

1.1.2 ANALÍTICO

Establecen comparaciones entre dos grupos o más con el fin de encontrar rela­
ción de causalidad entre factores de riesgo y sucesos de interés. Su objetivo es
validar hipótesis de causalidad formuladas al inicio. Así como los anteriores
responden a la pregunta ¿qué ocurre? estos responden a ¿por qué ocurre?
¿Qué factores explican el fenómeno? Se dividen en dos tipos y ambos se di­
ferencian en las características de los grupos que inician el estudio

Si la pregunta es: ¿Qué exposición produce un determinado daño?, ¿cuánto


aumenta el riesgo al estar expuesto?, ¿qué daños produce determinada exposi
ción? Se requiere un diseño analítico.

Este estudio permite:

- Contrastar hipótesis.
- Estudiar los determinantes de los problemas de salud.
- Evaluar presuntas relaciones de causa-efecto.

1.2 SEGÚN EL TIPO DE SEGUIMIENTO.


1.2.1 TRANSVERSAL (SIN SEGUIMIENTO).
Se estudia la exposición y el desenlace al mismo tiempo.
1.2.2 LONGITUDINAL (CON SEGUIMIENTO)
Analizan la exposición y el desenlace a lo largo del tiempo.

- 3-
Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

1.3 SEGÚN LA DIRECCION DEL ESTUDIO


1.3.1 PROSPECTIVO
Los hechos a estudiar (efectos) no han sucedido y los sujetos son seguidos
hasta obtener el resultado.
Si el investigador comienza su investigación definiendo los grupos de estudio
antes de que se produzca el evento, entonces su estudio será prospectivo.
1.3.2 RETROSPECTIVO.

Cuando los hechos a estudiar (efectos) ya han sucedido al iniciar el estudio.


Si el investigador comienza su investigación y define el grupo o los grupos de
estudio después que el evento ha ocurrido, entonces su estudio será retrospecti­
vo.

1.4 SEGÚN LA EXISTENCIA DE INTERVENCIÓN DEL INVESTIGADOR.


1.4.1 OBSERVACIONAL (SIN INTERVENCIÓN)
Cuando el investigador no interviene directamente en la intervención o expo­
sición (factor de estudio).
En este tipo de estudio:
- La naturaleza sigue su curso
- El investigador sólo observa
No se controlan las condiciones del estudio

Dentro de los estudios obscrvacionales están:

1.4.1.1 ESTUDIO DE COHORTES

Es un diseño observacional, analítico y longitudinal en el que se compara dos


grupos de sujetos libres de un evento (enfermedad), un grupo que esta expuesto
a un factor de riesgo con otro grupo que no esta expuesto, son seguidos durante
un período de tiempo para observar la frecuencia de aparición del fenómeno

- 4-
Capítulo I Diseños de Investigación en Salud

que nos interesa. La finalidad es comparar la incidencia de la enfermedad en


ambos grupos utilizando el Riesgo Relativo (RR).

El estudio de cohortes investiga de causa hacia el efecto

ESTUDIO DE COHORTES

SEGUIMIENTO EN EL PERSONAS QUE


TIEMPO NO
DESARROLLARON
LA ENFERMEDAD

-5 -
, Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

RIESGO RELATIVO. Estima la magnitud de la asociación entre una exposi­


ción y una enfermedad. Indica la probabilidad de desarrollar la enfermedad en
el grupo expuesto en comparación con el grupo de individuos no expuestos.

TABLA 2 x 2 PARA EL CALCULO DE LAS MEDIDAS DE ASOCIACIÓN EN


UN ESTUDIO DE COHORTE

Enfermos Sanos Total


Expuestos a b a+b
No expuestos c d c+d
Total a+c b+d a+b+c+d
. . Incidencia en expuestos a / ( a + b)
R iesgo relativo= --------------------- --------- ----------- :— = ---------------
Incidencia en no expuestos c/(c + d)

Ejemplo 1.7: En la tabla, Exponemos los resultados de un estudio de segui­


miento a 2473 mujeres gestantes, 853 mujeres estuvieron pasivamente expues­
tas al humo del tabaco durante la gestación y 1620 no lo estuvieron, y su aso­
ciación con el bajo peso al nacer.

DISTRIBUCIÓN DE GESTANTES SEGÚN EXPOSICIÓN PASIVA AL HUMO


DE TABACO Y RECIÉN

Tabaco Recién Nacido de Bajo peso


Total
Exposición pasiva Sí No
Sí 20 833 853
No 14 1606 1620
Total 34 2439 2473

- 6-
Capítulo I Diseños de Investigación en Salud

Incidencia en expuestos 20/853


Riesgo relativo=----------------------------- = ----- = 2.713
Incidencia en no expuestos 14/1620

El riesgo relativo igual a 2.713, lo que significa que las mujeres gestantes ex­
puestas al factor al tabaco tienen 2,71 veces más probabilidades de tener niños
de bajo peso que las no expuestas.

1.4.1.2 ESTUDIO DE CASOS Y CONTROLES

Se conoce el problema pero no el factor de riesgo o exposición y por tanto se


estudia la historia de exposición de esos sujetos. Parten de un grupo con el
fenómeno en estudio (caso) y un segundo grupo sin el suceso (control) para
descubrir en el pasado la presencia o ausencia del factor de riesgo. Son estu­
dios retrospectivos. Los casos se establecen en base a unos criterios y se bus­
can en fuentes de registro sanitarias. El grupo control debe ser de característi­
cas similares a los casos, se diferencian en no tener el problema. Los datos se
recogen por entrevista, cuestionario, historia clínica, su análisis pretenderá
hacer inferencia causal sobre la asociación entre el factor de riesgo y el pro­
blema.

Se llama caso a toda la persona que ha sido diagnosticada con la enfermedad


bajo estudio, durante un período de tiempo y en una determinada área geográ­
fica y control sujetos del estudio que no tienen la enfermedad que está siendo
investigada. Deben ser representativos de la población de donde provienen.

El estudio caso control investiga del efecto hacia la causa, son retrospectivos y
para evaluar el factor de riesgo se determina OR.

- 7-
Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

Estudio de Casos y Controles

<
TIEMPO

Ejemplo 1.8: Un investigador selecciono a 50 pacientes con cáncer pulmonar y


60 sin cáncer pulmonar, luego realizo una auditoria respecto a sus antecedentes
de fumar tabaco, obteniendo los siguientes resultados.

PACIENTES CON PACIENTES SIN


TOTAL
CÁNCER PULMONAR CÁNCER PULMONAR

Fumador a = 40 b = 15 a + b = 55
LO

No Fumador c=10 c + d = 55
II

Total a + c = 50 b + d = 60 a + b + c + d = 110

alb a*d 40*45


U K - ------- = ---------= --------------= 1 2
cid b*c 15*10

-8 -
Capítulo I Diseños de Investigac ion en Salud

1.4.1.3 ESTUDIOS TRANSVERSALES

Son estudios diseñados para medir la prevalencia de una exposición y también


permiten determinar la asociación entre una determinada exposición y una en­
fermedad en un punto específico de tiempo.

En el diseño transversal la variable resultado (enfermedad o condición de sa­


lud) y las variables de exposición (características de los sujetos como hábito de
fumar, edad, sexo) se mide en un mismo momento no involucra seguimiento.
Los estudios transversales pueden ser descriptivos o analíticos:
- Descriptivos: cuya finalidad es el estudio de la frecuencia y distribución de
eventos de salud y enfermedad en una población definida.

■ Prevalencia: número de casos existentes en una población


en un punto específico de tiempo.

. . Nro. de casos
■ Prevalencia = ------- ——— ------ ------
______________Población es estudio

- Analíticos: Cuya finalidad es investigar la asociación entre una determina­


da exposición y una enfermedad.
La medida de efecto o asociación puede ser medida por OR.

Los estudios transversales habitualmente no se hacen en un solo día, inclusive


pueden llevar meses o años para su realización, y durante la investigación se
estudian varios sujetos, pero todos ellos en un momento determinado de su vi­
da. No se los sigue en el tiempo. Es importante que observe que el corte trans­
versal representa un momento en la vida de la persona que está siendo estudia­
da o entrevistada, no hay un seguimiento de esa persona.

-9 -
Cielo De La Torre Dueñas Yeny M. Accostupa Quispe

1.4.2 EXPERIMENTAL (CON INTERVENCION)

Son aquellas en los que el investigador tiene cierto control de la exposición y


evalúa los efectos de dicha intervención.

1 El Investigador posee la facultad de decidir sobre los condicionesy cambios


de las variables (factores), tiempo de realización, numero de sujetos,
quienes son expuestos y no expuestos.
2 En este tipo de investigación el investigador produce cambios en la variable
independiente (factores) para ver que sucede con la variable dependiente
(Respuesta)

Diseños pre experimental


Se denominan PRE-EXPERIMENTAL, cuando el investigador aplica un tra­
tamiento a un solo grupo de sujetos, sin grupo de control, observándolo antes y
después de aplicar el tratamiento.

Diseños cuasi-experimentales.
Entendemos por diseños cuasi-experimentales cuando se cumplen las siguien­
tes condiciones:
• Se tiene dos o más grupos con características similares, uno de ellos llama­
do grupo control y los otros grupos experimentales.
• Los grupos fueron asignados por conveniencia, no es aleatoria.

Diseños experimentales
Son aquellos en los que se cumple que:
• Los gruposa ser investigados han sido asignados al azar, por procedimien­
tos aleatorios y los grupos resultantes son equivalentes.

-10-
Capítulo I Diseños de Investigación en Salud

EJERCICIOS PROPUESTOS

1. Los resultados de un seguimiento de 10 años de observación estudiando el riesgo


de enfermedad cardiovascular por hábito de fumar dieron los siguientes resulta­
dos:

AL INICIO DEL ESTUDIO RESULTADO LUEGO DE 10 AÑOS


Presentaron enf. No presentaron
Coronaria enf. Coronaria
2000 fumadores sanos 65 1935

4000 no fumadores sanos 20 3980

Cuál es el riesgo relativo de enfermedad coronaria por hábito de fumar?

2. En el estudio Framingham se obtuvo los siguientes resultados en relación con


enfermedad cardiovascular arteriosclerótica (ECVA). Calcule el riesgo relativo
para cada grupo de edad, considere que el factor de riesgo es pertenecer al sexo
masculino.

HOMBRES MUJERES
Edad al inicio Tasa de ECVA Tasa de ECVA
Incidencia Incidencia
del estudio en el examen en el examen
media anual media anual
(años) inicial inicial

29-34 76.7 19.4 0.0 0.0

35-44 90.7 40.0 17.2 2.1

45-54 167.6 106.5 111.1 29.4

55-62 505.4 209.1 211.1 117.8

-11-
CAPITULO II

VALIDEZ Y CONFIABILIDAD
DE INSTRUMENTOS
Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

VALIDEZ Y CONFIABILIDAD DE INSTRUMENTOS

El rigor y la calidad para evaluar el instrumento dependen, fundamentalmente, de


cómo se aborde la validez y la confiabilidad, cualidades esenciales que deben estar
presentes en el desarrollo del proceso de recoger y analizar la información conducente
a garantizar una mayor confianza sobre las conclusiones emitidas

2.1. INSTRUMENTOS DE RECOLECCIÓN DE INFORMACIÓN.

Dentro de un proceso de investigación una de las actividades que se realizan es


la recopilación de datos, la cual es el acopio de información y se incluye desde
elaborar fichas bibliográficas hasta la aplicación de cuestionarios con el em­
pleo de técnicas de muestreo.
Para Hernández (2006) un instrumento de medición es un recurso que utiliza
el investigador para registrar información o datos sobre las variables que tiene
en mente.

2.1.1. OBSERVACIÓN

La observación es una práctica que se utiliza tanto en los métodos cuantitativos


como en los cualitativos, la diferencia estriba en la forma de ejercerla. Cuando
el observador es pasivo y sólo mide y registra acontecimientos o conductas re­
gulares se acerca a la metodología cuantitativa; cuando, por el contrario, el ob­
servador se involucra con el objeto de investigación y participa cercanamente
en las actividades del grupo de estudio, posibilita la comprensión de ¡os proce­
sos simbólicos, de los significados de las acciones que los mismos individuos
le imprimen, es decir, se aproxima a una metodología de corte cualitativo.

-14-
Capítulo II Validez y Confiabilidad de Instrumentos

2.1.2. ENCUESTA

La encuesta es una técnica de interrogatorio que emplea el cuestionario como


instrumento. El cuestionario se caracteriza por ser estructurado y presentarse
por escrito.

2.1.3. ENTREVISTA

La entrevista es una técnica de interrogatorio que se caracteriza por su aplica­


ción interpersonal o "cara a cara".
Ésta se utiliza con el fin de obtener información en forma amplia y detallada,
por ello las preguntas suelen ser abiertas y se aplica a quienes poseen datos y
experiencias relevantes para el estudio.

2.1.3.1. Entrevista estructurada

Se denomina estructurada cuando el entrevistador prepara previamente


una guía de preguntas con un orden definido.
Llevar a efecto este tipo de entrevista demanda información suficiente sobre el
tema u objeto de estudio así como de claridad acerca de la información reque­
rida para alcanzar los objetivos, es decir, saber con precisión qué datos necesi­
tará recopilar a través de la entrevista.

2.1.3.2. Entrevista no estructurada

A esta forma de entrevista se recurre cuando no se cuenta con suficiente infor­


mación sobre el tema o para efectuar una entrevista en profundidad, es decir,
una entrevista que rescate datos significativos de la persona a medida que se
desarrolla la conversación.

-15-
Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

2.2. VALIDACIÓN DEL INSTRUMENTO

La validación de los instrumentos se realiza con el fin de conseguir una mayor


objetividad al seleccionar los ítems en los respectivos cuestionarios.

2.2.1. VALIDEZ DE CONTENIDO

El proceso de validación de contenido es eminentemente lógico, si bien pueden


utilizarse jueces expertos en el tema para valorar la congruencia entre los di­
versos ítems y los diversos objetivos.
Existen procedimientos cuantitativos diversos para que cada experto valore el
grado en que un ítem sirve para evaluar el objetivo al que corresponde. El pro­
cedimiento cuantitativo más sencillo sería el siguiente:
• Especificar los diversos objetivos (v.gr. áreas diferentes de contenidos) que
se Pretenden evaluar.
• Elaborar varios ítems para cada objetivo.
• Seleccionar una muestra de expertos en el contenido del test.
• Pedirles que, según su opinión, asignen cada ítem al objetivo que pretende
medir.
• Seleccionar los ítems en los que los expertos manifiestan mayor acuerdo en
sus clasificaciones.

-1 6 -
Capítulo II Validez y Confiabilidad de Instrumentos

2.2.2. CRITERIO DE EXPERTOS


Método 1: HOJA DE PREGUNTAS PARA LA VALIDACIÓN

PREGUNTAS ESCALA DE VALORACIÓN


1. ¿Considera usted que los ítems del instru­ 1 2 3 4 5
mento miden lo que se pretende medir?
2. ¿Considera usted que la cantidad de ítems
registrados en esta versión son suficientes 1 2 3 4 5
para tener una comprensión de la materia
de estudio?
3. ¿Considera usted que los ítems contenidos
en este instrumento, son una muestra repre­ 1 2 3 4 5
sentativa del universo materia del estudio?
4. ¿Considera usted que si aplicamos en reite­
radas oportunidades este instrumento a 1 2 3 4 5
muestras similares, obtendríamos también
datos similares?
5. ¿Considera usted que los conceptos utili­
zados en este instrumento, son todos y cada 1 2 3 4 5
uno de ellos, propios de las variables del
estudio?
6. ¿Considera usted que todos y cada uno de
los ítems contenidos en este instrumento 1 2 3 4 5
tienen los mismos objetivos?
7. ¿Considera usted que el lenguaje utilizado
en el presente instrumento es claro, sencillo 1 2 3 4 5
y no da lugar a diversas interpretaciones?
8. ¿Considera usted que la estructura del pre­
sente instrumento es adecuada al tipo de 1 2 3 4 5
usuario a quien se dirige el instrumento?
9. ¿Estima usted que las escalas de medición
utilizadas son pertinentes a los objetos ma­ 1 2 3 4 5
teria de estudio?
10. ¿Qué aspectos habría que modificar, que aspectos tendrían que incre­
mentarse o que aspectos habría que suprimirse?...............

-1 7 -
Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

PROCEDIMIENTO

El método DPP mide la adecuación de los instrumentos, para medir la variable


de Ínteres, en función a la valoración de los expertos.
Ejemplo 18.
En el presente estudio la valoración de los expertos es:

EXPERTOS
Item 1 2 3 4 Promedio

1 5 4 5 5 4.75
2 5 5 5 5 5
3 5 4 5 4 4.5
4 5 5 4 4 4.5
5 5 5 5 5 5
6 5 5 5 5 5
7 4 5 3 4 4
8 4 4 5 4 4.25
9 4 4 5 5 4.5

Con los promedios hallados, se determina la distancia de punto múltiple (DPP),


mediante la siguiente ecuación:

D P P = yl(X¡- Y lf +(X2- r 2/ + ..............& , - Y j


Dónde:
X¡ = Valor máximo en la escala para el ítem i.
Y¡ = El promedio del ítem i.

DPP = 7 (5 - 4 .7 5 / + ( 5 - 5 / + ............... (5 - 4.5 / = 1.541


Determinar la distancia máxima (Dmax) del valor obtenido respecto al punto de
referencia cero (0), con la ecuación:

-18-
Capítulo II Validez y Confiabilidad de Instrumentos

Du„ - , / ( * , - O1 + ( * , - l ) ! + ..................... ( * „ - ! )2
Donde:
X¡ = Valor máximo en la escala concedido para el ítem i.
1 = Valor mínimo de la escala para cada ítem.

DUax = -J(5 - l)2 + (5 - l)2 + .....................( 5 - 1 ) 2 = 12


La Dmax hallada fue de 12
La Dmax se divide entre el valor máximo de la escala, lo que nos da un valor
de 12/5=2.4
Con el valor hallado anteriormente (apartado 4) se construye una nueva escala
valorativa a partij^de cero, hasta llegar a Dmax. Dividiéndose en intervalos
Iguales entre sí, llamándose con las letras A, B, C, D, y E.
Siendo:

Valoración de
Escala Valoración
Expertos
0-2.4 A = Adecuación Total DPP= 1.541
2.4-4.8 B = Adecuación en gran medida
4.8-7.2 C = Adecuación Promedio
1.2-9.6 D = Escasa Adecuación
9.6-12 E = inadecuación

El punto DPP debe caer en las zonas A o B; en caso contrario, la encuesta re­
quiere reestructuración y/o modificación, luego de las cuales se somete nueva­
mente ajuicio de expertos. El valor hallado del DPP fue de 1.541 cayendo en
la zona A, lo que indica la Adecuación del instrumento y que puede ser apli­
cado.

-19-
Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

Método 2
Cuadro 1. Formato para validar instrumentos a incluir en el instrumento de va­
lidación.

Criterios a evaluar observaciones


Lenguaje Mide lo ( si debe elim i­
Claridad Inducción
Coherencia Adecuado que pre­ narse o modifi­
ÍTEM En la a la respuesta
interna Con el nivel tende carse un favor
redacción (sesgo)
del informante medir indique)
Si No Si No Si No Si No
1
n
Aspectos generales

El instrumento contiene instrucciones claras y precisas para responder el


cuestionario

Los ítems permiten el logro del objetivo de la investigación

Los ítems están distribuidos en forma lógica y secuencial

El número de ítems es suficiente para recoger la información. En caso de


ser negativa su respuesta, sugiera los ítems a añadir

Validez

Aplicable ( ) No aplicable ( )

Validado por:

Firma:

2.3. CONFIABILIDAD del INSTRUMENTO

Antes de iniciar el trabajo de campo, es imprescindible probar el cuestionario


sobre un pequeño grupo de población. Esta prueba piloto ha de garantizar las
mismas condiciones de realización que el trabajo de campo real. Se recomien­
da un pequeño grupo de sujetos que no pertenezcan a la muestra seleccionada
pero sí a la población o un grupo con características similares a la de la muestra
del estudio, aproximadamente entre 14 y 30 personas. De esta manera se esti­
mará la confiabilidad del cuestionario.

-20-
Capítulo II Validez y Conflabilidad de Instrumentos

La conflabilidad responde a la pregunta ¿con cuánta exactitud los ítems, reac­


tivos o tareas representan al universo de donde fueron seleccionados?. El
término conflabilidad “...designa la exactitud con que un conjunto de puntajes
de pruebas miden lo que tendrían que medir” (Ebel, 1977, citado por Fuentes,
op. cit., p. 103).

Entre los métodos para estimar la conflabilidad, se tienen:

Método Test-Retest: una forma de estimar la conflabilidad de un test o cues­


tionario es administrarlo dos veces al mismo grupo y correlacionar las puntua­
ciones obtenidas.
El coeficiente que se obtiene recibe el nombre de coeficiente de estabilidad
porque denota la coherencia de las puntuaciones en el tiempo
Para un desarrollo adecuado y sean confiables deben variar entre 0,80 y 0,95
(Popham, 1980, citado por Fuentes, op. cit.).
Se usa la correlación por el método de los puntajes directos (Correlación r de
Pearson):

Dónde:

^xy : es el coeficiente de correlación

n: número de sujetos
X: valores de X (I a aplicación)
Y : valores de Y (2a aplicación)

-21-
Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

Método común de división por mitades o Hemitest: este método computa el


coeficiente de correlación entre los puntajes de las dos mitades del test o cues­
tionario aplicado. Esto supone que las dos test mitades son paralelos, tienen
igual longitud y varianza entre sí. Se estima a través del coeficiente de confia­
bilidad de Spearman-Brown:
Se establece la correlación entre los dos puntajes de las dos mitades del test a
través del método de ios puntajes directos, Correlación r de Pearson:

Estimación del test completo (Spearman-Brown) con la fórmula:

Se interpreta la prueba de hemitest como coeficiente de consistencia interna,


ya que una sola prueba contiene las dos formas equivalentes y su énfasis lo po­
ne en las puntuaciones de los sujetos, no en los (temes.

El método de división por mitades de Rulon: utiliza la división del test en


mitades, pero su método no supone necesariamente varianzas iguales en los
sub-tests. coeficiente de consistencia interna.

Donde:

Yu : Coeficiente de confiabilidad
s] : Varianza de la diferencia entre las puntuaciones de las mitades
sf : Varianza de las puntuaciones de! test total

-22-
Capítulo II Validez y Confiabilidad de Instrumentos

El método de división por mitades de Guttman: también se denomina coefi­


ciente de consistencia interna. Su fórmula es:
2 2
S an + S hb
ru = 2

Dónde:

^ : Coeficiente de confiabilidad
s 2a : Varianza de las puntuaciones de los ítems pares
s 2b : Varianza de las puntuaciones de los ítems impares
s 2 : Varianza de las puntuaciones del test total

2.3.1. ALFA DE CRONBACII

Para evaluar la confiabilidad o la homogeneidad de las preguntas o ítems es


común emplear el coeficiente alfa de Cronbach cuando se trata de alternativas
de respuestas policotómicas, como las escalas tipo Likert; la cual puede tomar
valores entre 0 y 1, donde: 0 significa confiabilidad nula y 1 representa confia­
bilidad total. El coeficiente a de Cronbach puede ser calculado por medio de la
varianza de los ítems y la varianza del puntaje total (Hernández Sampieri et al,
2003). Para calcular el coeficiente de confiabilidad se usó el "COEFICIENTE
ALFA DE CROMBACH (a)” Córdova (2009), cuya ecuación es:
K Z s[
a =
K- 1 ' si J
Dónde:
a: Coeficiente de confiabilidad de la prueba o cuestionario
fc:Número de ítems del instrumento
S f : Varianza total del instrumento.
Y.SÍ'- Sumatoria de las varianzas de los ítems.

-23-
Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

Método de Kuder-Richarson 21: permite obtener la conflabilidad a partir de


los datos obtenidos en una sola aplicación del test. La suposición básica es
considerar que todos los ítems presentan igual varianza. Coeficiente de consis­
tencia interna.

n
n- 1 nst
Donde:
n: número total de ítems
M: media aritmética de las puntuaciones obtenidas por los individuos

sf : varianza de las puntuaciones totales

Para la interpretación de la conflabilidad se utiliza el siguiente cuadro:

TABLA DE CATEGORIAS

ESCALA CONFIABILIDAD
r > 0.89 Muy alta
0.70 < r < 0.89 Alta
0.60 < r < 0.69 Aceptable
0.40 < r < 0.59 Moderada
0.30 < r < 0.39 Baja
0.10 < r < 0.29 Muy baja
0 < r < 0.09 Despreciable

-24-
Capítulo II Validez y Confiabilidad dé Instrumentos

Ejemplo 19.
Determine la confiabilidad, utilizando alfa de cronbach, para la siguiente información

Preguntas (ítems) T
n
1 2 3 4 5 6 7 8 9 10
1 0 0 0 1 1 1 0 0 0 0 3
2 0 1 1 1 2 1 1 1 2 2 .12
3 0 1 0 2 1 1 0 0 0 0 5
4 0 0 0 1 1 0 0 1 0 0 3
5 0 0 1 1 1 1 2 1 0 0 7
6 0 , 0 0 1 1
1
1
2
0
2
1
1
0
0
0
2
4
10
7 0 0 0 2
8 0 0 0 0 0 1 0 0 0 0 1
9 1 0 0 1 1 0 0 0 0 0 3
10 0 1 0 2 2 2 0 2 2 2 13
11 0 0 1 1 1 1 0 1 2 2 9
12 0 1 0 1 2 2 0 2 0 1 9
13 0 0 0 1 2 2 0 0 0 0 5
14 1 0 0 2 2 0 0 1 0 0 6
15 1 1 0 0 0 0 0 1 0 0 3
Total 3 5 3 17 18 15 5 12 6 9 93
S 2r 0.17 0.24 0.17 0.42 0.45 0.57 0.53 0.46 0.69 0.83

^ T s r2 = 4.53

,S'¿2: Varianzadel instrumento


' Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

x =—
n

- 93 o
* = 15 =
2 _ 186-4
“ 14
S f = 13.31
S?: Varianza de cada pregunta
(X i ~ X ) 2

n - 1

Y Sr = 8.:32

>7
ttmT = i r s r
15 r 4 .5 3 1
a _ 1 5 -ir 13.31J
a = 0.71
El índice de confiabilidad es alto de conformidad con la tabla de categorías.

BAREMACIÓN DEL INSTRUMENTO, UTILIZANDO ESCALA DE


LIKERT.
Para medir la variable de estudio se aplicó una encuesta utilizando la escala de
likert, la misma que presenta en cada ítem cinco alternativas, a partir de las
cuales los entrevistados pueden elegir, con la finalidad de señalar su nivel de
acuerdo.

Alternativa Asignación numérica


a 5
b 4
c 3
d 2
e 1

-26-
Capítulo II Validez y Confiabilidad de Instrumentos

Para obtener las puntuaciones de la variable de estudio, se suman los valores obteni­
dos respecto de cada ítem. El puntaje mínimo (PM) resulta de la multiplicación del
número de ítems (x) por 1. Una puntuación alta (PA) está dada por el número de
ítems o afirmaciones multiplicado por 5.

PM---------------------1-----------------------1----------------------- 1------------------- PA

El promedio del puntaje del instrumento se obtiene mediante:

_ Puntaje
P r omedio = -------- —
n
Para facilitar la interpretar las puntuaciones de la variable de estudio se transforman
a una escala cualitativa, según el siguiente criterio.

PUNTEE OBTENIDO CATEGORÍA

Prom edio <1.49 Deficiente

1.5 < P r om edio < 2 .5 Malo

1.5 < Prom edio < 2.5 Regular

1.5 < P r om edio < 2 .5 Bueno

Prom edio > 4 .5 Muy bueno

2.4. BAREMACIÓN DEL INSTRUMENTO, UTILIZANDO ESCALA DE IN­


TENSIDAD.

Para medir las variables de estudio se aplica encuestas, las mismas que presentan en
cada ítem cuatro alternativas, a partir de las cuales los entrevistados pueden elegir,
con la finalidad de señalar su nivel de acuerdo.

- 27 -
Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

El tipo de escala que se utiliza es ordinal (Escala de intensidad), asignación un valor


a cada alternativa como se muestra en el siguiente cuadro:

ALTERNATIVA ASIGNACIÓN NUMÉRICA


a 4
b 3
c 2
d 1

Con la finalidad de realizar un análisis estadístico de las variables con sus respectivas
dimensiones previamente se realiza la baremación del instrumento (Medición de la
variable).

Para medir la variable de estudio (Puntuación), se suman los valores obtenidos res­
pecto de cada ítem. El puntaje mínimo (PM) resulta de la multiplicación del número
de ítems (x) por 1. El puntaje máximo (PA) está dada por el número de ítems multi­
plicado por 4.

PM------------------- -I------------ ----------1— --------- — t---—--------- PA

En el cuadro siguiente se muestra el resumen de la puntuación:

PUNTUACION PUNTUACIÓN TRANSFORMADA


CARACTERÍSTICAS
ORIGINAL A ESCALAVIGESIMAL
Nro. de preguntas (ítems) m m
Mínimo m 1
Máximo 4m 20
Puntaje Obtenido T X

-28-
Capítulo II Validez y Conflabilidad de Instrumentos

I ,a puntuación original se transformación a una escala vigesimal utilizando la siguien


te relación
T - \ __ x —1
4 m- l ~ 19

Despejando el valor de x, se obtiene la puntuación del individuo en escala vigesimal.

v- ' +1
4m - 1

l'inalmente la escala vigesimal es transformada a una escala cualitativa:

PUNTAJE OBTENIDO CATEGORÍA


0-8 Deficiente
9-10 Malo
11-13 Regular
14-17 Bueno
18-20 Muy bueno

-29-
CAPITULO III

INTRODUCCIÓN
AL MUESTREO
Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

3.1. INTRODUCCIÓN.

El objetivo de la estadística es hacer inferencias acerca de una población con


base a la información contenida en una muestra. Este mismo objetivo motiva el
estudio del problema de muestreo.
En lo referente al muestreo, la inferencia consiste en la estimación de un pará­
metro de población, tal como una media, proporción con un margen de error de
estimación (precisión).
Para un buen entendimiento del problema de muestreo, introduciremos ense­
guida, ciertosaspectos técnicos de muestreo.

3.2. DEFINICIÓN DE TÉRMINOS, REVISIÓN DE CONCEPTOS

Población: Es una colección finita o infinita de individuos o elementos, con


una característica de interés para el estudio.
Una tarea importante para el investigador es definir cuidadosa y completamen­
te la población antes de recolectar la muestra. La definición debe contener una
descripción de los elementos que serán incluidos y una especificación de las
mediciones que se van a considerar, ya que estas dos componentes están inter-
relacionadas.

Muestra: Es un subconjunto representativo de la población. Una muestra pue­


de ser probabilística (aleatoria) o no probabilística.

Unidad de Muestreo: Es una colección de uno o más elementos de la pobla­


ción. Las unidades de muestreo cubren toda la población. Una unidad de mues­
treo debe ser claramente definida, identificable y observable.

-32-
Capítulo III Introducción al Múestreo

Unidad de Análisis: Es la que suministra la información estadística requeri­


da.

Marco de Muestreo: Se presenta en forma de lista o mapa de las unidades


de muestreo que conforman la población. Forma el material básico para la se­
lección de la muestra. El marco muestral debe contener todas las unidades de
muestreo que conforman la población bajo estudio, y debe excluir unidades
de cualquier otra población.

Paj’ámetro: Es un valor numérico de la población usualmente desconocido


que representa cierta característica de la población.

Estadístico: Es una función real de la muestra aleatoria, usado para estimar


un parámetro, si un parámetro se denota con 0, el estimador se denotará con

0.

Estimación: Es el valor que toma el estimador en los datos de la muestra.

Error de Estimación: Es la diferencia absoluta entre el parámetro y su esti­

mador, es decir 10 —Q\ . Como se puede apreciar, es imposible conocer con

exactitud el error de estimación, pero podemos, al menos aproximadamente


encontrar un límite E tal que:
/V

P(\ 0 — 0 \< E ) = y , para cualquier y entre 0 y 1.

Si 0 tiene distribución aproximadamente normal, entonces para

E = 1.9 6 t¡V (0 ) se cumple:

P ( \ 0 - 0 \ < E ) = O.95

-33-
Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

Límite para el error de estimación: Denotado por E es dado por

E = 1.96tJ v 0 ) . El factor E es llamado también precisión. Si E esta expre­

sado en las mismas unidades de la medida de la variable, se le llama precisión


absoluta. Si E está expresado como un porcentaje del parámetro que se está
estimando, se le llama precisión relativa.
Una vez estimado el límite E, podemos afirmar que el parámetro 0 se encuen­

tra en el intervalo (Ó - E , 0 + E ^ con una confianza del 95%. El interva­

lo anterior es llamado intervalo de confianza.

Error de Muestreo: Este error se debe a que una muestra no produce infor­
mación completa sobre una población. Puede ser controlado por un diseño
cuidadoso de la muestra y es estimado en gran parte por el factor E. Por esta
razón, algunos autores denominan al factor E, error de muestreo.

Error de no Muestreo: Son los errores que se introducen imperceptiblemen­


te a la encuesta y estos son más difíciles de controlar, infortunadamente estos
errores no se pueden medir fácilmente, y aumentan a medida que aumenta el
tamaño de la muestra. Los tipos errores no muéstrales que suelen presentarse
son:
Definición equivocada del problema.
Definición defectuosa de la población.
Marco imperfecto o desactualizado.
- La no respuesta.
El sesgo de respuesta.
Diseño pobre del instrumento de medición.

- 34 -
Capítulo III Introducción al Muestreo

Sin embargo, los errores de no muestreo pueden ser controlados mediante


una atención cuidadosa en todas las etapas de la encuesta.

3.3. ENCUESTA.

La función de la encuesta es la medición del comportamiento, actitudes o ca­


racterísticas del encuestado, que es un individuo de la población en estudio se­
leccionado para la muestra.

Diseño de la encuesta
Pasos a seguir, para diseñar una encuesta:
4 Definir los objetivos
4 Determinar el marco
4 Diseñar el procedimiento de muestreo
4 Diseñar el cuestionario
4 Diseñar y realizar el trabajo de campo
4 Codificar, depurar y analizar las respuestas
4 Redactar el informe

Diseño de la m uestra
El diseño de la muestra incluye:
❖ La elección del procedimiento de muestreo
❖ La determinación del tamaño de la muestra
Existen varios procedimientos de muestreo, entre las principales se tiene
muestreo: aleatorio simple, estratificado y sistemático.

3.4. M UESTREO ALEATORIO SIM PLE

Definición. Si una muestra de tamaño n, es seleccionado de una población de


tamaño N de tal manera que cada muestra posible tiene la misma probabilidad
de ser seleccionada, el procedimiento de muestreo se llama Muestreo Aleatorio
Simple (M. A. S.)

-35-
Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

El M.A.S. puede ser de 2 formas, sin reposición (muestreo irrestricto aleato­


rio) y con reposición.

Procedimiento de selección.
El procedimiento de selección de una Muestra Aleatoria Simple (M.A.S.) con­
siste en:
i) Enumerar las unidades de la población, desde 1 hasta N.
ii) Usando la tabla de números aleatorios seleccionar la primera unidad
para la muestra.
iii) Continuar la selección excluyendo las unidades repetidas (si es sin re­
posición) o incluyendo las unidades repetidas (si es con reposición)
hasta completar el tamaño de muestra n.
Tam año de la m uestra
Una parte fundamental para realizar un estudio estadístico de cualquier tipo
es obtener unos resultados confiables y que puedan ser aplicables. Como ya
se comentó anteriormente, resulta casi imposible o impráctico llevar a cabo
algunos estudios sobre toda una población, por lo que la solución es llevar a
cabo el estudio basándose en un subconjunto de ésta denominada muestra.
Sin embargo, para que los estudios tengan la validez y confiabilidad buscada
es necesario que tal subconjunto de datos, o muestra, posea algunas carac­
terísticas específicas que permitan, al final, generalizar los resultados hacia la
población en total. Esas características tienen que ver principalmente con el
tamaño de la muestra y con la manera de obtenerla.

Para calcular el tamaño de una muestra hay que tomar en cuenta tres factores:
El nivel de confianza con el cual se quiere generalizar los datos desde la
muestra hacia la población total.
El error que se pretende aceptar al momento de hacer la estimación.
La varianza

-36-
Capítulo III Introducción a! Muestreo

1. Tamaño de muestra para estimar la media poblacionaL

Si se desea estimar la media poblacional p, con precisión £ fijada por el in­


vestigador, el tamaño de muestra necesario es dado por:

Z<í-«/2) * v 2 + ( N - 1) { e f Poblaci6n

n _
2
(l-g /2 )
* <7 2
°
2 , Población infinita.
*
Donde
_2
CT Es la varianza poblacional

_ 2 2
En la practica el valor de C7 estimado por S a partir de una encuesta ante­
rior o de una muestra piloto

2. Tamaño de la muestra para estimar la proporción poblacional.


De manera simular, la fórmula del tamaño de muestra n para la estimación de la

proporción poblacional, p con un error máximo de estimación de £ y un ni­


vel de confianza del 100(1 - a)% , esta dado por:

-37-
Cteto De La Torre Dueñas Yeny M. Accostupa Quispe

* N * p (\~ p )
n= , Población finita.
7 2 ^ *
Z ,( l - a / 2 ) p (l- p )+ (A r -l)(í)2

Si N —

n , Población infinita.

En este caso el valor de S esta entre 0 y 1, el valor de p es desconocido, por


lo que debe ser estimado preliminarmente a partir de una encuesta anterior, o
de una muestra piloto. En última instancia el valor de p se puede sustituir por
0.5 y se obtendrá un tamaño de muestra mayor que el requerido.

Recomendaciones para el uso del M. A. S.


El M. A. S. Está orientada a encuestas de pequeña escala y raras veces a en­
cuestas de gran escala, debido a que otros diseños proporcionan mayor o igual
precisión a menor costo.
En las encuestas por muestreo a gran escala, el M. A. S. es usado
como parte de un diseño de muestreo mucho más complejo.
El M. A. S. es muy eficiente cuando la población es homogénea.

3.5. M UESTREO ESTRATIFICADO.

Una muestra estratificada es obtenida mediante la separación de los elementos


de la población en grupos heterogéneos disjuntos, llamados estratos y la selec­
ción posterior de una muestra aleatoria simple en cada estrato.

-38-
Capítulo III Introducción al Muestreo

Consideremos una población de tamaño N, la cual es dividida en k estratos


(sub poblaciones) de tamaños N¡, i= 1,2...., k, tal que:
N = N , + N j + ... + N k

El tamaño de muestra se estima mediante:


k

/=!

W i : Es el peso asignados al estrato i

El tamaño de muestra necesario de cada estrato, se puede obtener por afijación


proporcional al tamaño de cada estrato, es decir:

n (, = n * = n * w i, i = l k

Cuando se realiza un muestreo estratificado, los tamaños muéstrales en cada


uno de los estratos, ni, los elige quien hace el muestreo, Así en un estrato dado,
se tiende a tomar una muestra más grande cuando:
El estrato es más grande;
El estrato posee mayor variabilidad interna (varianza).

-39-
Gleto De La Torre Dueñas Yeny M. Accostupa Quispe

3.6. M UESTREO SISTEM ÁTICO

Definición.- Una muestra obtenida al seleccionar aleatoriamente un elemento


de los primeros k elementos en el marco y después cada k-ésimo elemento, se
denomina muestra sistemática de intervalo de selección k.
Una muestre sistemática simple se obtiene cuando el intervalo de selección k
es exactamente un número entero.
El procedimiento de selección de una muestra sistemática simple consiste:
i) Las unidades del marco deben ser ordenados en magnitud de acuerdo
con algún esquema de ordenación (población ordenada) es base al orden
se establece la numeración desde 1 hasta N
N
ii) Determinar el intervalo de selección & = — (k exactamente un número
n
entero)
iii) Seleccionar un número aleatorio entre 1 y k (arranque aleatorio) sea “a”
el arranque aleatorio elegido, entonces los elementos de la muestra sis­
temática, son los que ocupan las posiciones en el marco:
a, k+a, 2k+a, 3k+a, (n-l)k+a
iv) El tamaño de muestra, para el muestreo sistemático es el mismo que el
M.A.S

-40-
Capítulo III Introducción al Muestreo

EJERCICIOS DESARROLLADOS

I. Un investigador, desea hacer una estimación del egreso medio que tienen los
pacientes en un hospital, con 99% de confianza, suponiendo qué el máximo
error permitido es de 1 sol, además de una muestra piloto se obtuvo una varian­
za de 25. También se sabe que el hospital atiende semanalmente 2500 pacientes
por año. ¿Qué tamaño de muestra necesitara para tal estudio?

Solución

N = 2 5 0 0 , S = 1,

<J — 2 5 , Z(i_a/2) — 2 .5 8

n=

2 .5 8 2 * 2 5 0 0 * 2 5
n= = 1 5 6 .0 8 « 1 5 7

Se debe utilizar como mínimo 157 pacientes para el estudio.

2. Por encargo del Ministerio de Salud, un grupo de especialistas debe-realizar un


estudio, para determinar el nivel de automedicación en una ciudad. La estima­
ción debe presentar un nivel de confianza del 95% y un margen de error de 5%,
suponiendo que la población es de 25000 ¿Cuál es el tamaño de muestra míni­
mo para este estudio?

-41-
Cleto De La Torre Duefias Yeny M. Accostupa Quispe

Solución:
Consideremos que no se tiene ningún estudio de este tipo, por tanto

P ~ 0*5, del problema:


N = 25000, £ - 0.05, Z(1_a/2) =1.96

n_ z l - a i2)*Np( ' - p y

z l - a n ) * p < y - p ) + ( N - xÁ s ) 2

f1,962) *25000*0.5(1 -0.5)


n=- i 1-------------- ------- -------5-=378.361 * 379
(l .%2) *0.5(1 -0.5 )+ (2 5 0 0 0 -l)(0 .0 5 )

Se debe utilizar como mínimo 379 personas para el estudio.

3. Un funcionario del sector de Salud, desea estimar el porcentaje de personas que


presentan problemas de desnutrición en cierta región, con un nivel de confianza
del 95% y un margen de error del 5%. Suponiendo que en estudio realizado
hace 10 años, el porcentaje estimado de personas con desnutrición fue de 15%
¿Cuál debe ser el tamaño de muestra para este estudio?

Solución:
La población materia de estudio, no es finita, por tanto la relación para estimar
el tamaño de muestra es:

n = — --------- -— ; --------1—

(4
-42-
Capítulo III Introducción al Muestreo

Del problema se tiene los siguientes datos

P = 0.15, £- = 0.05, Z(\-a /2) =

1.962 * 0.15(1-0.15)
n-' = 195.92 «196
(0.05)2

4. Un grupo de especialistas en Salud, planifican realizar un estudio sobre el porcen­


taje de personas que presentan problemas de TBC, en una región del Perú. Su­
poniendo que esta región se divide en tres provincias, cuyo tamaño poblacional
se muestra en el cuadro siguiente:

Provincia Tamaño de población


A 2000
B 1200
C 5000
Total 8200

Considere que el tamaño de muestra es 245, calcule el tamaño de muestra por


cada provincia, necesario para este estudio.

Solución:
En este ejemplo, las ciudades forman los estratos:

Provincia N¡ w¡
A 2000 =2000/8200=0.24
B 1200 =1200/8200=0.15
C 5000 =5000/8200=0.61
Total N=8200 1

n = 245.

-43-
Cleto Del¿a Torre Dueñas Yeny M. Accostupa Quispe

Usando la relación:

na . •
=/?* Se determina el tamaño de muestra para cada

provincia.

— nM * N
n A= á- | = „ * wA = 2 4 5 * 0.2 4 = 5 9 . 7 6 * 60
N

n B = «*[ = n * ^ B = 245 * 0.15 = 35.85 * 36

n r* - n n * Wr- = 2 45 * 0.61 = 1 4 9 . 3 9 « 149


N

-44-
Capítulo III Introducción al Muestreo

EJERCICIOS PROPUESTOS

1. Un investigador está interesado en estimar la proporción de muertes debidas a


cáncer de estómago en relación con el número de defunciones por cualquier ti­
po de neoplasia. Su experiencia le indica que sería sorprendente que tal propor­
ción supere el valor de 1/3. ¿Qué tamaño de muestra debe tomar para estimar la
anterior proporción, con una confianza del 99 %, para que el valor estimado no
difiera del valor real en más de 0,03?.

2. Sólo una parte de los pacientes que sufren un determinado síndrome neurológi-
co consiguen una curación completa; Si de 64 pacientes observados se han cu­
rado 41,¿Qué número de enfermos habría que observar para estimar la propor­
ción de curados con un error inferior a 0,05 y una confianza del 95%?

3. Se desea estimar el tiempo medio de sangría en fumadores de más de 20 ciga­


rrillos diarios, con edades comprendidas entre 35 y 40 años, con una precisión
de 5 segundos. Ante la ausencia de cualquier información acerca de la variabi­
lidad del tiempo de sangría es este tipo de individuos, se tomó una muestra pre­
liminar de 5 individuos, en los que se obtuvieron los siguientes tiempos (en se­
gundos): 9 7 ,80,67,91, 73.
a) Determinar el tamaño mínimo de muestra, al 95 %, para cumplir el obje­
tivo anterior.
b) Qué tipo de muestreo se debe aplicar para este estudio.

4. Se quiere estimar la incidencia de la hipertensión arterial en el embarazo.


¿Cuántas embarazadas tenemos que observar, con una confianza del 95 %, pa­
ra estimar dicha incidencia con un error del 2% en los siguientes casos:
a) Sabiendo que un sondeo previo se ha observado un 9% de hipertensas.
b) Sin ninguna información previa.

-45-
Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

5. Un investigador a cuyo cargo está un departamento de educación física, desea


hacer una estimación del consumo de oxígeno (en litros por minuto) de los es­
tudiantes normales qué estén entre los 17 y 21 años de edad, después de haber
hecho un tipo especial de ejercicio. El investigador desea que su estimación se
encuentre por lo menos a 0,1 litros de la media verdadera con un nivel de con­
fianza del 95%. Los estudios que se han hecho indican que la varianza del con­
sumo de oxígeno de éste tipo de sujetos, bajo ías condiciones especificadas, es
aproximadamente igual a 0,09 litros por minutos al cuadrado ¿Qué tamaño de­
be tener la muestra que necesita éste investigador?

6. Un especialista tiene que estimar la prevalecía de TBC en la Provincia de la


Convención. La estimación debe presentar un nivel de confianza del 95% y un
margen de error de 5%, suponiendo que la población es de 166000 habitantes
¿Cuál es el tamaño de muestra mínimo para este estudio? ¿Qué proceso de se­
lección es la más adecuada?

7. En un estudio de seguimiento del programa de niño sano en la región Cusco.


a) Cuál es el tamaño de muestra para este estudio.
b) Que suposiciones considero para estimar el tamaño de muestra.
c) ¿Qué tipo de muestreo se debe aplicar?.

8. Un investigador desea estimar el porcentaje de niños hiperactivos que existe en


una ciudad con un nivel de confianza del 98%.
¿Cuántos niños debería seleccionar para su estudio y que criterio de selección
de la muestra debe utilizar?. Justifique adecuadamente su respuesta.

-46-
CAPITULO IV

ESTIMACIÓN PUNTUAL
Y POR INTERVALOS
CIcto De La Torre Dueñas Yeny M. Accostupa Quispe

4.1. INFERENCIA ESTADÍSTICA.

La Inferencia estadística es aquella rama de la estadística mediante la cual se


trata de sacar conclusiones de una población en estudio, a partir de la informa­
ción que proporciona una muestra representativa de la misma.
Cuando se busca información acerca de una población, pero solo disponemos
de datos sobre una muestra, se necesitan algunos medios para utilizar los datos
de la muestra y sacar conclusiones acerca de la población. Los conceptos y
técnicas que satisfacen esta necesidad constituyen lo que se conoce con el
nombre de Inferencia Estadística.

ESTIMACIÓN

INFERENCIA ESTADÍSTICA «
PRUEBAS DE HIPÓTESIS

Definición. Un estadístico es cualquier función de las observaciones de una


muestra aleatoria; es por lo tanto una variable aleatoria.
Se llama estim ador de un parámetro cualquier función de una muestra

que conduce a la obtención de valores

aproximados de 0 . Un estimador es un estadístico.

La estimación es puntual cuando el estimador t? toma un solo valor.

Definición. Un estimador puntual de un parámetro 0 es insesgado si su valor

esperado es 0 ; es decir, 0 es insesgado si E [ 0 ] = 0


a —
A la diferencia E [ 0 ] - 0 se le denomina sesgo del estimador.

-48-
Capítulo IV Estimación Puntual y por Intervalos

4.2. DISTRIBUCIONES EN EL MUESTREO


4.2.1. Distribución de la media muestra! con varianza poblacional conocida.

Sea X una variable aleatoria con media // y desviación típica a conocida y

una muestra aleatoria de tamaño n, entonces la media

muestral será:

1^

Por el Teorema Central del Límite, si n > 30, la distribución deJCso


se aproxi-
ma a la de una variable aleatoria normal de media fi y desviación típica

Se representa por X ~ N(ju9c r¡/ 4^ n


ñ)

4.2.2. Distribución de la media muestral en poblaciones normales con varianza


poblacional desconocida.

Dada una variable aleatoria con distribución normal X ~ N ( ju,<j ) con a 2

conocido y una muestra aleatoria simple de tamaño n suya, X l9X ? , . . . , X n,

entonces:

X -fi

Donde la varianza muestral se define como:

1 vr

-49-
Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

4.2.3. Distribución de la proporción muestral

La proporción muestral es un caso particular de la media muestral. Dada una


población, llamamos p a la proporción poblacional de elementos que presentan
una determinada característica. Si extraemos aleatoriamente un individuo de
dicha población, la variable aleatoria X que toma valor 1 si tal individuo pre­
senta la característica y 0 si no es así, es una variable de Bernoulli,

Si tomamos una muestra aleatoria simple de X de tamaño n,

La proporción representa el cociente entre el número de elementos que poseen


la característica y el tamaño de la muestra.
A

Si « > 3 0 , aplicando el Teorema Central del Límite, la distribución de P se

aproxima por una normal, N ( /? , y /?(1 — p ) / fí )

4.2.4. Distribución de la diferencia de medias muéstrales de dos poblaciones


normales independientes con varianzas poblacionales conocidas.

Sean X e Y dos variables aleatorias normales:

X - N ^ c r J

conocidas.

-50-
Capítulo IV Estimación Puntual y por Intervalos

Sea una muestra aleatoria simple de X de tamaño «, X x, X 2. . . . , X He inde­

pendientemente se extrae otra muestra aleatoria simple de Y de tamaño m,

Como las medias muéstrales A e / son independientes, tenemos que:

X —Y /n + o ^ /m )

4.2.5. Distribución de la diferencia de medias muéstrales de dos poblaciones


normales independientes con varianzas poblacionales desconocidas, pero
¡guales.

Sean X e Y dos variables aleatorias normales, X ~ N(ju,,<7,) e Y ~ N{/u2,<j 2)

con desviaciones típicas cr, = a 2 = cr, pero desconocida.

Sea una muestra aleatoria simple de X de tamaño n, X \ j ^ 2 » * * •’ e in­

dependientemente se extrae otra muestra aleatoria simple de Y de tamaño m

Y¡, Y2 , . . . , Ym . Entonces:

wmmmmmmmmmmmmmm 111 11 ' l

-51-
Cleto De LaTorreDueíias Yeny M. Accostupa Quispe

Dónde:
2
S l’ es la varianza muestral de la variable X y S 2 la varianza muestral de la
variable Y.

c2 VlS\ + WlS^
O _ *.= es el estimador de la varianza común.
n + m -*2

4.2.6. Distribución de la varianza muestral en poblaciones normales.

Si X ~ N ( j U , o ) y X l9X 2,.". .,X n es una muestra aleatoria de tamaño n , enton-


5 ♦,4; ’ íi •. í. ¿~ ■.?.... , - í -• ■
rr2
ces la distribución de la varianza muestral & es :

.... - ■ ■ y2 ,
a2 Mn~ 1)

2
Donde X ( n-\) denota la distribución chi cuadrado con n-\ grados de libertad.

4.2.7. Distribución del cociente de varianzas muéstrales de dos poblaciones nor­


males

Sean X e Y dos variables aleatorias normales, X ~ <7, )e

Y ~ N ( jU2,<J2) e independientes. Si extraemo.s muestras de tamaños

n : x t, x 2, . . . , x n y m : r t, r 2, . . . , r m

Respectivamente observamos que

-52-
Capitulo IV Estimación Puntual y por Intervalos

*2
nS, (n ~ 1)5
x L i ;

m S ¡ _ (m - 1 ) 5 .
x l -1

El cociente entre ellas se distribuye según una F de Snedecor

xl-, ! " - ' P

Por lo tanto,

$LL zL „ f
S¡2/ a ¡

U INTERVALOS DE CONFIANZA.

Cuando tratamos la estimación puntual, uno de los problemas que se plantea­


ron es que el valor de la estimación es solo uno de los valores del estimador,
obtenido al extraer una muestra concreta, de forma que si extraemos dos mues­
tras distintas, las estimaciones serán distintas.
Al hacer cualquier estimación se está cometiendo un error, y seria deseable
proporcionar una medida de la precisión de la estimación del parámetro.
En este tema vamos a introducir el concepto de intervalo de confianza como un
intervalo cuyos extremos son variables que dependen de la muestra, y en el
cual se confía que esté el valor de parámetro. El intervalo se obtendrá a partir
de un estadístico generalmente relacionado con un estimador puntual, cuya dis­
tribución no depende del parámetro desconocido, y una medida de la validez
dél intervalo es el nivel de confianza, que indica la proporción de intervalos de

-5 3 -
Cleto DeJLa Torre Dueñas* Yeny M. Accostupa Quispe

todos los que se podrían construir a partir de muestras distintas, que realmente
contienen al parámetro.
La importancia del intervalo de confianza para la estimación está en el hecho
de que el intervalo contiene información sobre el estimador puntual (valor cen­
tral del intervalo) y sobre el posible error en la estimación a través de la disper­
sión y de la distribución muestral del estimador. Una estimación será tanto más
precisa cuanto menor sea la amplitud del intervalo de confianza, es decir, cuan­
to menor sea el error de estimación.

Definición

Un intervalo de confianza (IC) al 100(1 - cc)% para un parámetro poblacional 0


de una v.a. X es un intervalo con estadísticas Li y L2 en los extremos (1C = [

L u L2]) tal que P ( L { < 0 < L 2 ) = l - a .

Intervalo de confianza para la media


> El 1C ál 100(1 - a)% para p, cuando cf es conocida, se obtiene usando
como pivote a

Z -------------------N ( 0 , 1 ) y vienen dado por


<7 /

-54-
Capítulo IV Estimación Puntual y por Intervalos

Donde:

X : Estimador

Z\-Ji : Factor de confiabilidad

: Error típico del estimador

En términos generales un intervalo de confianza se puede expresar como

i c = (estim ador) ± (fa g to r de confiabilidad) ( e r r o r típico d e l estim ador)

> El IC al 100(1 - a)% para p, cuando ó1 es desconocida se obtiene usando


como pivote a

y vienen dado por :

X - t < // < X +

-55-
Cletp De La Torre Dueñas Ycny M. Accostupa Quispe

t(l-a/2) t(l--a/2)
Dónde:

t(\-C L n - \ ) denota al valor de la distribución t de Student con n - 1 grados de

libertad y la varianza muestral está dado p o r:

¿ (x, - x )2
S 2 = -& ------ —

n —1

Intervalo de confianza para la varianza


El 1C al 100(1 - <x)% para cr2, se obtiene usando como pivote á

( » - l ) S 2 2
— 2------- ~ X ( n - 1) y Vienen dado por :
<r
Capítulo IV Estimación Puntual y por Intervalos

2 2
Donde X (jqL-^n - j ) y X ( \ - & - 9n- \ y denotan los valores en la distribución

chi-cuadrado con n - 1 grados de libertad y la varianza muestral dado por:


n
k2
Z (* /-* )

n - 1

Intervalo de confianza para la razón de dos varianzas

z r.2 // r r 2
El IC al 100(1 - a)% para • & 2 >se obtiene usando como pivote ;

S¡ I a 2

y vienen dado por


„2

2 -^(a/2,«2-1,W |-1) ~ 2 ~ 2 - ^ ( 1 - a / 2 , « 2 —1 -1)

-57-
Cleto De La Torre Dueñas Yeny M. Accostupa Quíspe
*

Donde f { a / 2 , n 2 - 1, n x - 1 ) y f { \ —a 12 ,n 2 - \ , n x - 1 ) denotan a

los valores en la distribución F. s? y s \ y son las varianzas de dos mues­

tras aleatorias independientes de tamaños y M2 •

1
El valor de : f (a f 2 ,/i2 -1 ,n { -1) , por lo tan-
J (1 —ex / 2 ,//| - 1,« 2
to el intervalo de confianza para el cociente de varianza es:
r,2
1 Y Sl
~ ~ T - ~^2
f ( \- a / 2 ,n\ -1,«2 CT2 iSq2

Intervalo de confianza para la diferencia entre dos medias.


2 2
El IC al 100(1 - a)% para f¿\ ~ , cuando 0"\ y CT 2 es conocida se ob­

tiene usando como pivote a

¿zé -—* « " J


~2 —2
g| , 2
/I, /t2

y vienen dado por:


Capítulo IV Estimación Puntual y por Intervalos

Intervalo de confianza para la proporción


El 1C al 100(1 - oc)% para p , se obtiene usando como pivote a

p - p
z = - J = = ~ N ( 0, 1 )
J p (x~ p )

y vienen dado por:

Intervalo de confianza para la diferencia entre dos proporciones

El 1C al 100(1 - oc)% para p } — p 2 ,se obtiene usando como pivote a

z = ( y f- i ) - ( ^ ) ^ N (o j)

p\ Q-jPi) , 1 2 O - 12 )
’S j n , n2

y vienen dado por:

-59-
Cleto De La Torre Dueñas Yeny M. Accostupa Quispe
* : ...........
4.4. RESUMEN DE INTERVALO DE CONFIANZA.

En el cuadro siguiente se presenta el resumen de las relaciones para los interva­


los de confianza de los principales parámetros.

Intervalos de
Límite inferior Limite Superior
confianza de:
La Media
-Si se asume a 2
conocido
x ~ z( '- v f ñ x + z ^ 7 ¿

Nota: Si la po­
blación no es
normal pero 'r + z < | - ? ) ¿
n > 30

La Media
Si se asume que
a 2 es desconoci­
do
La diferencias de
Medias
2 2 - - *
CT\ y or2 Co­

nocidos
Nota: Si las
poblaciones no
son normales ' + -
pero n¡>30 y
H "i

n2>30

-60-
Capítulo IV Estimación Puntual y por Intervalos

La diferencia de
1 1
Medias (Xl- X 2)-t0* S j - + 1 1
(X) - X 2) +t0*SpJ - +-
Asumiendo que: i«i «2
2 2
= <? 2 y f (W1~0^|2+(n2
desconocidos. n\ + n 2 -2

La diferencia de o2 O2
(Aj Xrj) í{|_a/2jV) 1+ 2
Medias
h ”2
Asumiendo que:
p2 r<2
( £ i_+£2.)2 n\ n2
o f * o j y des­
v —
(S|2 /»l)2 (S2 / k2)2
conocidos.
«j-1 «2”^

La varianza
,n - 1)
d - t

c2
La razón de *^i /■
varianzas. f ( l - a 1 2 ,n j - 1,«2 -1 ) ^ 2 v ( ] - « / 2 , « 2 _ 1>w] “ O

La proporción
( 1 -*f )-)V
Í W --/»)
«
/? + z J 5 EW7 )
(1 - ^ ) V

La diferencia de (= uÉ :
proporciones. (fl ~P2>-\pg) * / — + -------
/?> M> v ^ A

-61-
Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

EJERCICIOS DESARROLLADOS

1. En una muestra de 250 neonatos de sexo masculino de 12 semanas de vida, se


obtuvo un peso medio de 5900 gr y una desviación típica de 94 gr. Obtener un
intervalo de confianza al 95% para el peso medio poblacional.
Solución:

n = 2 5 0, F = 5 9 0 0,
= 94, (i
1.9 6
Reemplazando en la relación

<J (7
X ~ ~~T= < ^ < X + Z
2

94 94
5900 - 1 .96- f= < / / < 5900+1.96
V25Ó J250

588&34<//<5911.65
El 95% de los neonatos tienen pesos que fluctúan entre 5888.34 y 5911.65
gramos, un 2.5% presenta pesos superiores a 5911.65 y el 2.5% pesos inferio­
res a 5888.34

-62-
Capítulo IV Estimación Puntual y por Intervalos

2. El colesterol de 30 pacientes seleccionados aleatoriamente tiene una media de


256 mg/dl y un desviación de 32 mg/dl. Determine el intervalo de confianza
para la media al 95%.
Solución:

n = 30, X = 256, s = 32, í n _ a _ _ n = 2 .0 4 5


v* 2 '

Reemplazando en la relación

,-T ^ S ^ . S
X ~ ~ ¡ = - /* - X + t

2 5 6 - 2 .0 4 5 2 L < f l < 2 5 6 + 2 .0 4 5 3
V s o - ^ Vio

2 4 4 .0 5 < / / < 2 6 7 .9

3. Un investigador entrevisto a 200 familias sobre sus antecedentes de enfermeda­


des oncológicas, de los cuales 140 afirman que algún familiar presento enfer­
medades oncológicas. Construir un intervalo de confianza del 95% para la pro­
porción de familias que presentan dicho problema de salud.
Solución:

140
P = 2Ó 0 = 0 ' 7 • V í > = 1'9 6 - " - 200

-63-
Cieto De La Torre Dueñas Yeny M. Accostupa Quispe

4. Dos tipos de extracto A y B, antiinflamantes se prueba experimental mente en


dos grupos de ratones. El extracto A, se aplicó a 250 ratones, el extracto B a
200 ratones. Después de aplicado los extractos se evaluó las reacciones adver­
sas que causan estos extractos en los ratones, obteniéndose que 75 ratones pre­
sentaron reacciones adversas con el extracto A y 80 con el extracto B. Utili­
zando un intervalo de confianza del 95% ¿ Se puede aceptar que es igual la
proporción de reacciones adversas con los dos tipos de extractos ?
Solución:
Extracto A

p x= = 0.3 # Ylx - 2 5 0
250
Extracto B

■Zj a —1.96
2

/ 0.3(l-0.3) ( 0.4(1-0.4)
(0 .3 -0 .4 )+ 1.96* V 250 1 200

-0.18 < { p x - P 2 ) <-0.011

El intervalo contiene solo valores negativos, entonces.

ÍP1- P 2) < 0 => P \ <P2

-64-
Capítulo IV Estimación Puntual y por Injtervaioi

De la relación anterior se concluye que la proporción de reacciones adversas no


es similar para ambos extractos, observándose que el extracto A presenta menor
nivel reacciones que el extracto B.

5. Un psicólogo desea evaluar la efectividad de dos terapias para tratar el proble­


ma de autoestima en adolescentes. Para ello agrupo a 50 adolescentes con
problemas de autoestima y se trató con la terapia A y 40 adolescentes se les
trato con la terapia B. Al final del estudio se midió el nivel de reducción del
problema de autoestima en una escala de 0 a 120, resultando las medias de 13
y 15 para las terapias A y B respectivamente y las desviaciones estándar res­
pectivamente son 3 y 4. Utilizando un intervalo de confianza del 95% para la
diferencia de medias ¿Podemos concluir que la reducción media de los rendi­
mientos de la terapia B es mayor que la de A?

Solución:
Terapia A

=13, o¡ =3, r\ =50

Terapia B

x2 =15, cr2 = 4, n2 = 4 0

1.96
=

-65-
Cleto De Lá Torre Dueñas Yeny M. Accostupa Quispe

(X x X 2) Z ( i - a / 2) * A 1 + 2 - M\ X 2)
V nx

- 3 . 4 9 < jux- ju2 < - 0 .5 0

Se concluye que la terapia B presenta mejores resultados que la terapia A.

6. Un psicólogo desea calcular el tiempo medio de respuesta de unos jóvenes a un


determinado sonido, para ello selecciona una m.a.s. de 25 universitarios para
participar en el experimento. El tiempo medio de respuesta para la muestra es de
160 milisegundos con una desviación típica de 5 milisegundos. Suponiendo que
el tiempo de respuesta de todos los individuos está normalmente distribuido.
Construya el Intervalo de confianza del 99%.

Solución:

X : Tiempo de respuesta

desconocida

1- a = 0,99 => t0 = 2 ,7 9 6 9
n = 25 ,* = 1 60 , s = 5

-66-
Capítulo IV Estimación Puntual y por Intervalos

S
r —t
A Lo
------- <
r m < x + t0 •
yjn yfñ

157,2031 < ju < 162,7969


El psicólogo puede afirmar con un 99% de conflabilidad, que el tiempo medio
verdadero de respuesta para todos los individuos similares a los que se emplean
en el experimento, está aproximadamente entre 157 y 163 milisegundos.

7. Un biólogo desea estudiar los efectos de ciertas drogas sobre el consumo de


agua en una especie particular de animales de laboratorio. La droga A que con­
tiene un agente que produce sed, se administró a una m.a.s. de 25 animales y la
droga B que no contiene tal agente se administró a una m.a.s. independiente de
22 animales similares. El biólogo registró la cantidad de agua consumida por ca­
da animal durante un periodo de tiempo determinado después de la administra­
ción de las drogas. Las cantidades promedio de agua consumida por animal en

cada uno de los grupos fueron respectivamente de xa = 50mi y xb =25 mi

Las desviaciones típicas son s A = 5 ,3 s B = 5 ,6

El biólogo supone que las dos muestras de respuestas son Independientes ¿cuál

será el Intervalo de confianza al 95% para ¡u A ~ M b

Solución:

X t = Cantidad de agua consumida, en m i , por un animal durante un periodo

de tiempo determinado después de la administración de las droga i.


i = A, B .

- 67 -
Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

2 _ 2
(i) Suponemos que las varianzas poblacionales son iguales. A ~ B

- ( W[~ 1)~‘yi2 + ( w2 ~ 1)-'s2 _ (25 - 1) •5,32 + ( 2 2 - 1) •5,62


= 29,616
nx+n2- 2 25 + 2 2 - 2

+— ( x , - x B) + t 0
' 11 n, v 7 nx n2

/ X 129,616 29,616 ^ , x ¡'29,616 29,616


(50-25)-2,014lJ— — + — - < / / A- / / 5 < (50-25) +2,014lJ-
25 22

21,7958 < Ma - M ü ^ 28,2041

2 2
(ii) Suponemos que las varianzas poblacionales son distintas. 5

rr Z n2
( —L - + —L - ) 2
v n\ n\
V
(¿j2 / * ! ) 2 t ( 5 | / » 2 ) 2
~1 n 2 -\

í r 5, 32 ^ a5,62^V
+
\ \ 25 y v 22 yy
V = 2,0126
f 5,32 5,62
'+
25 - 1 2 2 - 1

'JL
'A ,lB

-68-
Capítulo IV Estimación Puntual y por IntoM ilw

21,6909 < jUa -Mb ^ 28,3090

Podemos afirmar con un nivel de confianza del 95%, que la diferencia verda­
dera entre las medias poblacionales está aproximadamente entre 22 y 28 mi,

entonces se concluye M a ^ M b

8, Un especialista en control de la calidad de fármacos, analiza el contenido de 25


muestras. La media muestral resultó 2 mg y la desviación típica 0.08 mg. Constru­
ya un intervalo de confianza al 95% para la variabilidad de los contenidos.

Solución:
X =2
n=25.
5 = 0.08

Reemplazando en la relación anterior.


2

< a 2 <
X - 1) X ( f-, n - 1)

( 2 5 - l ) * 0 ,0 0 6 4 (2 5 - l ) * 0,00 64
3 9 ,3 6 1 2 ,4 0

0 ,0 0 3 9 0 2 4 3 9 < a 2 < 0 ,0 1 2 3 8 7 0 9 7

-69-
Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

El intervalo de confianza para la desviación es

0 , 0 6 2 4 6 9 5 0 5 < <7 < 0 ,1 1 1 2 9 7 3 3 5

El intervalo para el coeficiente de variación


0,062469505 0 111297335
*10 0% < C V ( X ) < ’ 10 0 %

3,12% < C V (X ) < 5 , 5 6 %


El contenido se encuentra bajo control.

9. Se analiza los niveles de hemoglobina en la sangre de 9 trabajadores mineros,


por parte de los Laboratorios A y B, obteniendo los siguientes resultados.

Solución:

Laboratorio A 17.4 18.2 18.5 19.3 19.7 20.6 21.7 24.1 15.9
Laboratorio B 17.6 18.3 18.5 19.4 19.8 20.6 22 24.2 16.1

Construya un intervalo de confianza al 95% para el cociente de varianzas?. ¿Pue­


de concluirse que los dos laboratorios presentan similar nivel de confianza en los
resultados?
Solución:
XA Xb X2a i X2b
17,4 17,6 302,8 310
18,2 18,3 331,2 335
18,5 18,5 342,3 342
19,3 19,4 372,5 376
19,7 19,8 388,1 392
20,6 20,6 424,4 424
21,7 22 470,9 484
24,1 24,2 580,8 586
15,9 16,1 252,8 259
175,4 176,5 3466 3509

-70-
Capítulo TV Estimación Puntual y por Intervalos

— 1 7 5 >4
XA = ^ = — — = 19,49 .
n 9

— Y j Xíb 176,5
X' = n m —

s 2a= ^ X‘ ~ X a 1 9 ,4 9 2 = 5,2609
n 9

2 X x¡ - 2 3 5 0 8 ,5 1 2
í* = — -■ - x B = -------- --------- 1 9 ,6 1 = 5 ,2 3 8 7 .
n 9
r»2 _2 «2
^ /*
_2 •/ ( a /2 ,n - l,w - l) 2. ~~~¿2 J ( \- a ! 2 ,n - \,n - \)
'~*B ^B

5,2609 _ , . ^ cr* 5,2609


—---------- * 0 , 3 1 4 £ — 4" ^ — *3,18
5,2387 ; <7‘ 5,2387

0,3 15 < — y < 3 , 1 9

2
4 __ 1 7 2
Se concluye — ^ — I , entonces cr " = <j B
° b

10. Se tomaron dos muestras de presión sistólica (en mm Hg.) a sujetos normales
(X) y sujetos hospitalizados (Y), obteniéndose la siguiente información:
Normales (X) : 146 142 135 140 154 163 138 168
Hospitalizados (Y) : 164 176 165 172 169 171

-71-
Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

a) Determine entre qué valores se encuentra la presión sistólica media de la


población de sujetos normales con un nivel de confianza del 95%.
b) ¿Podría Ud. afirmar que la presión sistólica media de los sujetos hospitali­
zados es mayor que la de los sujetos normales? Use un nivel de significa­
ción de 0.05
c) ¿Es la varianza de la presión sistólica en la población de sujetos hospitali­
zados igual a 16 (mm Hg.)? Use un nivel de significación de 0.05
d) Un médico afirma que la presión sistólica de los sujetos hospitalizados es
menor que 175 mm Hg. Verifique tal afirmación usando un nivel de con­
fianza del 95%.
Solución:
2
a) Cf es desconocida, por tanto la relación a emplear es:

- , S ^ ^ s
X ~ ^(1 - a / 2 - 1 ) /— ^ M — X + t ( i - a / 2, n~l ) j—

Normales
1 146 5,0625
2 142 39,0625
3 135 175,5625
4 140 68,0625
5 154 33,0625
6 163 217,5625
7 138 105,0625
8 168 390,0625

Totales 1186 1033,5

-72-
Capítulo IV Estimación Puntual y por Intervalos

i 1186
— ■' =1 14 8 . 2 5
8

I (* , - * ) J 1033.5
s 2 = -/=l- 147. 64
n —1 8-1

s = \ - & --------- = Vi 47.64 = 12.15


V n- 1

t { \ - a I2,n~\) = 2 . 3 6 5

X t(\-a!2,n-\) /— — M — X + t a ¡2,n-\) /—
y jn y/n

12 15 12 15
148.25 - 2. 365- — 148. 25 + 2.365
V8

138,09 < n < 1 5 8 , 4 0 9

b) En forma similar, desarrollamos el intervalo de confianza para los pacientes hospi­


talizados.

Hospitalizados X. (x,-x) 2
1 164 30,25
2 176 42,25
3 165 20,25
4 172 6,25
5 169 0,25
6 171 2,25
Totales 1017 101,5
Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

X = -í¿j = - •• - - = 1 6 9 .5
n 6

8 v2
E ( * * - * ) 1015
S 2 = ^ 20. 3
n -1 6- 1

E ( x. ~ x )2
s = \|^> = V 2 0 . 3 = 4.51
n - 1

^(1 - a / 2 , n - l ) = 4 , 0 3 2

1 6 9 , 5 - 2 , 5 7 1 — LL- < n < 148,25 + 2,571 4-51


■y/ÍT ~ Vó’
1 6 4 , 7 6 6 < // < 174,23 4

El IC de la presión sistólica para los pacientes normales es:


1 3 8 , 0 9 < ju < 1 5 8 , 4 0 9

El IC de la presión sistólica para los pacientes hospitalizados es:


1 6 4 , 7 66 < // < 1 7 4 , 2 34

Los dos intervalos no presentan elementos comunes por tanto la presión sistólica
entre el grupo de sujetos normales y hospitalizados difiere significativamente.
Los sujetos hospitalizados presentan mayores valores en su presión sistólica.

c) S 2 = 2 0 .3

2 = 0 . 8 3 1 x} „ s = 12.83

-74-
Capítulo IV Estimación Puntual y por Intervalos

El Intervalo de confianza para la varianza, esta dado por:

( „ - o -

7,91 1 < o- 2 < 1 2 2 . 2 8 9

La varianza de la presión sistólica en la población de sujetos hospitalizados es


igual a 16 (mm Hg)

d) Como el intervalo de confianza de la presión sistólica de los pacientes hospitaliza­


dos es: 1 6 4 , 7 6 6 < // < 1 7 4 , 2 3 4 , por tanto al 95% se confirma la sos­

pecha del médico.

-75-
Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

EJERCICIOS PROPUESTOS

1. Según un estudio sobre los niños que padecen dolor de pecho, realizado por
Selbst, Ruddy y Clark (Clinical Pediatrics, 1990), se ha hallado que de 137 ni­
ños que tenían dolor de pecho, 100 daban radiografías de tórax normales.

a) Obtener un intervalo de confianza del 95% para la proporción de niños con


dolor de pecho que dieron radiografías normales.

b) Hallar el mínimo tamaño muestral para que el error cometido en la estima­


ción de p sea inferior a 0,1, al nivel de 95%.

2. La cantidad mínima requerida para que un anestésico surta efecto en una inter­
vención quirúrgica fue por término medio de 50 mg, con una desviación típica
de 10,2 mg. En una muestra de 60 pacientes. Obtener un intervalo de confianza
para la media al 99%, suponiendo que la muestra fue extraída mediante muestreo
aleatorio simple sobre una población normal.

3. Se desea hacer un estudio del efecto de la terapia de parejas, para tal fin se ha
medido el nivel de discrepancias en una escala de 0 a 100 antes y después de la
terapia.

Antes 120 90 110 105 95 60 70


Después 70 53 65 62 56 65 76

En base a la información cuál es su conclusión a! 95% de confianza respecto al


estudio.

-76-
Capítulo IV Estimación Puntual y por Ir vjpóv

4. Una psicóloga afirma que los hombres, son monos variables en agresiviei i hacia
sus hijos cuando tienen conflictos con su pareja que las mujeres.
Para contrastar dicha afirmación selecciona una muestra aleatoria de 150 parejas
casadas con conflictos con su pareja y se mine su agresividad, obteniéndose que
100 mujeres y 70 hombres son más agresivos con sus hijos. Con 99% de con­
fianza que se puede decir respecto a la información de la psicóloga.

5. De acuerdo con un método de análisis del contenido de plomo en el agua, el


promedio aritmético y desviación estándar del agua son 20.2 y 10.8 pg/L, res­
pectivamente. Un estudio de 40 muestras de agua produce una media de 24.75
pg/L. Halle el intervalo de confianza del 95% para la inedia.

6. En un estudio sobre seguridad de explosivos usada en ciertas minas, los explosi­


vos que contenían nitrato de potasio se utilizaron en 95 de 250 casos estudiados.
Construya un intervalo de confianza del 98% sobre la proporción de empresas
que utilizan nitrato de potasio en los explosivos.

7. Debido a las variaciones en las técnicas de laboratorio, a las impurezas de los,


materiales y a otros factores desconocidos, los resultados de un experimento en
un laboratorio de química no siempre dan las mismas respuestas numéricas. En
un experimento de electrólisis, una clase mide la cantidad de cobre precipitado
de una solución saturada de sulfato de cobre, durante un período de 30 minutos.
Los 40 estudiantes consiguieron una media de 0.145 moles y una desviación
estándar de 0.051 moles. Determine un intervalo de confianza del 90% para la
cantidad media de cobre precipitado.

8. La cantidad mínima requerida para que un anestésico surta efecto en una inter­
vención quirúrgica fue por término medio de 50 mg, con una desviación típica

-77-
Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

de 10,2 mg, en una muestra de 60 pacientes. Obtener un intervalo de confianza


para la media al 99%, suponiendo que la muestra fue extraída mediante muestreo
aleatorio simple sobre una población normal.

9. Un cardiólogo se encuentra interesado en encontrar límites de confianza al 90 %,


para la presión sistólica tras un cierto ejercicio físico. Para tal propósito se se­
lecciona una muestra de 50 individuos , obteniendo una media de 13 y una des­
viación de 3 y suponemos que el comportamiento de la v.a. es normal.

10. En una muestra de tabletas de aspirinas, de las cuales observamos su peso ex­
presado en gramos, obtenemos:

1,19; 1,23; 1,18; 1,21; 1,27; 1,L7; 1,15; 1,14; 1,19; 1,2

Suponiendo la Normalidad para esta distribución de pesos, determinar un inter­


valo al 80% de confianza para la varianza.

11. Para valorar el incremento del tiempo de reacción producido por una alcohole-
mia de 0.6g/l se realiza un ensayo clínico con una muestra de 12 sujetos que se
dividen al azar en dos grupos: El primero con alcoholemia 0 y el segundo grupo
en el que los participantes ingieren alcohol hasta alcanzar un nivel de alcohole­
mia de 0.6g/I. La tabla muestra el tiempo de reacción en ambos grupos.

-78-
Capítulo IV Estimación Puntual y por Intervalos

TIEMPO DE
INDIVIDUO ALCOIIOLEMIA
REACCIÓN
1 0 35
2 0 25
3 0 40
4 0 20
5 0 50
6 0 40
7 0.6 35
8 0.6 55
9 0.6 65
10 0.6 45
11 0.6 50
12 0.6 70

Podemos concluir que la alcoholemia de 0.6g/l incrementa el tiempo de reacción.

-79-
CAPÍTULO V

PRUEBAS DE HIPÓTESIS
Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

5.1. PRUEBAS DE HIPÓTESIS

En muchas situaciones el investigador tiene alguna idea o conjetura sobre el


comportamiento de una o más variables en la población.
El diseño de la investigación debe permitir probar la veracidad de sus ideas so­
bre la población en estudio, en base a los datos de la muestra.

La idea o conjetura es una hipótesis y el procedimiento de toma de decisión


sobre la hipótesis se conoce como prueba de hipótesis.
Una hipótesis estadística es una conjetura sobre el comportamiento probabilís-
tica de una población.

Si la hipótesis estadística identifica por completo la distribución, recibe el


nombre de “hipótesis simple' , y si no la especifica recibe el nombre de
“hipótesis compuesta’ .
La prueba de hipótesis tiene por finalidad decidir si una conjetura respecto de
un tema de investigación puede considerarse cierta, o debe rechazarse, basán­
donos en la información suministrada por una muestra.

Hipótesis nula (denotada como 110). Esta hipótesis nula es la que se somete a
comprobación, y es la que se acepta o rechaza, como la conclusión final de un
contraste.

Hipótesis alternativa (denotada como Ha). Se denomina hipótesis alternativa


aquella hipótesis contra la cual queremos contrastar la hipótesis nula. Esta
hipótesis puede ser simple o compuesta. Podemos cometer dos tipos de error:
rechazar la hipótesis nula siendo ésta cierta (error de tipo 1) y aceptar la hipóte­
sis nula cuando esta es falsa (error de tipo Ií).

- 82 -
Capítulo V Prueba de Hipótesis

Aceptar Ho Rechazar lio


Ho verdadera Decisión correcta Error Tipo I
lio falsa Error Tipo 11 Decisión correcta

La decisión de rechazar, o no, la hipótesis nula la tomamos a partir de la infor­


mación proporcionada por la muestra (estadístico de prueba). Realizarnos una
partición del espacio muestral en dos regiones, la región crítica en la que se re­

chaza la hipótesis nula (tiene probabilidad OL si es cierta) y la región de

aceptación, en la que se acepta la hipótesis nula.

Antes de definir los pasos de una prueba de hipótesis se define algunos concep­
tos básicos.

1. Nivel de significación del contraste es la probabilidad de cometer un error


del tipo I, es decir, de rechazar la hipótesis nula siendo cierta , y se acos­

tumbra a denotar por CC

2. El contraste de hipótesis, es pues, un mecanismo mediante el cual se re­


chaza la hipótesis nula cuando existan diferencias significativas entre los
valores muéstrales y los valores teóricos, y se acepta en caso contrario. Es­
tas variables se medirán mediante una variable denominada estadígrafo de
contraste, que sigue una distribución determinada conocida, y que para ca­
da muestra tomará un valor particular.

3. La región crítica es el conjunto de valores del estadístico de contraste que


nos induce a rechazar la hipótesis nula

- 83 -
Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

5.2. PASOS DE UNA PRUEBA DE HIPÓTESIS.

Los pasos que son convenientes seguir para realizar la prueba de hipótesis
son:
1. Formulación de hipótesis.
Los supuestos planteados en la investigación nos llevan a formular hipóte-
sis estadísticas, las mimas que presentan las siguientes formas.

H l, -.e = e , vs
H , - . e = e a ys
H , - . e = 6 a vs H „ : 0 > 0 a

2. Elegir el nivel de significación & .


3. Estadístico de prueba
4. Determinar la región crítica. La forma de la región crítica depende de la
hipótesis alterna.

Para H a 6 * 0 0

i R.R. H0— +------------ R . A . H0 - - - — h— R-R> hc


Capítulo V Prueba de Hipótesis

Para H a 6 > 6 0

---------------- R.A. H0 f----R.R. H0— I

Para H á : 0 < 0 0

I— R.R. H0 — i------------------- R.A. H0 ----- ----------------

La región de rechazo de la hipótesis nula es la sombreada. Se rechaza lí,, cuan­


do el estadístico de prueba toma un valor comprendido en la zona sombreada y
se acepta Ho cuando el valor del estadístico de prueba cae en la región de acep­
tación, región no sombreada.

-85-
Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

5. Conclusión. Determinar las conclusiones estadísticas del contraste (aceptar


o rechazar Ho).
A continuación se presentan las pruebas de hipótesis en forma de resumen.

5.3. PRUEBAS DE HIPÓTESIS EN POBLACIONES NORMALES.

Pruebas de Hipótesis.
Estadístico
Rechazar Ho, si:
Hipótesis de Prueba
Hipótesis Nula
Alternativa

Prueba de
Medias
Ha: p*po
^7 __
\ZÁ>
H0: jli = po vs: c c r /y fñ
si cr2 conocido
- Si la pobla­ Ha: p>p0 Zc > Z( , - „ )
ción no es
normal pero n Z = X~r
c sHn A
>30 Ha: p<po

£
[

Ha: p^po

Prueba de
Medias
H0: p = p0 vs Ha: p>po rp __ X —/Jq Tc > ^ (\ —a ,n—\ )
Si se asume C ~ S/Jñ
que a 2 es des­
conocido

Ha: p<po Tc

-86-
Capítulo V Prueba de Hipótesis

Prueba de
diferencias de Ha: >z( 1 - f )
Medias
H0: pi =H 2 vs:
Asumiendo -í-+—
n\ n2
2 2
CT1 y o - 2 Ha: Pi>|^2
Zc >
Conocidos _ X t1- X ,
—Si las pobla­ !L+ i 2_
ciones no son "l "2
normales pero
n¡>30 y n{> Ha: p i < j L t 2
30
Prueba de
diferencia de
z >t(1-^,«1+^-2)
Medias
Ha:
H0: pi = \x2 vs 7 _ * \-X 2 T >
1c ^ lt (\-a,nx+n2-2)
Asumiendo que
2 2 c 5„ ^
O-J = c r2 y
Desconocidos
r< -¿
4/^-2

Ha: pi<P2

Prueba de
diferencia de T - > t
Medias X\-*2
r =
H0: j l l i = p2 vs Ha: \i&\x2 S'2 S’2
X+22.
Asumiendo m n2
que: Ha: )iii>H2 T
1c
> t ( l- a ,v )
2 2 (ll+ÍL)2
< T\*C Í y Vti] 112’
Ha: P-i<J-L2 V=
desconocidos} (S2/n¡)2 (S¡/n2)2
n \- \ r¡2-\
T < - t\ \ - a , v )
2c ^

-87-
Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

Ha: a 2 &Oq

£c > % i ^ n-X) 0

Ha:a 2 > ctq


Prueba de
varianzas ¿ > X ( \ - a , n- \ )
r 2 _ M * ’
H0: ct2 = CTq
vs

'w'
i
Ha:or2 < cXq

X c ^ X ( a ,n - l)

cr¡2 * a \
F<F ó
Prueba de
razón de va­
rianzas. Ha: cr2 > a \ o2
Z7 __ max
c - s 2.
H0: o f =0 2 umin
F F
vs c
Ha: cr2 < a \ F <F

Ha: p * po
Prueba de
proporciones Ha: p > po
Z c > Z (H )
H0:p=po Vs
^ _ P~Po

Ha: p < Po
Z c > V « )

4 < ~ V )

-88-
Capítulo V Prueba de Hipótesis

Ha: p,* p2 V— PcPi


> ^ (1 -f)
Prueba de Í «¡ n
diferencia de Ha: p,> p2
proporciones
Z c > z a -a y
_ n ]p + n 2p 2
H0: pi = P2 Vs
Ha: Pi< P2 Pe ~ p+n 2

-89-
Cleto De La Torre Dueñas Yeny M. Accostupa Quisi

EJERCICIOS DESARROLLADOS

1. La concentración media de dióxido de carbono en el aire en una cierta zona no


habitualmente mayor que 355 p.p.m.v. (partes por millón en volumen). Se So
pecha que esta concentración es mayor en la capa de aire más próxima a la s
perficie. Para contrastar esta hipótesis se analiza el aire en 60 puntos elegid*
aleatoriamente a una misma altura cerca del suelo. Resulto una media muestr
de 580 p.p.m.v. Suponiendo normalidad para las mediciones, proporcionan esfc
datos suficiente evidencia estadística, al nivel de 95% de confianza, a favor de
hipótesis de que la concentración media es mayor cerca del suelo? U
cr = 180.
Solución:
Formulación de hipótesis.
H0: p = 355
Ha: 355

Nivel de significancia, a = 5%

Estadística de prueba.

z a/yfñ

<7 = 1 8 0 , V * ) ^ 1 -6 4 5 , « = 6 0 , x, = 5 8 0

Z C
- 580-355 - 9 .6 8

-90-
Capítulo V Prueba de Hipótesis

Región critica

R egión R egión
A c ep tació n 1 ~ Crítica ~ ^

Conclusión.

Como Z c > Z 0

Se rechaza la hipótesis nula. La concentración media de dióxido de carbono en


el aire es mayor cerca del suelo.

2. Se tienen algunos indicios de que el consumo de tabaco tiende a provocar pro­


blemas de trombosis debidos a un aumento en la capacidad dé coagulación Para
estudiar esta hipótesis, Levine (1973) extrajo muestras de sangre de 9 indh iuos
antes y después de que fumasen un cigarrillo y midió la capacidad de agregación
de las plaquetas, obteniendo los datos siguientes (correspondientes al máximo
porcentaje de plaquetas que se agregaron después de haber sido sometida^ a un
estímulo adecuado):

Antes 25 25 27 44 30 67 53 53 52
Después 27 29 37 56 46 82 57 80 61
Diferencia 2 4 10 12 16 15 4 27 9

-91-
Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

3. Hay suficiente evidencia estadística al nivel de significación de 0,05 a favor de


la hipótesis de que los fumadores presentan una mayor tendencia a la formación
de coágulos? Indicar las condiciones que se requieren para que el test utilizado
sea válido.

Solución:
Formulación de hipótesis.
H0: Pd = 0
Ha: 0

Nivel de significancia, Ct — S°/o

Estadística de prueba.

T —
c S/ yf ü
s = 7 . 7 6 ,

I - a / 2,/» - 1 )
= 2 . 26 2

n = 9 , x, = 1 1
1 1 - 0

Región critica

-92-
Capítulo V Prueba de Hipótesis

R .R . H0— i- ------------ R .A . H 0— ------- 1---- R .R . H0— i

Conclusión.
Se rechaza la hipótesis nula. Los fumadores presentan una mayor tendencia a la
formación de coágulos.

4. Con el propósito de verificar la efectividad de un tratamiento basado en ejerci­


cios para el aumento de la talla en niños de 10 años en cm, se realizó un experi­
mento aplicando el tratamiento a 13 niños y considerando 16 como controles, el
que arrojó los siguientes resultados. Suponga que las varianzas poblacionales son
similares.

Tratados nx = 13 , x} = 138.6 , S 2 = 2 9 .1 6

Controles fi2 = 16 , X2 = 1 2 5 .8 , ~S ^ 2 = 2 6 .7

Solución:
Formulación de hipótesis.
H0: Lti =
Ha: pi^(a2

Nivel de significancia, a = 5%

-93-
Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

Estadística de prueba.
Supongamos que las varianzas poblacionales son iguales, entonces el estadístico
de prueba es:

T _ X x- X 2
c o / _ L , _L
P V«1 «2

De la información se tiene:

Tratados nx = 13 , x , = 1 3 8 . 6 , *S'12 = 2 9 . 1 6

Controles n 2 = 16 , x 2 = 125.8 , S 22 = 2 6 . 7

_ - 0 * 1 - /(13-l)*29.16+(l6-l)*26.7
^ p ~ \ n, + n 2 - 2 _ V 13+16-2

T , = . t. r, _ ,
S ' V " * ■■ 5 .2 7 * ^ / y V + jV

Región critica
T0 = ~ 2 ) = f0 975 (1 3 + 1 6 - 2 ) = f0 975 ( 2 7 ) = 2 . 0 5 2

Conclusión.

R.R. Ho— i------------- R.A. H0---------- h— R.R. H^

- 94 -
Capítulo V Prueba de Hipótesis

Como Tc > T q , entonces se rechaza Ho, por tanto el método los ejercicios

permiten mejorar el crecimiento.

4. Se aplica un medicamento a 15 pacientes que padecen cierta enfermedad, esco­


gidos al azar, y un placebo a 20 pacientes. En el primer grupo, la desaparición
del estado febril se observa a las 19 hrs de tratamiento en promedio con una
desviación de 2 hrs. En el grupo control, la mejoría se observa en promedio a las
25 hrs con una desviación de 3 hrs. ¿El medicamento modifica el tiempo de cu­
ración?

Solución:
Formulación de hipótesis.

H o I jUy = ¡¿ 2 , el medicamento es inocuo.

H a H \ ^ A 2 *e*medicamento produce efecto.

Nivel de significancia, a = 5 %

Estadística de prueba. r
(2 5 - 1 9 ) - 0
T 4 * = = 7.06

Región critica
Es un ensayo de dos colas donde los valores críticos se buscan en la Tabla /-
student, interpolando entre 30 y 40 grados de libertad.

*0 ^ ( i- a .,„ | + „ 2 _ 2 ) ^(0.975,20 + 15-2) *(0.975,33) = 2 .0 3 5 7

-95-
Cleto !>e La Torre Dueñas Yeny M. Accostupa Quispe

Conclusión.
Se acepta la hipótesis nula.

Como Tc > r 0 ,se rechaza Ho, es decir ju{ ^ ju2 •

El medicamento presenta efecto en el tratamiento de la enfermedad.

5. En un estudio sobre las preferencias de un grupo de especialistas, sobre el uso


de dos tipos de tratamiento A y B para una enfermedad. De 600 especialistas
encuestados, respondieron: 20% prefiere el tratamiento A para la enfermedad, y
15 % el tratamiento B. ¿Es posible concluir con 95% de confianza que las prefe­
rencias de los tratamientos A y B son similares?

Solución:
Formulación de hipótesis.
H0: pi =p2
Ha:p i* p 2

Nivel de significancia,

a = 5%

Estadística de prueba.

P \-P l
zc
Pe 0 P e) | Pe O P e)

Tratamiento A.

p { = 0.2 , Ylx - 6 0 0

-96-
Capítulo V Prueba de Hipótesis

Tratamiento B.

~ p2 = 0 . 1 5 , n 2 = 6 0 0

= »i T, + n2p~2 = 6 0 0 * 0 . 2 + 6 0 0 * 0 . 1 5 _ Q ^1 $
« i + « 2 6 0 0 + 6 0 0

2 - , P ' ~ p2 - ____________ 0-20-0-15____________ = 2279


C IP c O - P c ) , P c ( l - P c ) |o 175(1-0.175) 10.175(1-0.1757
Y n\ n2 V 600 600

Región critica

Región Región
Aceptación ~~ 1 Crítica
Conclusión.

Como Z c > Z o , se rechaza la hipótesis nula, por tanto pi* p2 La preferencia

de los especialistas por ambos tratamientos es diferente, observándose mayor


preferencia por el tratamiento A.

6. Un laboratorio de fármacos está interesado en la uniformidad de la máquina


que utiliza para llenar los fármacos. De manera específica, es deseable que la va­
rianza del proceso de llenado sea m enor que 0 .01, de otro modo existe un por­
centaje mayor que el deseable de botellas con un contenido menor de fármaco.
Supóngase que la distribución del volum en de llenado es aproximadamente

-9 7 -
Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

Normal. Al tomar una muestra aleatoria de 20 fármacos se obtiene una varianza


muestral de 0.0153. ¿Tiene el laboratorio problemas en el proceso de llenado de
las fármacos?. Realizar el contraste al 5% de significación.

Solución:
Formulación de hipótesis.
H0: cj2=0,01

Ha: (T2 >0,01

Nivel de significancia, a = 5%
Estadística de prueba.

2 ( 2 0 - l ) * 0 ,0 1 53
y = ------ -— ------= 29 07
%c 0,01

Región critica.

J a 9 5 ( l 9 ) = 3° . 14

Conclusión
2
Como % c ~ ^9, 07 < 30,14 ? Se acepta la hipótesis nula, por tanto la ma­

quina tiene homogeneidad en el embasado, se concluye que la maquina no pre­


senta problemas en el llenado.

7. Con el propósito de evaluar la homogeneidad de dos fármacos analgésicos, se


tomó una muestra aleatoria de 16 pacientes que fueron tratados con el analgési­
co A y una muestra aleatoria de 13 pacientes tratados con el analgésico B. La va­
rianza del efecto analgésico (reducción de dolor después del tratamiento) con el
analgésico A fue de 7,85 y con el analgésico B fue de 9,69 ¿Proporcionan estos

- 98 -
Capítulo V Prueba de Hipótesis

datos evidencia suficiente como para concluir que los dos analgésicos presentan
resultados homogéneos en la reducción de dolor en los pacientes, suponiendo
que tienen similares efectos?

Solución:

X j : Reducción de dolor con el analgésico A

^2 : Reducción de dolor con el analgésico A

Formulación de Hipótesis.

H 0 : er,2 = a \
9
H |:a\ * a 2

Nivel de significancia. Oí — 0,05

Estadísticos de Prueba

„ s¡ 9,69
F c ~ 7 = — = 1, 2 3 4 3 9
J, 7,85

Región critica.
La RC - {F ! F < (l / 3,18 ) = 0,314 v F > 2,96 }

Conclusión.

Como F c = 1,2 3 4 3 9 Sé R C => Aceptamos la H 0

Los dos fármacos presentan similares resultados de homogeneidad en la reduc­


ción de dolor.

-99-
Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

8. Encada uno de los siguientes casos especifique:


a. El Propósito Estadístico.
b. El Valor final de las variables en estudio, si es el caso
c. La Prueba de inferencia estadística a emplean
d. Criterio para aceptar o rechazar la hipótesis nula (Ho).

Caso A:
Se desea producir evidencia acerca del efecto de la ingesta excesiva de ju­
gos de frutas (>350ml/día), en el peso y la talla de niños de 2 a 5 años. Para
ello se seleccionan mediante procedimiento aleatorio un grupo de niños varo­
nes con la condición dietética descrita.

a. Propósito Estadístico.

El propósito estadístico,en este caso es evaluar el efecto (Incremento o


disminución) de la ingesta excesiva de jugos de frutas en el peso y la ta­
lla de los niños de 2 a 5 años.

b. Valor final de las variables.

Las variables en estudio tienen como valor final el Peso y talla después
del efecto de la ingesta de Jugos de fruta.

c. Prueba estadística a emplear:

La prueba estadística que se empleara en este caso será la prueba de me­


dias, (prueba bilateral o de dos colas), es decir se realizara una compara­
ción entre el antes y después del efecto de la ingesta de fruta en el peso y
la talla de los niños de 2 a 5 años.
Peso

H o * (¿antes = (¿ d e s p u é s V S H l I (¿antes^M'después

-100-
Capítulo V Prueba de Hipótesis

Talla

H q! (¿antes = (¿después V S H | ! (¿antes’^ d e sp u é s

d. Criterio para aceptar o rechazar Ho.

El valor estadístico

y _ x,~x2
c V»i *
Rechazar Ho, si |Zt.| > h

Caso B:
A un grupo representativo de mujeres solteras en edad reproductiva (MER) se
les administra vacuna contra la rubéola. Se estimara el porcentaje de dichas
MER en las cuales se logró el éxito (protección), a través del dosaje de anti­
cuerpos específicos.

a. Propósito Estadístico.

Evaluar el efecto de la vacuna contra la rubéola en mujeres solteras en


edad reproductiva.

b. Valor final de las variables.

Protección contra la rubéola o la no protección.

c. Prueba estadística a emplear.

Ho:pi =P 2 VS Hi:pi>p2
Donde:
Pi: Porcentaje de Mujeres sin protección.
P2: Porcentaje de Mujeres con protección.

-101-
Cleto De La Forre Dueñas Yeny M. Accostupa Quispe

d. Criterio para aceptar o rechazar lio.

¡PcQ-Pc), PcQ-Pc) y
V fh "2

= nxp x+ n 2p 2 ,
re
n\ + n2
Rechazar Ho, si Z c > z x_a

Caso C
Se desea demostrar la eficacia de dos estrategiaseducativas (expositiva vs ta­
ller), para el cambio de actitud y conducta de los jóvenes acerca del uso de
protección en sus relaciones sexuales para evitar infecciones de transmisión
sexual (ITS) y embarazos no deseados (EnD). La actitud será expresada en un
puntaje producido por una escala de valoración y también en categorías (favo­
rable/desfavorable). La conducta se medirá en la incidencia de ITS y de EnD.

a. Propósito Estadístico.

Analizar la eficacia de las estrategias educativas “Expositiva” y de “ta­


ller” en el cambio de actitud y conducta de los jóvenes acerca del uso de
protección en sus relaciones sexuales;

b. Valor final de las variables.

Actitud favorable o desfavorable respecto a la protección en rela­


ciones sexuales.
Incidencia o no de enfermedades de transmisión sexual y embarazos
no deseados.

-1 0 2
Capítulo V Prueba de Hipótesis

c. Prueba estadística a emplear.

Para la actitud.

fl, Actitud favorable


X = \
[0, Actitud desfavorable

H0: p i = P 2 VS Hf. p i > p 2

Donde:
Pj: actitud favorable con la estrategia expositiva.
P2: actitud favorable con la estrategia taller.

d. Criterio para aceptar o rechazar lio.

n i P i + n 2P i
jPcO-Pc) ,PcO-Pc) ~N (0* i) y Pe -
«i+n2
V «I >h

Rechazar Ho, si |Zt | >

Para la conducta.

íl, Incidencia de ITS y EnD


[0, no incidencia de ITS y EnD

H<>: pi =P2 VS H | : p i > p 2

Dónde:
Pi ¡Incidencia con la estrategia expositiva.
P2:Incidencia con la estrategia taller.

-103-
Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

e. C riterio para aceptar o rechazar Ho.

PrPi ” i P i + n 2p 2
feo-#),PcQ-Pc) ~N (°>]) y Pe=

Rechazar Ho si |Zt>| > z] ja

Caso D
Mediante selección aleatoria se forman grupos de madres de familia de los es­
tratos socioecomicos bajo, medio y alto para indagar el gasto mensual en salud
expresado a través del porcentaje (%) del ingreso económico mensual.
Además se recogerán datos sobre el perfil de morbilidad (enfermedades trans­
misibles, enfermedades no transmisibles, accidentes y violencias y adicciones),
de los miembros de la familia.
a. Propósito Estadístico.
Evaluar si el gasto familiar en salud difiere de estrato socioe­
conómico a otro estrato.
Evalüar la influencia del estrato socioeconómico en gastos de
salud.

b. Valor final de las variables.


Perfil de morbilidad de las familias en los tres estratos socioeconó­
micos.

c. Prueba estadística a emplear.


Análisis de varianza

H o 'M x = M 2 = M i

H ,: //. ^ fJ. j , para algún par (i, j)

-104-
Capítulo V Prueba de Hipótesis

Donde:

//,: Gasto en salud de las familias de estrato bajo

/A : Gasto en salud de las familias de estrato medio


ju ^ : Gasto en salud de las familias de estrato alto

d. Criterio para aceptar o rechazar lio.


Se rechaza Ho si Fc > Fo

Caso E
Se desea encontrar evidencia acerca del tiempo de supervivencia y la calidad
de vida de las mujeres que han sido operadas por cáncer de mama.
Simultáneamente se estudiara la influencia del tiempo de enfermedad, tipo his­
tológico, estadio de la neoplasia, quimioterapia, edad y adherencia a la qui­
mioterapia y al control, en el tiempo de sobrevivencia. Para la calidad de vida
(buena / deficiente), se recogerán datos acerca de la adherencia a la rehabilita­
ción, actividad física (ejercicio), dieta, apoyo familiar y resiliencia.

a. Propósito Estadístico.

Evaluar el tiempo de supervivencia y la calidad de vida de las muje­


res operadas por cáncer de mama.
Influencia del tiempo de enfermedad, tipo histiologia, estadio de
neoplasia,...en el tiempo de supervivencia.

b. Valor final de las variables.

Calidad de vida.
Tiempo de supervivencia.

-105-
Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

c. Prueba estadística a emplear.


Para evaluar la influencia del tiempo de. enfermedad, tipo histiologia,
estadio de neoplasia,... en el tiempo de supervivencia, se aplicada
regresión logística.
Para evaluar la calidad de vida (buena/deficiente) en función a la ad­
herencia a la rehabilitación, actividad física, dieta, apoyo familiar y
residencia se puede aplicar la regresión logística, también se puede
aplicar la prueba de chi cuadrado.

d. Criterio para aceptar o rechazar Ho.

Caso F
Se desea establecer la influencia de la edad, el peso y la talla, en el índice me­
tabólico de reposo (metabolismo basal) en una muestra representativa de hom­
bres y mujeres de la ciudad de Arequipa.
a. Propósito Estadístico.
Influencia de la edad, peso y talla en el índice de metabólico de re­
poso.

b. Valor final de las variables.


índice de metabólico de reposo.

c. Prueba estadística a emplear.


Si el índice es un valor que varía de 0 a 1Q0% se aplicara el análisis
de regresión lineal.
Ho: No Influye la edad, peso y talla en el índice de metabólico de
reposo
Ho: Influye la edad, peso y talla en el índice de metabólico de reposo

-1 0 6 -
Capítulo V Prueba de Hipótesis

d. Criterio para aceptar o rechazar Ho.

Caso G
Se desea evaluar la influencia de la contaminación atmosférica, la condición de
“fumador pasivo”, antecedente familiar, presencia de polvo. Humedad y pre­
sencia de animales domésticos (perros, gatos, aves), en la incidencia de “en­
fermedades respiratorias” en la población infantil (1-14 años) en los hogares
de la ciudad de Arequipa.
a. Propósito Estadístico.

Influencia de la contaminación atmosférica, la condición de fumador


pasivo, presencia de polvo, humedad y presencia de animales
domésticos en la incidencia de enfermedades respiratorias.

b. Valor final de las variables.


Presencia o ausencia de enfermedades respiratorias.

c. Prueba estadística a emplear.


La presencia es éxito y la ausencia es fracaso, por lo tanto la variable
respuesta es dicotómica, razón por la cual se puede aplicar la regre­
sión logística.

Ho: No Influye la contaminación atmosférica, la condición de fu­


mador pasivo, presencia de polvo, humedad y presencia de
animales domésticos en la incidencia de enfermedades respira­
torias.
H/: Influye la contaminación atmosférica, la condición de fumador
pasivo, presencia de polvo, humedad y presencia de animales
domésticos en la incidencia de enfermedades respiratorias.

d. Criterio para aceptar o rechazar Ho.

-107-
Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

EJERCICIOS PROPUESTOS

1. Se escogen al azar dos grupos formados por 20 individuos cada uno, entre los que
padecen cierta alergia. Se administra una droga curativa al primer grupo y se ob­
serva una mejoría en 15 de los casos. Al segundo grupo se le administra un pla­
cebo y mejoran 13 de ellos. En base a la información cual es su conclusión.

2. Se selecciona 5 pacientes al azar, del grupo que concurre diariamente al Labora­


torio de Análisis Clínicos a efectuarse una determinación de Uremia. Las mues­
tras extraídas se miden con el procedimiento habitual y además con una nueva
técnica clínica que se desea probar. Analiza si hay diferencia entre ambas técni­
cas. Los resultados ,expresados en g/1 fueron:

Pacientes Vieja Nueva Diferencias


1 0.38 0.33 0.05
2 0.54 0.45 0.09
3 0.22 0.15 0.07
4 0.11 0.09 0.02
5 0.23 0.22 0.01

3. El jefe de un laboratorio se encuentra con una técnica de medición fuera del con­
trol estadístico. Para investigar las causas decide investigar si el factor humano
tiene incidencia, y toma una muestra de suero cualquiera la divide en 20 alícuo­
tas. Luego elige 10 de ellas al azar y se las entrega al laboratorista 1 para que
haga las determinaciones; las restantes las encomienda al laboratorista 2 para que

las mida. Los resultados obtenidos son: —2.4 es la varianza obtenida por el

laborista, 1 y Sj = 0.8 para el otro. ¿Hay diferencia en dispersión entre ambos?

-108 -
Capítulo V Prueba de Hipótesis

4. Dos tipos de soluciones químicas A y B fueron ensayadas para medirle su pH. Se


tomaron 6 muestras de A que dieron una media de 7,48 con un desviación de
0,02. De la B se tomaron 5 muestras y se obtuvo una media de 7,32 con un des­
viación de 0,03. Con esta información se puede concluir al 95% de confianza que
ambas muestras tienen el mismo pH.

5. Un dentista afirma que el 40% de los niños de 10 años presentan indicios de ca­
ries dental Tomada una muestra de 100 niños, se observó que 36 presen­
taban indicios de caries. Contrastar la hipótesis del dentista para un nivel de con­
fianza del 90%.

6. Una compañía farmacéutica afirma que cierto medicamento elimina el dolor de


cabeza en un cuarto de hora en el 90% de los casos. Tomada una muestra de 200
pacientes a los que se les administro el medicamento, se observó la desaparición
del dolor en 170 de ellos. Contrastar la hipótesis de la compañía al 95% de con­
fianza.

7. Se deseaba saber si los individuos sometidos a dos tipos de intervenciones con


objeto de curar fracturas en el brazo, y sometidos al mismo tipo de rehabilitación,
conseguían la misma fuerza. Para ello, después de un mes de la intervención y

tras 15 días de ejercicios de rehabilitación, se les sometió a una prueba consisten­


te en levantar pesos progresivos con el brazo afectado hasta llegar a un máximo.
¿Qué se puede afirmar a la vista de los resultados que se muestra a continuación?:

T, t nx = 8 , = 1 2 .3 , s? = 4 . 6 1
intervención 1: 1 1 '

f * ■. •, o ni - 15, x7 = 11.1, s* = 4.35


Intervención 2: 2 1
Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

8. Se sabe que los individuos con un infarto temprano (antes de los 35 años) tienen
un riesgo alto de volver a sufrir otro infarto en los siguientes 5 años. Se piensa
que tal riesgo se reduce si las personas con infarto temprano se someten a una se­
rie prolongada de ejercicios de esfuerzo. ¿Qué se puede decir de la efectividad de
tales ejercicios si, de 60 personas sometidas a ellos, 16 registraron un nuevo infar­
to, en tanto que ello sucedió en 83 personas de las 198 que no se sometieron a los
mismos?

9. Se desea probar la efectividad de una vitamina en el crecimiento de ratas. De


una muestra aleatoria de 20 ratas se escogen al azar 12 para aplicarles el trata­
miento y se dejan 8 como controles (no se les aplica el tratamiento). Después de
un tiempo se miden las ratas y sus longitudes (en pulgadas) fueron las siguientes :
Tratadas : 7.4 ; 7.4 ; 7.5 ; 7.6 ; 7.9 ; 7.9 ; 8.0 ; 8.1 ; 8.2 ; 8.3 ; 8.4 ; 8.4
Controles : 7.2 ; 7.3 ; 7.4 ; 7.3 ; 8.0 ; 8.2 ; 8.2 ; 8.5
a) Pruebe la hipótesis de que la vitamina es efectiva (proporciona longi­
tudes mayores) con un nivel de confianza del 95%.
b) Encuentre un intervalo de 90% de confianza para la diferencia de
longitudes entre los dos grupos.
c) Pruebe la hipótesis de que la varianza poblacional para los tratados
es de 0.8 pulgadas cuadradas a un nivel de significación de 1%.
d) Si se desea estimar el crecimiento medio de las ratas tratadas con una
confiabilidad de 95% y un error no mayor que 0.5 pulgadas ¿Cuántas
ratas se deben escoger para aplicarles el tratamiento?

10. Se sospecha que una nueva droga es efectiva en el 90% de los casos para una
cierta enfermedad, pero el laboratorio que fabrica dicha droga cree que es efecti­
va en menos del 90%. En una muestra aleatoria de 400 personas que tenían esa
enfermedad, 320 sanaron con la aplicación de la droga.

-110-
Capítulo V Prueba de Hipótesis

a) ¿Cree Ud. que el laboratorio tiene razón? Use una significación de 1%.
b) ¿Entre qué valores se encuentra la verdadera proporción de efectividad
de la droga con una confiabilidad de 95%?
c) Si se desea estimar la proporción de efectividad de la droga con un error
de 5% y una confiabilidad de 95% ¿En cuántas personas deberá ser apli­
cada la droga? (Use la muestra anterior como muestra piloto)

11. Un psicólogo desea evaluar la eficacia de dos terapias para tratar problemas de
estrés, para ello selecciona al azar 70 pacientes y forma aleatoriamente dos grupos.
El primer grupo de 30 pacientes fue tratado con la terapia A y el segundo grupo de
40 pacientes con la terapia B. Al cabo de un tiempo se les mide su nivel de estrés
en una escala de o a 100. los resultados son, para la terapia A, su media es 40 y pa­
ra la terapia B es 60. Suponiendo que las desviaciones son
a , = 5 5 .,<j 2 = 2 0 .A l nivel de significancia del 2%, cuál es su conclusión.

12. El colegio de psicólogos realizo un estudio para comparar la efectividad de dos


terapias para tratar problemas de suicidios en adolescentes, para tal efecto se
consideró 300 pacientes para la terapia A y 100 para B, resultando que la terapia
tuvo efecto en 25 y 40% de los casos respectivamente. Al nivel de confianza del
95%, cuál es su conclusión.

13. Se afirma que cierta terapia que se prescribe para tratar la ansiedad es efectiva
en menos del 50% de los casos. AI parecer esta afirmación no se ajusta a la rea­
lidad, por lo que se les aplica esta terapia a 70 pacientes, resultando que 50 de
ellos han experimentado mejoras. Hay suficiente evidencia para concluir que re­
almente la terapia es efectiva en más del 50% de los casos al nivel de significan­
cia del 5%.

-111-
Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

14. Un psicólogo afirma que su terapia para tratar la depresión en adolescentes es


efectiva, reduciendo en promedio 18 unidades en una escala de 0 a 100. El jefe
de la unidad de terapia piensa que esta cifra es exagerada y pide realizar un es­
tudio. En una muestra de 10 adolescentes que fueron tratados con esta terapia se
ha medido el nivel de reducción de la depresión ,obteniéndose los siguientes re­
sultados 17,18,23,20,19,16,17,22,25,16. Con un nivel de confianza del 97% cual
es su conclusión.

15. Se afirma que cierta terapia que se prescribe para tratar la ansiedad es efectiva
en 60% de los casos. Al parecer esta afirmación no se ajusta a la realidad, por lo
que se les aplica esta terapia a 35 pacientes, resultando los siguientes datos
1,0 ,0 , 1, 1, 1, 1,0 , 1,0 , 1, 1, 1, 1, 1,0 ,0 , 1,0 ,0 , 1, 1, 1, 1, 1,0 ,0 ,0 , 1,0 , 1,0 , 1,0,1 donde 1 indica

que el tratamiento es efectivo y 0 que no es efectivo para tratar la ansiedad. En


base a la información, cuál es su conclusión respecto a la terapia al 98%.

16. Se van a probar dos medicamentos, A y B, contra una enfermedad. Para esto
tratamos 100 ratones enfermos con A y otros 100 con B. El número medio de

horas que sobreviven con A es X - 1200 y el número medio con B es Y -


1400. Suponiendo Normalidad en ambos casos.
a) Se puede aceptar igualdad de varianzas al 95% de confianza, si sabemos que

£ (Xí X ) 2 = 900000 y Y j ( y¡ - Y ) 2 = 9 5 0 0 0 0

b) Es más efectivo el medicamento B? Plantear el contraste adecuado para Es­


tudiar esto con un nivel de confianza del 95%.

17. El límite superior especificado de impurezas de una sustancia es 0.01 por 100. El
analista repite el análisis cinco veces y encuentra los siguientes resultados:

-112 -
Capítulo V Prueba de Hipótesis

0.009, 0.012, 0.0113, 0.0821 y 0.0915. Teniendo en cuenta el error experimental,


¿es significativamente superior el promedio de impurezas al especificado del
0 .01 %?. <x=0.01

18. Se instala un nuevo dispositivo de filtrado en una unidad química. Antes y después
de su instalación una muestra aleatoria proporcionó los siguientes resultados
acerca del porcentaje de impurezas:

Tamaño de Promedio
Tiempo Varianda
muestra aritmético
Antes 40 12.5 101.17
Después 35 10.2 94.73

¿Ha reducido significativamente el porcentaje de impurezas el dispositivo de filtra­


do?. 06=0.05

19. Un biólogo sostiene que las concentraciones altas de actinomisina D inhiben la


síntesis de ARN en las células y, por consiguiente, también la producción de pro­
teínas. En un experimento realizado para probar esta teoría, se compara la sínte­
sis del ARN en células tratadas con dos concentraciones de actinomisina D, 0.6 y
0.7 microgramo por milímetro, respectivamente. De las 70 células tratadas con la
concentración más baja, 55 se desarrollaron normalmente, mientras que sólo 28
de las 50 tratadas con la concentración alta se desarrollaron normalmente. ¿Pro­
porcionan estos datos suficiente evidencia para concluir que hay diferencia entre
las tasas de síntesis del ARN normales para las células expuestas a las dos con­
centraciones de actinomisina D?. a= 0 .10

-113-
Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

20 . Se pretende demostrar que cierto tratamiento practicado durante un mes, ayuda a

reducir el colesterol. Para ello se realiza un estudio con una muestra aleatoria
simple de 10 personas. Los resultados se muestran a continuación.

Antes 200 210 330 240 260 300 245 210 190 225
Después 150 200 275 250 200 250 200 180 190 205

¿Qué podemos concluir de estos datos?.

21. Muchos especialistas afirman que los pacientes con depresión tienen una función
cortical por debajo de lo normal debido a un riego sanguíneo cerebral por debajo
de lo normal. A dos muestras de individuos, unos con depresión y otros norma­
les, se les midió un índice que indica el flujo sanguíneo en la materia gris (dado
en mg/( 100g/min)) obteniéndose:

Tamaño de muestra Media Desviación

Depresivos 19 47 7,8

Normales 22 53,8 6,1

Con un 95% de confianza cuál es su conclusión.

22. Se sabe que el 70% de los pacientes internados en un hospital traumatológico


requieren algún tipo de intervención quirúrgica. Para determinar si un nuevo
método de fisioterapia reduce el porcentaje de intervenciones, se aplica este a 30
pacientes de los cuales 17 requieren alguna intervención quirúrgica. Comprobar
que no hay razones suficientes para afirmar la eficacia del método con un nivel
de confianza del 95 %.
CAPITULO VI

PRUEBA DE
CHI'CUADRADO
CU t o De La Torre Dueñas Yeny M. Accostupa Quispe

La prueba de chi-cuadrado es una prueba-no paramétrica, que no requiere del supues­


to de que la muestra pertenezca a una población conocida.
En este capítulo abordaremos las pruebas de homogeneidad e independencia.

6.1, Tabla de contingencia.


Es relativamente frecuente encontrarse con información referida a la observación
de dos características de una población, en las que se establecen modalidades (
categorías, mediante las cuales se clasifican los individuos o elementos que cons­
tituyen una muestra de la misma. Este tipo de distribución bidimensional de fre­
cuencias suele presentarse en forma de tabla de doble entrada, también llamada
tabla de contingencia.

La información obtenida del estudio generalmente se presenta en una tabla de


contingencias, en esta se tiene un conjunto de n elementos clasificados de acuer­
do a dos criterios, X e 7, cada uno de los cuales tiene una serie de categorías mu­
tuamente excluyentes:

-116-
Capítulo VI Prueba de Chi-cuadradq ¿

Tabla de Contingencia

• • »JY
Lj. • • • Total
T , y 2 r c

X, ° ii °1 2 % < \c

x 2 °21 O 22 °2 J °2 c n 2.

x, °n 0 ,2
°s ° ic n

... ... ... ... ...

°A °r2 °rj n r.

II
Total
3
« i n .2 n j » .c
Donde:

O ¿j : Representa la frecuencia observada, es decir, el número de individuos que

pertenecen simultáneamente a las categorías X i e Y..


Las frecuencias marginales son:

» , = £ » . y *. = £ *
/=! j=\

En esta sección se verán las pruebas de homogeneidad y de independencia.


Si bien ambas pruebas presentan el mismo procedimiento de cálculo, las
hipótesis a probar son diferentes y por lo tanto las conclusiones obtenidas tam­
bién.

- 117 -
Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

6.2. PRUEBA DE HOMOGENEIDAD.

En ocasiones ocurre que tenemos varias poblaciones clasificadas de acuerdo


con las categorías definidas para una determinada variable. La pregunta que se
sugiere inmediatamente es si la proporción de individuos pertenecientes a cada
una de las clases es la misma en todas las poblaciones. Si, con la información
suministrada por las muestras obtenidas, se puede aceptar que esto es así, di­
remos que las poblaciones son homogéneas con respecto a la variable de clasi­
ficación utilizada.

Existen r poblaciones y una muestra aleatoria es extraída desde cada pobla­


ción. Sea ft/.el tamaño de la muestra extraída de la i-ésima población. Cada
observación de cada muestra puede ser clasificada en una de c categ o r­
ías diferentes. Los datos son arreglados en la siguiente tabla de contin­
gencia rxc:

Categoría 1 Categoría 2 Categoría c Total

Población 1 o„ O 12 Ole nir

Población 2 O 21 O2C n2.

: ; :

nr.
Población r o rl o r2 a. nr-

Total n.i n.2 n.c n...

-118 -
Capítulo VI Prueba de Chi-cuadrado

En la tabla, o/;es el número de observaciones(frecuencias observadas) de la


muestra i clasificadas en la categoría j; n.jQs el número total de observacio­
nes en la categoría j extraídas desde las r poblaciones y n.. es el total de
observaciones extraídas desde las r poblaciones.

Hipótesis:

Sea 7C ¡j la probabilidad de que una observación seleccionada de la pobla­


ción i sea clasificada en la categoría j. Entonces las hipótesis son:

H 0: 7Cij =... = 7crj para todo j = l,2 ,...c

Ha: Al menos una igualdad no se cumple.

Las hipótesis pueden expresarse equivalentemente de la siguiente manera:

Ho: La variable aleatoria tiene la misma distribución de probabilidades en


la s r poblaciones.

Ha: La variable aleatoria tiene una distribución de probabilidades dife­


rente en al menos una de las poblaciones.

La estadística de prueba esta dado por:

2
Xc
y=i y=i

Donde, las frecuencias esperadas esta dada por :

n..

-119-
Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

Regla de decisión:
2
La hipótesis nula se rechaza con un nivel de significación a si el X c resulta

mayor que el valor de tabla

2
X ( \ - a , ( r - l ) ( c - l ))

6.3. PRUEBA DE INDEPENDENCIA

La prueba de independencia es adecuada para la investigación explicativa,


permite analizar la influencia de la variable independiente (causa) sobre la va­
riable dependiente (efecto), es decir evalúa la independencia o no de dos varia­
bles cualitativas.
Dado una muestra aleatoria de tamaño n.. es extraída, y cada observación
de la muestra es clasificada de acuerdo a dos criterios (variables X y
Y). U sando el primer criterio cada observación es clasificada en una de r
filas y usando el segundo criterio en una de c columnas, Los datos son arre­
glados en la siguiente tabla de contingencia r x c:

Columna 1 Columna 2 Columna c Total

Fila 1 On 0¡2 Ot c nh

Fila 2 02i On 02c n2.

:
:

Fila r O rl O r2 Ore nr.

Total n.i n.2 n .c n ..


Capítulo VI Prueba de Chi-cuadrado

En la tabla, ojj es el núm ero de observaciones clasificadas en la fila /


colum na j, «,.es el núm ero total de observaciones en la fija i y -n.fi s el
núm ero total de observaciones en la columna j.

Hipótesis:
Sea:

^ i j la probabilidad de que una observación sea clasificada en la fila i

colum na j,

jr
i . la probabilidad de que una observación sea ciasif¡cada:ep la fila

iy

, j la probabilidad de que una observación sea clasificada en la columna

j. Entonces las hipótesis son:

jr — JT 71 .
Ho: ij , i. - j para todo / = 1,... r ,j - 1, ... c.

Ha: Al menos una igualdad no se cumple.

Las hipótesis pueden expresarse, en forma equivalente de la siguiente manera:

Ho: Las variables X (causa) y Y (efecto) son independientes.


H] :Las variables X (causa) y Y(efecto)no son independientes.
Estadístico de prueba:

n r n .f
Donde e u = --------- -
n ..

-121-
Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

Regla de decisión:
Se adopta la siguiente regla de decisión:
2 2
• Si % c ^ % ( r —l ) ( c —1) entonces se acepta la hipotes I i Q

2 2
• Si X>c % ( r —l)(c —1) entonces se rechaza la hipotes II0

Como puede observarse el procedimiento es muy similar al de la prueba de


homogeneidad, y a veces suelen confundirse.

6.4. APLICACIÓN A ESTUDIOS EPIDEMIOLOGICOS.

En los estudios epidemiológicos se suele contemplar una variable explicativa


factor de exposición y una variable respuesta Enfermedad.
El seguimiento de los estudios longitudinales puede realizarse hacia adelante
(estudios prospectivos o de cohorte) o hacia atrás (retrospectivos o de caso-
control).
En los estudios prospectivos los individuos son clasificados en dos grupos
(presencia o ausencia de algún factor de riesgo, ejemplo habito de fumar), a
estos grupos se realiza el seguimiento durante un espacio de tiempo hasta de­
terminar un determinado desenlace objeto de estudio (ejemplo problemas vas­
culares).
En los estudios retrospectivos, se forman dos grupos de sujetos a partir de la
presencia o ausencia de una determinada condición sujetos sanos y pacientes
con problemas vasculares y se hace un seguimiento hacia atrás sobre la pro­
porción en la que se encuentra un determinado factor desencadenante por
ejemplo habito de fumar

-122-
Capítulo VI Prueba de Chi-cuadrado

6.4.1. RIESGO RELATIVO

Mide la fuerza de asociación. A mayor RR, mayor asociación entre factor y en­
fermedad. Se utiliza en investigación causal, en estudios de cohortes.
El riesgo relativo de una enfermedad (RR), es la razón de incidencia en perso­
nas expuestas a un factor con respecto a la incidencia en las personas no ex­
puestas.
Es riesgo relativo puede calcularse sólo a partir de una estudio de cohorte o
prueba clínica en donde se identifica primero a un grupo de personas expuestas
a una factor y otro no expuesto, y luego se estudian durante un tiempo para de­
terminar que personas desarrollan la enfermedad.

Personas
Factor de riesgo Total
Enfermos No enfermos
Expuestas A, Ni-A, N,

No expuestas Ao No-Ao No

Total A N-A N

El riesgo relativo solo tiene sentido en estudios prospectivos, y se define co­


mo:

P rob(Enferm edad/E xpuestos)


K K — ------- -----------------------:-------------- -— 1---------------------------------
P r o b ( E n f e r m e d a d / N o E x p u e s to s )

y que se estima por:

A
RR A ,* N Q
A A0* N t
N 0

-123-
Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

> Si RR = 1, El factor de exposición no es un factor de riesgo para la en­


fermedad, La incidencia de enfermedad para las personas expuestas es la
misma que para las no expuestas

> Si RR > 1, El factor de exposición es un factor de riesgo para la enfer­


medad. Las personas expuestas tiene mayor incidencia de la enfermedad
que las personas no expuestas.

> Si RR < 1, El factor de exposición es un factor de protección para la en­


fermedad. Las personas expuestas tiene menor incidencia de la enferme­
dad que las personas no expuestas.

Mide la fuerza de asociación. A mayor RR, mayor asociación entre factor y en­
fermedad. Se utiliza en investigación causal, en estudios de cohortes.

Estimación de RR mediante intervalo de confianza


Para que podamos concluir, con certeza, que el factor considerado es un factor
de riesgo para la enfermedad, es necesario que el valor obtenido para el RR sea
significativamente mayor que 1, para estar seguros de este resultado se obtiene
la estimación por intervalo al 95% de confianza para RR; los límites se calcu­
lan con la siguiente expresión:

i n 0- a 0
In ( i? i? ) + l .9 6 — -
N 0A0
L — e

N \ - A i t N 0- A 0 N v- A i f N 0- A 0
\n(RR)-l.96 ln( R R ) + 1.96
N,Ai N 0A0
e < rr < e

-124-
Capítulo VI Prueba dé Chi-cuadritdp

Ejemplo 5.1.Supongamos que se realiza un estudio sobre la relación entre el


habito de fumar y problemas vasculares, utilizando una muestra de 240 sujetos.

Problemas vasculares
Tabaquismo Total
Con problemas Sin problemas
Fuma 23 81 104
No fuma . 9 127 136
Total 32 208 240

Determine e interprete RR.


Solución

RR = A * N = 23*136 3 53 4 1 8
A0 * N i 9 *104

Como RR> 1 , el tabaquismo es un factor de riesgo para tener problemas vascu­


lares.
Es más probable encontrar problemas vasculares en sujetos fumadores que en
sujetos no fumadores. Los sujetos fumadores tienen 3,3418 veces más posibili­
dad de presentar problemas vasculares que los no fumadores.

6.4.2. ODDS RATIO

El Odds Ratio es el cociente entre la razón de expuestos a no expuestos en los


casos, y la razón de expuestos y no expuestos en los controles.

Enfermedad
Factor de exposición
Si No Total
Si a b c,
No c d c2
Total n 1*2 N

-125-
Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

El odds ratio en estudios prospectivos se define por:


P ro b ( E n f e r m edad / E xp u e stos)
q r - 1 - P ro b ( E n f e r m e d a d / E x p u e s t o s )
Prob ( E n f e r m e d a d / N o Exp uestos)
1 - P ro b ( E n f e r m e d a d / N o E x p u e s t o s )

En estudio retrospectivo se define como:


P ro b ( E x p u e s t o s / E n f e r m o s )
q r - 1 - P ro b ( E x p u e s t o s / E n f e r m o s )
P r o b ( E x p u e s t o s / N o Enferm os)
1 - P ro b ( E x p u e s t o s / N o E n f e r m o s )

Ambas expresiones son equivalentes por lo que la estimación del OR para es­
tudios prospectivos y retrospectivos es la misma y viene dada por:
a_
h ad
OR = - £ - = -------
c_ be
d

> Si OR = 1, El factor de exposición no es un factor de riesgo para la en­


fermedad, la relación de expuestos a no expuestos es la misma para casos
y controles.

> Si OR > 1, El factor de exposición es un factor de riesgo para la enfer­


medad. La proporción de casos que han sido expuestos es mayor que la
proporción de controles que han sido expuestos.

> Si OR < 1, nos indica que el factor de exposición es un factor de protec­


ción para la enfermedad. La porción de expuestos es mayor en los con­
troles que en los casos.

-126-
Capítulo VI Prueba de Chi-cuadrado

Estimación de OR mediante intervalo de confianza.


Para que podamos concluir, con certeza, que el factor considerado es un factor
de riesgo para la enfermedad, es necesario que el valor obtenido para el OR sea
significativamente mayor que 1, por ello para estar seguros de este resultado se
obtiene la estimación por intervalos al 95% de confianza para OR.

l n ( 0 / ? ) - l . 9 6 . / —+ i-+—+ — ln(0/í )+l . 9 6 . / —+ —+ —+ —


b ° d < OR < L = e Va b c d

La significación del OR viene dada por la prueba chi-cuadrado que en el caso


de una tabla 2x2 tiene la siguiente expresión.

, ( a d - b c V .n
X = - — ------------ —
r, r2 c , c 2

V 2 Con (2-l)x(2-l) = 1 grado de libertad.


Que sigue una distribución A

Observación.
Existen medidas para medir el grado de asociación y correlación entre varia­
bles cualitativas con dos categorías, las mismas que se definen a continuación.
• Coeficiente de Contingencia. Determina el grado de asociación entre
las dos variables consideradas en el estudio y esta definida por:

X2
h

Coeficiente de correlación, <¡) Permite medir el grado de relación en­

tre las dos variables dicotomicas y se define mediante la relación:

- 127 -
Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

EJERCICIOS DESARROLLADOS

1. En una investigación realizada sobre las reacciones adversas que producen tres
tipos de extractos para el tratamiento de una enfermedad, se obtuvo los siguien­
tes resultados.
Tratamiento
Reacciones adversas
A B c Total

Si 70 100 150 320

No 130 100 50 280

Total 200 200 200 600

¿Podemos concluir con 95% de confianza que el la presencia de interacciones


de los tres fármacos es similar?

Solución:
Ho: El porcentaje de reacciones adversas es homogéneo para los tres trata­
mientos.
H\: El porcentaje de reacciones adversas no es homogéneo para los tres tra­
tamientos.

320*200 320*200
en = ------------------- = 106.67 , en = = 106.67,
11 600 12 60 0
320*200 280*200
= 10 6 . 6 7 , e7l = ---------------------= 9 3 . 3 3 ,
600 " 600
80 *---------
200 = 9a3, . 3, 3 ' >
280*21
= ------------
6 00 23 600

-128-
Capítulo VI Prueba de Chi-cuadrado

2 (70-106.67)2 (100-106.67)2 (150-106.67)2


*c ~ 106.67 + 106.67 + 106.67
(130-93.33)2 (100-93.33)2 (50-93.33)2
+ 93.33 + 93.33 + 93.33

Z c2 = 65.625

De la tabla de chi-cuadrado con 2 grados de libertad, % o = 5 . 9 9 1

2 2
Como X c > X o , se rechaza la hipótesis nula

La proporción de reacciones adversas de los tres tratamientos no es similar. En


el cuadro siguiente se muestra el tipo de distribución.

Reacciones Tratamiento
adversas A B C Total
Si Frecuencia 70 100 150 320
Porcentaje 35,0% 50,0% 75,0% 53,3%
No Frecuencia 130 100 50 280
Porcentaje 65,0% 50,0% 25,0% 46,7%
Total Frecuencia 200 200 200 600
Porcentaje 100% 100% 100,0% 100,0%

-129-
Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

El tratamiento A, solo en un 35% produce reacciones adversas, mientras que el


Tratamiento C produce reacciones adversas en el 75% de los casos.

Reacciones
adversas

A B C
Tratamiento

2. En un estudio sobre enfermedades al corazón en hom bres, 356 volunta­


rios fueron clasificados de acuerdo con su nivel socioeconómico y sus
hábitos de fumar. Los datos se presentan en la siguiente tabla:

Nivel Socioeconómico
Habito de fumar Total
Alto Medio Bajo
Actualmente 51 22 43 116
En el pasado 92 21 28 141
Nunca 68 9 22 99
Total 211 52 93 356

¿Es el hábito de fumar independiente del nivel socioeconómico?

-130 -
Capítulo VI Prueba de Chi-cuádrado

Solución:
Las hipótesis a contrastar serán las siguientes:
Ho: El hábito de fumar es independiente del nivel socioeconómico.
Hi: El hábito de fumar no es independiente del nivel socioeconómico.
Las frecuencias observadas y esperadas (frecu en cias esp erad as entre
p arén tesis) se presentan en la siguiente tabla:

Nivel Socioeconómico
Habito de fumar Total
Alto Medio Bajo
Actualmente 51 (68.75) 22(16.94) 43(30.30) 116
En el pasado 92(83.57) 21(20.60) 28(36.83) 141
Nunca 68(58.68) 9(14.46) 22(25.86) 99
Total 211 52 93 356

Con estos datos el estadístico de prueba es:

3 3 (o —e V
* 2 = X X J ,J}
/=! 7 = 1 e ij

2 ( 5 1 - 6 8 , 7 5 )2 | ( 2 2 - 1 6 , 9 4 ) 2 [ | ( 2 2 - 25 .>6 )¡
6 8,75 16,94 2 5 ,8 6

Los grados de libertad para el estadístico de prueba son (3-1 )(3 -1) = 4.
■2
El valor de tabla para un nivel de significación del 5% es * ( 0.95,4) = 9.488

Como el valor calculado es mayor que el valor de tabla se rechaza H 0 y se


concluye que existe suficiente evidencia e s t a dí s t i c a par a a c e p ta r que
el hábi t o de f umar y el nivel s oc i oe c onómi c o e stán relacionados. El
tipo de relación se muestra a continuación

-131-
Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

Nivel socioeconómico
Habito de fumar Alto Medio Bajo Total
Actualmente Frecuencia 51 22 43 116
Porcentaje 24,2% 42,3% 46,2% 32,6%
En el pasado Frecuencia 92 21 28 141
Porcentaje 43,6% 40,4% 30,1% 39,6%
Nunca Frecuencia 68 9 22 99
Porcentaje 32,2% 17,3% 23,7% 27,8%
Total Frecuencia 211 52 93 356
Porcentaje 100,0% 100,0% 100,0% 100,0%

Las personas de nivel económico alto en el pasado tenían hábito de fumar en


un 43,6% de los casos, mientras que las personas de nivel económico bajo ac­
tualmente en 46,2% presentan habito de fumar.

3. Los siguientes datos fueron obtenidos en un estudio sobre la enfermedad de


Hodgkin, un cáncer de los nodos linfáticos . Cada uno de los 538 pacientes con
la enfermedad fue clasificado según el tipo de Histilogia y por su respuesta al
tratamiento después de tres meses de iniciado este. Los valores de la variable
Histilogia considerados fueron, predominancia de Linfocitos (PL), Esclerosis
Nodular (EN), Gelularidad Mixta (CM) y agotamiento de los Linfocitos (AL).
Los datos obtenidos fueron:

Respuesta
Histología Total
Positiva Parcial Ninguna
PL 74 18 12 104
EN 68 16 12 96
CM 154 54 58 266
AL 18 10 44 72
Total 314 98 126 538

La respuesta al tratamiento esta relacionado el tipo de Histología.

-132 -
Capítulo VI Prueba de Chi-cuadrado

Solución;
H0: La respuesta al tratamiento no esta relacionado el tipo de Histología. (In­
dependientes)

Ha: La respuesta al tratamiento esta relacionado el tipo de Histología (De­


pendientes)
Una forma de aceptar o rechazar la hipótesis nula es utilizando el p-valor. El p-
valor, juega un papel muy importante en la decisión de las hipótesis. Si p-valor
< 0.05 se acepta la hipótesis alterna con un nivel de confianza del 95%, en el ca­
so que p > 0.05 la decisión es aceptar la hipótesis nula.

Respuesta
Histilogia Positiva Parcial Ninguna Total
PL Frecuencia 74 18 12 104
Porcentaje 71.2% 17.3% 11.5% 100.0%
EN Frecuencia 68 16 12 v 96
Porcentaje 70.8% 16.7% 12.5% 100.0%
CM Frecuencia 154 54 58 266
Porcentaje 57.9% 20.3% 21.8% 100.0%
AL Frecuencia 18 10 44 72
Porcentaje 25.0% 13.9% 61.1% 100.0%
Total Frecuencia 314 98 126 538
Porcentaje 58.4% 18.2% 23.4% 100.0%

p-va!or=r0,02

En nuestro caso p-valor<0.05, se rechaza la hipótesis nula. La respuesta al tra­


tamiento esta relacionado con el tipo de Histología.

4. Un medicamento terapéutico fue ensayado contra un placebo, en función de tres


categorías de pacientes evaluados subjetivamente como:
(1) Muy mejorados (2) ligeramente mejorados (3) no mejorados
En total 120 pacientes fueron asignados al grupo que recibió el medicamento y
otros 90 pacientes recibieron el placebo. Se juzgó que todos se encontraban en

-133 -
Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

aproximadamente la misma condición inicial. La evaluación fue hecha por médi­


cos que no sabían que tratamiento había recibido el paciente

( 1) (2) (3)
Medicamento 60(50,28) 32(28) 28(41,71) 120
Placebo 28(37,71) 17(21) 45(31,28) 90

Solución:
Ho: El grado de mejora de pacientes tratados con medicamento y placebo son
similares.
Ha: El grado de mejora de pacientes tratados con medicamento y placebo es di­
ferente.

2 (6 0 - 5 0 , 2 8 ) 2 (32 - 2 8 ) 2 ( 2 8 - 4 1,71 ) 2
X c~ 50,28 + 28 + 41,71
( 2 8 - 3 1 , 71)2 (l 7 —21 ) 2 t( 4 5 - 3 1 , 2 8 ) _
31,71 21 31,28

grados de l i b e r t a d = (2 - 1 )• (3 - 1) = 2

RC = {X 2 / * 2 > 5,991 } si « = 0 ,05

Como x c = 1 6 , 2 3 4 > x l = 5 , 9 9 1 , s e rechaza Ho. Se concluye que el

grado de mejoría entre el grupo del placebo y el grupo del medicamento es dife­
rente. ,

5. Se ha realizado un estudio para analizar la posible relación de un factor de expo­


sición y la presencia o no de una determinada enfermedad. El diseño del estudio
fue prospectivo se tomaron 29 individuos expuestos y 47 no expuestos, y se ob-

-134 -
Capítulo VI Prueba de Chi-cuadrado

servó si desarrollaron o no la enfermedad los datos experimentales se resumen á


continuación en la siguiente tabla.
Enfermedad
Factor de exposición Total
Si No
Si 21 8 29
No 16 31 47
Total 37 39 76

Calcular el odds ratio OR y su intervalo de confianza.

Solución:
Calculo de OR
Se tiene que

OR = — = - = 5,08594
b.c 16.8

Como el valor de OR>l, se concluye que el factor de exposición es un factor de


riesgo para contraer la enfermedad.
Las personas expuestas al factor de riesgo presentan 5.08 veces más de posibili­
dad de contraer la enfermedad que las no expuestas.

Calcula del IC 95%(OR)

ln ( 0 / ? ) -l .96,/— + -J-+ — + — l n ( 0 f l ) + l .96,/— + — + — + —


e b c d , < ()R < i = Q v« b c d

ln(5.08594 ) - l . 96, /— + Í + — + — ln(5,08594 )+ l . 9 6 J — + - + — +-


, V 21 8 16 31 ^ n o ^ * V21 8 16 •

ex p ( 0 . 6 1 3 0 ) < OR < exp ( 2 .6 4 )

1 . 8 4 5 9 < OR < 1 4 . 0 1 2 7

-135-
Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

6. Un estudio de caso-control, se estudia la asociación entre la edad y Glaucoma.


Los resultados fueron.

Grupo (Enfermedad)
Factor de riesgo: Edad Total
Casos (si) Controles (no)
Mayor o igual a 60 27 95 122
Menor de 60 44 443 487
Total 71 538 609

Calcule OR y su intervalo de cofianza.

Solución:
ad 22*443
OR = — = -------------= 2 , 8 6 1 5
be 44*95
La edad es un factor de riesgo para contraer la enfermedad, debido a que
OR>l, además se observa que las personas mayores de 60 anos presentan 2.86
veces más de posibilidad de contraer la enfermedad que las personas menores
de 60 años.

ln (2 ,8 6 15 ) - l .96 J — + — + — + —!— J- l —+—+-


ln( 2,8615 )+ l. 96
l l l
e V 27 95 44 443 < Q j ^ < e > 27 95 44 443

e 0 ’ 52 < o * < e 1’ 58
1,68 < O R < 4,85

7. En un estudio realizado a, 341 pacientes fueron clasificados por grupo etéreo y


Presión. Los resultados se presentan en la siguiente tabla:
PRESION
GRUPO ETAREO Total
Alta Normal Baja
Joven 15 25 40 80
Adulto 30 100 43 173
Adulto Mayor 43 27 18 88
Total 118 150 73 341

-136-
Capítulo VI Prueba de Chi-cuadrado

¿Existe alguna relación significativa entre la presión y grupo etáreo de los pa­
cientes? Use un nivel de conflabilidad de 99%

Solución:
H0 : No Existe relación entre el Presión y grupo Etáreo de los pacientes,
quiere decir que son independientes.
Ha : Existe relación entre el Presión y grupo Etáreo de los pacientes, quiere
decir que No son independientes.

El nivel de significación es Oí = 1 % = 0 .Ü 1

El estadístico es:

Previamente calculamos los valores esperados.


Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

*\P.2 . 8 0 * 1 5 0
e \2
n 341

n2 n 2 173*150
e22 = - ^ - = ■ -=76.10
n 341

88*150
e i2 = = - •- - = 38 .71
n 341

80 * 73
n 341
173 * 7 3
n 2 . n .i
n 341

« 3.«3 8 8 * 73
e 33 = = =18.84
n 341

Reemplazando en el estadístico

i= 1 j = 1

2 2 2
(15 - 27.68) ( 2 5 - 35. 19) ( I 8 - I 8.84)
= ^ Í - + -Í------------------ + + — = 71.41
27.68 35.19 18.84

Com o X l = 7 1 . 4 1 > X 02 = 3 , 7 4 7 , por tanto se rechaza la

hipótesis nula y se acepta la hipótesis alterna, Existe relación entre Presión y


grupo Etéreo.

-138 -
Capítulo VI Pruebade Ch i-cu adrado

8. En el cuadro siguiente se muestra los resultados del diagnostico precoz y el diag­


nostico microbiológico de neumonía de 58 personas.

Diagnóstico Diagnóstico Precoz


Total
microbiológico Neumonía No neumonía
Neumonía 36 7 43
No neumonía 2 13 15
Total 38 20 58

a) Existe relación entre ambos diagnósticos, use un nivel de significancia del


5%.
b) Determine el grado de asociación entre el- diagnostico precoz y diagnosti­
co microbiológico.
c) Determine el grado de relación entre el diagnostico precoz y diagnostico
microbiológico.

Solución
a) Utilizando la prueba de chi-cuadrado, para tablas de 2x2.
Ho: Los diagnósticos no están relacionados.
Ha: Los diagnósticos están relacionados.

2 (ad-bc'f.n ( 3 6 * 1 3 - 7 * 2 ) 2 * 58
Xc = --------- = ------------------------------- -------------= 2 4 3 9
r, r 2 C, C 2 43*15*38*20
2
De la tabla de la distribución X con (2-l)x(2-l) = 1 grado de libertad, se

tiene: X 02 — 3 . 8 4 .

Como Xc > Xo » se rechaza Ho, por tanto se concluye que los diagnósti­

cos presentan relación.

-139-
r ie lo I V 1,» Torre WHHhi Yrny M. Accostupa íjufspc

b) Para determinar e! grado de asociación, utilizamos le coeficiente de con-

c = = 0,544
n+ z s. V 58 + 2 4 . 3 9

c) Para determinar el grado de correlación se utiliza el coeficiente *

* = ' ,~ = 'l ^ s T = 0,648


Presentan una relación de 64,8% entre ambos diagnósticos.

-140-
Capítulo VI Prueba de Chi-cuádrado

EJERCICIOS PROPUESTOS

1. Un investigador analiza la influencia del Clima organizacional de los hospitales


del Perú en la calidad de atención de los pacientes, para este fin realizo un estu­
dio en 32 hospitales, obteniendo los siguientes datos.
Clima organi-
R M B R R M M B B M M B R R M M
zacional
Calidad de
M M B R R M R B R R M B R R M M
atención
Clima organi­
R R B B R M M B R R B R M R B M
zacional
calidad de
atención
R M R B R ■3R . M B ¿R R B R M R M R

Donde M: Mala, R: Regular, B: Buena. Al 95% de confianza.


a) Influye el clima organizacional en la calidad de atención.
b) Determineel tipo de íhfiüéncia; si existe. '

2. Se desea analizar la influencia del síndrome de Bornout en las relaciones inter­


personales de enfermeras de la unidad de emergencia del hospital Loayza, ob­
teniendo los simientes resultados. '

Síndrome de Bornout M A M M A B A B M
Relaciones interpersonales M R R R M B R B R
Síndrome de Bornout M M, A M B g B R M
Relaciones interpersonales R B M R MB B R MB B
Síndrome de Bornout M A A B B M A M B
Relaciones interpersonales M R M MB B B M M B

Al 95% de confianza cuál es su conclusión del éstudio. - •


Dónde:
En el síndrome de Bornout B: Baja, M: Media y A: Alta
En relaciones interpersonales M: Mala, R: Regular, B: Buena, MB: Muy buena

- 141 -
Cielo De La Torre Dueñas Yeny M. Accostupa Quispe

3. Se desea evaluar la efectividad de una nueva vacuna antigripal. Para ello se


decide suministrar dicha vacuna, de manera voluntaria y gratuita, a una peque­
ña comunidad. La vacuna se administra en dos dosis, separadas por un período
de dos semanas, de forma que algunas personas han recibido una sola dosis,
otras han recibido las dos y otras personas no han recibido ninguna. La siguien­
te tabla indica los resultados que se registraron durante la siguiente primavera
en un grupo de habitantes de la comunidad elegidos al azar.

No vacunados Una dosis Dos dosis


Gripe 24 9 13
No gripe 289 100 565

¿Proporcionan estos datos suficiente evidencia estadística al nivel de significa­


ción 0,05 para indicar una dependencia entre la clasificación respecto a la va­
cuna y la protección frente a la gripe?

4. Las células infectadas por el virus del SIDA HIV-1 producen una pro-
teína llamada TAT. Se lleva a cabo un estudio para contrastar la asociación en­
tre presencia de anticuerpos TAT y el sarcoma de Kaposi en pacientes de SI­
DA. Se analiza el suero de 297 pacientes HIV-1-seropositivos dentro del perio­
do de un mes desde la diagnosis del SIDA. Cada observación se clasifica según
contenga el sarcoma de Kaposi o no, y según contenga anticuerpos TAT o
no. De las 78 observaciones que contenían sarcoma, 10 presentaban anti­
cuerpos TAT; de los 219 pacientes sin sarcoma, 21 tenían anticuerpos
TAT. Contrastar, al nivel 0.05, la asociación entre presencia de anticuerpos y
presencia de sarcoma de Kaposi. ¿Se trata de un contraste de independencia o
de homogeneidad? (Datos de Reiss y Lange (1990), N ature, 30 de Agosto, p.
801).

-1 42-
Capítulo VI Prueba de Chi-cuadrado

5. Se ha realizado un estudio para determinar los síntomas clínicos que ayudan a


la identificación de la tos ferina. Un síntoma investigado es la tos aguda de
cualquier duración. Los datos obtenidos sobre 233 niños estudiados se mues­
tran en la siguiente tabla:

Tiene tos aguda No tiene tos aguda


Padece tos ferina 112 6
No padece tos ferina 83 32

¿Existe relación entre tener tos aguda y padecer la enfermedad, al nivel de sig­
nificación del 0 ,01?

6. En un estudio para averiguar los efectos secundarios de dos medicamentos,


fueron analizados 100 pacientes y los resultados se presentan en la siguiente
tabla:
Tipo de Efecto Secundario
Total
Medicamento SI NO
A 11 39 50
B 8 42 50
Total 19 81 100

Determine si existen diferencias significativas en las proporciones de efectos


secundarios de los medicamentos. Use un nivel de significación de 1%

7. Con el propósito de analizar si el grupo sanguíneo influye en la presión sanguí­


nea, se tomó una muestra de 1500 sujetos a los que se les determinó su grupo
sanguíneo y se |es tomó la tensión arterial, clasificándose ésta en baja, normal,
y alta. Obteniéndose los siguientes resultados:

-143-
Ciclo De La Torre Dueñas Yeny M. Accostupa Quispe

Grupo sanguíneo
Tensión arterial
A B AB O Total
Baja 28 9 7 31 75
Normal 543 211 90 476 1320
Alta 44 22 8 31 105
Total 615 242 105 538 1500

Con un 95% de confianza, cuál es su conclusión

8. El departamento de psicología de una universidad aplica tres tipos de terapias


de estudio: A, B y C , para mejorar el rendimiento académico. Cada tipo de te­
rapia se aplicó a 60 estudiantes .Los resultados del experimento se dan en la si­
guiente tabla.

Terapias
Efectividad
A B C
Sin mejoras 10 20 15
Cierta mejora 40 30 20
Mejora Total. 10 10 25

¿Podemos concluir al nivel de significancia del 5%, que las tres terapias son
igualmente efectivos para mejorar el rendimiento?

9. Un hospital desea determinar si la causa del estrés se relaciona con la edad, para
lo cual se toma una muestra de 200 al azar y se les clasifica según edad y pre­
sencia del estrés obteniendo los siguientes datos:

EDAD
Presencia de estrés
Menos de 30 3 0-50 Más de 50
Si 40 28 52
No 20 36 24

-144
Capítulo VI Prueba de Chi-cuadrado

¿La edad está relacionada con la presencia del estrés? Use un nivel de confianza
del 95%.

10. En un grupo de 800 personas, la prevalecía de fumadores de ambos sexos en


mayores de 18 años es 20%. Se realiza un estudio en el que se siguen a los gru­
pos de fumadores y no fumadores. En la evaluación inicial ninguna persona de
ambos grupos padecía de cáncer pulmonar. Después de 10 años se encuentra en
el primer grupo 16 casos de cáncer pulmonar y en el segundo 8 casos. La pobla­
ción de edad mayor o igual a 18 años es el 60%. Calcule :
a) La Tasa de incidencia de casos de cáncer pulmonar en ambos grupos.
b) El riesgo relativo del hábito de fumar e interprete dicho valor.

11. Se estudian dos grupos de 120 y 500 hombres adultos c/u. seleccionados aleato­
riamente. Los del primer grupo tienen cáncer de páncreas y el segundo clínica y
laboratorialmente sano. En ambos grupos se indaga el antecedente de consumo
de alcohol según tiempo, frecuencia y cantidad. En el grupo de enfermos el 40%
registra el antecedente de consumo y en el grupo de sanos el 85% no consumió.
Calcule e interprete OR.

12. Un grupo de 80 mujeres con diagnóstico de cáncer de mama y otro grupo de 160
mujeres de características semejantes clínicamente sanas, son seleccionadas en
forma aleatoria. En ambos grupos se indaga el antecedente de edad de la primera
gestación. Se define un punto de corte de igual o mayor de 30 años. Se produje­
ron los siguientes datos:
Mujeres con cáncer de mama con antecedente positivo (Primer embarazo a la
edad de 30 o más años) = 30. Mujeres sin cáncer de mama con dicho antecedente
=20
a) el estudio es:

-145-
Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

i. Experimental
ii. Observacional
i ii. Longitudinal
iv. Cohertes
v. Casos y controles
b) Calcula e interprete OR

13. Los resultados de un seguimiento de 10 años de observación estudiando el riesgo


de enfermedad cardiovascular por hábito de fumar dieron los siguientes resulta­
dos:

Resultado luego de 10 años


Al inicio del estudio Presentaron No presentaron enfer­
enfermedades Coronaria medades Coronaria
2000 fumadores sanos 65 1935
4000 no fumadores sanos 20 3980

¿Cuál es el riesgo relativo de enfermedad coronaria por hábito de fumar?

14. Ante la sospecha de que el habito de fumar de una embarazada puede influir en el
peso de su hijo al nacer, se tomaron dos muestras, una de fumadoras y otra de no
fumadoras, y se clasifico a sus hijos en tres categorías en función de su peso en
relación con los percentiles PIO y P90 de la población. El resultado se expresa en
la tabla siguiente:

Madre Peso del Neonato.


Fumadora Menor de P,0 EntreP10yP,o Mayor a P^
Si 117 529 19
No 124 1147 117

-146-
Capítulo VI Prueba de Chi-cuadrado

¿Hay una evidencia significativa a favor de la sospecha a la vista de los resulta­


dos de la muestra?

15. Se deseaba saber si el embarazo en adolescentes es un factor de riesgo para el


nacimiento de niños prematuros. Para ello se obtuvo una muestra de 282 partos
de madres adolescentes, de los cuales 21 fueron niños prematuros. Se comparó
con 4847 partos en mujeres de más de 18 años, que tuvieron un total de 220 ni­
ños prematuros. ¿Es la edad juvenil de la madre un factor de riesgo para la pre-
maturidad?

- 147 -
CAPITULO VII

DISEÑO
EXPERIMENTAL
Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

7.1. INTRODUCCIÓN.

El diseño de experimentos es en la actualidad una de las herramientas princi­


pales utilizados en la investigación científica, el objetivo que se tiene es estu­
diar el efecto de uno o varios factores sobre una variable respuesta.
Diseñar un experimento, simplemente significa planear un experimento de mo­
do que se reúna la información que sea pertinente al problema bajo investiga­
ción.
El diseño de un experimento, es entonces, la secuencia completa de pasos to­
mados de antemano para asegurar que los datos apropiados se obtendrán de
modo que permitan un análisis objetivo que conduzca a deducciones válidas
con respecto al problema establecido.

FACTOR.

Son todas aquellas variables cuyo efecto se desea medir, en algunos casos se
les llama tratamiento.

NIVEL

Es el conjunto de valores que tiene la variable independiente o factor en el ex­


perimento.

UNIDAD EXPERIM ENTAL

Es la entidad más pequeña a lo que se aplica el tratamiento, es decir; es el ele­


mento donde se realiza la medición.

ERRO R EXPERIM ENTAL

Es la medida de la variación, existente entre observaciones de las unidades ex­


perimentales.
En un Diseño Experimental se tiene variabilidad inherente a la unidad experi­
mental y otra variabilidad debida a los tratamientos.

-150-
Capítulo VII Diseño Experimental

Para reducir e! error experimental se siguen algunos pasos:


• Repetir el experimento
• Adicionar más tratamientos
• introducir variables o bloques

El proceso o sistema bajo estudio puede representarse por medio del modelo:

FACTORES CONTROLADOS

ENTRADA --------- ^ UNIDAD


EXPERIMENTAL. ► SALIDA

FACTORES NO CONTROLADOS

Podemos pensar que el proceso es una combinación de tratamiento, personas y


otros recursos que transforman alguna entrada, en una salida que tienen una o
más respuestas observadas

7.2. OBJETIVOS DEL DISEÑO EXPERIMENTAL

• Determinar las variables con mayor influencia en la respuesta


• Determinar el mejor valor de las variables que influyen en la respuesta de
manera que:
• La respuesta se aproxime al valor deseado
• La variabilidad de la respuesta sea pequeña
• Se minimiza el efecto de las variables incontrolables

- 151 -
Cielo De La Torre Dueñas Yeny M. Accostupa Quispe

7.3. DISEÑO UNIFACTORIAL (Diseño completamente aleatorio)

• Es el Diseño Experimental más simple.


• En este Diseño los tratamientos (niveles) se distribuyen al azar en todas las
unidades experimentales. Este diseño es muy útil cuando las unidades expe­
rimentales tienen variabilidad uniformemente repartidos (homogeneidad)

VENTAJAS Y DESVENTAJAS
• VENTAJAS
o Este Diseño es fácil de planear y es flexible en cuanto al número de
repeticiones y unidades experimentales del tratamiento

• DESVENTAJAS
Solo es aplicable, cuando el material experimental es homogéneo.
Los resultados del experimento se pueden agrupar de la siguiente forma:

RESPUESTA

a ó „ ) c ( y 3I ) B ( r 2, ) D O ^l )
B {Y 2i ) A (Y¡i ) D Ó « ) c ( y ,2 )
B ( r 2í ) c (y » ) A (T u ) D Ó 43 )
A (Y,4 ) D( Y„ ) C ( r 34 ) B(Yl4 )

y..
Donde ,J es el resultado de la medición del i-ésimo tratamiento en la j-
ésima repetición.

-152 -
Capítulo VII Disefio Experimental

En resumen:

Tratam ientos 1 2 ••• i ••• a

r2, ... yal


r» *n
CO
LU y
22
... Y,2 ... yal y,í(- '
Z ••
O ••
0 TOTAL
V ... ... y
1 /2j Y» <9
UJ Yv
. .••;

eo 4
cq
o y2/i ... Y,„ ...
- ' 7■aw
Totales y ... 7 r
lí. 2. Y,. a.
Medias V Y, r
-

Varianzas
... C2
A2, i 5 2

Donde:
n
, Total del i-ésimo tratamiento

n y
Yi = , Media del i-ésimo tratamiento
M n

r=fx= £ f %
/=1 /=1 y*i
.T°Bl

i — — , Media total
an

-153 -
Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

7.3.1. Análisis de varianza

Es la técnica mediante el cual se mide los efectos de los tratamientos puesto


que descompone la varianza total en diferentes fuentes de variabilidad definida
por el modelo.
Para el cual se siguen los siguientes pasos:

tfo-'/'i = Mi =••• = Ma

H a ' M i ^ f¿ j , para algún par (i j )

La fórmula asumida para calcular la suma de los cuadrados es la siguiente:

\2 ^ ^ y ~
s"=nu-x.r=i2>s-4 • "■«"
i=\ 7=1 /=! 7=1 N

SCA= T N = an
t i n, N
SCE = SCT - SCA
Los cuadrados medios son los estimadores de las varianzas y son obtenidos
de la siguiente forma:

CMA =
a~ 1
S CE _2
C MU, — — -------- - = <7 ó varianza del error.
a(n-l)
Por otra parte el cociente de dos variables % se distribuye mediante la distri­
bución de Fisher

SCA
a - 1 f
SCE ~
a(n-l)

-154-
Capítulo VII Diseño Experimental

íl-a )
R.A. H0 — i- - R.R. H0

Análisis de la varianza.

Fuentes de
g-1 SC CM Fe
Varianza

CMA
Tratamiento a-1 SCA CMA
CME
Error a(n-l) SCE CME
Total an-1 STT

Conclusiones:

• Si Fc> Fo Se rechaza Ho

• Si Fe< F0 Se acepta H0

7.4. DISEÑO EXPERIMENTAL DE DOS FACTORES

El análisis de la varianza de dos factores está formado como su nombre indica


por dos factores que a su vez tienen la misma importancia en este tipo de análisis
existen “a” niveles del factor A y “b” niveles de factor B.

-155-
Cleto De La Torre Duefias Yeny M. Accostupa Quispe

Este tipo de análisis se determinan según el número de observaciones; si cada


unidad experimental tiene una observación, el modelo del análisis univariado
de la varianza de dos factores se denomina sin réplica, en este caso no existe
interacción entre los dos factores. En este tipo de análisis el control local (uni­
dad experimental) por el factor A, el cual esta constituido por todo los del fac­
tor B o variantes repetidas una sola vez siendo el factor A una repetición con la
condición de que los del factor B están dentro del factor A . de donde se puede
afirmar que cada factor A contiene los elementos del factor B el cual disminu­
ye el error experimental.

TABLA DE ANÁLISIS DE VARIANZA


Fuentes de
g-1 SC CM F cal
Varianza
CMA
Factor A a-1 SCA CMA
CME
CMB
Factor B b-1 SCB CMB
CME
CMAB
Interacción AB (a-l)(b-l) SCAB CMAB
CME
Error ab(n-l) SCE CME

Total abn-1

Donde:
Capítulo VII Diseño Experimental

b Y V
an abn

a h V 2 y 2
SC A B = V Y ± J L -A -~ -S C A -S C B
tí % n abn

SCE = SCT-(SC A+SCB+SC A B)

El cuadrado medio, se obtiene:

Para el factor A : CMA - — —


a- 1
Or'D
Para el factor B : CMB - —
b- 1
nyr i n
Para la interacción AB : CMAB = ’— ----------
\a - \) { b - .n

S!CF
Para el error : CME - - - —

-157-
Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

INTERACCIÓN.

En estadística, la idea de una interacción, es medir el efecto de una variable


(factor), manteniendo constante los demás.

En términos generales interacción entre dos factores es sinónimo de relación


entre los factores, en este caso los factores actúan en forma conjunta sobre la
variable respuesta.

Factor
8

Factor A Factor A
No existe interacción Existe interacción

Figura: Interacción de factores.

De la gráfica anterior se concluye que geométricamente existe interacción


cuando las líneas se intersectan, en cambio no existe interacción, cuando las
líneas son paralelas.

-158-
Capítulo VII Diseño Experimental

EJERCICIOS DESARROLLADOS

1. Puesto que el hígado es el principal lugar para el metabolismo de los fármacos,


se espera que los pacientes con enfermedades de hígado tengan dificultades en
la eliminación de fármacos. Uno de tales fármacos es la fenilbutazona. Se rea­
liza un estudio de la respuesta del sistema a este fármaco utilizando tres gru­
pos: controles, pacientes con cirrosis hepática y pacientes con hepatitis activa
crónica. A cada individuo se le suministra oralmente 19 mg de fenilbutazo-
na/Kg. de peso. Basándose en los análisis de sangre se determina para cada uno
el tiempo de máxima concentración en plasma (en horas). Se obtienen estos da­
tos:

Normal Cirrosis Hepatitis


35 22,6 16,6
30,6 14,4 12,1
26,8 26,3 7,2
37,9 13,8 6,6
13,7 17,4 12,5
49 18.5 15,1

¿Se puede concluir que las tres poblaciones difieren respecto del tiempo de
máxima concentración en plasma de fenilbutazona?

Solución:
La hipótesis estadística esta dado por:

H o : Mi = Mi = Mi

H a ‘ Mi * M j

-159 -
Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

Normal Cirrosis Hepatitis


35 36 37
30.6 30.7 30.8
26.8 26.9 26.10
37.9 37.10 37.11
13.7 13.8 13.9
49 50 51

OO
L/l
oo

OO
oo

to
Totales yz =86

II
£

sVí
11

II
n 6 6 6 N=18

y 2. y 3. y ..
Media 3^1. =14 =14.3333333 =14.6666667 =14.3333333

ser = ¡352 + 30.62 + 2Ó.82 + ....+512] - ^ - = 2194.57


tfjzT9 N L J 18

SC^ y ^ - i ¿ = 842+8 62 + 8 82 - ^ L o . 7 0 5 9
¿—t n¡ N 6 18
!=1 '

S C E = S C T - SCA = 219 3 .8 7

Análisis de la varianza

Fuentes de
gl se CM Fc
Varianza
Tratamiento 2 0.7059 0.35295 0.00220775
Error . 15 2193.87 146.258
Total 17 2194.57

-160-
Capitulo VII Diseño Experimental

De la tabla Fc< F0= 3.68, Se acepta H0, por lo tanto se concluye que no existe
diferencias en el tiempo máximo de concentración en plasma de fenibutazona.

2. Se mide el tiempo de recuperación en días, desde que los pacientes comienzan


el tratamiento de una patología utilizando 4 tipos de fármacos a 3 dosis cada
una. Los resultados se muestran a continuación.

Dosis Fármaco 1 Fármaco 2 Fármaco 3 Fármaco 4


18 17 17 13
I 16 17 14 12
17 19 19 14
10 14 12 5
11 11 15 15 9
10 7 10 2
3 8 8 1
III 7 6 9 2
7 10 9 1

Con un 95% de confianza, cuál es su conclusión del estudio.

Solución:
La hipótesis estadística para el factor A, está dado por:

-161-
Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

H o: El factor fármaco, no influye en el tiempo de recuperación.


Ha : El factor fármaco, influye en el tiempo de recuperación.

La hipótesis estadística para el factor B, está dado por:


H0 : El factor dosis, no influye en el tiempo de recuperación.
Ha : El factor dosis, influye en el tiempo de recuperación.
La hipótesis estadística para la interacción, esta dado por:
H0 : El factor fármaco y dosis, no actúan simultáneamente en el tiempo de
recuperación, su efecto de cada factor es independiente.
Ha : El factor fármaco y dosis, actúan simultáneamente en el tiempo de re­
cuperación, su efecto de uno de los factores depende del otro.

Dosis Fármaco 1 Fármaco 2 Fármaco 3 Fármaco 4 Total


18 17 17 13
I 16 17 14 12
17 19 19 14
sub. total 51 53 50 39 193
10 14 12 5
II 11 15 15 9
10 7 10 2
sub. total 31 36 37 16 120
3 8 8 1
III 7 6 9 2
7 10 9 1
sub. total 17 24 26 4 71
Total 99 113 113 59 384

Calculo de las sumas de cuadrado.


a= 4, niveles del fármacos (Factor A)
b=3, niveles de Dosis (Factor B)

-162 -
Capítulo VII Diseño Experimental

n=3, réplicas de cada ensayo.

a b n \r

a b n
/' = ! j = I * = 1

S C T = Í"l82 + 1 6 2 + 1 7 2 + . . . + 12 + 2 2 + 12 ] - - ^ — = 9 7 6
L J 44 ** 33 ** 33

a y 2 y 2

sca = y f
/=!

9 9 2 + 1 13 2 + 1 13 2 + 5 9 : 384
= 217,333
3*3 4*3*3

* Y Y
sc b = y
an aon

1932 + 1 2 0 2 + 712 384


= 628,167
4*3 4*3*3

1 Y] Y2
i=l 7=1

512 + 532 + 502 + 392 + 312 + 362 + 3 7 2 + 1 6 2 + 1 7 2 + 2 4 2 + 2 6 2 + 4 2 ‘


SCAB =
3

384
-2 1 7 ,3 3 3 - 6 2 8 ,1 6 7 -
4*3*3
SCAB = 15,1667

SCE = SCT-(SCA+SCB+SCAB)= 976-(217,333+628,167+15,1667)


= 115,333

-163-
Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

Cálculo de los cuadrados medios.


S C A217,333
C M A = = ---- = 72,4444
a -1 3

CMB =^ = - * ’ l 6 l = 314,083
* 2
6-1 2

C M A B = S C A B = l 5’.1..667 = 2,52778
(a - 1)(6 - 1) 3*2

C M E = SC- * r r 0 r = 1 1 5 ’333 = 4 , 8 0 5 5 6
a b ( n - 1) 4*3*(3-l)

Valores calculados de F.

CMA 72,4444 - 1CAO


• FCÁ = --------- = ----------------- = 15 , 0 8 ; De la tabla
CME 4,80556

F oa = 2 , 9 9
Como > Foa , se rechaza la hipótesis nula del factor A.
• f = £ M J L = 314,083 = 6S 3 6 ; De la tabla F 0B = 3 , 3 9
CB CME 4,80556

Como F qq > F qB (se rechaza la hipótesis nula del factor B.

FC A B C MA B 2 ,5 2 7 7 8 o 53 > *a tabla
C ME 4 ,8 0 5 5 6

F oab = 2 , 4 9

Como F cab > F qAB , se rechaza la hipótesis nula de la interacción AxB.

-164-
Capítulo VII Diseño Experimental

ANOVA
Fuente Suma de Cuadrados gl Cuadrado Medio Razón-F Valor-P
EFECTOS
PRINCIPALES
A: Fármaco 217,333 3 72,4444 15,08 0,0000
B: Dosis 628,167 2 314,083 65,36 0,0000
INTERACCIONES
AB 15,1667 6 2,52778 0,53 0,7829
Error 115,333 24 4,80556
TOTAL 976,0 35

1 2 3 4
Fármaco

Los fármacos 1,2 y 3 presentan similares resultados, pero superiores al fármaco 4.


Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

O
o
05

o
a>
l-
0)
TJ
O
Q.
E
<D

til
Dosis
La Dosis I presenta mejor resultado que las otras dosis.

Dosis
— I
0
1Q)
Q.
3
O
2
CD
"O
O
Q.
E
Q>

Fármaco

-166-
Capítulo VII Diseño Experimental

3. Un investigador analiza el efecto antünflamatorio de un extracto a 4 d o s is (E E l,


EE2,EE3, EE4) y un medicamento comercial (Naproxeno). Los resultados de la
disminución real (eliminado el efecto del grupo control) ,se muestra en el cuadro
siguiente.

Disminución Disminución
Tiempo Tratamiento Tiempo Tratamiento
de Volumen de Volumen
30 EE1 -0.085 90 EE3 0.09
30 EE1 0.045 120 EE3 0.2
60 EE1 -0.1 120 EE3 0.25
60 EE1 0.02 150 EE3 0.26
90 EE1 -0.075 150 EE3 0.34
90 EE1 0.085 30 EE4 0
120 EE1 -0.073 30 EE4 0.07
120 EE1 0.087 60 EE4 0.03
150 EE1 0.25 60 EE4 0.1
150 EE1 0.17 90 EE4 0.09
30 EE2 -0.11 90 EE4 0.17
30 EE2 0.03 120 EE4 0.21
60 EE2 -0.1 120 EE4 0.2
60 EE2 0.02 150 EE4 0.35
90 EE2 -0.08 150 EE4 0.42
90 EE2 0.07 30 Naproxeno 0.03
120 EE2 -0.05 30 Naproxeno 0.06
120 EE2 0.11 60 Naproxeno 0.11
150 EE2 0.12 60 Naproxeno 0.1
150 EE2 0.25 90 Naproxeno 0.17
30 EE3 -0.06 90 Naproxeno 0.15
30 EE3 0 120 Naproxeno 0.21
60 EE3 -0.04 120 Naproxeno 0.32
60 EE3 0.02 150 Naproxeno 0.44
90 EE3 0.02 150 Naproxeno 0.42

-167-
Cleto De Lá Torre Dueñas Yeny M. Accostupa Quispe

Con 95% cual es su conclusión de este estudio.

Solución:
En el cuadro siguiente se muestra el análisis de varianza.

ANOVA
Suma de Cuadrado
Fuentes de variación gl Fe P-Value
cuadrados medio
Factores
A Tratamiento 0.242096 4 0.0605239 12.40 0.0000
B Tiempo 0.611808 4 0.152952 31.34 0.0000
Interacción
AB 0.0524227 16 0.00327642 0,67 0.7941
Error 0.122 25 0.00488
Total 1.02833 49

Del análisis de varianza que se muestra en el cuadro anterior se puede concluir


con 95% de confianza que los tratamientos considerados en el estudio (diferen­
tes tipo de de extracto más el estándar que es naproxeno) influyen en la disminu­
ción del volumen de la inflamación. (P-valor < 0.05), es decir algunos de estos
tipos de tratamiento genera mejor efecto en la actividad antiinflamatoria en com­
paración de los otros tratamientos.

También del mismo cuadro se puede desprender que el factor tiempo influye (p-
valor < 0.05) es decir que en determinado tiempo tiene mejor efecto los trata­
mientos.

Para determinar que tratamiento tiene mejor efecto se aplica las pruebas de
comparación de múltiples que se ilustra gráficamente.

-168-
Capítulo VII Diseño Experimental

Means and 95.0 Percent LSD Intervals


Disminución de Volumen

Tratamiento

De este gráfico se observa que los tratamientos naproxeno y EE4 estadísticamen­


te tienen similares efectos en la desinflamación y este grupo presenta mejor efec­
to en comparación de los tratamientos EE3, EE2, EE1.

Por otra parte el Extracto EE1 y EE2 tiene el menor efecto de todos los trata­
mientos.
Ciclo De La Torre Dueñas Yeny M. Accostupa Quispé

Means and 95.0 Percent LSD Intervals


Disminución de Volumen

Tiempo

El efecto antiinflamatoria de los distintos tratamientos es creciente de 60 a 150


minutos. Por otra parte también se puede observar que los distintos tratamientos
tiene efectos similares de 30 a 60 min. En cambio de 120 a 150 presentan mejor
efecto (mayor desinflamación).

Tiempo

-170 -
Capítulo VII Diseño Experimental

De este análisis se puede concluir que todos los tratamientos presentan mejor
efecto a los 150 minutos.

4. Para realizar un estudio de contaminación por plomo en especímenes que habitan


en cuatro sectores costeros diferentes, se selecciona muestras aleatorias de es­
pecímenes en los cuatro sectores y se miden los porcentajes de plomo observa­
dos en ellos. Los resultados se muestran en la tabla siguiente:

Sector A 0.027 0.025 0.029 0.026


Sector B 0.025 0.028 0.030 0.027 0.024
Sector C 0.034 0.029 0.032 0.031 0.036
Sector D 0.030 0.033 0.031

a) Pruebe la hipótesis de no diferencia en los porcentajes medios de plomo


entre los sectores Use a =0.01.
b) Compare las medias por pares, al 5% de significación.

Solución:

SECTOR
Sector A Sector B Sector C Sector D
0,027 0,025 0,034 0,03
0,025 0,028 0,029 0,033
0,029 0,03 0,032 0,031
0,026 0,027 0,031
0,024 0,036
Total Y1 =0,107 Y2.=0,134 Y3.= 0,162 Y4 = 0,094 Y. = 0,497
Tamaño 4 5 5 3 N=17

Media 0,027 0,027 0,032 0,031 0,029

Formulación de Hipótesis

-171-
Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

Ho: No hay diferencia en los porcentaje medios de plomo


entre los sectores.

H a: Hay diferencia en los porcentaje medios de plomo entre los


sectores.

v^xr-1 V 2 T 9 9 91 0497^
S C T = y > y¡¡ - — = 0.027 + 0.025 +.... + 0.031 — ----------= 0.000183
iV L j 17

SCA = t ^ - ^ — *— - 0.7059
t i nt N 4 5 5 3 17

SCE = SCT - SCA = 0.000183 - 0.000117 = 0.000065

Fuentes de variación g-1- SC CM Fe


Tratamiento 3 0.000117 0,000039 7,8
Error 13 0.000065 0,000005
Total 16 0.000183

Como F c = 7 .8 > F 0 = 5 . 7 4 , por tanto se rechaza la hipótesis nula,

se concluye que hay diferencia en los porcentaje medios de plomo entre los
sectores considerados.

-172-
Capítulo VII Diseño Experimental

EJERCICIOS PROPUESTOS

1. En un estudio de control de parásitos, cada rata fue inyectada con 500 larvas del
parásito llamado Nippostrongylus muris. Diez días después fueron sacrificadas y
se contó el número de gusanos adultos. Se quiere dilucidar la siguiente cuestión:
¿Hay diferencia en la resistencia a la invasión parasitaria por grupos de ratas su­
ministradas por diferentes proveedores? Se analizaron 4 grupos diferentes, for­
mados por 5 ratas cada uno. Los resultados fueron:

Número Grupo 1 Grupo 2 Grupo 3 Grupo 4


1 279 378 172 381
2 338 275 335 346
3 334 412 335 340
4 198 265 282 471
5 303 286 250 318

2. El objetivo de un estudio es evaluar el poder hipocolesterolemiante de tres trata­


mientos diferentes A, B y C en pacientes hipertensos; el tipo de tratamiento hipo-
tensor puede influir en los resultados; para controlar este posible efecto se realiza
un diseño de bloques. Hay tres pacientes por cada uno de los seis tipos principa­
les de tratamiento hipotensor: diuréticos, betabloqueantes, alfabloqueantes, IE-
CAS, ARAII y calcioantagonistas; se seleccionan tres pacientes de cada tipo de
tratamiento hipotensor y se asignan al azar a cada uno de los tres tratamientos
hipolipemiantes; tres meses después se analiza el nivel del colesterol total de ca­
da uno de los dieciocho pacientes que participan en el estudio en mg por 100 mi.
Los datos obtenidos son los siguientes:

-173-
Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

A B C
Diuréticos 227 233 210

Betabloq. 231 241 190

Alfabloq. 216 252 186

IECAS 222 237 175

ARAII 217 242 177

Calcioant 211 250 168

¿Hay diferencias entre los valores del colesterol obtenidos mediante los trata­
mientos de los tres hipolipemiantes? ¿Hay efecto de bloques?

3. Tres programas de entrenamiento deportivo fueron probados en 15 atletas, asig­


nando al azar 5 de ellos a cada programa. Luego de terminado el entrenamiento
sus respectivas habilidades fueron comparadas por un mismo entrenador con los
resultados indicados:

PROGRAMA
A B C
48 42 68
54 59 71
78 62 87
83 80 98
96 92 101

Pruebe si hay diferencia entre los tres programas usando un nivel de significación
de 5%.

-174-
Capítulo VII Diseño Experimental

4. Los siguientes datos representan los tiempos de reacción (en segundos) a tres
tipos de estímulos:

Estímulo A: 4.9 6.1 4.3 4.6 5.3


Estímulo B: 5.5 5.4 6.2 5.8 5.6 5.2 4.8
Estímulo C: 6.4 6.8 5.7 6.5 6.3 6.6
a) Pruebe si el tiempo de reacción al tipo de estímulo B es superior al tipo de
estímulo A. Use 0.05.
b) Pruebe utilizando la prueba adecuada, si el tiempo de reacción es diferente
a los tres tipos de estímulos. Use un nivel de significación de 1%.

5. La tabla siguiente muestra los niveles de residuo pesticida (PPB) en muestras de


sangre de 4 grupos de personas. Contrastar a un nivel de confianza de 0.05, la
hipótesis nula de que no existe diferencia en los niveles de PPB en los cuatro
grupos considerados.

Niveles de PPB
Grupo / 10 37 12 31 11 9 23
Grupo II 4 35 32 19 33 18 8
Grupo III 15 5 10 12 ' 6 6 15
Grupo IV 7 11 1 8 2 5 3

6. Un test de personalidad, tiene dos formas de determinar su valoración suponien­


do inicialmente que ambos métodos miden igualmente la extraversión. Para ello
se estudia en 12 personas obteniéndose los siguientes resultados:

Medida de la extraversión
Forma A 12 18 21 10 15 27 31 6 15 13 8 10
Forma B 10 17 20 5 21 24 29 7 11 13 8 11

¿Hay diferencia entre los dos métodos?

-175-
Cleto De La Torre Dueñas Yeny M. Accostupa Qui&pf
— ,r; .. m.,,,,,- ,.., ■,■■■■■..... — ------ t— :----------. ¡ Ji'rrnm
7. Se desea saber si el grado de ansiedad es el mismo, en tres enfermedades distin­
tas. Para ello se tomaron tres muestras de 10, 12 y 8 personas, respectivamente,
con esas enfermedades. A cada una de los pacientes se aplico un test que mide
el grado de ansiedad del individuo. Los resultados se dan en la tabla adjunta.

Enfermedad Grado de ansiedad


A 4 6 5 5 6 3 3 2 6 5
B 2 1 5 5 4 6 4 4 4 3 3 2

C 7 5 8 7 9 3 5 5

¿Qué puede concluirse de los datos?.

8. En un estudio realizado para comparar la eficacia de tres tipos de pesticidas se


escogió una muestra de 18 árboles que en forma aleatoria configuraron tres gru­
pos, fumigando cada grupo con un pesticida diferente, luego al momento de co­
sechar se registró el porcentaje de frutos que tenían gusanos obteniéndose la tabla
adjunta:

Grupo 1 23 18 16 15 14 10
Grupo 2 10 8 9 10 11 10
Grupo 3 25 16 15 14 12 9

Con un nivel de significación de un 5% ¿se puede recomendar un tipo de pesti­


cida en especial?

9. Clasificados los pacientes en tres grupos (Gj, G 2 y G3), se han seleccionado al


azar dentro de cada grupo cuatro individuos y se les ha suministrado cuatro me­
dicamentos diferentes (Mi, M2, M 3 y M4), midiéndose para cada combinación
paciente/medicamento cierta variable indicadora de la mejora experimentada por
el paciente:

-176 -
Capítulo VII Diseño Experimental

M, m2 m3 m4
G, 15 18 20 20

g2 10 8 12 15
G3 17 15 20 22

Se quiere saber si los pacientes de cada grupo responden de igual manera a los
tratamientos y si existen diferencias entre las efectividades de los medicamentos.

10. Se está investigando cual es el efecto de tres tipos de fármaco sobre dos tipos de
patologías. Se espera que el efecto de los distintos fármacos se manifieste de
forma diferente dependiendo del tipo de patología. Para el presente estudio toma­
remos dos tipos de patología, I y II, y tres tipos de fármaco que denotaremos con
A, B y C. La respuesta es un índice recuperación tras la aplicación de los distin­
tos fármacos. Los resultados se muestran en la tabla siguiente:

Fármaco
Patología
A B C
I 8 10 8
4 8 6
0 6 4
II 14 4 15
10 2 12
6 0 9

Al 95% cual es su conclusión del estudio.

11. En un hospital se hace un experimento para comprobar el efecto de determinado


tipo de fármaco (A o B) en el tiempo de recuperación del paciente. Se supone
que dicho tiempo depende considerablemente del nivel de glucosa del paciente
(g<120mgr/l, g>120mgr/l), por lo que se considera como factor a tener en cuenta.
Para estudiar dicho efecto, se realizó un experimento con 24 pacientes dividién-

-177 -
Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

dolos a partes iguales en cada posible grupo, obteniendo las siguientes medias en
cada grupo:

Fármaco g < 120mgr/l g > 120mgr/l


11.47, 14.23, 11,07, 11.49,13.62, 8.73,
A
10.86, 12.89, 9.54 10.94, 9.94, 10.87
10.72, 15.29, 15.71, 13.05, 13.81, 13,25,
B
0.56, 12.93, 13.80 12.36, 14.65, 13.13

Estudiar los posibles efectos que tengan ambos factores en el tiempo de recu­
peración de los pacientes, sin descartar la posible interacción entre fármaco y
nivel de glucosa.

12. A fin de investigar el efecto del fármaco Rhitalin sobre los niños hiperactivos se
tomó una muestra de 4 niños para cada uno de los cruces de los dos siguientes
factores: Tipo de niño (normal e hiperactivo) y medicamento administrado (Pla­
cebo y Rhitalin). Para cada niño se midió un índice de actividad, obteniéndose
los siguientes datos:

Tipo de niño Placebo Rhitalin


Normal 50 45 55 52 67 60 58 65
Hiperactivo 70 72 68 75 51 57 40 55

13. Los miembros de un equipo ciclista se dividen al a^ar en tres grupos que entre­
nan con métodos diferentes. El primer grupo realiza largos recorridos a ritmo
pausado, el segundo grupo realiza series cortas de alta intensidad y el tercero tra­
baja en el gimnasio con pesas y se ejercita en el pedaleo de alta frecuencia. Des­
pués de un mes de entrenamiento se realiza un test de rendimiento consistente en

-178-
Capítulo VII Diseño Experimental

un recorrido cronometrado de 9 Km. Los tiempos empleados fueron los siguien­


tes:

Método I Método II Método III


15 14 13
16 13 12
14 15 11
15 16 14
17 14 11

A un nivel de confianza del 95% ¿Puede considerarse que los tres métodos pro­
ducen resultados equivalentes?; por el contrario ¿Hay algún método superior a
los demás?

-179-
CAPITULO VIII

REGRESIÓN
PROBIT
Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

8.1. REGRESIÓN PROBIT.

Ensayos de tipo dosis-respuesta son aquellas en que una determinada droga es


administrada en k diferentes dosis Xj, x2, ....,Xk . y mi, m2, m^ número de
individuos que recibieron las dosis respectivamente. Obteniéndose como res­
puesta yi,....yu individuos que mudan de estado (ocurrencia de un suceso, por
ejemplo muerte). Suponga que cada individuo responde (muerte o sobrevive) a
dosis aplicada.
Los resultados de este tipo de ensayos pueden ser considerados como prove­

nientes de una distribución binomial con probabilidad 7li . Que es la probabi­

lidad de la ocurrencia de un suceso o evento. Es decir y¡ & ? 7ti ) .

Si la dosis Xj es dada para una población. f(u) función de densidad para la dis­
tribución de tolerancia, todo individuo cuya tolerancia es menor que x¡ respon­
derá a la droga con una probabilidad .

«■/ = P [ U á * ,] = F ( X j ) = j f ( u ) d u
00
Esta probabilidad de ocurrencia de respuesta es típicamente nula para valores
pequeños de dosis. Unitaria para valores grandes.
El problema entonces es encontrar una curva senosoidal que se ajuste bien a los
datos, a partir de ella obtendremos la dosis efectiva.
Dentro de las curvas senosoidales más comunes están: logia, probit y comple­
mento log-log.

-182-
Capítulo VIII Regresión Provit

8.2. APLICACIÓN

La siguiente tabla muestra el número de insectos muertos. Esta información


está referida a un ensayo de toxicidad, en que distintas dosis de insecticida
fueron aplicados a mj insectos, los cuales fueron expuestos durante 24 horas
X: niveles de la dosis utilizada
Y: Muertos: número de cuando se utiliza las dosis correspondiente
m¡: número de individuos que recibieron las dosis

X= Dosis y¡ m,
0.649 0 6
0.791 0 6
1.044 2 6
1.493 2 6
1.917 4 6
2.43 5 6
3.087 5 6
3.926 6 6
4.886 6 6

OBJETIVOS
• Los objetivos de este tipo de experimentos son en general, modelar la proba­

bilidad de sucesos 7Vi como función de variables explicatorios o indepen­

dientes.
• Determinar la dosis Efectiva (DLP) que causan la mudanza de estado del p%
de los individuos.
• Comparar la potencia de diferentes productos.

-183-
Cleto De La Torre Dueñas________________________Yeny M. Accostupa Quisgc

En el caso en particular el objetivo es la determinación de la dosis letal que eli­


mina el p% de los insectos, con la finalidad de recomendar su aplicación de in­
secticida en el campo.

Definamos la respuesta de la siguiente forma:


Y =l, Insecto muere
Y=0, Sobrevive.

* * * * * * * * * * * * P R O B IT ANALYSIS *********
Parameter estimates converged after 11 iterations.
Optimal solution found.

Parameter Estimates (PROBIT model: (PROBIT(p)) = Intercept + BX):

Regression Coeff. Standard Error Coeff./S.E.

DOSIS .92228 .31501 2.92778

Intercept -1.50966 .66632 -2.26568

Pearson Goodness-of-Fit C hiSquare= 1.150 DF = 5 P = .950

De los resultados anteriores que se muestra, La ecuación de regresión probit


esta dado por:

probit{p ) = (p~X{ p ) = J3¡ + J32x = - 1 .50966 + 0.92228 dosis

- 184 -
Capítulo VIII Regresión Provit

El test de chi cuadrado, con un valor 1.150 y 5 grados de libertad y un grado de


significación p=0.950, no establece dudas acerca de la bondad del ajuste del mo­
delo a los datos.
En conclusión el modelo ajusta adecuadamente los datos para este problema.

************ PROBIT ANALYSIS *********

Observed and Expected Frequencies


Number of Observed Expected
DOSIS Subjects Responses Responses Residual Prob

1.04 6.0 2.0 1.754 .246 .29226


1.49 6.0 2.0 2.683 -.683 .44722
1.92 6.0 4.0 3.612 .388 .60193
2.43 6.0 5.0 4.607 .393 .76775
3.09 6.0 5.0 5.457 -.457 .90946
3.93 6.0 6.0 5.896 .104 .98262
4.89 6.0 6.0 5.992 .008 .99863

Los resultados anteriores, en la primera columna se presenta la dosis y en la se­


gunda el número de insectos. La tercera columna recoge las respuestas observa­
das, y la cuarta columna las esperadas, extraídas a partir de la probabilidad co­
rrespondiente a cada valor y obtenida esta probabilidad a través de la regresión.
Finalmente, en la quinta, aparece el residual o la diferencia entre una y otras y
allí es donde se puede observar el ajuste del modelo más detalladamente.
Finalmente los resultados que se muestra, nos servirá para determinar que valores
de la variable dosis tiene que probabilidad de respuesta. Esta información es su­
mamente importante ya que en la mayoría de las aplicaciones de esta prueba. In­

185 -
Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

teresa saber con que valores de la variable dosis obtendremos un 50, 90,
100,%,etc de respuesta positiva(muerte de los insectos)

************ p p o B IT A' N A L Y S I S ' * * * * * * * * *

Confidence Limits for Effective DOSIS

95% Confidence Limits


’rob DOSIS Lower Upper

01 -.88552 -6.73462 .32855


.02 -.58994 -5.84831 .51347
.03 -.40241 -5.28695 .63178
.04 -.26134 -4.86530 .72140
.05 -.14659 -4.52280 .79479
.06 -.04892 -4.23167 .85765
.07 .03672 -3.97674 .91310
.08 .11340 -3.74880 .96306
.09 .18314 -3.54177 1.00877
.10 .24733 -3.35146 1.05111
.15 .51311 -2.56684 1.22973
.20 .72433 -1.94846 1.37691
.25 .90555 -1.42349 1.50871
.30 1.06829 -.95842 1.63345
.35 1.21909 -.53531 1.75687
.40 1.36219 -.14390 1.88408
.45 1.50063 .22127 2.02068

- 186 -
Capítulo VIII Regresión Provit

.50 1.63688 .56208 2.17368


.55 1.77313 .87736 2.35221
.60 1.91158 1.16385 2.56749
.65 2.05468 1.41866 2.83129
.70 2.20548 1.64276 3.15374
.75 2.36822 1.84260 3.54370
.80 2.54943 2.02898 4.01409
.85 2.76066 2.21593 4.59270
90 3.02644 2.42436 5.34750
.91 3.09063 2.47182 5.53269
.92 3.16037 2.52246 5.73480
.93 3.23705 2.57716 5.95800
.94 3.32268 2.63722 6.20832
.95 3.42036 2.70460 6.49492
.96 3.53511 2.78249 6.83293
.97 3.67618 2.87669 7.25000
.98 3.86371 2.99984 7.80651
.99 4.15928 3.19039 8.68720

De los resultados anteriores se puede extraer la dosis letal para eliminar el por­
centaje que uno vea por conveniente por ejemplo:

• La dosis letal para eliminar el 50% de insectos, es de 1.63688, a esta dosis se


le conoce como dosis letal media.
• La dosis letal para eliminar el 90% de insectos es 3.02644.

-187-
Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

EJERCICIOS PROPUESTOS

1. Un insecticida que contiene rotenona como uno de sus componentes, es rociado


en una muestra de insectos. La tabla que a continuación se presenta, contiene las
concentraciones del insecticida (Dosis), el número de insectos en cada muestra
(tamaño) y el número de insectos muertos (casos). Se desea conocer la influencia
del contenido de rotenona para el control de insectos así mismo como su DL50:

Dosis (ppm) Tamaño Casos


10.2 50 44
7.7 49 42
5.1 46 24
3.8 48 16
2.6 50 6
APÉNDICE
TABLA NORMAL ESTÁNDAR

z 0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09


0 0 0.00399 0.00798 0.01197 0.01595 0.01994 0.02392 0.0279 0.03188 0.03586
0.1 0.03983 0.04395 0.04776 0.05172 0.05567 0.05962 0.06356 0.0675 0.07124 0.07534
0.2 0.07926 0.08617 0.08706 0.09095 0.09483 0.09871 0.10257 0.10642 0.11026 0.11409
0.3 0.11781 0.12172 0.12552 0.1293 0.13307 0.13683 0.14058 0.14431 0.14803 0.15173
0.4 0.15542 0.1591 0.16276 0.1664 0.17003 0.17364 0.17724 0.18082 0.18439 0.18793
0.5 0.19146 0.19497 0.19847 0.20194 0.2054 0.20884 0.21226 0.21566 0.21904 0.2224
0.6 0.22575 0.22907 0.23237 0.23565 0.23891 0.24215 0.24537 0.24857 0.25175 0.2549
0.7 0.25804 0.26115 0.26424 0.2673 0.27035 0.27337 0.27637 0.27935 0.2823 0.28524
0.8 0.28814 0.29103 0.29389 0.29373 0.29955 0.30234 0.3051 0.30785 0.31057 0.31327
0.9 0.31594 0.31859 0.32124 0.32381 0.32639 0.32894 0.33147 0.33398 0.33646 0.33891
1 0.34134 0.34375 0.34614 0.34849 0.35083 0.35314 0.35543 0.35769 0.35993 0.36214
1.1 0.36433 0.3665 0.36864 0.37076 0.37286 0.37923 0.37698 0.379 0.381 0.38298
1.2 0.38493 0.38686 0.38877 0.39065 0.39251 0.39435 0.39616 0.39796 0.39973 0.40147
1.3 0.4032 0.4049 0.40658 0.40824 0.40988 0.41149 0.41308 0.41466 0.41621 0.41774
1.4 0.41924 0.42073 0.4222 0.42364 0.42507 0.42647 0.42785 0.42922 0.43056 0.43189
1.5 0.43319 0.43448 0.43574 0.43699 0.43822 0.43943 0.44062 0.44179 0.44295 0.44408
1.6 0.4452 0.4463 0.44738 0.44845 0.4495 0.45053 0.45154 0.45254 0.45352 0.45449
1.7 0.45543 0.45637 0.45728 0.45818 0.45907 0.45994 0.46079 0.46164 0.46246 0.46327
1.8 0.46407 0.46485 0.46562 0.46637 0.46712 0.46784 0.46856 0.46926 0.46995 0.47062
1.9 0.47128 0.47193 0.47257 0.4732 0.47381 0.47441 0.475 0.47558 0.47615 0.4767
2 0.47725 0.47778 0.47831 0.47882 0.47932 0.47982 0.4803 0.48077 0.48124 0.48169
2.1 0.48214 0.48257 0.48299 0.48341 0.48382 0.48422 0.48461 0.485 0.48537 0.48574
2.2 0.4861 0.48645 0.48679 0.48713 0.48745 0.48778 0.48809 0.4884 0.4887 0.48899
2.3 0.48928 0.48956 0.48983 0.49001 0.49036 0.49061 0.49086 0.4911 0.49134 0.49158
2.4 0.4918 0.49202 0.49224 0.49245 0.49266 0.49286 0.49305 0.49324 0.49343 0.49361
2.5 0.49379 0.49396 0.49413 0.4943 0.49446 0.49461 0.49477 0.49491 0.49506 0.4952
2.6 0.49534 0.49547 0.4956 0.49573 0.49585 0.49597 0.49609 0.49621 0.49632 0.49643
2.7 .0.49653 0.49664 0.49674 0.49683 0.49693 0.49702 0.49711 0.4972 0.49728 0.49736
2.8 0.49744 0.49752 0.4976 0.49767 0.49774 0.49781 0.49788 0.49795 0.49801 0.49807
2.9 0.49813 0.49819 0.49825 0.4983 0.49836 0.49841 0.49846 0.49851 0.49856 0.4986
3 0.49865 0.49869 0.49874 0.49878 0.49882 0.49886 0.49889 0.49893 0.49897 0.499
3.1 0.49903 0.49906 0.4991 0.49913 0.49916 0.49918 0.49921 0.49924 0.49926 0.49929
3.2 0.49931 0.49934 0.49936 0.49938 0.4994 0.49942 0.49944 0.49946 0.49948 0.4995
3.3 0.49952 0.49953 0.49955 0.49957 0.49958 0.4996 0.49961 0.49962 0.49964 0.49965
3.4 0.49956 0.49968 0.49969 0.4997 0.49971 0.49972 0.49973 0.49974 0.49975 0.49976
3.5 0.49977 0.49978 0.49978 0.49979 0.4998 0.49981 0.49981 0.49982 0.49983 0.49983
3.6 0.49984 0.49985 0.49985 0.49986 0.49986 0.49987 0.49987 0.49988 0.49988 0.49989
3.7 0.49989 0.4999 0.4999 0.4999 0.49991 0.49991 0.49992 0.49992 0.49992 0.49992
3.8 0.49993 0.49993 0.49993 0.49994 0.49994 0.49994 0.49994 0.49995 0.49995 0.49995
3.9 0.49995 0.49995 0.49996 0.49996 0.49996 0.49996 0.49996 0.49996 0.49997 0.49997

- 190 -
TABLA DE LA DISTRIBUCIÓN T-STUDENT p ( x < c ) = \ - a

i - a
gl
0.75 0.80 0.85 0.9 0.95 0.975 0.99 0.995
1 1 1.376 1.963 3.078 6.314 12.706 31.821 63.657
2 0.816 1.061 1.386 1.886 2.920 4.303 6.965 9.925
3 0.765 0.978 1.250 1.638 2.353 3.182 4.541 5.841
4 0.741 0.941 1.190 1.533 2.132 2.776 3.747 4.604
5 0.727 0.920 1.156 1.476 2.015 2.571 3.365 4.032
6 0.718 0.906 1.134 1.440 1.943 2.447 3.143 3.707
7 0.711 0.896 1.119 1.415 1.895 2.365 2.998 3.499
8 0.706 0.889 1.108 1.397 1.860 2.306 2.896 3.355
9 0.703 0.883 1.100 1.383 1.833 2.262 2.821 3.250
10 0.7 0.879 1.093 1.372 1.812 2.228 2.764 3.169
11 0.697 0.876 1.088 1.363 1.796 2.201 2.718 3.106
12 0.695 0.873 1.083 1.356 1.782 2.179 2.681 3.055
13 0.694 0.870 1.079 1.350 1.771 2.160 2.650 3.012
14 0.692 0.868 1.076 1.345 1.761 2.145 2.624 2.977
15 0.691 0.866 1.074 1.341 1.753 2.131 2.602 2.947
16 0.69 0.865 1.071 1.337 1.746 2.120 2.583 2.921
17 0.689 0.863 1.069 1.333 1.740 2.110 2.567 2.898
18 0.688 0.862 1.067 1.330 1.734 2.101 2.552 2.878
0.688 0.861 1.066 1.328 1.729 2.093 2.539 2.861
20 0.687 0.860 1.064 1.325 1.725 2.086 2.528 2.845
21 0.686 0.859 1.063 1.323 1.721 2.080 2.518 2.831
22 0.686 0.858 1.061 1.321 1.717 2.074 2.508 2.819
23 0.685 0.858 1.060 1.319 1.714 2.069 2.500 2.807
24 0.685 0.857 1.059 1.318 1.711 2.064 2.492 2.797
25 0.684 0.856 1.058 1.316 1.708 2.060 2.485 2.787
26 0.684 0.856 1.058 1.315 1.706 2.056 2.479 2.779
27 0.684 0.855 1.057 1.314 1.703 2.052 2.473 2.771
28 0.683 0.855 1.056 1.313 1.701 2.048 2.467 2.763
29 0.683 0.854 1.055 1.311 1.699 2.045 2.462 2.756
30 0.683 0.854 1.055 1.310 1.697 2.042 2.457 2.750
40 0.681 0.851 1.050 1.303 1,684 2.021 2.423 2.704
60 0.679 0.848 1.046 1.296 1.671 2.000 2.390 2.660
120 0.677 0.845 1.041 1.289 1.658 1.980 2.358 2.617

-191-
TABLA DE LA DISTRIBUCIÓN CHI CUADRADO ( p (jc2 < c) = 1- a )

gl 0.005 0.01 0.025 0.05 0.1 0.2 0.4 0.6 0.8 0.9 0.95 0.975 0.99 0.995
1 0 0 0 0 0.02 0.06 0.27 0.71 1.64 2.71 3.84 5.02 6.63 7.88
2 0.01 0.02 0.05 0.1 0.21 0.45 1.02 1.83 3.22 4.61 5.99 7.38 9.21 10.6
3 0.07 0.11 0.22 0.35 0.58 1.01 1.87 2.95 4.64 6.25 7.81 9.35 11.34 12.84
4 0.21 0.3 0.48 0.71 1.06 1.65 2.75 4.04 5.99 7.78 9.49 11.14 13.28 14.86
5 0.41 0.55 0.83 1.15 1.61 2.34 3.66 5.13 7.29 9.24 11.07 12.83 15.09 16.75
6 0.68 0.87 1.24 1.64 2.2 3.07 4.57 6.21 8.56 10.64 12.59 14.45 16.81 18.55
7 0.99 1.24 1.69 2.17 2.83 3.82 5.49 7.28 9.8 12.02 14.07 16.01 18.48 20.28
8 1.34 1.65 2.18 2.73 3.49 4.59 6.42 8.35 11.03 13.36 15.51 17.53 20.09 21.95
9 1.73 2.09 2.7 3.33 4.17 5.38 7.36 9.41 12.24 14.68 16.92 19.02 21.67 23.59
10 2.16 2.56 3.25 3.94 4.87 6.18 8.3 10.47 13.44 15.99 18.31 20.48 23.21 25.19
11 2.6 3.05 3.82 4.57 5.58 6.99 9.24 11.53 14.63 17.28 19.68 21.92 24.73 26.76
12 3.07 3.57 4.4 5.23 6.3 7.81 10.18 12.58 15.81 18.55 21.03 23.34 26.22 28.3
13 3.57 4,11 5.01 5.89 7.04 8.63 11.13 13.64 16.98 19.81 22.36 24.74 27.69 29.82
14 4.07 4.66 5.63 6.57 7.79 9.47 12.08 14.69 18.15 21.06 23.68 26.12 29.14 31.32
15 4.6 5.23 6.26 7.26 8.55 10.31 13.03 15.73 19.31 22.31 25 27.49 30.58 32.8
16 5.14 5.81 6.91 7.96 9.31 11.15 13.98 16.78 20.47 23.54 26.3 28.85 32 34.27
17 5.7 6.41 7.56 8.67 10.09 12 14.94 17.82 21.61 24.77 27.59 30.19 33.41 35.72
18 6.26 7.01 8.23 9.39 10.86 12.86 15.89 18.87 22.76 25.99 28.87 31.53 34.81 37.16
19 6.84 7.63 8.91 10.12 11.65 13.72 16.85 19.91 23.9 27.2 30.14 32.85 36.19 38.58
20 7.43 8.26 9.59 10.85 12.44 14.58 17.81 20.95 25.04 28.41 31.41 34.17 37.57 40
21 8.03 8.9 10.28 11.59 13.24 15.44 18.77 U" 26.17 29.62 32.67 35.48 38.93 41.4
22 8.64 9.54 10.98 12.34 14.04 16.31 19.73r 2Í03 27.3 30.81 33.92 36.78 40.29 42.8
23 9.26 10.2 11.69 13.09 14.85 17.19 20.691j. 24.07 28.43 32.01 35.17 38.08 41.64 44.18
24 9.89 10.9 12.4 13.85 15.66 18.06 21.65 25.11 29.55 33.2 36.42 39.36 42.98 45.56
25 10.5 11.5 13.12 14.61 16.47 18.94 22.62 26.14 30.68 34.38 37.65 40.65 44.31 46.93
30 13.8 15 16.79 18.49 20.6 23.36 27.44 31.32 36.25 40.26 43.77 46.98 50.89 53.67
35 17.2 18.5 20.57 22.47 24.8 27.84 32.28 36.47 41.78 46.06 49.8 53.2 57.34 60.27
40 20.7 22.2 24.43 26.51 29.05 32.34 37.13 41.62 47.27 51.81 55.76 59.34 63.69 6677
45 24.3 25.9 28.37 30.61 33.35 36.88 42 46.76 52.73 57.51 61.66 65.41 69.96 73.17
50 28 29.7 32.36 34.76 37.69 41.45 46186 51.89 58.16 63.17 67.5 71.42 76.15 79.49
55 31.7 33.6 36.4 38.96 42.06 46.04 51.74 57.02 63.58 68.8 73.31 77.38 82.29 85.75
60 35.5 37.5 40.48 43.19 46.46 50.64 56.62 62.13 68.97 74.4 79.08 83.3 88.38 91.95
65 39.4 41.4 44.6 47.45 50.88 55.26 61.51 67.25 74.35 79.97 84.82 89.18 94.42 98.1
70 43.3 45.4 48.76 51.74 55.33 59.9 66.4 72.36 79.71 85.53 90.53 95.02 100.4 104.2
75 47.2 49.5 52.94 56.05 59.79 64.55 71.29 77.46 85.07 91.06 96.22 100.8 106.4 110.3
80 51.2 53.5 57.15 60.39 64.28 69.21 76.19 82.57 90.41 96.58 101.88 106,6 112.3 116.3
85 55.2 57.6 61.39 6475 68.78 73.88 81.09 87.67 95.73 102.1 107.52 112.4 118.2 122.3
90 59.2 61.8 65.65 69.13 73.29 78.56 85.99 92.76 101.1 107.6 113.15 118.1 124.1 128.3
95 63.3 65.9 69.92 73.52 77.82 83.25 90.9 97.85 106.4 113 118.7 123.9 130 134.3

- 192 -
TABLAF p ( F > c ) = \ - a

Gra
dos f(0.90, vl,v2)
de
U-
ber-
Grados de libertad del numerador vi
tad
v2 i 2 3 4 5 6 7 8 9 10 12 15 20 25 30 40 50 60 80 100

2 8,53 9,00 9,16 9,24 9,29 9,33 9,35 9,37 9,38 9,39 9,41 9,42 9,44 9,45 9,46 9,47 9,47 9,47 9,48 9,48
3 5,54 5,46 5,39 5,34 5,31 5,28 5,27 5,25 5,24 5,23 5,22 5,20 5,18 5,17 5,17 5,16 5,15 5,15 5,15 5,14
4 4,54 4,32 4,19 4,11 4,05 4,01 3,98 3,95 3,94 3,92 3,90 3,87 3,84 3,83 3,82 3,80 3,80 3,79 3,78 3,78
5 4,06 3,78 3,62 3,52 3,45 3,40 3,37 3,34 3,32 3,30 3,27 3,24 3,21 3,19 3,17 3,16 3,15 3,14 3,13 3,13
6 3,78 3,46 3,29 3,18 3,11 3,05 3,01 2,98 2,96 2,94 2,90 2,87 2,84 2,81 2,80 2,78 2,77 2,76 2,75 2,75
7 3,59 3,26 3,07 2,96 2,88 2,83 2,78 2,75 2,72 2,70 2,67 2,63 2,59 2,57 2,56 2,54 2,52 2,51 2,50 2,50
8 3,46 3,11 2,92 2,81 2,73 2,67 2,62 2,59 2,56 2,54 2,50 2,46 2,42 2,40 2,38 2,36 2,35 2,34 2,33 2,32
9 3,36 3,01 2,81 2,69 2,61 2,55 2,51 2,47 2,44 2,42 2,38 2,34 2,30 2,27 2,25 2,23 2,22 2,21 2,20 2,19
10 3,29 2,92 2,73 2,61 2,52 2,46 2,41 2,38 2,35 2,32 2,28 2,24 2,20 2,17 2,16 2,13 2,12 2,11 2,09 2,09
12 3,18 2,81 2,61 2,48 2,39 2,33 2,28 2,24 2,21 2,19 2,15 2,10 2,06 2,03 2,01 1,99 1,97 1,96 1,95 1,94
15 3,07 2,70 2,49 2,36 2,27 2,21 2,16 2,12 2,09 2,06 2,02 1,97 1,92 1,89 1,87 1,85 1,83 1,82 1,80 1,79
20 2,97 2,59 2,38 2,25 2,16 2,09 2,04 2,00 1,96 1,94 1,89 1,84 1,79 1,76 1,74 1,71 1,69 1,68 1,66 1,65
25 2,92 2,53 2,32 2,18 2,09 2,02 1,97 1,93 1,89 1,87 1,82 1,77 1,72 1,68 1,66 1,63 1,61 1,59 1,58 1,56
30 2,88 2,49 2,28 2,14 2,05 1,98 1,93 1,88 1,85 1,82 1,77 1,72 1,67 1,63 1,61 1,57 1,55 1,54 1,52 1,51
40 2,84 2,44 2,23 2,09 2,00 1,93 1,87 1,83 1,79 1,76 1,71 1,66 1,61 1,57 1,54 1,51 1,48 1,47 1,45 1,43
50 2,81 2,41 2,20 2,06 1,97 1,90 1,84 1,80 1,76 1,73 1,68 1,63 1,57 1,53 1,50 1,46 1,44 1,42 1,40 1,39
60 2,79 2,39 2,18 2,04 1,95 1,87 1,82 , 1,77 1,74 1,71 1,66 1,60 1,54 1,50 1,48 1,44 1,41 1,40 1,37 1,36
80 2,77 2,37 2,15 2,02 1,92 1,85 1,79 1,75 1,71 1,68 1,63 1,57 l*51, 1,47 1,44 1,40 1,38 1,36 1,33 1,32
100 2,76 2,36 2,14 2,00 1,91 1,83 1,78 1,73 1,69 1,66 1,61 1,56 1,49 1,45 1,42 1,38 1,35 1,34 1,31 1,29
120 2,75 2,35 2,13 1,99 1,90 1,82 1,77 1,72 1,68 1,65 1,60 1,55 1,48 1,44 1,41 1,37 1,34 1,32 1,29 1,28

-193-
Grados f(0.95, vl,v2)
de
Libertad Grados de libertad del numerador vi
v2 60
1 2 3 4 5 6 7 8 9 10 12 15 20 25 30 40 50 80 100

2 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 19,41 19,43 19,45 19,46 19,46 19,47 19,48 19,48 19,48 19,49

3 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 8,74 8,70 8,66 8,63 8,62 8,59 8,58 8,57 8,56 8,55

4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,91 5,86 5,80 5,77 5,75 5,72 5,70 5,69 5,67 5,66

5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 4,68 4,62 4,56 4,52 4,50 4,46 4,44 4,43 4,41 4,41

6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 4,00 3,94 3,87 3,83 3,81 3,77 3,75 3,74 3,72 3,71

7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 3,57 3,51 3,44 3,40 3,38 3,34 3,32 3,30 3,29 3,27

8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 3,28 3,22 3,15 3,11 3,08 3,04 3,02 3,01 2,99 2,97

9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14 3,07 3,01 2,94 2,89 2,86 2,83 2,80 2,79 2,77 2,76

10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 2,91 2,85 2,77 2,73 2,70 2,66 2,64 2,62 2,60 2,59

12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75 2,69 2,62 2,54 2,50 2,47 2,43 2,40 2,38 2,36 2,35

15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54 2,48 2,40 2,33 2,28 2,25 2,20 2,18 2,16 2,14 2,12

20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 2,28 2,20 2,12 2,07 2,04 1,99 1,97 1,95 1,92 1,91

25 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28 2,24 2,16 2,09 2,01 1,96 1,92 1,87 1,84 1,82 1,80 1,78

30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,16 2,09 2,01 1,93 1,88 1,84 1,79 1,76 1,74 1,71 1,70

40 4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,12 2,08 2,00 1,92 1,84 1,78 1,74 1,69 1,66 1,64 1,61 1,59

50 4,03 3,18 2,79 2,56 2,40 2,29 2,20 2,13 2,07 2,03 1,95 1,87 1,78 1,73 1,69 1,63 1,60 1,58 1,54 1,52

60 4,00 3,15 2,76 2,53 2,37 2,25 2,17 2,10 2,04 1,99 1,92 1,84 1,75 1,69 1,65 1,59 1,56 1,53 1,50 1,48

80 3,96 3,11 2,72 2,49 2,33 2,21 2,13 2,06 2,00 1,95 1,88 1,79 1,70 1,64 1,60 1,54 1,51 1,48 1,45 1,43

100 3,94 3,09 2,70 2,46 2,31 2,19 2,10 2,03 1,97 1,93 1,85 1,77 1,68 1,62 1,57 1,52 1,48 1,45 1,41 1,39

120 3,92 3,07 2,68 2,45 2,29 2,18 2,09 2,02 1,96 1,91 1,83 1,75 1,66 1,60 1,55 1,50 1,46 1.43 1,39 1,37

- 194 -
f(0.975, vl,v2)
de
Libertad Grados de libertad del numerador vi
v2
i 2 3 4 5 6 7 8 9 10 12 15 20 25 30 40 50 60 80 100

2 38,51 39,00 39,17 39,25 39,30 39,33 39,36 39,37 39,39 39,40 39,41 39,43 39,45 39,46 39,46 39,47 39,48 39,48 39,49 39,49

3 17,44 16,04 15,44 15,10 14,88 14,73 14,62 14,54 14,47 14,42 14,34 14,25 14,17 14,12 14,08 14,04 14,01 13,99 13,97 13,96

4 12,22 10,65 9,98 9,60 9,36 9,20 9,07 8,98 8,90 8,84 8,75 8,66 8,56 8,50 8,46 8,41 8,38 8,36 8,33 8,32

5 10,01 8,43 7,76 7,39 7,15 6,98 6,85 6,76 6,68 6,62 6,52 6,43 6,33 6,27 6,23 6,18 6,14 6,12 6,10 6,08

6 8,81 7,26 6,60 6,23 5,99 5,82 5,70 5,60 5,52 5,46 5,37 5,27 5,17 5,11 5,07 5,01 4,98 4,96 4,93 4,92

7 8,07 6,54 5,89 5,52 5,29 5,12 4,99 4,90 4,82 4,76 4,67 4,57 4,47 4,40 4,36 4,31 4,28 4,25 4,23 4,21

8 7,57 6,06 5,42 5,05 4,82 4,65 4,53 4,43 4,36 4,30 4,20 4,10 4,00 3,94 3,89 3,84 3,81 3,78 3,76 3,74

9 7,21 5,71 5,08 4,72 4,48 4,32 4,20 4,10 4,03 3,96 3,87 3,77 3,67 3,60 3,56 3,51 3,47 3,45 3,42 3,40

10 6,94 5,46 4,83 4,47 4,24 4,07 3,95 3,85 3,78 3,72 3,62 3,52 3,42 3,35 3,31 3,26 3,22 3,20 3,17 3,15

12 6,55 5,10 4,47 4,12 3,89 3,73 3,61 3,51 3,44 3,37 3,28 3,18 3,07 3,0! 2,96 2,91 2,87 2,85 2,82 2,80 :

15 6,20 4,77 4,15 3,80 3,58 3,41 3,29 3,20 3,12 3,06 2,96 2,86 2,76 2,69 2,64 2,59 2,55 2,52 2,49 2,47

20 5,87 4,46 3,86 3,51 3,29 3,13 3,01 2,91 2,84 2,77 2,68 2,57 2,46 2,40 2,35 2,29 2,25 2,22 2,19 2,17

25 5,69 4,29 3,69 3,35 3,13 2,97 2,85 2,75 2,68 2,61 2,51 2,41 2,30 2,23 2,18 2,12 2,08 2,05 2,02 2,00

30 5,57 4,18 3,59 3,25 3,03 2,87 2,75 2,65 2,57 2,51 2,41 2,31 2,20 2,12 2,07 2,01 1,97 1,94 1,90 1,88

40 5,42 4,05 3,46 3,13 2,90 2,74 2,62 2,53 2,45 2,39 2,29 2,18 2,07 1,99 1,94 1,88 1,83 1,80 1,76 1,74

50 5,34 3,97 3,39 3,05 2,83 2,67 2,55 2,46 2,38 2,32 2,22 2,11 1,99 1,92 1,87 1,80 1,75 1,72 1,68 1,66

60 5,29 3,93 3,34 3,01 2,79 2,63 2,51 2,41 2,33 2,27 2,17 2,06 1,94 1,87 1,82 1,74 1,70 1,67 1,63 1,60

80 5,22 3,86 3,28 2,95 2,73 2,57 2,45 2,35 2,28 2,21 2,11 2,00 1,88 1,81 1,75 1,68 1,63 1,60 1,55 1,53

100 5,18 3,83 3,25 2,92 2,70 2,54 2,42 2,32 2,24 2,18 2,08 1,97 1,85 1,77 1,71 1,64 1,59 1,56 1,51 1,48

120 5,15 3,80 3,23 2,89 2,67 2,52 2,39 2,30 2,22 2,16 2,05 1,94 1,82 1,75 1,69 1,61 1,56 1,53 1,48 1,45

-195-
f(0.99,vl,v2)
bt

1 2 3 4 5 6 7 8 9 10 12 15 20 25 30 40 50 60 80 100
¡

2 98.50 99.00 99.16 99.25 99.30 99.33 99.36 99.38 99.39 99.40 99.42 99.43 99.45 99.46 99.47 99.48 99.48 99.48 99.48 99.49

3 34.12 30.82 29.46 28.71 28.24 27.91 27.67 27.49 27.34 27.23 27.05 26.87 26.69 26,58 26.50 26.41 26.35 26.32 26.27 26.24

4 21.20 18 00 16.69 15.98 15.52 15.21 14.98 14.80 14.66 14.55 14.37 14.20 14.02 13.91 13.84 13.75 13.69 13.65 13.61 13.58

5 16.26 13.27 12.06 11.39 10.97 10.67 10.46 10.29 10.16 10.05 9.89 9.72 9.55 9.45 9.38 9.29 9.24 9.20 9.16 9.13

6 13.75 10.92 9.78 9.15 8.75 8.47 8.26 8.10 7.98 7.87 7.72 7.56 7.40 7.30 7.23 7.14 7.09 7.06 7.01 6.99

7 12.25 9.55 8.45 7.85 7.46 7.19 6.99 6.84 6.72° 6.62 6.47 6.31 6.16 6.06 5.99 5.91 5.86 5.82 5.78 5.75

8 11.26 8.65 7.59 7.01 6.63 6.37 6.18 6.03 5.91 5.81 5.67 5.52 5.36 5.26 5.20 5.12 5.07 5.03 4.99 4.96

9 10.56 8.02 6.99 6.42 6.06 5.80 5.61 5.47 5.35 5.26 5.11 4.96 4.81 4.71 4.65 4.57 4.52 4.48 4.44 4.41

10 10.04 7.56 6.55 5.99 5.64 5.39 5.20 5.06 4.94 4.85 4.71 4.56 4.41 4.31 4.25 4.17 4.12 4.08 4.04 4.01

12 9.33 6.93 5.95 5.41 5.06 4.82 4.64 4.50 4.39 4.30 4.16 4.01 3.86 3.76 3.70 3.62 3.57 3.54 3.49 3.47

15 8.68. 6.36 5.42 4.89 4.56 4.32 4.14 4.00 3.89 3.80 3.67 3.52 3.37 . 3.28 3.21 3.13 3.08 3.05 3.00 2.98

20 8.10 5.85 4.94 4.43 4.10 3.87 3.70 3.56 3.46 3.37 3.23 3.09 2.94 2.84 2.78 2.69 2.64 2.61 2.56 2.54

25 7.77 5.57 4.68 4.18 3.85 3.63 3.46 3.32 3.22 3.13 2.99 2.85 2.70 2.60 2.54 2.45 2.40 2.36 2.32 2.29

30 7.56 5.39 4.51 4.02 3.70 3.47 3.30 3.17 3.07 2.98 2.84 2.70 2.55 2.45 2.39 2.30 2.25 2.21 2.16 2.13

40 7.31 5.18 4.31 3.83 3.51 3.29 3.12 2.99 2.89 2.80 2.66 2.52 2.37 2.27 2.20 2.11 2.06 2.02 1.97 1.94

50 7.17 5.06 4.20 3.72 3.41 3.19 3.02 2.89 2.78 2.70 2.56 2.42 2.27 2.17 2.10 2.01 1.95 1.91 1.86 1.82

60 7.08 4.98 4.13 3.65 3.34 312 2.95 2.82 2.72 2.63 2.50 2.35 2.20 2.10 2.03 1.94 1.88 1.84 1.78 1.75

80 6.96 4.88 4.04 3.56 3.26 3.04 2.87 2.74 2.64 2.55 2.42 2.27 2.12 2.01 1.94 1.85 1.79 1.75 1.69 1.65

100 6.90 4.82 3.98 3.51 3.21 2.99 2.82 2.69 2.59 2.50 2.37 2.22 2.07 1.97 1.89 1.80 1.74 1.69 1.63 1.60

120 6.85 4.79 3.95 3.48 3.17 2.96 2.79 2.66 2.56 2.47 2.34 2.19 2.03 1.93 1.86 1.76 1.70 1.66 1.60 1.56

- 196 -
f(0.995, vl,v2)
de
Libertad Grados de libertad del numerador vi
v2
i 2 3 4 5 6 7 8 9 10 12 15 20 25 30 40 50 60 80 100

2 198.5 199.0 199.2 199.2 199.3 199.3 199.4 199.4 199.4 199.4 199.4 199.4 199.4 199.4 199.5 199.5 199.5 199.5 199,5 199.5

3 55.55 49.80 47.47 46.20 45.39 44.84 44.43 44.13 43.88 43.68 43.39 43.08 42.78 42.59 42.47 42.31 42.21 42.15 42.07 42.02

4 31.33 26.28 24.26 23.15 22.46 21.98 21.62 21.35 21.14 20.97 20.70 20.44 20.17 20.00 19.89 19.75 19.67 19.61 19.54 19.50

5 22.78 18.31 16.53 15.56 14.94 14.51 14.20 13.96 13.77 13.62 13.38 13.15 12.90 12.76 12.66 12.53 12.45 12.40 12.34 12.30

6 18.63 14.54 12.92 12.03 11.46 11.07 10.79 10.57 10.39 10.25 10.03 9.81 9.59 9.45 9.36 9.24 9.17 9.12 9.06 9.03

7 16.24 12.40 10.88 10.05 9.52 9.16 8.89 8.68 8.51 8.38 8.18 7.97 7.75 7.62 7.53 7.42 7.35 7.31 7.25 7.22

8 14.69 11.04 9.60 8.81 8.30 7.95 7.69 7.50 7.34 7.21 7.01 6.81 6.61 6.48 6.40 6.29 6.22 6.18 6.12 6.09

9 13.61 10.11 8.72 7.96 7.47 7.13 6.88 6.69 6.54 6.42 6.23 6.03 5.83 5.71 5.62 5.52 5.45 5.41 5.36 5.32

10 12.83 9.43 8.08 7.34 6.87 6.54 6.30 6.12 5.97 5.85 5.66 5.47 5.27 5.15 5.07 4.97 4.90 4.86 4.80 4.77

12 11.75 8.51 7.23 6.52 6.07 5.76 5.52 5.35 5.20 5.09 4.91 4.72 4.53 4.41 4.33 4.23 4.17 4.12 4.07 4.04

15 10.80 7.70 6.48 5.80 5.37 5.07 4.85 4.67 4.54 4.42 4.25 4.07 3.88 3.77 3.69 3.59 3.52 3.48 . 3.43 3.39

20 9.94 6.99 5.82 5.17 4.76 4.47 4.26 4.09 3.96 3.85 3.68 3.50 3.32 3.20 3.12 3.02 2.96 2.92 2.86 2.83

25 9.48 6.60 5.46 4.84 4.43 4.15 3.94 3.78 3.64 3.54 3.37 3.20 3.01 2.90 2.82 2.72 2.65 261 2.55 2.52

30 9.18 6.35 5.24 4.62 4.23 3.95 3.74 3.58 3.45 3.34 3.18 3.01 2.82 2.71 2.63 2.52 2.46 2.42 2.36 2.32

40 8.83 6.07 4.98 4,37 3.99 3.71 3.51 3.35 3.22 3.12 2.95 2.78 2.60 2.48 2.40 2.30 2.23 2.18 2.12 2.09

50 8.63 5.90 483 4.23 3.85 3.58 3.38 3.22 3.09 2.99 2.82 2.65 2.47 2.35 2.27 2.16 2.10 2.05 1.99 1.95

60 8.49 5.79 4.73 4.14 3.76 3.49 3.29 3.13 3.01 2.90 2.74 2.57 2.39 2.27 2.19 2.08 2.01 1.96 1.90 1.86

80 8.33 5.67 4.61 4.03 3.65 3.39 3.19 3.03 2.91 2.80 2.64 2.47 2.29 2.17 2.08 1.97 1.90 1.85 1.79 1.75

100 8.24 5.59 4.54 3.96 3.59 3.33 3.13 2.97 2.85 2.74 2.58 2.41 2.23 2.11 2.02 1.91 1.84 1.79 1.72 1.68

120 8.18 5.54 4.50 3.92 3.55 3.28 3.09 2.93 2.81 2.71 2.54 2.37 2.19 2.07 1.98 1.87 1.80 1.75 1.68 1.64

-197 -
MÉTODOS ESTADÍSTICOS
DE ACUERDOAL TIPO DE VARIABLES y NIVEL DE INVESTIGACIÓN

Tipo de
Tipo de variable Nivel de investigación Método o Técnica Estadística.
Descripción
Tabla de Frecuencias, pro­
porciones, o porcentajes.
• Cualitativa (No­ Representados por gráfico
Variables indi­ minal y Ordinal) de barras, sectores o picto-
DESCRIPTIVA
viduales gramas.
• Escala de Likert Intervalo de confianza y
prueba de hipótesis de la
proporción.
Distribución de frecuencias
por intervalos.
- Medias, desviación, va­
rianza, percentiles.
Variables indi­ Cuantitativa (Inter­
DESCRIPTIVA - Intervalo de confianza y
viduales valo o razón)
prueba de hipótesis de la
media.
- Análisis factorial, análisis
de compontes principales.

- 198 -
Tablas de contingencia.
- Cálculo de riesgos.
- Pruebas de chi-cuadrado:
V. Ind.:
independencia
Cualitativa
Asociación - Gráfico de barras de doble
entre variables EXPLICATIVA entrada.
con V.Dep: Cualita­
- Pruebas de Kendall, de
tiva
Spearman.
- Análisis de corresponden­
cias

- Tablas con clasificación


V. Ind.: Cualitativa
Asociación categórica, con promedios,
(Grupos) con COMPARATIVA
entre variables desviaciones, etc.
V.Dep: Cuantitativa
- Prueba t-student

- Diseño experimental
V. Ind.: Cualitativa PRE EXPERIMENTAL,
Asociación (ANOVA)
(factor) con V. Dep: CUASI EXPERIMENTAL,
entre variables - Prueba t
Cuantitativa EXPERIMENTAL
- Comparación de medias.

V. Ind.: Cuantitati- - Análisis de regresión.


Asociación RELACIONAL,
va(s) con V.Dep: - Coeficiente de correlación
entre variables CORRELACIONAL
Cuantitativa de pearson.

V. Ind.: Cuantitati-
- Regresión Logística.
Asociación va(s), cualitativa(s)
EXPLICATIVA - Análisis Discriminante.
entre variables Con V.Dep: Cualita­
tiva

-199-
- 200 -
BIBLIOGRAFIA.

1. CORDOVA, MANUEL (2003). Estadística descriptiva e inferencial.


Editorial Moshera Lima.
2. DANIEL. WAYNE W (2002)- Bioestadística. Ed Limusa
3. DE LA TORRE ,CLETO (2009). Estadística Aplicada a las Ciencias de la
Salud
4. DE LA TORRE ,CLETO (2009). Estadística Inferencial para la Investi­
gación Biomédica
5. GUILFORD J. P. Y FRUCHTER B (1984) Estadística aplicada a la Psi­
cología y a la Educación”. Editorial Me Graw HUI.
6. Kleinbaum, D. Kupper, L. Morgenstén, (1990). Fundamentáis of Epidemi-
ologic Research, Duxbury Press Inc.
7. Matthews D. Farewell V., (1990). Estadística Medica Ed. Salvat.
8. Milton Susan J., (1994). Estadística para Biología y Ciencias de la Salud,
McGraw-Hill
9. Ministerio de Salud (2001). Pruebas Estadísticas Unidad I, II y III, Pro­
grama de especialización de epidemiología de campo
10. Montano, R. Schiattino, I. Silva, C. Villegas, C., (2002). Estadística Apli­
cada. Apuntes y material del curso. Universidad de Chile, Escuela de Salud
Pública.
11. RosnerB.(1986) Fundamentáis of Bioestatistics, Ed. PWS-KENT.
12. Schefler, (1981). Bioestadística, Fondo Educativo Interamericano S.A.
13. Shoukri M.M., Edge V.L., (1996). Statistical Methods for Health Sciences,
CRC. Press.
14. Taucher, Erica, (1998). Bioestadística, Editorial Universitaria.
15. Tsokos, Milton, (1987). Estadística para Biología y Ciencias de la Salud,
Editorial Interamericana Me Graw Hill.
16. Tukey, J., (1968). Exploratory Data Analysis, John Wiley and Sons.

You might also like