Professional Documents
Culture Documents
MAESTRIA EN ECOLOGIA
40
Porcentaje
30
20
10
0
Bajo
Intermedio
Alto
Hbito de estudio
Mtodos Estadsticos
1RA EDICION
Mtodos Estadsticos
CAPITULO I
INTRODUCCION A INVESTIGACION CIENTIFICA
Qu es investigar?
Investigar viene del latn investigare.
Es la forma ms adecuada de aproximarse al conocimiento de la verdad
mediante verdades parciales.
Desarrollar actividades con el objetivo de registrar, indagar o descubrir
la verdad.
Mtodos Estadsticos
De entender, verificar,
que
deben
propsitos
tiene
ser
respondidas?
Qu
la Objetivos.
han
anteriormente
sobre
el
tema
planteado?
Qu hay escrito al respecto?
Marco Terico.
Qu se pretender probar?
Cmo
se
va
Hiptesis.
realizar
la
Metodologa.
investigacin?
Cunto tiempo se requiere para el
Programacin
estudio propuesto?
Qu recursos se necesitan?
Presupuesto.
Bibliografa.
referir el investigador?
Mtodos Estadsticos
Qu
tipo
de
informacin
se Identificacin de informacin.
pregunta (s) de
y
verificar
las
hiptesis?
Dnde encuentro la informacin?
Definicin
de
fuentes
de
informacin.
Si utilizo fuentes primarias, a Determinacin de la muestra
cuntas personas
debo requerir
de
recoleccin:
procesamiento
ordenamiento
de
y
la
informacin.
Cmo se utiliza la informacin Elaboracin
procesada y ordenada?
anlisis
de
la
informacin.
de
los
resultados
del la investigacin.
anlisis?
estudiar
principales rasgos.
Mtodos Estadsticos
PROBLEMA DE INVESTIGACION.
Para la presentacin del POI, es necesario considerar cuatro momentos: el
diagnstico, el pronstico, el control del pronstico y la formulacin de la
pregunta o preguntas o la redaccin de un texto a manera de pregunta.
El diagnstico es la descripcin de los sntomas o problemas.
El pronstico es la serie consecuencias de los problemas.
El control del pronstico es la serie de acciones para superar las
consecuencias de los problemas.
Formulacin del problema
Mtodos Estadsticos
Qu se investigar?
Variable/s
Quines participarn
Sujetos a estudiar
Qu estrategia se seguir?
Diseo
Dnde se realizar?
mbito de estudio
Cundo se realizar?
Perodo de Tiempo.
Mtodos Estadsticos
Situacin
Unidad de
problemtica
estudio
Espacio
Tiempo
Situacin problemtica
Responde a la pregunta Qu investigar?
Por ejemplo: Rendimiento acadmico, gestin educativa, desempeo
profesional,..
La especificidad
Es el aspecto o los aspectos concretos que se quiere investigar acerca
del hecho o situacin problemtica.
Por ejemplo: causas, consecuencias, caractersticas, importancia,
influencia, tendencia, modalidades, incidencia, prevalencia, implicancias,
estructura, funcin, nivel, relacin, evolucin, etc.
Unidades de estudio.
Son aquella en las se ponen de manifiesto los hechos o situaciones
problemticas y constituyen, desde el punto de vista estadstico, la
poblacin o muestra a la que se refiere la investigacin. Son: Personas,
grupos
sociales,
seres,
acontecimientos,
instituciones,
objetos,
procesos.
Espacio
Esta referido al lugar en el que ocurre el hecho o situacin problemtica.
Puede ser geogrfico o administrativo. Dnde?; Per, Ciudad del
Cusco, Zona Franca, Aceros Arequipa, etc.
Tiempo
Est referido al momento en que ocurre el hecho o situacin
problemtica. Cundo?
Mtodos Estadsticos
conocer,
explicar,
refutar,
comprobar, etc.)
Elemento de estudio.
Contenido
Accin
Mtodos Estadsticos
construccin
del
marco
terico
depende
de
lo
que
Mtodos Estadsticos
Qu Funciones cumple?
Direccionar el problema objeto de investigacin
Identificar variables objeto de anlisis
Orientar el uso de mtodos y tcnicas de obtencin de informacin
11
Mtodos Estadsticos
2.
Variables,
las
caractersticas
propiedades
cualitativas
relacin o causalidad.
Mtodos Estadsticos
dependiente.
relacionan
con
las
variables y
a estas entre s.
ALCANCE DESCRIPTIVA
Orientada al descubrimiento de las propiedades particulares del hecho o
situacin problemtica y tambin a la determinacin de la frecuencia con que
ocurre el hecho o situacin problemtica.
Responde a las preguntas Cmo son? Cuntos son? Dnde estn? Se
refiere a las caractersticas cualidades internas y externas, propiedades y
rasgos de la poblacin de estudio
Pregunta
Ejemplo 2:
Nivel de conocimiento de las estrategias cognitivas por los profesores, de la
poblacin de la ciudad de Cusco, 2011.
13
Mtodos Estadsticos
INVESTIGACIN CORRELACIONAL
Orientada a descubrir la relacin o correspondencia entre los valores de
dos hechos o situaciones problemticas.
Orientada al descubrimiento de las causas o consecuencias o
condicionantes de la situacin problemtica
Est dirigida a responder a las causas de los eventos fsicos o sociales y
su inters se centra en explicar por qu y en qu condiciones ocurre un
fenmeno, o por qu dos o ms variables se relacionan.
Por qu? La finalidad es determinar por qu un hecho o fenmeno de
la realidad tiene tales y cuales caractersticas.
Problema Pregunta
Ejemplo 3:
Principales causas de la desercin escolar en la regin andina del Per, 2010.
Ejemplo 6:
Correlacin entre hbitos de estudio y aprendizaje en los estudiantes de la
Universidad de Nacional San Antonio Abad del Cusco, 2011.
ALCANCE EXPLICATIVO
Orientada a descubrir la validez de un hecho para la modificacin de una
situacin problemtica.
Qu cambios y modificaciones se han producido? Qu mejoras se
han logrado?.
Pregunta
Es ms eficaz ...que....?
Ejemplo 7:
Evaluacin del efecto del uso de tres tipos de materiales didcticos en el
rendimiento acadmico, en las I.E de la ciudad de Cusco, 2011.
14
Mtodos Estadsticos
Se investiga
INVESTIGACION
TECNOLOGICA.
Se
relaciona
esencial,
objetiva
Mtodos Estadsticos
Diseos experimentales
Son aquellos en los que se cumple que:
Los grupos a ser investigados han sido asignados al azar, por
procedimientos aleatorios y los grupos resultantes son equivalentes, de
tal manera que se tiene un grupo control equivalente a los grupos
experimentales.
Diseos cuasi-experimentales.
Entendemos por diseos cuasi-experimentales cuando se cumplen las
siguientes condiciones:
Los grupos sobre los que se lleva a cabo la investigacin no han
podido establecerse como equivalentes en las caractersticas
fundamentales. Los grupos no han sido asignados al azar, sino
que han sido establecidos por algn otro procedimiento de
muestreo.
16
Mtodos Estadsticos
Diseos transversales
17
Mtodos Estadsticos
1.12 VARIABLES
A las caractersticas objeto de estudio en la poblacin se les llama variables, ya
que pueden variar de un individuo a otro y se representara por letras
maysculas: X, Y, Z,. . ., debemos distinguir los distintos tipos de variables que
hay, lo cual nos va a permitir utilizar las herramientas estadsticas apropiadas.
TIPOS DE VARIABLES.
Las variables estadsticas pueden ser de dos tipos:
Variables cualitativas o atributos: describen cualidades y no toman
valores numricos, estas a su vez pueden ser:
Nominales.- Las cualidades no presentan ningn orden. Ejemplo Sexo
del estudiante (Femenino, Masculino), Procedencia, I.E.
Ordinales.- Este tipo de variables presentan orden Ejemplo: Grado de
estudios
(Analfabeto,
primaria,
secundaria,
superior),
Nivel
de
conocimiento de Docentes.
Toman
valores
en
un
intervalo.
Generalmente
Una caracterstica esencial de este tipo de variables es que sus valores nunca
son observables con exactitud, sino que dependen (las observaciones) de la
precisin del instrumento de medida.
18
Mtodos Estadsticos
Ejemplo 7
Los
19
Mtodos Estadsticos
Mtodos Estadsticos
Tipo
Informacin
Transform.
Significa Significa
Significa
deducible
admisibles
orden
Origen
Relaciones
Nominal igual que o
distinto que
No
Ordinal
mayor que
o igual que
No
No
Ejemplos
Procedencia
Aplicaciones
del Profesor,
inyectivas
tipo de
metodologia
Si
Relaciones
distancia
No
No
Grado de
planificacin,
Funciones
Nivel de
crecientes
utilizacin de
materiales
educativos.
Igualdad o
Intervalo
Si
Si
No
desigualdad
A + b.x
Temperatura,
de
(b 0)
inteligencia
diferencias
Igualdad o
Razn
desigualdad
de razones
Si
Si
Si
Rendimiento
B .x
acadmico,
(b 0)
Nmero de
estudiantes.
y deficiente,
Mtodos Estadsticos
Asignacin Asignacin
Numrica
Numrica
II
Alternativa
Alternativa
Alternativa
Alternativa
Muy de
Totalmente
Definitivamen Completame
acuerdo
de acuerdo
te s
nte
verdadero
De acuerdo
De acuerdo
Probablemen
Verdadero
te s
0
Ni de
Neutral o
acuerdo, ni
indiferente
Indeciso
Ni falso, ni
verdadero
en
desacuerdo
-1
-2
En
En
Probablemen
desacuerdo
desacuerdo
te no
Muy en
Totalmente
Definitivamen Completame
desacuerdo
en
te no
desacuerdo
22
Falso
nte falso
Mtodos Estadsticos
PM--------------------I----------------------I----------------------I------------------PA
Donde: PM: Puntaje mnimo y PA: Puntaje Mximo.
Frecuencia
Porcentaje
Asignacin de
puntajes
Totalmente de acuerdo
(5)
4.4%
2(5)
De acuerdo
(4)
9%
4(4)
Indeciso
(3)
15.6%
7(3)
En desacuerdo
(2)
20%
9(2)
23
51%
23(1)
n=45
100%
Total=88
23
Mtodos Estadsticos
Totalmente
En
En
desacuerdo desacuerdo
(1)
(2)
45*1=45
45*2=90
Indeciso
(3)
De acuerdo
(4)
45*3=135 45*4=180
Totalmente de
Acuerdo (5)
45*5=225
Variable dependiente
Es aquella que juega un rol de consecuencia, al ser determinada,
originada o influida por la variable independiente. Esto significa que
no pueden existir variables dependientes sin las independientes.
Considerando el tiempo, las independientes son ms antiguas que
las dependientes. Se encuentran en las siguientes investigaciones:
1. Explicativa
24
Mtodos Estadsticos
2. Relacional
3. Correlacinal
4. Experimental (La variable dependiente en una investigacin
experimental se le conoce como respuesta)
Ejemplo 13:
En el problema influencia del uso de mapas mentales en el rendimiento
acadmico de los estudiantes de las I.E de la regin de Cusco, 2011.
Variable independiente: Rendimiento Acadmico
Variable dependiente: Uso de mapas mentales
Variable Intermedia
Es aquella que juega un rol de factor condicionante, pues su
presencia entre la variable independiente y variable dependiente
hace que sin tener el carcter de factor causal o determinante,
modifique le resultado ms complejas y de mayor profundidad.
Ejemplo 14:
En el estudio de formacin acadmica y rol de la experiencia en el
desempeo profesional, Quillabamba. 2011.
Variable independiente: formacin acadmica.
Variable Dependiente: Desempeo profesional
Variable Intermedia : Experiencia
Variable interviniente
Es aquella que en ciertas medida juega un rol pasivo en el problema,
pues permite medir las caractersticas, atributos, estructuras,
incidencia, elementos o aspectos que se son inherentes.
La variable interviniente, la encontramos en investigaciones:
1. Descriptiva
2. Comparativa.
25
Mtodos Estadsticos
Ejemplo 15:
En el problema: Niveles de desnutricin de los estudiantes de las
instituciones educativas de la ciudad de Sicuani, 2011.
Variable interviniente : Nivel de desnutricin.
Variables Asociadas
Son aquellas que no guardan mayor nivel de dependencia, no hay
relacin causal entre ellas y considerando el criterio tiempo vienen a
ser ms o menos contemporneas, pues para que aparezca el
problema surgen de manera simultnea.
Este tipo de variables, se encuentra en la investigacin descriptiva
multivariable, se trata de dos o ms variables intervinientes, por lo
que nunca van acompaadas de algn otro tipo de variables.
Ejemplo 16:
En el problema: Rasgos sociales y culturales de los profesores de la
ciudad de Cusco , 2011.
Las variables asociadas son rasgos sociales y rasgos
culturales
Variables Interdependientes
Son aquellas que indistintamente pueden ser consideradas como
causa o como consecuencia una de otra. Corresponden a la
investigacin correlacional.
Ejemplo 17:
En el problema: Correlacin entre tipo de alimentacin y obesidad
de los estudiantes de la ciudad de Cusco, 2010.
Las variables interdependientes, son tipo de alimentacin y obesidad
26
Mtodos Estadsticos
Descriptiva
Interviniente
Asociada
Comparativa
Relacional
Interviniente
Explicativa
Independiente(s)
Dependiente(s)
Correlacional
Experimental
Independiente
Interdependiente
Estimulo (Factor)
Dependiente
Interdependiente
Respuesta
Observaciones:
1.
2.
27
Mtodos Estadsticos
Para
realizar
la
observacin
se
utilizan
diversos
3.- La entrevista
Mtodos Estadsticos
VALIDEZ DE CONTENIDO
El proceso de validacin de contenido es eminentemente lgico, si bien pueden
utilizarse jueces expertos en el tema para valorar la congruencia entre los
diversos items y los diversos objetivos.
Existen procedimientos cuantitativos diversos para que cada experto valore el
grado en que un tem sirve para evaluar el objetivo al que corresponde. El
procedimiento cuantitativo ms sencillo sera el siguiente:
Especificar los diversos objetivos (v.gr. reas diferentes de contenidos)
que se Pretenden evaluar.
Elaborar varios tems para cada objetivo.
Seleccionar una muestra de expertos en el contenido del test.
Pedirles que, segn su opinin, asignen cada tem al objetivo que
pretende medir.
29
Mtodos Estadsticos
Seleccionar los tems en los que los expertos manifiestan mayor acuerdo
en sus clasificaciones.
CRITERIO DE EXPERTOS
Mtodo 1:HOJA DE PREGUNTAS PARA LA VALIDACIN
PREGUNTAS
ESCALA DE VALORACION
Considera
usted
que
los
tems contenidos
estudio?
10. Que aspectos habra que modificar, que aspectos tendran que incrementarse o que aspectos
habra que suprimirse?
PROCEDIMIENTO
30
Mtodos Estadsticos
Ejemplo 18.
En el presente estudio la valoracin de los expertos es:
EXPERTOS
Item
Promedio
4.75
4.5
4.5
4.25
4.5
(1
x
(1
x
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
(1
x
)
M
a
x
1
2
n
Donde:
Xi = Valor mximo en la escala concedido para el tem i.
1 = Valor mnimo de la escala para cada tem.
DMax (5 1)2 (5 1)2 ...................(5 1) 2 12
31
Mtodos Estadsticos
Valoracin
Valoracin de
Expertos
0-2.4
A = Adecuacin Total
DPP=1.541
2.4-4.8
4.8-7.2
C = Adecuacin Promedio
7.2-9.6
D = Escasa Adecuacin
9.6-12
E = inadecuacin
Mtodo 2
32
Mtodos Estadsticos
TEM
Criterios a evaluar
observaciones
Claridad
Coherencia
Induccin
Lenguaje
En
interna
Adecuado
la
redacci
la
respuesta
Con el nivel
Mide lo
si
debe
que
eliminarse
pretend
modificarse un
e medir
favor indique)
(sesgo)
Del
informante
Si
No
Si
No
Si
No
Si
No
Si
No
Si
No
1
..
n
Aspectos generales
El instrumento contiene instrucciones claras y precisas
para responder el cuestionario
Los tems permiten el logro del objetivo de la investigacin
Los tems estn distribuidos en forma lgica y secuencial
El nmero de tems es suficiente para recoger la
informacin. En caso de ser negativa su respuesta, sugiera
los tems a aadir
Validez
Aplicable ( )
No aplicable ( )
Validado por:
Firma:
*************
Mtodos Estadsticos
rxy
n xi yi xi yi
n xi2 xi * n yi2 yi
2
Donde:
Mtodos Estadsticos
r12
n x1 x2 x1 x2
n x12 x1 * n x22 x2
2
rtt
2r12
1 r12
sd2
rtt 1 2
st
Donde:
35
Mtodos Estadsticos
sa2 sb2
rtt 2 1 2
st
Donde:
ALFA DE CRONBACH
donde:
: coeficiente de confiabilidad de la prueba o cuestionario
nmero de tems del instrumento
: Varianza total del instrumento.
: Sumatoria de las varianzas de los tems.
36
Mtodos Estadsticos
KR21
n M n M
1
n 1
nst2
Donde:
n: nmero total de tems
M: media aritmtica de las puntuaciones obtenidas por los individuos
st2 : varianza de las puntuaciones totales
TABLA DE CATEGORAS
ESCALA
CONFIABILIDAD
r>0.89
Muy alta
Alta
Aceptable
Moderada
Baja
Muy baja
Despreciable
37
Mtodos Estadsticos
Ejemplo 19.
Determine la confiabilidad, utilizando alfa de cronbach, para la siguiente
informacin
Encuestados
Preguntas (tems)
Puntos
10
12
10
10
13
11
12
13
14
15
Total
17
18
15
12
93
0.17 0.24 0.17 0.42 0.45 0.57 0.53 0.46 0.69 0.83
38
Mtodos Estadsticos
Asignacin
numrica
Para obtener las puntuaciones de la variable de estudio, se suman los valores obtenidos
respecto de cada tem. El puntaje mnimo (PM) resulta de la multiplicacin del nmero de tems
(x) por 1. Una puntuacin alta (PA) est dada por el nmero de tems o afirmaciones
multiplicado por 5.
PM--------------------I----------------------I----------------------I------------------PA
El promedio del puntaje del instrumento se obtiene mediante:
39
Mtodos Estadsticos
Pr omedio
Puntaje
n
Puntaje Obtenido
Categora
Pr omedio 1.49
Deficiente
Malo
Regular
Bueno
Pr omedio 4.5
Muy
bueno
Asignacin
numrica
Con la finalidad de realizar un anlisis estadstico de las variables con sus respectivas
dimensiones previamente se realizo la baremacin del instrumento (Medicin de la
variable)
40
Mtodos Estadsticos
Para medir la variable de estudio (Puntuacin), se suman los valores obtenidos respecto de
cada tem. El puntaje mnimo (PM) resulta de la multiplicacin del nmero de tems (x) por 1. El
puntaje mximo (PA) est dada por el nmero de tems multiplicado por 4.
PM--------------------I----------------------I----------------------I------------------PA
En el cuadro siguiente se muestra el resumen de la puntuacin:
Caractersticas
Puntuacin
original
Nro. de
preguntas
(tems)
Mnimo
Mximo
Puntaje
Obtenido
Puntuacin
transformada
A escala
vigesimal
m
1
20
x
4m
T
T 1 x 1
4m-1
19
Despejando el valor de x, se obtiene la puntuacin del individuo en escala vigesimal.
19 T 1
4m 1
Puntaje
Categora
Obtenido
0-8
Deficiente
9-10
Malo
11-13
Regular
14-17
Bueno
18-20
Muy
bueno
41
Mtodos Estadsticos
OBJETIVO
HIPOTESIS
VARIABLES
General
General
General
Variable independiente
.?
Formulacin de problemas
especficos.
Formulacin de hiptesis
1. .?
Objetivo especfico
operativas.
2.
..
TIPO DE ESTUDIO
POBLACIN Y
RECOLECCIN DE DATOS
MUESTRA
Nivel de investigacin.
Variable Dependiente
PRUEBAS
ESTADISTICAS
Poblacin.
Gua de observacin
Tipo de investigacin.
Cuestionario encuestas
Diseo de investigacin
Muestra
VARIABLES
DIMENSIONES
INDICADORES
Ubicacin de tems
..
..
Entrevistas
42
Mtodos Estadsticos
1.19
MODELO DE TESIS
TTULO DE LA TESIS:
ANTECEDENTES DE ESTUDIO
MARCO CONCEPTUAL
MARCO NORMATIVO
MARCO TERICO
CONCEPTUALIZACIN EN TRMINOS
HIPTESIS DE INVESTIGACION.
43
Mtodos Estadsticos
NIVEL DE INVESTIGACIN
TIPO DE NVESTIGACION.
DISEO DE INVESTIGACIN
POBLACIN Y MUESTRA
VARIABLES
OPERACIONALIZACIN DE VARIABLES
TCNICAS E INSTRUMENTOS DE RECOLECCIN DE DATOS
TCNICAS DE ANLISIS DE DATOS.
CONCLUSIONES
RECOMENDACIONES
BIBLIOGRAFIA
ANEXOS
44
Mtodos Estadsticos
EJERCICIOS PROPUESTOS.
1.
Influencia
del
uso
de
materiales
didcticos
en
el
Frecuencia
Totalmente de acuerdo
15
De acuerdo
40
Indeciso
25
En desacuerdo
10
Totalmente en desacuerdo
3.
j.
Mtodo de enseanza.
45
Mtodos Estadsticos
CAPITULO II
ORGANIZACIN Y PRESENTACIN
1.1
DIVISION DE LA ESTADISTICA
As, la estadstica se divide en dos partes ntimamente relacionadas:
Estadstica Descriptiva.- Esta es la parte de la estadstica que se dedica a
la organizacin, sntesis y descripcin de conjuntos de datos.
Esta es importante, ya que antes de que la mente humana pueda interpretar
(hacer inferencias) un conjunto de datos, especialmente cuando estos son
demasiados, es necesario resumirlos o representarlos de manera clara,
simplificada o reducida.
Estadstica Inferencial.- Esta rama de la estadstica trata el problema de
inferir la naturaleza de un conjunto de datos a partir de una muestra de
dichos datos.
CONCEPTOS BASICOS
Poblacin. Es cualquier conjunto de datos, objetivo de nuestro inters,
sobre los cuales interesa observar una o ms caractersticas. Esta puede ser
finita o infinita. El tamao de la poblacin es el nmero de individuos que
tiene
46
Mtodos Estadsticos
Por otra parte, el reporte de las variables medidas requiere de los siguientes
conceptos:
Exactitud. Hace referencia a la cercana con la que se encuentra la medicin
realizada con el valor real de la variable medida, est relacionado con el concepto
de la media.
Precisin. Hace referencia a la cercana con que se encuentran un conjunto de
mediciones realizadas sobre la misma variable, relacionado con el concepto de
varianza.
ORGANIZACIN DE INFORMACION
La presentacin de datos a travs de tablas estadsticas es una actividad
importante dentro de los sistemas de informacin, estas se fortalecen
significativamente cuando se la acompaan con grficos descriptivos ilustrativos.
En el contexto de los sistemas de informacin, en ms de una oportunidad se
encontrara que un buen grafico resume y expresa mucho ms que prrafos
completos de comentarios e interpretaciones literales.
47
Mtodos Estadsticos
2.1
TABLA DE FRECUENCIAS.
Un primer resumen de la informacin contenida en un conjunto de datos
observado se obtiene al organizarlos en lo que se llama una tabla de
frecuencias. En sta se recogen los distintos valores (nmeros o categoras)
que toma la variable junto con sus correspondientes frecuencias de
aparicin.
n n n
i
...... nk n
i 1
ni
, se cumple
n
f 1
i
i 1
Ni n1 n2 ...... ni
La frecuencia relativa acumulada del valor i-simo es la suma de las
frecuencias relativas hasta dicho valor, se denota por F i
48
Mtodos Estadsticos
Fi f 1 f 2 ...... fi ,
Fi
Ni
n
Frecuencias
frecuencias
frecuencias
absolutas
relativas
de la
absolutas
relativas
Porcentuales
variable
fi
hi
pi
acumuladas acumuladas
Fi
Hi
C1
f1
h1
p1
F1
H1
C2
f2
h2
pi
F2
H2
Ck
fk
hk
pk
Fk=n
Hk=1
Total
1.00
100.00
Diagrama de Pareto.
Se ordenan las categoras de mayor a menor importancia y se dibujan los
rectngulos correspondientes.
Diagrama de sectores
Se dibujan en un crculo sectores con reas proporcionales a las frecuencias
de cada una de las categoras.
Mtodos Estadsticos
Dada una variable X, consideramos una muestra de tamao n que toma k valores
distintos, x1, . . . , xk (x1 < x2 < . . . < xk).
La organizacin es en forma similar al caso cualitativo.
la absolutas fi
relativas hi
variable
frecuencias
Porcentuales absolutas
pi
frecuencias
relativas
acumuladas acumuladas
Fi
Hi
x1
f1
h1
p1
F1
H1
x2
f2
h2
pi
F2
H2
xk
fk
hk
pk
Fk=n
Hk=1
Total
1.00
100.00
Observaciones
Los datos iniciales se pueden representar utilizando los grficos
Diagrama de cajas(box-plot)
1. Paralelo a un eje numerado dibujamos un segmento con extremos en los
valores menor y mayor que aparecen en la muestra.
2. Dibujamos una caja con extremos en el primer y tercer cuartil y marcamos
en ella la mediana.
3. Se hallan los lmites interiores (Q1 1.5 IQR y Q3 + 1.5 IQR) y los lmites
exteriores (Q1 3 IQR y Q3 + 3 IQR).
Donde Qi : Cuarteles que seran desarrollados ms adelante.
4. Se unen, con unos segmentos (bigotes), Q1 y Q3 con los valores
adyacentes de la muestra.
5. Por ltimo se indican los valores atpicos
Mtodos Estadsticos
1. Si los datos son de dos dgitos, a la izquierda (en el tallo) aparece la cifra
de las decenas, a la derecha separada por una lnea aparecen las hojas y
se escriben ordenadas y todas seguidas.
2. Si hay tres dgitos el tallo est formado por los dos primeros. Las hojas
son las unidades.
LI i LSi
2
LS : Limite superior.
51
Mtodos Estadsticos
Intervalo
Marcas
Frecuenci
Frecuenci
Frecuencias
Frecuencias
frecuencias
frecuencias
de clase
as
as
relativas
Porcentuale
absolutas
relativas
Ii
mi
absolutas
relativas
hi
acumuladas
acumuladas
fi
hi
pi
Fi
Hi
I1
m1
f1
h1
h1
p1
F1
H1
I2
m2
f2
h2
h2
pi
F2
H2
Ik
mk
fk
hk
hk
pk
Fk=n
Hk=1
1.00
1.00
100.00
Total
Histograma de frecuencias
Es la representacin ms frecuente con datos agrupados. Es igual que el
diagrama de rectngulos, considerando ahora en el eje de abscisas los
intervalos y en las ordenadas las frecuencias (absolutas o relativas).
Polgono de frecuencias
Se obtiene uniendo los puntos medios de los extremos superiores de los
rectngulos que forman el histograma.
Curva de frecuencias.
Resulta de suavizar el polgono de frecuencias, en sus puntos angulosos.
Ojivas
EJERCICIOS RESUELTOS
19
19.5
20
20.9
23
19.5
20
20.9
23
19.7 20.2
21
23.2
19.7 20.3
21.1
23.3
52
Mtodos Estadsticos
15.5 17.2 18
18.5 19.2
19.7 20.3
21.4
23.5
19.7 20.5
21.6
23.5
19.7 20.6
21.7
24.1
19.8 20.6
22
24.2
19.9 20.8
22.4
24.8
19.9 20.8
22.7
26.2
19
19.5
R 14
2
k 7
LI - LS
mi
[12.2 14.2)
13.2
[14.2 16.2)
15.2
[16.2 18.2)
17.2
[18.2 20.2)
19.2
[20.2 22.2)
21.2
[22. 2 24.2)
23.2
[24.2 26.2)
25.2
TOTAL
fi
Fi
hi= fi/n
0.02
6
18
36
16
0.07
26
0.2
62
0.4
78
0.18
87
0.1
3
n=90
90
0.03
1
pi
2.22
6.67
20
40
17.8
10
3.33
100
Hi
0.02
0.09
0.29
0.69
0.87
0.97
1
Mtodos Estadsticos
Histogram
40
Porcentaje
30
20
10
0
12
2.-
15
18
21
hemoglobina en la sangre
24
27
los siguientes
resultados:
O, A, O, B, AB, O, O, A, O, O, A, O, B, O, O, AB, A, B, A, O, O, O A, AB, B, A,
A, B, O, AB, B, A, B, B, O, A, O.
Solucin.
Grupo Sanguneo.
fi
10
AB
15
Total
n=37
hi
Pi
0.27
27.03
0.108
10.81
0.216
21.62
0.405
1
40.54
100
50
percentage
40
30
20
10
0
A
AB
54
Mtodos Estadsticos
27.03%
Grupo Sanguineo
A
AB
B
O
40.54%
10.81%
21.62%
cef aleas
mareos
nauseas
v mitos
dolores estomacales
sueo
sudoracin
alergias
Otros ( edemas, taquicardia,
diarreas)
Total
55
Frecuencia
20
11
5
13
16
2
4
2
Porcentaje
25.0
13.8
6.3
16.3
20.0
2.5
5.0
2.5
8.8
80
100.0
Mtodos Estadsticos
25
20
Porcentaje
15
10
0
cefaleas
mareos
nauseas
vmitos
dolores
estom.
sueo
sudoracin
alergias
Otros
Def iciente
Regular
Bueno
Total
Frecuencia
26
8
7
41
56
Porcentaje
63.4
19.5
17.1
100.0
Mtodos Estadsticos
Porcentaje
60,0%
40,0%
20,0%
0,0%
Deficiente
Regular
Bueno
Conocimiento
EJERCICIOS PROPUESTOS
138
146
168
146
161
164
158
126
173
145
150
140
138
142
135
132
147
176
147
142
133
136
163
135
150
125
148
119
153
156
57
149
152
154
140
145
157
144
165
135
128
Mtodos Estadsticos
10
10
10
11
11
10
10
10
11
3.
Autor:
Temperatura
Fecha:
pH
Abundanc
ia especie
1
1
3
8
4
7
2
12
8
9
Localidad:
Abundancia
especie 2
...
...
Unidad 15
7.5
15
1
Unidad
12
7.3
48
2
Unidad
12
7.2
78
3
Unidad
13
8.2
23
4Unidad 14
6.2
64
5Unidad 17
6.8
85
6Unidad 19
5.5
14
7Unidad 15
7.1
15
8Unidad 13
7.0
32
9
4. Los siguientes son los resultados para la medida de oxgeno disuelto en
diferentes ocasiones en un punto de muestreo de un ro, en gramos por litro.
7.1 6.7
6.2
6.1
3.3 7.1
8.0
5.4
58
Mtodos Estadsticos
7.7 4.5
7.6
5.8
5.50
6.75
2.65
7.60
6.25
3.78
4.90
5.21
2.51
6.20
5.92
5.84
7.86
8.79
4.79
3.90
3.75
3.49
4.04
3.87
6.90
4.72
9.45
7.41
2.45
3.24
5.15
3.81
2.50
1.52
4.56
8.80
4.71
5.92
5.33
3.10
6.77
9.20
6.43
1.38
2.46
7.40
6.25
9.65
8.64
6.43
5.62
1.20
1.58
Mtodos Estadsticos
220.90
226.92
225.20
216.80
229.56
222.15
232.11
235.00
223.50
224.30
227.23
224.78
218.45
231.45
222.62
228.56
224.05
230.30
215.00
223.06
228.92
223.82
230.82
225.62
229.10
224.05
232.50
221.95
218.42
60
Mtodos Estadsticos
CAPITULO III
Media
Centralizacin Mediana
Moda
Percentiles
Cuartiles
Posicin
Deciles
Varianza
Desviacin tpica
Medidas
descriptivas
Coeficiente de variacin
Rango
Dispersin
Forma
61
Mtodos Estadsticos
Media, ( x )
Media para datos sin agrupar:
Dado un conjunto de observaciones x1, . . . , xn, la media se representa mediante
x , se obtiene mediante:
n
x1 x 2 ..... xn
x
x
i 1
para
k
f 1x1 f 2 x 2 ..... fkxk
xi hi
n
i 1
Si los datos estn agrupados por intervalos, para hallar la media tomamos la
marca de las clases,
x
k
f 1m1 f 2m2 ..... fkmk
hi mi
n
i 1
62
Mtodos Estadsticos
Mediana, (Me)
Se calcula para variables cuantitativas; es un nmero tal que al menos el 50% de
los datos es menor o igual que la mediana y al menos el 50% mayor o igual.
Me x n 1 , para n impar
x n x n
Me
1
2
, Si n es par.
2 Fi 1
0.5 H i 1
Me LI
A LI
A
hi
fi
Moda, (Mo)
Es el valor con mayor frecuencia. Si hay ms de una moda, la variable se dice
multimodal y puede calcularse para cualquier tipo de variable (Cuantitativas o
cualitativas).
63
Mtodos Estadsticos
Si los datos estn agrupados hablamos de clase modal y ser aquella para la que
la frecuencia absoluta sea mayor.
1
fi fi 1
Mo LI
A
A LI
1 2
fi fi 1 fi fi 1
Donde:
1 fi fi 1
1 fi fi 1
Clases de Distribuciones
Distribucin
x Me Mo
64
Mtodos Estadsticos
x Me Mo
Distribucin asimtrica sesgada a la derecha.
En este caso la media, es mayor que la mediana y que la moda.
Mo Me x
3.2
Medidas de Posicin.
Cuartiles
Dividen la muestra, ordenada de menor a mayor, en 4 partes iguales, y se
denotan por Qi , i=1,2,3
i.n
4 Fk 1
Qi LI i
A
f
k
Q1, primer cuartil, al menos el 25% de los datos son menores o iguales
que l y al menos el 75% de los datos son mayores o iguales que l.
65
Mtodos Estadsticos
Q3, tercer cuartil, al menos el 75% de los datos son menores o iguales
que l y al menos el 25% de los datos son mayores o iguales que l.
Percentiles
Dividen la muestra ordenada en 100 partes iguales.
i.n
100 Fk 1
Pi LI i
A
fk
i.n
10 Fk 1
Di LI i
A
fk
3.3
Medidas de dispersin
Mientras los estadsticos de tendencia central nos indican los valores alrededor de
los cuales se sitan un grupo de observaciones, los estadsticos de variabilidad o
dispersin muestran si los valores de las observaciones estn prximos entre s o
estn muy separados. Dos conjuntos de datos pueden tener la misma localizacin
central y no obstante, ser muy distintos si uno se halla ms disperso que el otro.
La dispersin es el grado en que los datos numricos tienden a extenderse
alrededor de
66
Mtodos Estadsticos
Varianza.
Slo tienen sentido para variables cuantitativas y se define:
n
S2
xi x
n
n
S2
i 1
mi x fi
i 1
fx
2
i i
i 1
n
n
i 1
2
i
fi
n
n
S2
i 1
x x
fm
i 1
2
i
variables continuas.
Observaciones sobre la varianza:
Las unidades de la varianza son los cuadrados de las unidades de los
datos y en muchas ocasiones no son fciles de interpretar.
Puede sufrir un cambio desproporcionado por la existencia de valores
extremos en el conjunto.
s s2
La desviacin tpica poblacional suele denotarse por .
67
Mtodos Estadsticos
Variables tipificadas
Los distintos conjuntos de datos estn asociados por lo general a diferentes
medias, ya sea porque son de naturaleza diferente (escalas de medidas
diferentes). Con el propsito de reducir los datos a un mismo punto de referencia
y a una escala comn, se realiza entre ellos una transformacin llamada
tipificacin.
Se conoce por tipificacin de una variable x a efectuar el cambio de origen y de
escala de la variable.
xx
para muestras
z s
Frmulas:
z x - para poblacin
Esta nueva variable (z), carece de unidades de medida y permite comparar dos o
ms cantidades que en un principio no son comparables porque aluden a
conceptos diferentes. Tambin es aplicable a casos en que se quieran comparar
individuos semejantes de poblaciones diferentes. Por ejemplo, si deseamos
comparar el nivel acadmico de dos estudiantes de diferentes universidades, z
nos indica cuntas desviaciones estndar est un valor por arriba o por debajo de
la media del conjunto de datos al cual pertenece.
Ejemplo:
Un mdico del Hospital Regional obtuvo 84 puntos en el test de aplicacin de
protocolos de salud, en el que la nota media fue 76, y la desviacin tpica 10; Otro
68
Mtodos Estadsticos
Mdico del HR
x = 76
x = 82
s = 10
s = 16
x = 84
x = 90
z=
84 76
0,8
10
z=
90 82
0,5
16
S
|X|
Recorrido o rango
Es la diferencia entre el mayor y menor valor de una muestra.
R x max x min
69
Mtodos Estadsticos
3.4
MEDIDAS DE FORMA
x Mo
S
70
Mtodos Estadsticos
P75 P25
0.5
P90 P10
71
Mtodos Estadsticos
EJERCICIOS RESUELTOS.
70 74 78 82 86 90 94 98 10
2
fi
16 28 45 66 85 72 54
10
11
11
11
12
12
38
27
18
11
Calcule:
a) El C.I. medio de los trabajadores.
b) Su desviacin tpica.
c) Si el gerente de la empresa
SOLUCION:
La variable de estudio es el cociente intelectual (X)
xi
fi
fixi2
fixi
Fi
Hi
70
280
19600
0.0083
74
666
49284
13
0.0271
78
16
1248
97344
29
0.0604
82
28
2296
188272
57
0.1188
86
45
3870
332820
102
0.2125
90
66
5940
534600
168
0.35
72
Mtodos Estadsticos
94
85
7990
751060
253
0.5271
98
72
7056
691488
325
0.6771
102
54
5508
561816
379
0.7896
106
38
4028
426968
417
0.8688
110
27
2970
326700
444
0.925
114
18
2052
233928
462
0.9625
118
11
1298
153164
473
0.9854
122
610
74420
478
0.9958
126
252
31752
480
1470
n=480
46064
4473216
a) Media
95.96
n
480
b) Varianza y desviacin.
n
S2
xi x
i 1
fi
fx
2
i i
i 1
x2
4473216
2
95.96 110.88
480
s 110.88 10.52
c) Mediana.
n=480 ( Par)
x n x n
Me
1
2
x 480 x 480
x 240 x 241
2
94 94
94
2
d) Percentil 85
P85 106
e) Percentil 25
P25 90
73
Mtodos Estadsticos
57
55
54
52
62
55
59
80
40
62
72
46
80
40
SOLUCION:
XA
XA2
XB
xB2
57
80
3249
6400
55
40
3025
1600
54
62
2916
3844
52
72
2704
5184
62
46
3844
2116
55
80
3025
6400
59
40
3481
1600
394
420
22244
27144
a) Estadsticos de A.
n
x1 x 2 ..... xn
xA
i 1
n
n
xi
394
56.28
7
MeA x n1 x 71 x 4 55
MoA 55
74
Mtodos Estadsticos
Estadsticos de B.
n
x1 x 2 ..... xn
xB
i 1
n
n
xi
420
60
7
MeB x n1 x 71 x 4 62
MoB1 40
MoB 2 80
b) Calcular la varianza
n
S A2
xi x
n
xi x
i 1
CVB
x
i 1
2
i
xA2
22244
(56.28)2 10.27
7
S
10.27
0.057
| X A | 56.28
S B2
i 1
CVA
x
i 1
2
i
xB2
27144
602 277.7
7
S
277.7
0.277
60
| XB |
75
Mtodos Estadsticos
80,00
Utilidad
70,00
60,00
50,00
40,00
Accin
3.- Con el fin de realizar un estudio sobre las retenciones econmicas de quinta
categora a los trabajadores de una empresa, se seleccion aleatoriamente a
24 trabajadores, obtenindose las siguientes cantidades de retencin
econmica en cientos de soles.
Retencin
Nmero de
Econmica.
trabajadores
[0, 1>
[1, 2>
[2, 3>
[3, 4>
[4, 5>
[5, 6>
[6, 7>
[7, 8>
[8, 9>
Mtodos Estadsticos
c) Moda.
SOLUCION:
I
fi
mi
mi2fi
mifi
Fi
[0, 1>
0.5
0.5
[1, 2>
1.5
4.5
[2, 3>
2.5
7.5
18.75
[3, 4>
3.5
21
73.5
13
[4, 5>
4.5
31.5
141.75
20
[5, 6>
5.5
5.5
30.25
21
[6, 7>
6.5
6.5
42.25
22
[7, 8>
7.5
7.5
56.25
23
[8, 9>
8.5
8.5
72.25
24
Total
24
40.5
92
440
fm
i
92
3.83
24
Varianza.
S
2
2
i i
x2
440
3.83 3.66
24
Desviacin.
s 3.66 1.91
Coeficiente de Variacin.
CV
S
1.91
0.498
| X | 3.83
Mediana
12 7
Me 3
*1 3.833
6
Moda
77
Mtodos Estadsticos
Mo Li 1 A
1 2
1
7 6 1
7 1 6
1
Mo 4
*1 4.14
1 6
a.
Nro de
conocimientos de
administradores
riesgo de inversion.
0-5
10
5-10
15
10-13
25
13-18
18-20
fi.
Fi
mi
mi2fi
mifi
0-5
10
10
2.5
25
62.5
5 -10
15
25
7.5
112.5
843.75
10-13
25
50
11.5
287.5
3306.25
13-18
58
15.5
124
1922
18-20
60
19
38
722
56
587
6856.5
60
a) Media y varianza
Media.
78
Mtodos Estadsticos
fm
i
587
9.78
60
Varianza.
S
2
2
i i
x2
6856.5
9.782 18.63
60
Desviacin:
s 18.63 4.31
b) Mediana y moda
Mediana
2 F k 1
Me Li
A
fK
Determinamos
n 60
30
2 2
n
2 F k 1
30 25
Me Li
A 10
3 10.6
fK
25
Moda
1
Mo Li
A
1 2
1 25 15 10
2 25 8 17
1
10
Mo Li
A 10
3 11.11
10 17
1 2
79
Mtodos Estadsticos
i.n
4 F k 1
Qi Li
A
f
K
Cuartil 1
1.n
4 F k 1
15 10
Q1 Li
A 5
5 6.67
fK
15
3.n
4 F k 1
45 25
Q3 Li
A 10
3 12.4
f
25
i.n
100 F k 1
Pi Li
A
f
K
Percentil 10
10.n
100 F k 1
60
P10 Li
A 0
5 3
fK
10
Percentil 90
80
Mtodos Estadsticos
90.n
100 F k 1
54 50
P90 Li
A 13
5 15.5
f
8
d) Coeficiente de Asimetra.
Ap
x M o 9.78 11.11
-0.308
s
4.31
Q3 Q1
12.4 6.67
0.5
0.5 -0.0416
P90 P10
15.5 3
EJERCICIOS PROPUESTOS
[0, 40[
[40,70[
[70, 90[
[90,110[
[110,120]
10
20
de soles.
Nmero de empresas
Calcule e interprete:
81
Mtodos Estadsticos
Empresas antiguas
Empresas Nuevas
0-15
19
29
15-30
13
10
30-50
11
50-70
32
3.
En una empresa donde los salarios tienen una media de 700 dlares y
los sueldos de
82
Mtodos Estadsticos
Seccin A
Ingresos ($)
Frecuencia
80-100)
30
100-120)
80
120-140)
40
140-160)
10
160-180)
180-200)
Seccin B
Ingresos ($)
Frecuencia
60-90)
10
90-120)
20
120-150)
50
150-180)
20
180-210)
15
210-240)
10
240-270)
83
Mtodos Estadsticos
Petirrojo
3926
4877
5855
4980
5681
4761
2134
305
1743
1987
2100
753
1140
3039
8077
2399
1469
2109
3575
1113
4292
1807
2173
3210
Paloma
1219
2438
9568
5355
1692
1362
5081
2542
11634
8132
4959
2316
674
5182
8038
11268
10939
424
5044
9668
9162
6026
8781
3109
36576
Regin Norte
Regin Oeste
Regin Sur
10.4
12.8
15.6
9.2
12.8
14.2
16.3
10.1
11.2
9.8
10.7
6.3
13.9
14.2
12.8
15
84
Mtodos Estadsticos
17 17.1 16.9
17 17.1
a) Encontrar el promedio.
b) Encontrar la varianza.
c) Encontrar la desviacin estndar.
d) Hacer una tabla de frecuencia mostrando la frecuencia, la frecuencia
relativa y la frecuencia relativa acumulada
e) Hacer un histograma.
f) Qu tanta simetra hay en esta distribucin?
8. En el cuadro se muestra la concentraciones de DBO en una regin
Intervalos
Nmero de
(Conc. DBO)
anlisis
50.00 - 59.99
60.00 - 69.99
10
70.00 - 79.99
16
80.00 - 89.99
14
90.00 - 99.99
10
100.00 - 109.99
10.00 - 119.99
a) Encontrar el promedio.
b) Encontrar la varianza.
85
Mtodos Estadsticos
litro (dato
desconocido por
el
analista).
Se realizaron cinco
Mtodo A: 1.34
1.33
1.32
1.34
1.31
Mtodo B: 1.30
1.26
1.30
1.33
1.24
Nmero de plantas
1.00 - 1.02
1.02 - 1.04
26
1.04 - 1.06
52
1.06 - 1.08
58
1.08 - 1.10
39
1.10 - 1.12
15
1.12 - 1.14
1.14 - 1.16
86
Mtodos Estadsticos
CAPITULO IV
DISTRIBUCIONES BIDIMENSIONALES
diferentes.
4.1 CUALITATIVA-CUALITATIVA.
Cuando las variables de estudio son cualitativas (categricas) o cuantitativas
discretas con poca
variables X
f
i 1 j 1
ij
Mtodos Estadsticos
hij
fij
,
n
se cumple:
h
i 1 j 1
ij
Distribuciones marginales
Nos indican el comportamiento aislado de cada una de las variables X e
Y que dan lugar a una variable bidimensional.
fi. fi1 fi 2
fil fij
j 1
fi .
n
hi.
f. j f1 j f 2 j
h. j
f kj fij
i 1
f. j
n
y1
y2
.....
yl
ni.
x1
f11
f12
.....
f1l
f1.
x2
f21
f22
.....
f2l
f2.
..
..
..
.....
..
..
fk2
.....
fkl
fk.
f.2
.....
f.l
xk
n.j
fk1
f.1
Ejemplos.
88
Mtodos Estadsticos
Producto
clientes
II
III
IV
Profesionales
30
35
55
40
Comerciantes
155
50
125
80
Obreros
130
30
105
50
Amas de casa
35
15
20
45
Solucin
Producto
Grupo de clientes
Prof esionales
Comerciant es
Obreros
Ama de casa
Total
I
Frecuencia
Porcentaje
Frecuencia
Porcentaje
Frecuencia
Porcentaje
Frecuencia
Porcentaje
Frecuencia
Porcentaje
30
18.8%
155
37.8%
130
41.3%
35
30.4%
350
35.0%
89
II
III
IV
35
21.9%
50
12.2%
30
9.5%
15
13.0%
130
13.0%
55
34.4%
125
30.5%
105
33.3%
20
17.4%
305
30.5%
40
25.0%
80
19.5%
50
15.9%
45
39.1%
215
21.5%
Total
160
100.0%
410
100.0%
315
100.0%
115
100.0%
1000
100.0%
Mtodos Estadsticos
160
140
120
100
80
II
III
60
IV
40
20
0
Profesionales
4.2
Comerciantes
Obreros
Amas de casa
CUALITATIVA-CUANTITATIVA.
Supongamos que tenemos datos numricos para varias categoras, por
ejemplo en un experimento donde hacemos mediciones numricas en dos o
ms grupos. En estos casos, lo que se realiza es un estudio descriptivo de
la variable numrica en cada una de las muestras y se comparamos los
resultados.
Ejemplo
Ejemplo
La estructura financiera de una firma se refiere a la forma en que se dividen
los activos de la empresa por debe y haber, y el apalancamiento financiero
se refiere al porcentaje de activos financiados por deuda. En un estudio
financiero se afirma que el apalancamiento financiero puede utilizarse para
aumentar la tasa de rendimiento sobre la inversin, es decir que, los
accionistas pueden recibir rendimientos ms altos con la misma cantidad de
inversin gracias a su uso. Los siguientes datos muestran las tasas de
90
Mtodos Estadsticos
Tasas de Rendimiento
Control
Bajo
Medio
Alto
4.6
7.9
7.4
4.5
6.8
6.8
1.8
11.6
5.8
4.2
3.2
9.2
1.6
6.8
11
Alto
8.140
4.158
25.05
7.900
Bajo
3.68
5.13
61.56
3.20
Control
3.840
4.468
55.05
4.200
Medio
7.18
7.07
37.04
6.80
91
Mtodos Estadsticos
12
Tasas de rendimiento
10
2
Alto
4.3
Bajo
Control
Nivel de apalancamiento
Medio
CUANTITATIVA-CUANTITATIVA.
Anlisis de dos variables cuantitativas y establecimiento de una relacin
entre ellas. La forma ms sencilla de estudiar la posible asociacin entre
estas variables es el diagrama
Media y varianza
La informacin de las dos variables X e Y se puede resumir usando la media
y la varianza como se muestra a continuacin:
Media de la variable X:
fx
Media de la variable Y:
fy
i i
n
i
Varianza de la variable X: s
2
x
fx
Varianza de la variable Y: s
2
y
fy
La covarianza
92
2
i i
2
i
Mtodos Estadsticos
fxy
i i
x. y
Correlacin.
Estudia la relacin o dependencia que existe entre dos variables que
intervienen en una distribucin bidimensional.
s xy
s x .s y
93
Mtodos Estadsticos
Anlisis de Regresin.
Regresin: conjunto de tcnicas que son usadas para establecer una relacin
entre una variable cuantitativa llamada variable dependiente y una o ms
variables independientes, llamadas predictoras. Estas tambin deberan ser
cuantitativas, sin embargo algunas de ellas podran ser cualitativas.
i 1
i 1
i 1
n
i 1
n xi yi xi yi
i 1
n xi2 ( xi ) 2
i 1
S xy
S xx
i 1
y x
La pendiente , indica el cambio promedio en la variable de respuesta cuando
la variable predictora aumenta en una unidad adicional.
El intercepto , indica el valor promedio de la variable de respuesta cuando la
variable predictora vale 0. Sin embargo carece de interpretacin prctica si es
irrazonable pensar que el rango de valores de x incluye a cero.
A partir de la recta Y X podemos calcular los valores de y conocidos los
de x. La fiabilidad que podemos conceder a los clculos obtenidos viene dada por
el coeficiente de correlacin: si r es muy pequeo no tiene sentido realizar ningn
tipo de estimaciones.
Si r es prximo a 1 1, las estimaciones realizadas estarn cerca de los valores
reales.
Si r = 1 o r = -1, las estimaciones realizadas coincidirn con los valores reales.
Ejemplos.
94
Mtodos Estadsticos
51.3
49.9
50
49.2
48.5
47.8
47.3
45.1
46.3
42.1
44.2
43.5
42.3
40.2
31.8
34
102..5
104.5
100.4
95.9
87
95
88.6
89.2
78.9
84.6
81.7
72.2
65.1
68.1
67.3
52.5
a)
b)
c)
Solucin:
110
100
90
80
70
60
50
30
35
40
45
50
X2
X.Y
Y2
51.3
102.5
5258.25
2631.69
10506.25
49.9
104.5
5214.55
2490.01
10920.25
50
100.4
5020
2500
10080.16
49.2
95.9
4718.28
2420.64
9196.81
95
Mtodos Estadsticos
n
i
2
x
2
y
87
4219.5
2352.25
7569
47.8
95
4541
2284.84
9025
47.3
88.6
4190.78
2237.29
7849.96
45.1
89.2
4022.92
2034.01
7956.64
46.3
78.9
3653.07
2143.69
6225.21
42.1
84.6
3561.66
1772.41
7157.16
44.2
81.7
3611.14
1953.64
6674.89
43.5
72.2
3140.7
1892.25
5212.84
42.3
65.1
2753.73
1789.29
4238.01
40.2
68.1
2737.62
1616.04
4637.61
31.8
67.3
2140.14
1011.24
4529.29
34
52.5
1785
1156
2756.25
713.5
713.5
44.59375 ;
16
1333.5
83.34375 ;
16
2
i
32285.29
44.593752 29.228
16
114535.33
83.343752 212.277 ;
16
x
y
x y
48.5
2
i
sxy
x. y
60568.34
(44.59375).(83.34375) 68.9
16
Recta de regresin
n
i 1
n
i 1
n xi yi xi yi
i 1
n xi2 ( xi ) 2
i 1
S xy
S
2
x
68.9
2.357
29.228
i 1
96
Mtodos Estadsticos
sxy
sx .s y
68.9
0.8747
29.228. 212.277
Ejercicios propuestos.
1. Se ha medido la superficie en dm2 ocupada por Poa bulbosa (x) y especies
anuales (y) en 5 cuadros de muestreo de 10 dm2 para comprobar si se
asocian o no. Los resultados obtenidos aparecen en la siguiente tabla: 2.
n Poa bulbosa (x)
9
2
nplantas anuales
1
7
(y)
Calcular el coeficiente de correlacin (r).
2
8
1
10
6
4
Slidos supendidos
29
33
37
25
32
29
97
27
DQO
31
36
25
31
Mtodos Estadsticos
30
29
34
28
27
30
30
31
31
32
33
34
36
36
36
30
30
29
28
27
35
36
31
33
31
31
30
30
32
32
29
28
33
26
27
28
29
30
30
32
32
34
35
34
34
29
29
28
28
26
30
34
30
30
29
30
29
28
31
31
X2
X1 (Hierro (Aluminio Y (ndice de
Observacin extrable) extrable) adsorcin)
1
61
13
4
2
175
21
18
3
111
24
14
4
124
23
18
5
130
64
26
6
173
38
26
7
169
33
21
8
169
61
30
9
160
39
28
10
244
71
36
11
257
112
65
12
333
88
62
13
199
54
40
Hacer los clculos pertinentes.
98
Mtodos Estadsticos
14
31
21
11
16
26
29
DBO5
17
36
85
62
18
33
41
63
87
55
17
22
35
43
80
85
91
92
96 100
17
18
25
58
59
41
30
43
58
Peso
corporal
(g)
99
Mtodos Estadsticos
33.
51
5
59
38.
49
0
54
32.
50
0
55
37.
48
5
53
31.
52
5
57
33.
0
7.
Se sospecha que la 31.
abundancia de la especie de gramnea Poa
0
bulbosa en los pastizales 36.
mediterrneos depende en gran medida de la
5
humedad que hay en el suelo.
34. Para comprobar la hiptesis se realiza un
muestreo con una cuadrcula0 de 20 cm de lado, que se dispone 12 veces al
35.
azar sobre la comunidad de 0pasto. En cada cuadrcula se mide la cobertura
de la especie y la humedad del suelo mediante un TDR.
Obs.
1
2
3
4
5
6
7
8
9
10
11
12
Cobertura
82
98
87
40
116
113
111
83
85
126
106
117
100
Mtodos Estadsticos
CAPITULO V
PROBABILIDADES
Experimento aleatorio.
Es una accin que da lugar a resultados identificables y se caracteriza por:
Todos los posibles resultados son conocidos previamente.
Repeticiones en situaciones anlogas pueden dar resultados diferentes.
No se puede predecir el resultado del mismo antes de realizarlo, es decir,
no se sabe cul de los posibles resultados aparecer al final.
Espacio muestral.
Es el conjunto de todos los resultados posibles del experimento y se denota por
. A cada elemento de se denomina punto muestral w , es decir:
w / w es un punto muestral .
Mtodos Estadsticos
El evento
experimento.
El evento imposible , es aquel que no ocurre nunca.
Lo s eventos elementales solo tienen un punto muestral.
El evento complementario Ac , esta dado por todo los puntos muestrales
que no estn en A
OPERACIONES DE EVENTOS.
Unin de eventos: Dados dos eventos A y B de un mismo espacio muestral su
unin se representa por A B y es el evento que contiene los elementos que
estn en A o en B o en ambos. El evento A B ocurre si al menos uno de los dos
eventos ocurre.
Interseccin de eventos: Dados dos eventos A y B de un mismo espacio
muestral su interseccin se representa por A B y es el evento que contiene los
elementos que estn en A y B al mismo tiempo.
El evento A B ocurre cuando ambos eventos ocurren simultneamente.
Evento Complemento: El complemento de un evento A se representa por Ac y
es el evento que contiene todos los elementos que no estn en A. El evento Ac
ocurre si A no ocurre.
p( A)
casos favorables
casos posibles
Mtodos Estadsticos
A p(A)
i) 0 p( A) 1 A
ii) p 1
iii) Si A y B son sucesos incompatibles,
p A B p A p B
Como consecuencia de estos tres axiomas, se verifican adems las
siguientes propiedades:
iv)
p( Ac ) 1 p A
v)
p( ) 0
vi)
Si A B , p( A) p( B)
vii) P( A \ B) P( A) P( A B) , A,B
viii) Si A 1 , A 2 , ...... , A n son incompatibles dos a dos, entonces
p A1 A2 ... An p A1 p A2 ... p An
ix)
p A B p A p B p A B
x)
Probabilidad condicionada:
En muchas ocasiones, la verificacin o no de un suceso se estudia en
funcin de otro suceso de cuya verificacin depende o del cual est
condicionado.
Definimos la probabilidad de A condicionada a B como la probabilidad de que
ocurra A sabiendo que ha ocurrido B, la denotamos por P(A|B)
P( A | B)
P( A B)
, p(B) 0.
P( B)
En consecuencia,
p(A B) =p( A) p( B )
A
103
Mtodos Estadsticos
Independencia.
Dos sucesos A, B se dicen independientes si:
p( A) p( A | B) , o bien p( B) p( B | A)
An son independientes si
p( B) p( Ai ) p( B | Ai)
i 1
p( B) p( A1 ) p( B
A1
) p( A2 ) p( B
A2
) ....... p( An ) p( B
An
Teorema de Bayes.
Si A 1 , A 2 , ......., A n son un sistema completo de sucesos tal que p( Ai ) 0 ,
i 1,....n , entonces para un suceso B cualquiera se verifica:
104
Mtodos Estadsticos
p( Ai | B)
p( Ai B)
p( Ai ) p( B | Ai)
, i = 1, ...., n.
n
p( B)
p( Ai) p( B | Ai)
i 1
p( Ai | B)
p( Ai ) p( B | Ai)
p( A1 ) p( B ) p( A2 ) p( B ) ....... p( An ) p( B )
A1
A2
An
Problemas Resueltos.
presente
irregularidades.
c) Cual es la probabilidad de que la primera cuenta presente irregularidades y
la ultima no presente irregularidades.
d) Cual es la probabilidad de
irregularidades
Solucin.
Denotemos con P, si la cuenta presenta irregularidades y con N, si la cuenta
no presente irregulardades.
a) PP
1 2 N3 , PP
1 2 P3 , PN
1 2 N3 , PN
1 2 P3 , N1P2 P3 , N1P2 N3 , N1 N 2 P3 , N1 N 2 N3
b) Sea el evento A: Se presenta dos irregularidades
A PP
1 2 N3 , PN
1 2 P3 , N1 P2 P3
p( A)
n( A) 3
n() 8
p(C )
n(C ) 2
n() 8
Mtodos Estadsticos
D PP
1 2 N3 , PP
1 2 P3 , PN
1 2 N3 , PN
1 2 P3 , N1P2 P3 , N1P2 N3 , N1 N 2 P3
p ( D)
n( D ) 7
n() 8
no se presentan
se selecciona
b)
c)
La filial
haya empleado
la estrategia
C, dado
que no se presento
incremento en su utilidad.
Solucin
No incrementa
1%
99%
Incrementa
A
40%
No incrementa
2%
Estrategia
30%
98%
B
Incrementa
3%
30%
No incrementa
C
97%
Incrementa
Mtodos Estadsticos
a) p( D) p( A) p( D ) p( B) p( D ) p(C ) p( D )
A
B
C
p( D) 0.4*(0.01) 0.3*(0.02) 0.3*(0.03) 0.019 1.9%
b) p(B D) =p( B) p( D )
B
p(B D) =0.3*(0.02) 0.006 0.6%
c) p(C | D)
p(C D)
p(C ) p( D | C )
p ( D)
p( A) p( D | A) p( B) p( D | B) p(C ) p( D | C )
p(C | D)
0.3*(0.03)
0.473 47.3%
0.4*(0.01) 0.3*(0.02) 0.3*(0.03)
Pago de deudas
CATEGORIAS
bancarias
Al da
12
En mora
Mtodos Estadsticos
n( D) 25
0.5
n() 50
b) p( A B) p( A) p( B) p( A B)
p ( A B)
n( A) n( B) n( A B)
n() n()
n()
16 14 0 30
0.6
50 50 50 50
p(C D)
n(C ) n( D) n(C D)
n() n()
n()
20 25 8 37
0.74
50 50 50 50
d) p( A D)
n( A D ) 9
0.18
n()
50
n( B E )
P( B E )
n( B E ) 8
n ( )
e) P( B | E )
n( E )
P( E )
n( E )
25
n ( )
irregularidades en las
108
de que se trate de la
Mtodos Estadsticos
1/3
3/10
2/3
2/10
B
D
5/10
1/7
C
D
p(C | E )
p(C E )
p(C ) p( E | C )
p( E )
p( A) p( E | A) p( B) p( E | B) p(C ) p( E | C )
3 1
*
21
10
3
p(C | E )
32.8%
3 1 2 2 5 1 64
* * *
10 3 10 3 10 7
Problemas Propuestos.
1.-Un auditor tiene sobre su mesa dos grupos de 20 facturas cada uno. En el
primer lote hay dos facturas con errores de clculo y en el segundo tres. Una
corriente de aire hace que las facturas caigan de la mesa y, al recogerlas, una
del primer grupo se confunde en el segundo. Cul es la probabilidad de que,
al revisar una factura del segundo grupo tenga un error?
2.- Mara Campos, gerente del departamento de crdito de un banco, sabe que la
compaa utiliza 3 mtodos para conminar a pagar a las personas con cuentas
morosas. De los datos que se tiene registrados, ella sabe que 70% de los
deudores son visitados personalmente, 20% se le sugiere que paguen va
telefnica y al restante 10% se le enva una carta. Las probabilidades de recibir
alguna cantidad de dinero debido a los pagos de una cuenta con estos 3
mtodos son 0,75 0,60; y 0,65 respectivamente. La seorita Campos acaba de
109
Mtodos Estadsticos
3.- Una empresa compra cierto tipo de pieza que es suministrada por 3
proveedores: el 45% de las piezas son compradas al 1er proveedor resultando
defectuoso el 1%, el 2do proveedor suministra 30% de las piezas y de ellas es
defectuoso el 2%. Las restantes piezas provienen del 3er proveedor, siendo
defectuoso el 3% de las mismas.
En un control de recepcin de artculos se selecciona una pieza al azar y es
defectuosa. Calcular la probabilidad de que la haya suministrado el 2 do
proveedor.
4.- Una compaa de ventas por correo tiene tres empleados de almacn
denominados U, V y W quienes toman productos de la bodega y los
ensamblan para la subsiguiente verificacin y empaquetado. U comete un error
en un pedido (toma un producto equivocado o la cantidad equivocada del
producto) una de cada 100 veces, V comete un error en un pedido 5 veces de
cada 100 y W se equivoca tres de cada 100. Si U, V y W cubren
respectivamente el 30%, el 40% y el 30% de todos los pedidos. Cul es la
probabilidad de que si se encuentra un error en un pedido, ste haya sido
cometido por V?
Calidad de la
Costo o
Otros
escuela
comodidad
421
393
76
890
400
593
46
1039
Totales
completo
Tiempo parcial
110
Mtodos Estadsticos
Totales
821
986
122
1929
Reacciones
Favorables
Neutral
Desfavorables
Altas
173
101
61
Moderadas
88
211
70
Bajas
42
113
141
Ventas
111
Mtodos Estadsticos
Regular
Ocasional
Nunca
Frecuentes
0,12
0,48
0,19
No Frecuentes
0,07
0,06
0,08
Frecuencia
en las visitas
Mtodos Estadsticos
113
Mtodos Estadsticos
CAPITULO VI
X :
PX x P X x P / X x , tal que
P ( x) 1
xRx
fX :
0,
tal que
P a X b f X ( x)dx
,tal que
f X ( x)dx 1
Propiedades.
F es continua por la derecha y es creciente
114
Mtodos Estadsticos
dF ( x)
f ( x)
dx
lim x FX ( x) 0 y lim x FX ( x) 1
Propiedades.
El valor esperado de una constante es dicha constante
E a bX a bE X
X , se define como
V X X2 E X X E X E X E X E 2 X
2
Propiedades.
La raz cuadrada de la varianza se llama desviacin estndar.
X2 E X X2
2
V aX b a 2V ( X )
Desigualdad de Chebyshev.
Si X es una variable aleatoria, entonces para cualquier k se cumple
P X X k X 1
1
k2
115
Mtodos Estadsticos
Ejercicio resuelto.
1.- Sea X la variable aleatoria definida como la suma de los valores que aparecen
al lanzar dos dados.
a) Determine la distribucin de probabilidad.
b) Calcule la probabilidad P(5<X<8)
c) La media y su varianza.
Solucin.
a)
Resultados en 1
10
10
11
10
11
12
P(X)
1/36 2/36 3/16 4/16 5/36 6/36 5/36 4/36 3/36 2/36 1/36
b)
c)
10
11
12
Media
EX
x.P X x , si X es discreta
xRx
1 2 3 4 5 6 5 4
3
2
1
E X 2 3 4 5 6 7 8 9 10 11 12
36 36 36 36 36 36 36 36
36
36
36
252
EX
36
Varianza.
X2 E X E 2 X
2
116
Mtodos Estadsticos
1
2
3
4
5
6
5
4
3
2
1
E X 2 22 32 42 52 62 72 82 92 102 112 122
36
36
36
36
36
36
36
36
36
36
36
1974
EX2
36
DISTRIBUCIONES IMPORTANTES.
Existen, como en el caso de la ltima variable ejemplificada, otras variables cuyas
funciones de probabilidad o densidad resultan ser modelos de mucha utilidad para
una serie de aplicaciones. Nosotros citaremos brevemente algunos de los
modelos de mayor importancia.
DISTRIBUCIONES DISCRETAS.
Un experimento de Bernoulli, es un experimento aleatorio con solo dos
posibles resultados: xito y Fracaso. Sea p = P (xito).
C xn p x 1 p
PX x
, si x 0,1,2,..., n
, en otro caso.
C x1 1 p p r
PX x r 1
Valor esperado: X
, si x r , r 1, r 2,...
, en otro caso.
r 1 p
r
.
. Varianza: X2
p
p2
117
Mtodos Estadsticos
C xM CnNxM
PX x C nN
Valor esperado: X n
, si x 0,1,2,..., n
, en otro caso.
M
M M N n
. Varianza: X2 n 1
.
N
N N 1
N
Notas:
1. En PX se esta usando la convencin que Cab 0, si a > b.
2. Si la eleccin de la muestra fuera con reemplazamiento, entonces
X B n, p
M
.
N
Mtodos Estadsticos
x e
PX x x!
, si x 0,1,2,...
, en otro caso.
1
, si x a, b
f X x b a
0 , en otro caso.
Valor esperado: X
b a 2
ab
2
. Varianza: X
.
12
2
2 x
1
f X x
e 2
2
119
Mtodos Estadsticos
EJERCICIOS RESUELTOS
1.- Un auditor analiza 10 facturas, se sabe que por estudios anteriores que el 25%
de las facturas presentan algn tipo de error. Calcular la probabilidad de que:
a) Exactamente 4 facturas presenten error.
b) Ninguno de las facturas presenten error.
c) Todos presenten error.
d) Por lo menos 8 presenten error.
e) A lo sumo 3 presenten error.
f)
Solucin
Consideremos los sucesos
A = La factura presenta error, P (A) = 0.25
PX 8 PX 8 PX 9 PX 10
120
Mtodos Estadsticos
10
10
(0.25)8 (0.75) 2 (0.25)9 (0.75) 0 0.005
8
9
d) Media y Varianza
np 10 (0.25) 2.5
2 np(1 p) 10(0.25)(0.75) 1.875
2.-
121
Mtodos Estadsticos
60 (Media poblacional)
(Desviacin)
a) P( X 64) P(
64
) P( Z
64 60
) P(Z 0.67)
6
(0.67)
z=0.67
b) P( X 57) P(
57
) P( Z
122
57 60
) P( Z 0.5) (0.5) 0.5
6
Mtodos Estadsticos
(0.5)
z= 0.5
0.19146+0.5=0.69146=69.146%
c) P( X 63) P(
63
) P( Z
63 60
) P( Z 0.5) 0.5 (0.5)
6
(0.5)
z=0.5
0.5 0.19146=0.30854=30.854%
d) P(57 X 65) P(
P(0.50
57
65
(0.83)
z= 0.50
50
57 60
65 60
Z
)
6
6
(0.5)
e) P( X 50) P(
) P(
) P( Z
z=0.83
50 60
) P(Z 0.167)
6
123
Mtodos Estadsticos
(0.167)
z= 0.167
f) P(64 X 70) P(
P(0.67
64
70
) P(
64 60
70 60
Z
)
6
6
z=0.67 z=1.67
(0.67)
(1.67)
g) P(57 X 64) P(
P(0.5
57
64
) P(
57 60
64 60
Z
)
6
6
EJERCICIOS PROPUESTOS
124
Mtodos Estadsticos
2.- Los salarios de los trabajadores en cierta industria son en promedio $11,9 por
hora y la desviacin estndar de $0,4. Si los salarios tienen una distribucin
normal. Cul es la probabilidad de que un trabajador seleccionado al azar:
a) Reciba salarios entre $10,9 y $11,9?
b) Reciba salarios inferiores a $11?
c) Reciba salarios superiores a $12,95?
d) Cul debe ser el salario menor que gana un trabajador que se encuentra
entre el 10% de los trabajadores que ms ganan?
e) Si el dueo de la industria va a aumentarle el salario al 15% de los
trabajadores que menos ganan. Cul ser el salario mximo que deber
ganar un trabajador para ser beneficiado con el aumento?
4.- Se toma una muestra de 12 trabajadores de una gran empresa para estudiar
su actitud frente a un cambio en el mtodo de trabajo. Si el 60% de todos los
trabajadores de la empresa estn a favor del cambio. Cul es la probabilidad de
que menos de 5 de los miembros de la muestra estn a favor?
125
Mtodos Estadsticos
6.- Se sabe que el 30% de los clientes de una tarjeta de crdito a nivel nacional
dejan en cero sus saldos para no incurrir en intereses morosos. En una
muestra de 8 poseedores de esa tarjeta:
a) Cul es la probabilidad de que de 4 a 6 clientes paguen sus cuentas antes de
incurrir en el pago de intereses?
b) Cul es la probabilidad de que 3 clientes o menos paguen sus cuentas antes
de incurrir en pago de intereses?
126
Mtodos Estadsticos
127
Mtodos Estadsticos
CAPITULO VII
INTRODUCCION AL MUESTREO
INTRODUCCION.
El objetivo de la estadstica es hacer inferencias acerca de una poblacin
con base en la informacin contenida en una muestra. Este mismo
objetivo motiva el estudio del problema de muestreo. Consideraremos el
problema particular del muestreo de una poblacin finita (coleccin finita
de mediciones).
En lo referente al muestreo, la inferencia consiste en la estimacin de un
parmetro de poblacin, tal como una medida, un total o una proporcin
con un lmite para el error de estimacin (precisin).
Para un buen entendimiento del problema de muestreo, introduciremos
enseguida, ciertos aspectos tcnicos comunes a las encuestas de
muestreo.
Mtodos Estadsticos
129
Mtodos Estadsticos
E 1.96 V () se cumple:
P(| | E ) 0.95
La no respuesta.
El sesgo de respuesta.
Sin embargo, los errores de no muestreo pueden ser controlados mediante una
atencin cuidadosa en todas las etapas de la encuesta.
130
Mtodos Estadsticos
ENCUESTA.
La funcin de la encuesta es la medicin del comportamiento, actitudes o
caractersticas del encuestado, que es un individuo de la poblacin en estudio
seleccionado para la muestra.
Diseo de la encuesta
Pasos a seguir:
Definir los objetivos
Determinar el marco
Disear el procedimiento de muestreo
Disear el cuestionario
Disear y realizar el trabajo de campo
Codificar, depurar y analizar las respuestas
Redactar el informe
Diseo de la muestra
El diseo de la muestra incluye:
La eleccin del procedimiento de muestreo
La determinacin del tamao de la muestra
Existen varios procedimientos de muestreo, entre las principales se tiene
muestreo: aleatorio simple, estratificado y sistemtico.
Mtodos Estadsticos
Procedimiento de seleccin.
El procedimiento de seleccin de una Muestra Aleatoria Simple (M.A.S.) consiste
en:
i)
ii)
iii)
Tamao de la muestra
1.
Z (12 / 2) * N 2
Z (12 / 2) * 2 ( N 1)
Poblacin finita.
Z (12 / 2) * 2
, Poblacin infinita.
Donde
2 Es la varianza poblacional
En la practica el valor de 2 estimado por S2 a partir de una encuesta
anterior o de una muestra piloto
2.
Z (12 / 2) * N * p(1 p)
Z (12 / 2) * p(1 p) ( N 1)
, Poblacin finita.
y si N :
n
Z (12 / 2) * p(1 p)
132
Poblacin infinita.
Mtodos Estadsticos
MUESTREO ESTRATIFICADO.
Una muestra estratificada es la obtenida mediante la separacin de los elementos
de la poblacin en grupos
Dia
gn
st
ico
De
scri
k
pci
Z (12 / 2) * Ni2 pi (1n
pi ) / wi
i 1
,
n
de
k
2
2
2
N Z (1 / 2) * Nlos
i pi (1 pi )
i 1 snt
om i
es wi el % de observaciones asignados al estrato
as
o
cau
133
sas
El tamao de muestra se estima mediante:
Mtodos Estadsticos
n * wi , i 1,..., k
MUESTREO SISTEMATICO
Definicin.- Una muestra obtenida al seleccionar aleatoriamente un elemento de
los primeros k elementos en el marco y despus cada k-simo elemento, se
denomina muestra sistemtica de intervalo de seleccin k.
El muestreo sistemtico puede ser de dos formas, muestreo sistemtico simple y
muestreo sistemtico circular.
Procedimiento de seleccin del muestreo sistemtico simple.
Una muestre sistemtica simple se obtiene cuando el intervalo de seleccin k es
exactamente un numero entero.
El procedimiento de seleccin de una muestra sistemtica simple consiste:
i)
ii)
N
(k exactamente un numero
n
entero)
iii)
EJERCICIOS RESUELTOS
1.
Mtodos Estadsticos
Solucin.
2.
Z (12 / 2) * N 2
Z (12 / 2) * 2 ( N 1)
2.582 *2500*25
2.582 *25 (2500 1) 1
156.08 157
Solucin.
Consideremos que no se tiene ningn estudio de este tipo, por tanto P 0.5 ,
del problema: N 25000, 0.05, z(1 / 2) 1.96
n
Z (12 / 2) * NP(1 P)
Z (12 / 2) * P(1 P) ( N 1)
3.
378.361 379
Solucin.
La poblacin materia de estudio, no es finita, por tanto la relacin para
estimar el tamao de muestra es:
135
Mtodos Estadsticos
Z (12 / 2) * P(1 P)
4.
0.05
195.92 196
Provincia
Tamao de poblacin.
2000
1200
5000
Total
8200
Solucin.
En este ejemplo, las ciudades forman los estratos:
Ciudad
Ni
wi
2000
=2000/8200=0.24
1200
=1200/8200=0.15
5000
=5000/8200=0.61
Total
N=8200
n=245.
Usando la relacin,
136
Mtodos Estadsticos
N
ni n * i
N
ciudad.
N
nA n * A n * wA 0.24*245 59.76 60
N
N
nB n * B n * wB 0.15*245 35.85 36
N
N
nC n * C
N
MONITOREO AMBIENTAL
Se define como monitoreo a todas las metodologas diseadas para muestrear,
analizar y procesar en forma continua las concentraciones de (sustancias,
alimentos, agua,) en un lugar establecido y durante un tiempo determinado.
Las principales razones para el establecimiento de programas de monitoreo de
algn proceso tienen que ver con la necesidad de verificar si se cumple con las
condiciones mnimas para los usos requeridos.
El programa de monitoreo contempla las acciones de observacin, Muestreo,
Medicin y el Anlisis de datos tcnicos
OBJETIVOS DEL MONITOREO
Determinar (Determinar la congruencia con las normas y los criterios
legales).
Proporcionar (Proporcionar informacin de fuentes y riesgos de..).
Llevar a cabo (Llevar a cabo evaluaciones de tendencias a largo plazo).
Medir (Medir los efectos de las medidas de control ..).
Estudiar (Estudiar las reacciones..)
Calibrar y evaluar.
ESTRATEGIA DE MONITOREO
Definicin de parmetros a evaluar. Parmetros depender de los
objetivos del estudio u objetivos del monitoreo,
137
Mtodos Estadsticos
138
Mtodos Estadsticos
parmetros
antropognicas,
se
seleccionaran
fuentes
en
contaminantes
funcin
y
teniendo
las
en
actividades
cuenta
la
Mtodos Estadsticos
TIPOS DE MUESTRAS
Representativa: composicin y propiedades similares al conjunto de
la muestra.
Selectiva: obtenida en el muestreo de determinadas zonas.
Sistemtica: obtenida segn un procedimiento sistemtico.
Aleatoria: obtenida al azar.
Compsita : formada por dos o mas submuestras
TIPOS DE MUESTREO
Intuitivo: Basado en la experiencia en algn tipo particular de
muestra
Estadstico: Mediante un modelo estadstico previamente validado
Sistemtico: Siguiendo un protocolo en el que se especifica: tipo, tamao,
frecuencia, periodo del muestreo y lugar
En la planificacin del muestreo , han de considerarse los siguientes
aspectos:
Cuando, donde y como recoger la muestra
Equipos de muestreo : mantenimiento y calibracin
Contenedores de la muestra : limpieza , adicin de estabilizantes y
conservacin
Transporte de la muestra
Pretratamiento de la muestra : secado, homogeneizacin y manejo
de la muestra
Submuestreo
Sistema informativo en el laboratorio
Seleccin de los puntos y tiempos de muestreo :
Se toman incrementos de muestra en puntos preseleccionados al
azar, siguiendo un programa de muestreo, en el que se incluyan
estos puntos.
Representatividad de la muestra
La concentracin de los analitos en la muestra obtenida debe ser
idntica a la concentracin en la muestra real en la posicin y tiempo
140
Mtodos Estadsticos
Da , hora y lugar
Subdivisin de la muestra
La muestra bruta obtenida resulta de la mezcla de un cierto nmero
de unidades de muestreo (incrementos).
El nmero de unidades de muestreo depende ms de :
PRECAUCIONES EN EL TRANSPORTE
Evitar la exposicin a humedades extremas y mantenerlas a 4 C.
Las muestras biolgicas o de alimentos es necesario transportarlas
congeladas
PRECAUCIONES PARA LA CONSERVACION
Reducir los riesgos de alteraciones por contacto con la atmsfera,
absorcin y oxidacin
Evitar su exposicin al aire ya la luz y su manipulacin
Los slidos se mantienen secos eliminando el agua en una estufa
Las muestras biolgicas se congelan en nitrgeno lquido o se
liofilizan
El tratamiento de los lquidos depende del tipo de anlisis
Las muestras se almacenan por dos motivos:
141
Mtodos Estadsticos
los
142
Mtodos Estadsticos
143
Mtodos Estadsticos
144
Mtodos Estadsticos
145
Mtodos Estadsticos
CAPITULO VIII
DISTRIBUCIONES MUESTRALES.
DISTRIBUCION NORMAL.
En este captulo abordaremos el estudio de la distribucin normal y de otras
distribuciones asociadas a funciones de una muestra al azar de esta variable.
El porqu de la importancia de la distribucin normal se ilustra a travs de las
siguientes propiedades y distribuciones.
PROPOSICION
1. Teorema del lmite central (TLC).
X i n
Z i 1
n
X
N (0, 1).
/ n
X np
N (0, 1).
np1 p
b 12 np
a 12 np
1
1
Fz
.
Pa X b P a X b Fz
np1 p
np1 p
2
2
146
Mtodos Estadsticos
LA DISTRIBUCION CHI-CUADRADO.
Una v.a. X tiene distribucin chi-cuadrado con n grados de libertad, y se le
denota por
X 2 (n).
PROPOSICION.
1. Si Z N (0, 1), entonces Z2 2 (1).
2. Propiedad reproductiva. Si 12 22 ... k2
2 i2
i 1
libertad.
3. Si X 1 , X 2 ,..., X n es una m.a de X N (,2), entonces
n 1S 2
2 (n -1).
LA DISTRIBUCION T DE STUDENT.
Una v.a. X tiene distribucin t de Student con n grados de libertad, y se le
denota por
X t(n).
PROPOSICION.
1. Sea X t(n). Si n es grande, entonces aproximadamente X N (0, 1).
2. Si Z N (0, 1) y 2 2 (n) son v.as independientes, entonces
se cumple que:
X
t (n -1).
S/ n
147
Mtodos Estadsticos
LA DISTRIBUCION F DE FISHER.
Una v.a. X tiene distribucin F de Fisher con n grados de libertad en el
numerador y m grados de libertad en el denominador, y se le denota por X F
(n, m).
PROPOSICION.
1. Si X F (n, m), entonces
1
X
F (m, n).
12 / n
F (m, n). En particular, si X 1 , X 2 ,..., X n es una v.a. de X N
22 / m
S12 22
S 22 12
F (n -1, m - 1),
148
Mtodos Estadsticos
-Lmites de los intervalos de confianza: Son los dos valores extremos del
intervalo de confianza.
Definicin.
Un intervalo de confianza (IC) al 100(1 - )% para un parmetro poblacional
de una v.a. X es un intervalo con estadsticas L1 y L2 en los extremos (IC =
L1, L2) tal que PL1 L2 1 .
Intervalo de confianza para la media
El IC al 100(1 - )% para , cuando 2 es conocida, se obtiene usando
como pivote a Z
X
N (0, 1) y vienen dado por
/ n
X z1
X z1
Con
trol
del
Pro
nst
ico
Acci
ones
para
supe
Pronsti
rar
co
las
Elcons
IC al 100(1 - )% para , cuando 2 es desconocida seConsecu
obtiene usando
encias
de
ecue
X
los
ncia pivote a T
como
t (n -1) y vienen dado por
problema
S
/
n
s del
s
probl
ema
149
Mtodos Estadsticos
X t(1 , n 1)
2
S
S
X t(1 , n 1)
,
2
n
n
x x
i 1
n 1
Medicina
Pobla
cin
Muest
ra
Infere
ncias
For
mul
aci
n de
preg
unta
s
Que
tan
reales
es.
No
prese
nta
RAM
n 1S 2
El IC al 100(1 - )% para , se obtiene usando como pivote a W
2
n 1 S 2 2 n 1 S 2
12 n 1
2 n 1
S2
x x
i 1
n 1
150
Mtodos Estadsticos
2%
3%
No
prese
nta No
RAM prese
nta
40%
RAM
30%
30%
1%
Prese
nta
RAM
Presenta
RAM
Presenta
RAM
S12
12 S12
f / 2,n2 1, n1 1 2 2 f1 / 2,n2 1, n1 1
S22
2 S2
Donde
f / 2,n2 1, n1 1
distribucin F.
f1 / 2,n2 1, n1 1
denotan
a los
valores en la
independientes de tamaos n1 y n2
Intervalo de confianza para la diferencia entre dos medias. 1 2
El IC al 100(1 - )% para 1 2 , cuando 12 y 22 es conocida se obtiene
usando como pivote a z
X 1 X 2 ( 1 2 )
12
n1
22
n2
151
Mtodos Estadsticos
12
( X1 X 2 ) z(1 / 2) *
n1
22
n2
1 2 ( X1 X 2 ) z(1 / 2) *
12
n1
22
n2
p p
p 1 p
n
N (0, 1),
p z1
p p z1
p 1 p
n
( p1 p2 ) ( p1 p2)
p1 1 p1
n1
N (0, 1),
p2 1 p2
n2
( p1 p2 ) z1 *
2
p1 1 p1
n1
p2 1 p2
n2
( p1 p2 ) ( p1 p2 ) z1 *
2
p1 1 p1
n1
EJERCICIOS RESUELTOS
1.- En una muestra de 250 empresas se estimo el monto de recaudacin en un
da, obtenindose un monto medio de 5900 soles y una desviacin tpica de
94 soles. Obtener un intervalo de confianza (al 95%) para el monto medio de
recaudacin diaria.
Solucin.
Reemplazando en la relacin
X z1
X z1
152
p2 1 p2
n2
Mtodos Estadsticos
1
/2
/2
Z(1/2
5900 1.96
Z(1/2
94
94
5900 1.96
250
250
5888.34 5911.65
8.
Reemplazando en la relacin
S
S
X t(1 , n 1)
,
2
n
n
32
32
256 2.045
256 2.045
30
30
X t(1 , n 1)
2
244.05 267.9
9.
140
0.7 , z1 1.96 , n=200
2
200
153
Mtodos Estadsticos
p z1
p 1 p
n
0.7 1.96
10.
p 1 p
n
p p z1
0.7(10.7)
200
p 0.7 1.96
0.7(10.7)
200
Solucin.
Sistema A
p1
75
0.3 , n1 250
250
Sistema B
p2
80
0.4
200
, n1 200
z1 1.96
2
( p1 p2 ) z1 *
p1 1 p1
n1
0.310.3
250
p2 1 p2
n2
0.410.4
200
( p1 p2 ) ( p1 p2 ) z1 *
2
p1 1 p1
n1
0.310.3
250
-0.18 ( p1 p2 ) -0.011
El intervalo contiene solo valores negativos, entonces.
( p1 p2 ) 0 p1 p2
De la relacin anterior se concluye que el sistema de control A presenta
menor nivel de eficiencia que el sistema B.
154
p2 1 p2
n2
0.410.4
200
Mtodos Estadsticos
11.
B,
B es
mayor que la de A?
Solucin.
Ciudad A
x1 13, 1 3, n1 50
Ciudad B
x2 15, 2 4, n2 40
z1 1.96
2
( X1 X 2 ) z(1 / 2) *
12
n1
22
n2
1 2 ( X1 X 2 ) z(1 / 2) *
12
n1
22
n2
9 16
9 16
50 40
50 40
3.49 1 2 0.50
Como 1 2 0 , entonces 1 2 .
EJERCICIOS PROPUESTOS
1.
Mtodos Estadsticos
= 36
).
(b) Hacer una prueba de hiptesis para decidir si hay diferencia entre los dos
promedios poblacionales.
3.- Un grupo ambiental afirma que los incidentes de las aves que chocan con los
aviones son muy raros, es decir, como para justificar la matanza de aves en los
aeropuertos. Sin embargo, un grupo de pilotos aviadores afirman que, en el
despegue de los aviones, en el 10% de los casos, las aves chocan contra el
avin. Usar = 0.05 para probar esta afirmacin. La muestra es de 150
despegues abortados de aviones, de los cuales 5 se debieron a choque contra las
aves.
120
90
110
105
95
60
70
San
70
53
65
62
56
65
76
Borja
156
Mtodos Estadsticos
7.- Un activista del medio ambiente afirma que, menos de la mitad de las
industrias, cumplen con los lmites ambientales. Probar esta aseveracin, si un
sondeo dice que 48% de 1998 industrias si cumplen, satisfactoriamente, con
los reglamentos ambientales. Usar un nivel de = 0.05
8.- Una especie vegetal que aparece en solana y umbra aparenta crecer de
manera distinta en ambas ubicaciones. Para ello tomamos muestras de la altura
de dicha planta en centmetros. Los resultados obtenidos para solana y umbria
aparecen en la tabla.
Altura en Solana
(cm)
Altura en Umbra
(cm)
39
43
36
45
35
42
37
35
157
40
37
39
38
40
33
38
38
35
41
39
43
Mtodos Estadsticos
PRUEBAS DE HIPOTESIS
hiptesis
Rechazar Ho
verdadera
Decisin correcta
Error Tipo I
Ho falsa
Error Tipo II
Decisin correcta
Ho
158
Mtodos Estadsticos
Mtodos Estadsticos
160
Mtodos Estadsticos
PRUEBAS DE HIPOTESIS
Pruebas de Hiptesis.
Hiptesis Nula
Estadstica de Prueba
Regin crtica
Hiptesis
Alternativa
Z c z1
Prueba de Medias
H0: = 0 vs:
Ha: 0
Si 2 conocido
Ha: > 0
Zc
Zc
Ha: 0
H0: = 0 vs
Ha: > 0
Si se asume que :
Ha: < 0
X 0
N (0, 1)
/ n
X 0
s / n N (0, 1)
Tc
Zc z1
Tc t1 n 1
2
X 0
S/
Z c z1
t (n -1)
2 es desconocido
Tc t1 n 1
Tc t1 n 1
Ha: 1 2
H0: 1 = 2 vs:
Ha: 1 > 2
Asumiendo
Ha: 1 < 2
Zc
X1 X 2
12
n1
12 y 22 Conocidos
n2
2
Zc z1
N (0, 1)
Zc z1
Zc z1
161
Mtodos Estadsticos
pero n1 30 y n2 30
Ha: 1 2
H0: 1 = 2 vs
Ha: 1 > 2
Asumiendo que:
12
22
Ha: 1 2
H0: 1 = 2 vs
Ha: 1 > 2
Asumiendo que:
Ha: 1 < 2
12 22 y desconocidos
H0: 2 = 02 vs
Sp
s12 s22
n1 n2
Tc S X1 1X21
Ha: 1 < 2
desconocidos
Prueba de varianzas
X1 X 2
Zc
Tc t1 n1 n2 2
2
t (n1 + n2 -2)
Tc t1 n1 n2 2
X1 X 2
Tc t1 v
Sp
S12 S22
n1 n2
T (v)
S12 S12 2
n )
n1
1
( S12 / n1 ) 2 ( S 22 / n2 ) 2
n 1
n1 1
2
Ha:
02
Ha: 2 02
162
2
c
n1S 2
02
Tc t1 v
Tc t1 v
c2 2 n 1 c2 12 n 1
Ha: 2 02
2
Tc t1 n1 n2 2
n1 1S12 n2 1S22
n1 n2 2
Tc
v
n1 n2
N (0, 1)
(n - 1)
c2 1 n 1
c2 n 1
Mtodos Estadsticos
Fc F n1 1, n2 1 Fc F1
Ha: 12 22
Fc
Ha: 12 22
Ha: 12 22
S12
S22
F (n1 1, n2 - 1)
Fc F1 n1 1, n2 1
Fc F n1 1, n2 1
Prueba de proporciones
Ha: p p0
Zc
Ha: p > p0
H0: p =p0 Vs
p p0
p (1 p )/ n N (0, 1)
Ha: p < p0
Zc z1
Zc z1
Zc z1
Prueba de diferencia de proporciones
Ha: p1 p2
Zc
Ha: p1 > p2
H0: p1 =p2 Vs
Ha: p1 < p2
pc
163
p1 p2
pc (1 pc ) pc (1 pc ) N(0,1)
n1
n2
n1 p1 n2 p2
n1 n2
Z c z1
Zc z1
Zc z1
Mtodos Estadsticos
EJERCICIOS RESUELTOS
1.-El pago en promedio por concepto de impuestos de los establecimientos
comerciales en una ciudad es de 355 soles. Se Sospecha que estos
establecimientos evaden el pago de impuestos, pagando menos del debido. Para
contrastar esta hiptesis se analiza
Zc
X 0
/ n
Regin critica
=5%
Z0=1.645 Zc =9.68
Regin
Aceptacin
Regin
Crtica
Conclusin.
Como Zc Zo
Se rechaza la hiptesis nula, por lo tanto se debe pagar ms de lo que
actualmente se contribuye.
2- Se aplico una estrategia diferenciadora para colocar un producto en el mercado.
En el cuadro siguiente se muestra las utilidades antes y despus de aplicar la
estrategia en miles de dlares.
164
Mtodos Estadsticos
Antes
25
25
27
44
30
67
53
53
52
Despus
27
29
37
56
46
82
57
80
61
10
12
16
15
27
Diferencia 2
Hay suficiente evidencia estadstica (al nivel de significacin 0,05) a favor de que
la estrategia presenta un efecto positivo?.
Solucin
Formulacin de hiptesis.
H0: d = 0
Ha: d 0
Nivel de significancia, 5%
Estadstica de prueba.
Tc
X 0
S/ n
Tc
11 0
4.25
7.76 / 9
Regin critica
t0=2.26
R.R. H0
R.A. H0
t0=2.26 tc=4.25
R.R. H0
Conclusin.
Como tc 2.262 se rechaza la hiptesis nula.
3.- Se desea comparar el nivel de posicionamiento de dos empresas A y B en una
ciudad, para tal efecto se recopilo informacin de las recaudaciones diarias de
las dos empresas. Los resultados del estudio se muestran a continuacin.
Empresa A
Empresa B
165
Mtodos Estadsticos
Tc
X1 X 2
Sp
1 1
n1 n2
t (n1 + n2 -2)
De la informacin se tiene:
n1 13 , x1 138.6 , S12 29.16
Empresa A
Empresa B
Sp
n1 1 S12 n2 1 S22
Tc
X1 X 2
n1 n2 2
Sp
1 1
n1 n2
131*29.16161*26.7
1316 2
5.27
138.6 125.8
6.50
1
1
5.27* 13 16
Regin critica
T0 t1 n1 n2 2 t0.975 13 16 2 t0.975 27 2.052
2
t0=2.052
R.R. H0
t0=2.052
R.A. H0
tc=6.50
R.R. H0
Conclusin.
Como Tc T0 , entonces se rechaza H0.
4- El Ministerio de Economa viene desarrollando programas
destinados a la
poblacin, con la finalidad de que exijan la entrega de Boletas o facturas por todo
166
Mtodos Estadsticos
Solucin.
Formulacin de hiptesis.
H0: p1 =p2
Ha: p1 p2
Nivel de significancia, 5%
Estadstica de prueba.
Zc
p1 p2
pc (1 pc ) pc (1 pc )
n1
n2
Provincia A.
p1 0.2 , n1 600
Provincia B.
p2 0.15 , n2 600
pc
n1 p1 n2 p2 600*0.2 600*0.15
0.175
n1 n2
600 600
Zc
p1 p2
pc (1 pc ) pc (1 pc )
n1
n2
0.200.15
0.175(10.175) 0.175(10.175)
600
600
2.279
Regin critica
=5%
Z0=1.96
Regin
Aceptacin
167
Zc =2.279
Regin
Crtica
Mtodos Estadsticos
Conclusin.
Como
p1 p2
EJERCICIOS PROPUESTOS
1)
Media
tomillar
suelo
desnudo
6
8
74.8
72.9
Parcela
quemada
no quemada
10
9
13
12
12
16
16
15
16
17
19
20
Mtodos Estadsticos
169
Mtodos Estadsticos
Mtodos Estadsticos
Pareados de sectores
Sectores
concentrados
1
3.7
3.2
4.1
3.7
2.1
2.6
-0.9
0.1
4.6
4.1
5.2
4.8
6.7
5.2
3.8
3.9
4.9
4.6
pH (1975)
pH (1981)
4.97
4.98
4.32
4.49
4.97
5.21
4.98
5
171
Mtodos Estadsticos
4.58
4.94
4.72
4.9
4.53
4.54
4.96
5.69
10
4.96
5.75
11
5.31
5.43
12
5.42
5.19
13
5.6
5.7
14
5.37
5.38
15
4.87
4.9
16
5.87
6.02
17
6.2
6.25
18
6.67
6.67
19
6.06
6.09
20
5.38
5.51
21
5.6
5.98
22
5.6
5.66
23
5.37
5.67
24
5.07
5.18
25
6.23
6.29
26
6.24
6.37
27
5.15
5.68
28
4.82
5.45
29
5.42
5.54
30
4.99
5.25
31
5.31
5.55
32
5.99
6.13
33
4.63
4.92
34
4.47
4.5
35
4.6
4.66
36
4.88
4.92
37
4.6
4.84
38
4.85
4.86
172
Mtodos Estadsticos
39
5.06
5.11
40
5.97
6.17
41
5.47
5.82
Mtodo A
Mtodo B
Mtodo C
71
90
72
75
80
77
65
86
76
69
84
79
Probar la hiptesis de que no hay diferencias entre los tres promedios Poblacionales
con = 0.05.
CAPITULO IX
173
Mtodos Estadsticos
PRUEBA DE CHI-CUADRADO
Las pruebas de hiptesis desarrolladas anteriormente, estn basadas en el supuesto
de que la muestra pertenezca a una poblacin con distribucin conocida.
Muchas de las investigaciones cientficas
Aqu abordaremos dos problemas muy interesantes dentro de lo que se conoce con
el nombre de estadstica no paramtrica. La prueba de homogeneidad y la prueba
de independencia.
La justificacin de estos problemas es comparar las frecuencias esperadas y las
observadas.
9.1
TABLA DE CONTINGENCIA
Es relativamente frecuente encontrarse con informacin referida a la
observacin de dos caractersticas de una poblacin, en las que se establecen
modalidades o categoras, mediante las cuales se clasifican los individuos o
elementos que constituyen una muestra de la misma. Este tipo de distribucin
bidimensional de frecuencias suele presentarse en forma de tabla de doble
entrada, tambin llamada tabla de contingencia.
Total
Y1
Y2
...Y j ...
Yc
X1
o11
o12
o1 j
o1c
n1.
X2
o21
o22
o2 j
o2c
n2.
...
...
...
...
...
...
Xi
oi1
oi 2
oij
oic
ni.
...
...
...
...
...
...
Xr
or1
or 2
orj
orc
nc.
n.1
n.2
n. j
n.c
Total
174
Mtodos Estadsticos
i 1
j 1
En
esta
seccin
se
vern
las
pruebas
de
homogeneidad
de
9.2
PRUEBA DE HOMOGENEIDAD.
En ocasiones ocurre que tenemos a varias poblaciones clasificadas de acuerdo
con las categoras definidas para una determinada variable. La pregunta que se
sugiere inmediatamente es si la proporcin de individuos pertenecientes a cada
una de las clases es la misma en todas las poblaciones. Si, con la informacin
suministrada por las muestras obtenidas, se puede aceptar que esto es as,
diremos que las poblaciones son homogneas con respecto a la variable de
clasificacin utilizada.
Existen r poblaciones y una muestra aleatoria es extrada desde cada
poblacin. Sea ni. el tamao de la muestra extrada de la i-sima poblacin.
Cada observacin de cada muestra puede ser clasificada en una de c
categoras diferentes. Los datos son arreglados en la siguiente tabla de
contingencia r c:
Categora Categora
Poblacin 1 1 O 11
2 O 12
Poblacin 2
O22
O 21
Poblacin r
Total
O r2
n.1
...
.. .
.
..
.
.
....
O r2
n.2
Categora Total
n 1.
O
c 1c
O2c
n2
o rc
n.c
n r.
n..
nr-
Mtodos Estadsticos
Hiptesis:
Sea ij la probabilidad de que una observacin seleccionada de la
poblacin i sea clasificada en la categora j. Entonces las hiptesis son:
Ho: 1j =... =
xc2
j 1
(oij eij )
j 1
eij
x 2 (r 1)(c 1)
donde eij ni .x
n. j
n..
Regla de decisin:
La hiptesis nula se rechaza con un nivel de significacin a si el x c2 resulta
mayor que el valor de tabla x 21 ,( r 1)( c 1)
Fila 1
Fila 2
Columna c Total
O ic
ni.
0 2c
n2.
Mtodos Estadsticos
Fila r
Total
O r2
n .i
O r2
n .2
.
.
.
..
0 rc
n. ,
n ro
n..
.
En la tabla, ojj es el nmero de observaciones clasificadas en la fila i
columna j, n i . es el nmero total de observaciones en la fila i y n. j es el
nmero total de observaciones en la columna j.
Hiptesis:
Sea ij la probabilidad de que una observacin sea clasificada en la fila i
columna j, i. la probabilidad de que una observacin sea clasificada en
la fila i y . j la probabilidad de que una observacin sea clasificada en la
columna j. Entonces las hiptesis son:
Ho: ij i. . j para todo i = 1, ... r, j = 1, ... c.
H1: Al menos una igualdad no se cumple.
Las hiptesis pueden expresarse, en forma equivalente de la siguiente manera:
Ho: Las variables X y Y son independientes.
HI: Las variables X y Y no son independientes.
Estadstico de prueba:
r
xc2
j 1
(oij eij )
j 1
eij
n. j
n..
Regla de decisin:
Se adopta la siguiente regla de decisin:
EJERCICIOS RESUELTOS
Mtodos Estadsticos
Marcas
Preferencias
Total
Si
70
100
150
320
No
130
100
50
280
Total
200
200
200
600
Podemos concluir con 95% de confianza que las preferencias de las marcas
es similar?
Solucin.
H0: Las preferencias de las tres marcas son similares.
H1: Las preferencias de los tres marcas no son similares
2
c
e11
320*200
320*200
320*200
106.67 , e12
106.67 , e13
106.67
600
600
600
e21
280*200
280*200
280*200
93.33 , e22
93.33 , e23
93.33
600
600
600
70 106.67
106.67
100 106.67
106.67
150 106.67
106.67
130 93.33
93.33
100 93.33
93.33
50 93.33
93.33
c2 65.625
De la tabla de chi-cuadrado , 02 5.991
o2=5.99
R.A. H0
o2=65.625
R.R. H0
178
Mtodos Estadsticos
Tcnicas de
valorizacin
Tamao de la empresa
Alto
Medio
Bajo
Total
Actualmente
51
22
43
116
En el pasado
92
21
28
141
Nunca
68
22
99
211
52
93
356
Total
Tamao de la empresa
Uso de software
Alto
Medio
Bajo
Total
51
Actualmente
116
En el pasado
141
Nunca
68(58.68)
Total
9(14.46) 22(25.86)
211
179
52
93
99
356
Mtodos Estadsticos
.
3
x
2
c
ij
eij
eij
i 1 j 1
18.510
Total
al capital social
< $ 500
$500-2000
>$2000
Menor
12
13
29
Mayor
15
13
33
Total
17
28
17
62
Solucin
Ho: La Estructura de capital es similar en los distintos tipos de empresa.
(Independientes)
HI: La Estructura de capital es similar en los distintos tipos de empresa
(Dependientes)
180
Mtodos Estadsticos
Estructura
de capital
Menor
May or
Total
Frecuencia
Porcentaje
Frecuencia
Porcentaje
Frecuencia
Porcentaje
Chi-cuadrado=7.563
Total
29
46.8%
33
53.2%
62
100.0%
, P-v alor=0.023
EL p-valor, juega un papel muy importante en la decisin de las hiptesis. Si pvalor < 0.05 se acepta la hiptesis alterna con un nivel de confianza del 95%,
en este caso influye el factor; en el caso que p > 0.05 la decisin es aceptar la
hiptesis nula, no influye el factor.
En nuestro ejemplo p-valor<0.05, se rechaza la hiptesis nula.
La estructura
EJERCICIOS PROPUESTOS
181
Tramo
Alto
Tramo
Medio
Tramo
Bajo
+
+
+
+
+
+
+
+
+
+
-
+
-
+
+
+
182
CLETO DE LA TORRE
3) El departamento de tarjetas de crdito bancarias del California Bank sabe que por
su larga experiencia, que 5% de los tarjeta habientes han tenido algunos estudios de
bachillerato, 15% han terminado dicho nivel escolar, 25% han tenido ciertos estudios
universitarios, y 55% han concluido la instruccin en universidad. De los 500 tarjeta
habientes que fueron reportados por falta de pago en este mes, 50 tenan estudios
de bachillerato, 100 terminaron tal nivel escolar, 190 tenan cierta preparacin
universitaria y 160 concluyeron la instruccin en la universidad. Se puede concluir
que la distribucin de tarjeta habientes que no han pagado sus cuentas es diferente
de la de los dems?. Aplique el nivel de significancia de 0,01
Preocupacin
Sin inters
Algo de inters
Gran preocupacin
Gerencia alta
15
13
12
Gerencia media
20
19
21
Supervisor
Jefe de grupo
28
21
31
Adquirieron la
Regin
NE
NO
SE
SO
40
55
45
50
60
45
55
50
marca
No la adquirieron
183
ESTADISTICA
Rendimiento financiero
Bajo
Medio
Alto
Baja
15
25
18
Media
30
52
23
Alta
23
49
61
A qu conclusin llega usted? Utilice un nivel de confianza del 90% para su prueba.
7)
Menos de 100
13
10
18
12
Ms de 500
32
184
CLETO DE LA TORRE
MEDIA
ALTA
249
494
201
26
26
Muestran los datos al nivel 0.05 evedencia que respalde los reportes del experto ?
CONSULTORAS
Acciones
13
16
Bonos
31
24
10
Bonos convertibles
35
18
Proporcionan stos datos evidencia al nivel 0.10 de que las tres firmas consultoras
opinan distinto?
Frecuencia
84
110
146
152
61
47
Presentan los datos suficiente evidencia de que hay cajas preferidas al nivel 0.05?
ESTADISTICA
Si utiliza financiacin
No utiliza financiacin
Micros
115
325
Pequeas
20
20
Medianas
15
CAPITULO X
DISEO EXPERIMENTAL
FACTOR.
Son todas aquellas variables cuyo efecto se desea medir, en algunos casos se les
llama tratamiento.
NIVEL
Es el conjunto de valores que tiene la variable independiente o factor en el
186
CLETO DE LA TORRE
experimento.
UNIDAD EXPERIMENTAL
Es la entidad ms pequea a lo que se aplica el tratamiento, es decir; es el elemento
donde se realiza la medicin.
ERROR EXPERIMENTAL
Es la medida de la variacin, existente entre observaciones de las unidades
experimentales.
En un Diseo Experimental se tiene variabilidad inherente a la unidad experimental y
otra variabilidad debida a los tratamientos.
Para reducir el error experimental se siguen algunos pasos:
Repetir el experimento
Adicionar ms tratamientos
El proceso o sistema bajo estudio puede representarse por medio del modelo:
ESTADISTICA
manera que:
La respuesta se aproxime al valor deseado
La variabilidad de la respuesta sea pequea
Se minimiza el efecto de las variables incontrolables
VENTAJAS Y DESVENTAJAS
VENTAJAS
Este Diseo es fcil de planear y es flexible en cuanto al nmero de
repeticiones y unidades experimentales del tratamiento
DESVENTAJAS
Solo es aplicable, cuando el material experimental es homogneo
Los resultados del experimento se pueden agrupar de la siguiente forma:
factor variedad
A
B
niveles
C
D
yij
AY11
CY31
BY23
CY33
BY22
AY12
BY21
DY41
AY13
DY43
DY42 CY32
BY24
188
CLETO DE LA TORRE
Y11
Y21
Yi1
Ya1
Y12
Y22
Yi 2
Ya 2
Y1 j
Y2 j
Y1n
Y2 n
Tratam
Yij
Yaj
Yin
Yan
TOTAL
TOTALES
Y1.
Y2. Yi .
Ya .
Y..
Medias
Y1.
Y2.
Yan
Y..
sa2.
s..2
Varianzas
s12.
Yi.
s22. si2.
Donde:
n
Yi . Yij
j 1
Yi .
, Media del i-simo tratamiento
n
189
ESTADISTICA
Y..
i 1 j 1
Y..
, Media total
an
ANALISIS DE VARIANZA
Es la tcnica mediante el cual se mide los efectos de los tratamientos puesto que
descompone la Varianza Total en diferentes fuentes de variabilidad definida por el
modelo.
Para el cual se siguen los siguientes pasos:
H0 : 1 2 a
i 1 j 1
y..2
yij
N
i 1 j 1
a
yi2. y..2
SCA
N
i 1 ni
a
, N an
N an
CMA
SCA
a 1
CME
SCE
V ( ij ) 2
a(n 1)
190
CLETO DE LA TORRE
SCA
Fc a 1
SCE
a(n 1)
f a 1, a n1 gl
f 0 f a 1, a n1 gl
Anlisis de la varianza.
Fuentes de
g.l
SC
CM
FCAL
Tratamiento a-1
SCA
CMA
CMA
CME
Error
a(n-1)
SCE
CME
Total
an-1
STT
Varianza
Conclusiones:
Si Fc F0 Se rechaza H0
Si Fc F0 Se acepta H0
indica por
dos factores que a su vez tienen la misma importancia en este tipo de anlisis existen
a niveles del factor A y b niveles de factor B.
Este tipo de anlisis se determinan segn el numero de observaciones; si cada unidad
experimental tiene una observacin, el modelo del anlisis univariado de la varianza de
191
ESTADISTICA
dos factores se denomina sin replica, en este caso no existe interaccin entre los dos
factores. En este tipo de anlisis el control local (unidad experimental) por el factor A l
cual esta constituido por todo los del factor B o variantes repetidas una sola vez siendo
el factor A una repeticin con la condicin de que los del factor B estn dentro del
factor A . de donde se puede afirmar que cada factor A contiene los elementos del
factor B el cual disminuye el error experimental.
TABLA DE ANALISIS DE VARIANZA
Fuentes de
g.l
SC
CM
FCAL
Factor A
a-1
SCA
CMA
CMA
CME
Factor B
b-1
SCB
CMB
CMB
CME
Interaccin
(a-1)(b-1)
SCAB
CMAB
CMAB
CME
Error
ab(n-1)
SCE
CME
Total
abn-1
Varianza
AB
Donde:
2
SCT Y Y ,
abn
a
ijk
i 1 j 1 k 1
a
SCAB
i 1
j 1
...
2
ij .
SCA Y
a
i 1
2
i ..
bn
2
...
abn
2
...
abn
SCA SCB
SCE = SCT-(SCA+SCB+SCAB)
El cuadrado medio, se obtiene:
Para el factor A
: CMA
SCA
a 1
Para el factor B
: CMB
SCB
b 1
Para la interaccin AB
: CMAB
Para el error
: CME
SCAB
(a 1)(b 1)
SCAB
ab(n 1)
192
SCB
j 1
2
. j.
an
2
...
abn
CLETO DE LA TORRE
APLICACIONES.
1.- Puesto que el hgado es el principal lugar para el metabolismo de los frmacos, se
espera que los pacientes con enfermedades de hgado tengan dificultades en la
eliminacin de frmacos. Uno de tales frmacos es la fenilbutazona. Se realiza un
estudio de la respuesta del sistema a este frmaco. Se estudian tres grupos:
controles normales, pacientes con cirrosis heptica, pacientes con hepatitis activa
crnica. A cada individuo se les suministra oralmente 19 mg de fenilbutazona/Kg. de
peso. Basndose en los anlisis de sangre se determina para cada uno el tiempo de
mxima concentracin en plasma (en horas). Se obtienen estos datos:
Normal
Cirrsis
Hepattis
35
22,6
16,6
30,6
14,4
12,1
26,8
26,3
7,2
37,9
13,8
6,6
13,7
17,4
12,5
193
ESTADISTICA
49
18.5
15,1
Se puede concluir que las tres poblaciones difieren respecto del tiempo de mxima
concentracin en plasma de fenilbutazona?
Solucin
La hiptesis estadstica esta dado por:
H0 : 1 2 a
H1: i j
Normal
Totales
n
Cirrsis
Hepattis
35
36
37
30.6
30.7
30.8
26.8
26.9
26.10
37.9
37.10
37.11
13.7
13.8
13.9
49
50
51
y1. 84
y2. 86
y3. 88
y.. 258
N=18
Media
y..2
2582
2
2
2
2
SCT yij
35 30.6 26.8 .... 51
2194.57
N
18
i 1 j 1
a
SCA
i 1
0.7059
ni N
6
18
g.l
SC
CM
FC
0.7059
0.35295
0.00220775
Varianza
Tratamiento 2
194
CLETO DE LA TORRE
Error
15
2193.87
Total
17
2194.57
146.258
Disminucin
Tiempo
Tratamiento de Volumen
Disminucin
Tiempo
Tratamiento de Volumen
30 EE1
-0.085
90 EE3
0.09
30 EE1
0.045
120 EE3
0.2
60 EE1
-0.1
120 EE3
0.25
60 EE1
0.02
150 EE3
0.26
90 EE1
-0.075
150 EE3
0.34
90 EE1
0.085
30 EE4
120 EE1
-0.073
30 EE4
0.07
120 EE1
0.087
60 EE4
0.03
150 EE1
0.25
60 EE4
0.1
150 EE1
0.17
90 EE4
0.09
30 EE2
-0.11
90 EE4
0.17
30 EE2
0.03
120 EE4
0.21
60 EE2
-0.1
120 EE4
0.2
60 EE2
0.02
150 EE4
0.35
90 EE2
-0.08
150 EE4
0.42
90 EE2
0.07
30 Naproxeno
0.03
120 EE2
-0.05
30 Naproxeno
0.06
120 EE2
0.11
60 Naproxeno
0.11
150 EE2
0.12
60 Naproxeno
0.1
150 EE2
0.25
90 Naproxeno
0.17
195
ESTADISTICA
30 EE3
-0.06
90 Naproxeno
0.15
30 EE3
120 Naproxeno
0.21
60 EE3
-0.04
120 Naproxeno
0.32
60 EE3
0.02
150 Naproxeno
0.44
90 EE3
0.02
150 Naproxeno
0.42
ANALISIS DE VARIANZA
Fuentes de variacin Suma de
gl
cuadrados
Cuadrado
Fc
P-Value
medio
Factores
A:Tratamiento
0.242096
0.0605239
12.4 0.0000
0
B:Tiempo
0.611808
0.152952
31.3 0.0000
4
Interaccion
AB
0.0524227
16
Error
0.122
25
0.00488
Total
1.02833
49
Del anlisis de varianza que se muestra en el cuadro anterior se puede concluir con
95% de confianza que los tratamientos considerados en el estudio (diferentes tipo de
de extracto ms el estndar que es naproxeno) influyen en la disminucin del volumen
196
CLETO DE LA TORRE
Disminucion de Volumen
0.24
0.19
0.14
0.09
0.04
-0.01
EE1
EE2
EE3
EE4
Naproxeno
Tratamiento
197
ESTADISTICA
Disminucion de Volumen
0.36
0.26
0.16
0.06
-0.04
30
60
90
120
150
Tiempo
El efecto de los distintos tratamientos es creciente de 60 a 150 minutos .Por otra parte
tambin se puede observar que los distintos tratamientos tiene efectos similares de 30
Disminucion de Volumen
0.45
Tratamiento
EE1
0.35
EE2
EE3
EE4
0.25
Naproxeno
0.15
0.05
-0.05
30
60
90
120
150
Tiempo
De este anlisis se puede concluir que todos los tratamientos presentan mejor efecto a
los 150 minutos.
EJERCICIOS
198
CLETO DE LA TORRE
Sitio #1
Sitio #2
Sitio #3
Sitio #4
20
25
28
31
17
25
31
15
18
26
34
12
10
14
17
24
Nivel del PH
Nivel de concentracin de
cloro
pH = 7.0 pH = 7.2
199
pH = 7.4
pH = 7.6
ESTADISTICA
Baja
22
17
Mediana
11
Alta
0.025
0.029
0.026
Sector B 0.025
0.028
0.030
0.027
0.024
Sector C 0.034
0.029
0.032
0.031
0.036
Sector D 0.030
0.033
0.031
4.-Se quiere saber si el tipo de cobertura de suelo (suelo desnudo, piedras, hojarasca y
pastizal) influye sobre la densidad de hormigueros. Para ello se ha realizado un
muestreo en el que se ha medido el nmero de hormigueros en diez muestras
distribuidas al azar dentro de cada una de las zonas con diferente cobertura:
Cobertura
suelo desnudo
piedras
hojarasca
pastizal
Total
Densidad de hormigueros
78 88 87 88 83 82 81 80 80 89
78 78 83 81 78 81 81 82 76 76
79 73 79 75 77 78 80 78 83 84
77 69 75 70 74 83 80 75 76 75
n
10
10
10
10
40
Media
83.6
79.4
78.6
75.4
5.- Los siguientes datos representan los tiempos de reaccin (en segundos) a tres tipos
de estmulos:
Estmulo A: 4.9 6.1 4.3 4.6 5.3
Estmulo B: 5.5 5.4 6.2 5.8 5.6 5.2 4.8
Estmulo C: 6.4 6.8 5.7 6.5 6.3 6.6
200
CLETO DE LA TORRE
10
37
12
31
11
23
Grupo II
35
32
19
33
18
Grupo III
15
10
12
15
Grupo IV
11
7.- Se sospecha que las aguas de un lago estn contaminadas por los compuestos
fosforados procedentes de una industria. Para tratar de verificar esta sospecha, se
midieron los niveles de fsforo en distintos puntos del lago, obtenindose los
siguientes valores:
Lago 1: 7.1 8.5 6.2 7.3 7.9
Despus, se tomaron medidas de los niveles de fsforo en varios puntos de otros
tres lagos, que no estaban contaminados, obtenindose:
Lago 2: 7.2 6.5 5.9 7.8
Lago 3: 5.6 7.1 6.3 6.7 6.5
Lago 4: 7.2 6.6 6.3 7.4
Los valores obtenidos en lago bajo sospecha parecen ser algo superiores a los
obtenidos en los otros tres. Es suficientemente importante esta diferencia como para
poder concluir que el nivel de fsforo en el lago 1 es diferente que el que tienen los
dems, y por tanto est contaminado?
201
ESTADISTICA
202
CLETO DE LA TORRE
Z
0
0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
0.09
0.1
0.2
0.07926 0.08617 0.08706 0.09095 0.09483 0.09871 0.10257 0.10642 0.11026 0.11409
0.3
0.4
0.15542
0.5
0.2224
0.6
0.2549
0.7
0.8
0.9
0.31594 0.31859 0.32124 0.32381 0.32639 0.32894 0.33147 0.33398 0.33646 0.33891
0.34134 0.34375 0.34614 0.34849 0.35083 0.35314 0.35543 0.35769 0.35993 0.36214
0.1591 0.16276
0.2823 0.28524
1.1
0.36433
1.2
0.38493 0.38686 0.38877 0.39065 0.39251 0.39435 0.39616 0.39796 0.39973 0.40147
1.3
0.4032
0.379
0.381 0.38298
1.4
0.41924 0.42073
1.5
0.43319 0.43448 0.43574 0.43699 0.43822 0.43943 0.44062 0.44179 0.44295 0.44408
1.6
0.4452
1.7
0.45543 0.45637 0.45728 0.45818 0.45907 0.45994 0.46079 0.46164 0.46246 0.46327
1.8
0.46407 0.46485 0.46562 0.46637 0.46712 0.46784 0.46856 0.46926 0.46995 0.47062
1.9
2.1
2.2
2.3
2.4
0.4887 0.48899
0.4918 0.49202 0.49224 0.49245 0.49266 0.49286 0.49305 0.49324 0.49343 0.49361
2.5
2.6
0.49534 0.49547
2.7
2.8
0.49744 0.49752
2.9
0.4767
0.4952
0.4986
0.499
3.1
0.49903 0.49906
3.2
3.3
3.4
3.5
3.6
0.49984 0.49985 0.49985 0.49986 0.49986 0.49987 0.49987 0.49988 0.49988 0.49989
3.7
0.49989
3.8
0.49993 0.49993 0.49993 0.49994 0.49994 0.49994 0.49994 0.49995 0.49995 0.49995
3.9
0.49995 0.49995 0.49996 0.49996 0.49996 0.49996 0.49996 0.49996 0.49997 0.49997
0.4999
0.4999
0.4995
203
ESTADISTICA
p x c 1
gl
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
120
0.75
0.80
0.85
0.9
0.95
1
0.816
0.765
0.741
0.727
0.718
0.711
0.706
0.703
0.7
0.697
0.695
0.694
0.692
0.691
0.69
0.689
0.688
0.688
0.687
0.686
0.686
0.685
0.685
0.684
0.684
0.684
0.683
0.683
0.683
0.681
0.679
0.677
0.674
1.376
1.061
0.978
0.941
0.920
0.906
0.896
0.889
0.883
0.879
0.876
0.873
0.870
0.868
0.866
0.865
0.863
0.862
0.861
0.860
0.859
0.858
0.858
0.857
0.856
0.856
0.855
0.855
0.854
0.854
0.851
0.848
0.845
0.842
1.963
1.386
1.250
1.190
1.156
1.134
1.119
1.108
1.100
1.093
1.088
1.083
1.079
1.076
1.074
1.071
1.069
1.067
1.066
1.064
1.063
1.061
1.060
1.059
1.058
1.058
1.057
1.056
1.055
1.055
1.050
1.046
1.041
1.036
3.078
1.886
1.638
1.533
1.476
1.440
1.415
1.397
1.383
1.372
1.363
1.356
1.350
1.345
1.341
1.337
1.333
1.330
1.328
1.325
1.323
1.321
1.319
1.318
1.316
1.315
1.314
1.313
1.311
1.310
1.303
1.296
1.289
1.282
204
0.975
0.99
0.995
CLETO DE LA TORRE
0.05
0.1
0.2
0.4
0.6
0.8
0.9
0.95
0.975
0.99 0.995
0.02
0.06
0.27
0.71
1.64
2.71
3.84
5.02
6.63
7.88
10.6
0.1
0.21
0.45
1.02
1.83
3.22
4.61
5.99
7.38
9.21
0.35
0.58
1.01
1.87
2.95
4.64
6.25
7.81
9.35
11.34 12.84
0.21
0.48
0.71
1.06
1.65
2.75
4.04
5.99
7.78
9.49
1.15
1.61
2.34
3.66
5.13
7.29
9.24
11.07
1.64
2.2
3.07
4.57
6.21
8.56
10.64
12.59
2.17
2.83
3.82
5.49
7.28
9.8
12.02
14.07
2.73
3.49
4.59
6.42
8.35
11.03
13.36
15.51
1.73 2.09
3.33
4.17
5.38
7.36
9.41
12.24
14.68
16.92
10
3.94
4.87
6.18
8.3
10.47
13.44
15.99
18.31
11
2.6
4.57
5.58
6.99
9.24
11.53
14.63
17.28
19.68
12
3.07 3.57
5.23
6.3
7.81
10.18 12.58
15.81
18.55
21.03
13
5.89
7.04
8.63
11.13 13.64
16.98
19.81
22.36
14
6.57
7.79
9.47
12.08 14.69
18.15
21.06
23.68
15
4.6
5.23 6.26
7.26
8.55
19.31
22.31
25
16
7.96
9.31
20.47
23.54
26.3
28.85
17
5.7
6.41 7.56
8.67
10.09
14.94 17.82
21.61
24.77
27.59
18
9.39
22.76
25.99
28.87
19
23.9
27.2
30.14
20
25.04
28.41
31.41
34.17 37.57
21
8.03
26.17
29.62
32.67
22
27.3
30.81
33.92
23
28.43
32.01
35.17
24
29.55
33.2
36.42
25
30.68
34.38
37.65
30
13.8
16.79 18.49
20.6
36.25
40.26
43.77
35
24.8
41.78
46.06
49.8
53.2
40
47.27
51.81
55.76
45
46.76
52.73
57.51
61.66
58.16
63.17
67.5
68.8
73.31
50
28
0.3
2.7
3.05 3.82
15
4.4
12
42
32
34.27
40
57.34 60.27
55
63.58
60
68.97
74.4
79.08
83.3
65
74.35
79.97
84.82
70
72.36
79.71
85.53
90.53
75
85.07
91.06
96.22
80
90.41
85
95.73
90
59.2 61.8 65.65 69.13 73.29 78.56 85.99 92.76 101.05 107.6 113.15 118.1 124.1 128.3
95
66.4
90.9
97.85 106.36
205
113
118.75 123.9
88.38 91.95
130
134.3
ESTADISTICA
PRUEBAS DE HIPTESIS
SI
1
grupo
SI
NO
Distribucin
Normal
NO
SI
SI
Nmero
de
Grupos
2
grupos
i
n
d
e
p
e
n
d
i
e
n
t
e
s
n30
SI
Varianzas
iguales
SI Prueba T para la
diferencia de medias
Prueba T para la diferencia
de medias con ajuste de
NO grados de libertad.
Distribucin
normal
NO
NO
SI
n30
SI
NO
NODistribucin
normal
3 o ms
grupos
i
n
d
e
p
e
n
d
i
e
n
t
e
s
NO
SI
Distribucin normal
SI
con varianzas
semejantes
Distribucin normal
con varianzas
NO
semejantes
NO
206
CLETO DE LA TORRE
PRUEBAS DE HIPTESIS
SI
Prueba Z para la proporcin poblacional
1
grupo
Muestra grande
nP y n(1-P) > 5
Prueba Binomial para la proporcin poblacional
NO
SI
SI
2
grupos
Nmero
de
Grupos
i
n
d
e
p
e
n
d
i
e
n
t
e
s
SI
Frecuencias
esperadas
pequeas
No
3 o ms
grupos
NO
Prueba de McNeman
Comparacin de proporciones
SI
i
n
d
e
p
e
n
d
i
e
n
t
e
s
SI
Frecuencias
esperadas
pequeas
No
NO
Prueba Q de Cockran
Comparacin de proporciones
207
ESTADISTICA
PRUEBAS DE HIPTESIS
Coeficiente de correlacin lineal de pearson
Continua
Ordinal y/o
cardinal
Escala de
medicin
para
ambas
variables.
SI
Nominal
Cada variable
tiene dos
categoras
(Tabla 2x2)
NO
208
CLETO DE LA TORRE
Tipo de
Tipo de variable
Descripcin
Nivel de
Mtodo o Tcnica
investigacin
Estadstica.
DESCRIPTIVA
Tabla de Frecuencias,
Variables
Cualitativa
individuales
(Nominal y
proporciones, o
Ordinal)
porcentajes.
Representados por
grafico de barras,
sectores o pictogramas.
Escala de actitud
Intervalo de confianza y
de Likert)
prueba de hiptesis de la
proporcin.
Variables
Cuantitativa
DESCRIPTIVA
-Distribucin de
individuales
(Intervalo o
frecuencias por
razn)
intervalos.
-Medias, desviacin , ,
varianza, percentiles.
-Intervalo de confianza y
prueba de hiptesis de la
media.
-Anlisis factorial, anlisis
de compontes
principales.
Asociacin
V. Ind: Cualitativa
EXPLICATIVA
-Tablas de contingencia.
entre
con V.Dep:
-Calculo de riesgos.
variables
Cualitativa
ESTADISTICA
-Anlisis de
correspondencias
Asociacin
V. Ind: :
COMPARATIVA,
entre
Cualitativa(s)
categrica, con
variables
(Grupos)
promedios, desviaciones,
con V.Dep:
etc.
Cuantitativa
-prueba t-student
(Rpta)
Asociacin
V. Ind: :
EXPERIMENTAL,
Diseo experimental
entre
Cualitativa(s)
CUASI
(ANOVA)
variables
(factores)
EXPERIMENTAL
-Prueba de comparacin
con V.Dep:
de medias.
Cuantitativa(Rpta)
Asociacin
V. Ind: :
RELACIONAL,
-Grafico de dispersin.
entre
Cuantitativa(s)
CORRELACIONAL
- Anlisis de regresin.
variables
con V.Dep:
-coeficiente de
Cuantitativa
correlacin de pearson.
Asociacin
V. Ind: :
entre
Cuantitativa(s),
variables
cualitativa(s)
EXPLICATIVA
-Regresin Logstica.
-Anlisis Discriminante.
Con V.Dep:
Cualitativa
210
CLETO DE LA TORRE
Escala de la
Descripcin
variable
Variables
Nominal
individuales
Variables
Ordinales
individuales o
media poblacional.
ms de una
variable
Variables
Intercalar o de
individuales
razn.
-intervalos de confianza.
Mas de una
Intercalar o de
variables
razn
211