Professional Documents
Culture Documents
NACIONAL
DE CAJAMARCA
FACULTAD DE INGENIERA
ESCUELA ACADMICO PROFESIONAL DE
INGENIERA CIVIL
ESTADSTICA APLICADA
Alumna:
ROJAS GUTIRREZ, Mariela
CAJAMARCA PER
2016
K2
K . El
Fila 1
Columna
1
A
Columna
2
B
Columna
3
C
Columna
k
K
S2 , S3 ,
S 4 ) y decide realizar el
ESTADSTICA APLICADA
a2 , a3 , a4 ), e
i 2 , i 3 , i 4 ).
[ ]
A BC D
BC D A
C DAB
D A BC
[ ]
BC D A
C DAB
A BC D
D A BC
[ ]
C DBA
B AC D
DC AB
A B DC
Por ltimo, se asignan al azar las filas, las columnas y las letras latinas a los tres
factores. Por ejemplo, supongamos que las filas, las columnas y las letras se
asignan, respectivamente, a los tipos de insecticidas, semillas y abonos, de tal
forma que el diseo resultante es
Tabla N 1
SEMILLAS
INSECTICI
DAS
i1
i2
i3
i4
S1 S2 S3 S4
a3
a2
a4
a1
a4
a1
a3
a2
a2
a3
a1
a4
a1
a4
a2
a3
Por convenio, se suele situar el factor principal, en este caso el tipo de semilla,
en las celdillas. Reordenando el diseo anterior se obtiene la siguiente tabla:
ESTADSTICA APLICADA
a1 a2 a3 a4
s4
s2
s3
s1
s3
s1
s4
s2
s1
s3
s2
s4
En resumen, podemos
cuadrado latino tiene las siguientes caractersticas:
s2
s4
s1
s3
i=1,2 , k
ij(h)=+ i+ j + y h +uij(h) j=1,2 , k
h=1,2 , K
ij(h)
fila,
-sima columna y
es la media global
i=0
i
yh
uij(h)
i -sima
j =0
j
Y h =0
h
(0, )
ESTADSTICA APLICADA
ij(h)
N2, si
= 2 y
= 1, automticamente
j ). De esta forma,
de referencia es
N=K 2
Y
Y = Y ij(.) Y = 2
K
i. j
El total y la media por fila
k
Yi
Yi= Yij(.) Yi=
K2
j =1
El total y la media por columna
k
Yi
Y . j.= Yij(.) Y . j .= 2
K
i=1
donde la notacin
correspondiente a la celdilla ( i ,
j ) independientemente de la
Y .. h= Y ij(h) Y .. h=
i. j
donde
Y .. h
Y .. h
K
K
observaciones en las
N=K 2
observaciones
2
N
2
L ( , i , j , Y h , )=( 2 )
1
2
exp
Y i jY h ]
2 [ ij(h)
2 i=1 j=1
ln ( L ( , i , j ,Y h , 2 ) )=
2
N
N
1
ln ( 2 ) ln ( 2 ) 2 [ Y ij(h) i j Y h ]
2
2
2 i=1 j=1
ln L 1
= 2 [ Y ij(.) i jY h ]
i =1 j=1
ln L 1
= 2 [ Y ij(.) i jY h ] i=1, , k
i
i =1 j=1
ln L 1
= Y i jY h ] j=1, , k
j 2 i =1 j=1 [ ij(.)
ln L 1
= [ Y i jY h ] h=1, , k
Y h 2 i =1 j=1 ij(h)
K
2
ln L N
1
= 2+
Y
[
]
ij(.)
i
j
h
2
i
2 2 ( 2 ) i=1 j=1
Y ij(.)
^=
K2
=Y
1
^ i= Y ij ( .) ^ =Y iY
K j=1
ESTADSTICA APLICADA
^ j= 1 Y ij (. ) ^ =Y iY
K i=1
1
Y^ h= Y ij ( h )^=Y hY
K i. j
Se puede comprobar fcilmente que estos estimadores verifican
^ i= ^ j = Y^ h=0
i
Finalmente, sustituyendo
^ ,
^ i ,
^ j
Y^ h
en la ltima
^ 2=
2
1
Y ij (.) ^ ^ i ^ jY^ h ]
[
N i. j
Residuos
Los residuos en este modelo adoptan la expresin
e ij (.)=0 i=1, , k
j
e ij (.)=0 j=1, ,k
i
ESTADSTICA APLICADA
2
[ Y ij( h)Y^ ij(h ) ]
~2 ^ 2 i=1
=S R =
j=1
e 2ij(h)
=
(k 1)( k2)
i=1 j=1
(k 1)( k2)
D. DESCOMPOSICIN DE LA VARIABILIDAD
Siguiendo el mismo procedimiento que en modelo en bloques
aleatorizados, se comprueba que la ecuacin bsica del anlisis de la
varianza es
K
( Y ij( h)Y ) = K (Y ij (h )Y ) + K ( Y . j .Y ) + K ( Y .. h Y ) +
j=1
i=1
i=1
i=1
i=1
i=1 j=1
en
estas
sumas
de
cuadrados
se
construyen
2 2 2 2
T F C L
s^ ^s s^ s^ y s^
los
2
R
E ( CMF ) =E ( S^ 2F ) = 2 +
K 2i
i =2
K 1
k
E ( CMC )=E ( S^ 2C ) = 2 +
ESTADSTICA APLICADA
K 2J
i=2
K1
8
K Y 2h
i=2
K1
E ( CMR )=E ( S^ 2R ) = 2
Por lo tanto
1. Se verifica que
S^ 2R
SCR /(K1)(K2)
es un estimador
H 0 t : i=0, i
H 0 : i=0, j
H 0 Y :Y i=0, h
sea cierta, el correspondiente sumando de
S^ 2F ,
S^ 2C
S^ 2L
E(CMF)
que notar que si existen diferencias entre las medias de las filas, las
columnas o letras latinas, el respectivo valor esperado del cuadrado medio
es mayor que 2.
De todo esto podemos deducir que:
1. Un contraste para verificar la hiptesis nula de igualdad de medias
^
de las filas puede efectuarse comparando S F y
2
S^ 2R .
S^ 2C
S^ 2R .
S^ 2L
S^ 2R .
SCF
X 2K1
2
SCC
X 2K1
2
ESTADSTICA APLICADA
SCR
2
X(K
1)( K2)
2
SCR
X 2(K 1) ( K2) sean o no ciertas las hiptesis nulas.
2
Notamos que
SCF/ 2
S^ 2F
K 1
F =
= 2
SCR/ 2
S^ R
( K1)(K 2)
SCC / 2
S^ 2C
K 1
F =
= 2
SCR/ 2
S^ R
( K1)( K 2)
2
SCL/
S^ 2L
K 1
F =
= 2
SCR/ 2
S^ R
( K1)( K 2)
siguen distribuciones
de Snedecor con
K1 y ( K 1)( K 2)
F con
distribucin
K1 y ( K 1)(K 2)
grados de libertad.
SCT = Y ij(.)
i=1 j=1
Y
K
Y 2
SCF= Y 2
K
i=1
k
2
i ..
ESTADSTICA APLICADA
10
k
Y
1
SCC = Y 2. j . 2
K i=1
K
SCL= Y ..h
i =1
Y
K
SCR=SCT SCFSCCSCL
Alternativamente,
utilizando
las
expresiones
abreviadas
SCT , SCF , SCC , SCL y SCR , la Tabla ANOVA se puede presentar como
de
ESTADSTICA APLICADA
11
R 2=
donde, denotamos:
R2 =
R2
R2 =
R2y
SCF
SCT
SCC
SCT
R =
SCL
SCT
R2 ,
R2 ,
R2y
R + R
+ Ry
ESTADSTICA APLICADA
12
EJEMPLO N1
Un investigador quiere evaluar la productividad de cuatro
variedades de aguacate y decide realizar el ensayo en un terreno
que posee un gradiente de pendiente de oriente a occidente y
adems, diferencias en la disponibilidad de Nitrgeno de norte a sur,
para controlar los efectos de la pendiente y la disponibilidad de
Nitrgeno, utiliz un diseo de cuadrado latino, las variedades son:
A, B, C y D, los datos corresponden a la produccin en kg/parcela.
DISPONIBILI
DAD DE
NITRGENO
1
2
3
4
PENDIENTE
1
D
78
5
A
85
5
C
95
0
B
94
5
C
A
70
730
0
D
B
76
775
0
B
D
79
885
5
A
C
88
950
0
Y.j.
4
B
59
5
C
71
0
A
78
0
D
83
5
Yk
Aqu el juego de hiptesis a probar sera:
Ho = A = B = C = D
Ha = i j para cualquier i diferente de j.
El anlisis de varianza queda:
F de v
G
L
Tratamiento
Nitrgeno (Filas)
Pendiente
(Columnas)
Error
Total
3
6
1
5
P
vlu
e
1852.08 98.7 0.00
5556.25
3
8
5
92518.7 30839.5
5
83
52556.2 17518.7
5
5
112.5
18.75
150743.
75
S de C
CM
Fc
ESTADSTICA APLICADA
13
EJEMPLO N2
Se muestra en la siguiente tabla, a la que se han aadido las filas y
columnas necesarias para su resolucin.
2
Y
203
SCT = Y ij(.) 2 =3001 2 =425.4375
K
4
i=1 j=1
SCF = Y i ..
i=1
Y
K
=
2
ESTADSTICA APLICADA
11621 203
2 =329.6875
4
4
14
k
2
Y
1
10317 203
SCC = Y 2. j . 2 =
2 =3.6875
K i=1
4
K
4
SCL= Y ..h
i =1
Y
K
=
2
10615 203
2 =78.1875
4
4
SCR=SCT SCFSCCSCL=13,875 .
La tabla ANOVA correspondiente a este modelo es Tabla 5-7. Anlisis de la
varianza
EJEMPLO N3
Un investigador quiere evaluar la productividad de cuatro variedades de
aguacate y decide realizar el ensayo en un terreno que posee un gradiente
de pendiente de oriente a occidente y adems, diferencias en la
disponibilidad de Nitrgeno de norte a sur, para controlar los efectos de la
pendiente y la disponibilidad de Nitrgeno, utiliz un diseo de cuadrado
latino, las variedades son: A, B, C y D, los datos corresponden a la
produccin en kg/parcela.
Pendiente
Disponibili
dad de
nitrgeno
D 785
730
700
595
A 855
775
760
710
3
C 950 D
ESTADSTICA APLICADA
4
B 945 C
885
780
950
795
15
880
835
Total Tk
353
5
334
0
313
5
292
0
Total
Tj
281
0
310
0
341
0
361
0
129
30
tj2
tk2
789610
0
961000
0
116281
00
130321
00
42166
300
42006
450
Grados
de
liberta
variacion
d
Tratamient
os
Nitrogeno
Suma de
Promedio
F
Cuadrados(SC)
Cuadrado (MS)
SC Tratam .
= 18
n1
SC Tratamientos =
5556.25
SC
Filas
MS Tratam .
=
MS Error
52.0833
SC Filas
= 4934.
n1
= 92518.75
98.777
263.163
3
Pendiente
Error
SC Columnas
=
n1
SC Columnas =
52556.25
2803
112.5
SC Error
= 1
(n2)(n1)
150743.75
SS Total
= 10049
2
n 1
149.49
8.75
Total
15
.5833
Conclusiones:
A partir de la cual se rechaza la hiptesis nula y se concluye que existen por lo
menos dos variedades de aguacate con diferentes niveles de produccin, para
evaluar entre quienes est.
y ij(hp)=+ i+ j + h + p+ ij(hp)
{[ ]
i=1,2 , k
j=1,2 , k
h=1,2 , k
p=1,2 , k
Donde:
ESTADSTICA APLICADA
16
i=0
j =0
j
h=0
p=0
p
La notacin yij (hp) indica que los niveles i y j determinan los niveles h y p para
un cuadrado greco-latino especificado. Es decir, los subndices h y p toman
valores que dependen de la celdilla (i,j).
Se utiliza la siguiente notacin:
N=k2 es el nmero total de observaciones.
El total y el promedio de todas las observaciones
y . = y ij(hp ) y .=
i
y .
K2
y i = y ij(..)
y i =
j =1
yi
K
y . j ..= y ij(..)
y . j ..=
i=1
y . j ..
K
y .. h .= yij (h .)
y .. h .=
i. j
y .. h .
K
y p = y ij(. p)
i. j
ESTADSTICA APLICADA
17
y p =
yp
K
y .. h .
y p
y ij ( .. )
^=
K2
= y ,
^ i =
1
y
K j=1 ij(..)
^ j
=
y i y
1
y
K i=1 ij(..)
y . j .. y
^ h =
1
y ij(h .)
K
i, j
y .. h . y
^ p =
1
y ij(. p)
K
i, j
y ... p y
^ 2 =
2
1
y ij... ^ ^ i ^ j^ h ^ p ]
[
N i, j
A. Residuos
Los residuos en este modelo adoptan la expresin
(k 1)(k3) . En efecto
K 2 (k + 3(k 1))=(k 1)( k3)
Se verifican las mismas propiedades para los estimadores mximosverosmiles que en los modelos anteriores. En este modelo la expresin de
la varianza residual tiene la siguiente forma
ESTADSTICA APLICADA
18
2
S^ R
[ y ij(hp)^y ij (hp) ]
i=1 j=1
e 2ij (hp)
=
( k1)(k 3)
i=1 j =1
(k 1)(k 3)
B. Descomposicin de la variabilidad
Siguiendo el mismo procedimiento que en los modelos anteriores se
comprueba que la ecuacin bsica del anlisis de la varianza es
y
y
y
2
( .. h. y ) +
2
( . j.. y ) + K
2
h=1
k
( i y ) + K
j=1
( y ij ( hp) y )2=K
i=1 j=1
i=1
y
y
k
( ij ( hp ) y i y . j .. y .. h . y p +3 y )2
j=1
2
( p y ) +
i=1
K
p=1
SCT
S^ 2T ,
S^ 2F ,
ESTADSTICA APLICADA
19
S^ 2C ,
S^ 2L ,
S^ 2G , Y
S^ 2R
S
2
( F )
E(CMF) = E
^
S
(2C )
E(CMC) = E
^
S
(2L )
E(CML) = E
^
S
(2G )
E(CMG) = E
^
k 2i
2+
i=1
K 1
K
2+
k 2j
j=1
K 1
K
2+
k 2h
h=1
K 1
K
2+
S
2
( R )
E(CMR) = E
=
^
k 2p
p=1
K1
H 0 : i=0 , i
H 0 : h=0 , h
H 0 : i=0 , j
H 0 : i=0 , p
SCF/ 2
S^ 2F
K1
F =
=
SCR/ 2
S^ 2R
( K1)(K 3)
SCL/ 2
^S2L
K1
F =
=
SCR / 2
S^ 2R
( K 1)(K 3)
SCG/
S^ 2G
K1
F =
=
^S2
SCR / 2
R
( K 1)(K 3)
SCC /
^S2C
K 1
F=
=
^S2
SCR/ 2
R
(K 1)( K 3)
Bajo las hiptesis nulas cada uno de los estadsticos de contraste sigue una
distribucin F de Snedecor con
k 1 y ( k1)(k 3)
20
K1 y (k 1)(k3)
con
grados
de
libertad
al
nivel
Fuentes
de
variacin
Suma de cuadrados
Grados
de
libertad
Cuadrados
medios
Fexp
E. fila
y
2
( i y . )
K-1
S^ 2F
S^ 2F / S^ 2R
K-1
S^ 2C
S^ 2C / S^ 2R
K-1
S^ 2L
S^ 2L / S^ 2R
K-1
2
S^ G
2
2
S^ G / ^S R
K
i=1
.
j
..
y . )2
(
E.
columna
K
j=1
..
h
. y . )2
(
E. l. l.
K
h=1
p
y . )2
(
E. l. g.
K
p=1
Residual
TOTAL
K 1
( y ij ( hp) y )
2
S^ R
2
S^ T
i=1 j=1
y 2 .
SCT = y 2
K
i=1 j=1
k
ESTADSTICA APLICADA
21
2
ij
de
y
1
SCC = y 2. j .. .2
K j=1
K
2
k
y
1
SCF = y 2i ... 2.
K i=1
K
k
y 2.
1
2
SCL= y .. h . 2
K h=1
K
2
k
y .
1
2
SCG= y ... p 2
K p=1
K
FUENTES
DE
VARIACI
N
SUMA DE CUADRADOS
E.fila
y
1
y 2i ... .2
K i
K
E.columna
k
y .
1
2
y . j .. 2
K j
K
E. l. l.
y
1
y 2.. h . 2.
K h
K
E. l. g.
y .
1
2
y ... p 2
K p
K
CUADRA
DOS
MEDIOS
Fexp
K-1
S^ 2F
S^ 2F / S^ 2R
K-1
S^ 2C
S^ 2C / S^ 2R
K-1
2
S^ L
2
2
S^ L / S^ R
K-1
2
S^ G
2
2
S^ G / ^S R
Residual
GRADO
S DE
LIBERT
AD
SCT SCFSCSCLSCG
ESTADSTICA APLICADA
22
(K-1)(K3)
S^ 2R
TOTAL
2
ij (hp)
y
2.
K
S^ 2T
K 1
Coeficiente de determinacin
A continuacin se define el coeficiente de determinacin como
2
R=
Donde
R2 , R2 , R2 y R2
EJEMPLO N1
En la obtencin de un determinado producto qumico se est interesado en
comparar 4 procedimientos. Se supone que en dicha obtencin tambin puede
influir la temperatura, presin y tipo de catalizador empleado, decidindose
realizar un experimento en cuadrado greco-latino. Para ello, se consideran 4
niveles de cada uno de estos factores. La tabla adjunta muestra el cuadrado
greco-latino que resulta elegido y las cantidades de producto obtenidas. En dicha
tabla:
1.
2.
3.
4.
Las
Las
Las
Las
2
Y
147
SCT = Y ij(.) 2 =1503
=152.4375
2
K
147
i=1 j=1
2
ESTADSTICA APLICADA
23
Y 2 5491 1472
SCF= Y 2 =
2 =22.1875
4
K
4
i=1
k
2
i ..
k
Y 5549 1472
1
2
SCC = Y . j . 2 =
2 =36.6875
K i=1
4
K
4
SCL= Y 2..h
i =1
Y 2 5531 1472
=
2 =32.1875
4
K2
4
EJEMPLO N2
Se compara el rendimiento de tres procesos de fabricacin (A, B, C) en
tres condiciones experimentales ( , , ) tres das distintos con tres
procedimientos de medicin. El diseo y los resultados obtenidos se
indican en el cuadro. El nmero entre parntesis en cada casilla es la
media de las dos replicaciones.
ESTADSTICA APLICADA
24
El modelo matemtico:
Y ijkj =+ i+ i + y k + h +e ijkh
^=Y .=10
^ i=Y^ i Y =(1.33,1.33)
^ j=Y^ . j ..Y =(1,0.67,0 .33)
Y^ k =Y^ k . Y =(.067,0.67,0)
^ h=Y^ h Y =(0.33,0 .33,0.66)
La suma de cuadrados:
2
SCE= ( Y ijkh + Y i Y . j ..Y .. k. Y h +3 Y . ) =2 I 2 4 I + 3 ^ 2
ijkh
En nuestro ejemplo
I =3 , l tabla ANOVA es
ESTADSTICA APLICADA
25
La regin de
rechazo
por lo tanto el nico efecto significativo es el del mtodo.
es RR=
EJEMPLO N3
Interesa saber si existe diferencia significativa entre las millas recorridas
por galn, entre las gasolinas A, B, C y D.
Se consideraron los siguientes factores de bloqueo:
Fila: Tipo de Vehculo
Columna: Conductor
Letra Griega: Tipo de carretera
Con un arreglo en forma de cuadrado greco latino, el nmero de millas por
galn result ser:
Totales de
Totales de letra
26
CS Fila=16.50
CS Columna=6.50
CSF=111.50
CS LetraGriega=7.50
FUENTE
G.
L.
GASOLINAS
111.5
37.17
VEHCULOS
CONDUCTO
RES
16.5
5.5
7.5
2.17
AMINOS
ERROR
TOTAL
3
3
15
6
148
2.5
2
F
18.
6
2.7
5
1.0
8
1.2
5
L. S . D .=t
2
; ( k1 ) ,(k 3 )
2 ( 6.00 )
2C . M . E
3.18
=5.51
K
4
ESTADSTICA APLICADA
27
L. S . D es |X B X C|=7.25>5.51
de
medias
que
supera
este
ESTADSTICA APLICADA
28