You are on page 1of 692

DISEO Y

ANLISIS DE
EXPERIMENTOS

ERRNVPHGLFRVRUJ

DISEO Y
ANLISIS DE
EXPERIMENTOS
segunda edicin

ERRNVPHGLFRVRUJ
Douglas C. Montgomery
UNIVERSIDAD ESTATAL DE ARIZONA

0LIMUSAWILEY'

e r s i n a u t o r iz a d a e n e s p a o l d e l a o b r a p u b l ic a d a

EN INGLS CON EL TTULOI

DESIGN AND ANALYSIS OF EXPERIMENTS


John W iley & Sons, Inc., New York, Chichester,
B h is b a n e , S in q a p o r e , T o h o n t o a n d W e in h e im .
C

o l a b o r a d o r e n l a t r a d u c c i n :

RODOLFO PINA GARCA


R

e v is i n :

GRISELDAZETINAVLEZ
I n g e n ie r a q u Im ic a p o r l a

F a c u l t a d d e Q u m ic a d e l a

U n i v e r s id a d N a c i o n a l A u t n o m a d e M x ic o . D o c e n t e
EN m a te m tic a s . PROFESORA EN LA EsCUELA DE ClENCIAS
Q u m ic a s d e l a U n iv e r s id a d

La p r e s e n t a c i n

La S a l l e

y d is p o s ic i n e n c o n j u n t o de

DISEQ Y ANLISIS DE EXPERIMENTOS


s o n p ro p ie d a d d e l e d it o r . N in g u n a p a r te de e s t o b r a puede
SER r e p r o d u c id a o TRANSMITIDA, MEDIANTE NINGN SISTEM A O
M T O D O , ELECTRNICO O M ECNICO (INCLUYENDO EL POTOCOPIADO, LA GRABACIN O CUALQUIER SISTEMA DE RECUPERACIN
Y ALM ACENAMIENTO DE INFORM ACIN), SIN CONSENTIMIENTO POR
ESCRITO DEL EDITOR.

D er ec h o s

reservados;

2004, EDITORIAL LIMUSA, S.A. d e C.V.


GRUPO NORIEGA EDITORES
B a l d e r a s 9 5 , M x ic o , D .F .

C.R 06040
m 8503 8050
01(800) 706 9100
M 5512 2903
w
limusanorlega.com.mx
' T ' www.noriega.com.mx

CANIEM Nm. 121


H e c h o e n M x ic o

ISBN 968-18-6156-6
3.2

Prefacio

El presente libro es un texto de introduccin que aborda el diseo y anlisis de experimentos. Tiene como
base los cursos sobre diseo de experimentos que he impartido durante ms de 25 aos en la Universidad
Estatal de Arizona, la Universidad de Washington y el Instituto de Tfccnologa de Georgia. Refleja asimis
mo los mtodos que he encontrado tiles en mi propia prctica profesional como consultor en ingeniera
y estadstica en las reas generales de diseo de productos y procesos, mejoramiento de procesos e inge
niera de control de cahdad.
El libro est destinado a estudiantes que han llevado un primer curso de mtodos estadsticos. Este
curso previo debe incluir por lo menos algunas de las tcnicas de estadstica descriptiva, la distribucin
normal y una introduccin a los conceptos bsicos de los intervalos de confianza y la prueba de hiptesis
para medias y varianzas. Los captulos 10 y 11 requieren un manejo elemental de lgebra matricial.
Como los requisitos para llevar este curso son relativamente modestos, este libro puede usarse tam
bin en un segundo curso de estadstica enfocado en el diseo estadstico de experimentos para estudian
tes de Ucenciatura de ingeniera, fsica, ciencias fsicas y qumicas, matemticas y otros campos de las
ciencias. Durante varios aos he impartido un curso basado en este libro en el primer ao de estudios de
posgrado de ingeniera. Los estudiantes de este curso provienen de los campos tradicionales de ingenie
ra, fsica, qumica, matemticas, investigacin de operaciones y estadstica. Tkmbin he usado este libro
como base de un curso breve para el sector industrial sobre diseo de experimentos para tcnicos en ejer
cicio con una ampha diversidad en su formacin profesional. Se incluyen numerosos ejemplos que ilustran
todas las tcnicas de diseo y anlisis. Estos ejemplos se basan en aplicaciones del diseo experimental
en el mundo real, y se han tomado de diferentes campos de la ingeniera y las ciencias. Esto lleva al terreno
de las aplicaciones a un curso acadmico para ingenieros y cientficos y hace de este libro una litil herra
mienta de referencia para experimentadores de una amplia gama de disciplinas.

ACERCA DEL LIBRO


La presente edicin constituye una revisin sustancial del libro. H e procurado mantener el equilibrio en
tre los tpicos de diseo y anlisis; sin embargo, hay varios temas y ejemplos nuevos; asimismo he reorga
nizado gran parte del material. En la presente edicin se resalta ms el uso de la computadora. Durante
los ltimos aos han surgido varios productos de software excelentes que auxilian al experimentador en
las fases del diseo y el anlisis para esta materia. He incluido las salidas de dos de estos productos, MiniXs!oy Design-Expert, en varias partes del texto. Minitab es un paquete de software de estadstica de carc
ter general ampliamente disponible, que cuenta con tiles herramientas de anUsis de datos y que maneja
bastante bien el anlisis de experimentos tanto con factores fijos como aleatorios (incluyendo el modelo
mixto). Design-Expert es un paquete que se enfoca exclusivamente en el diseo experimental. Tiene mu
chas herramientas para la construccin y evaluacin de diseos, as como mltiples caractersticas de an
lisis. En el sitio web de este libro puede obtenerse una versin para estudiantes de Design-Expert, y se hace
una amplia recomendacin para usarlo. Exhorto a todos los profesores que usen este libro para que incor
poren software de computadora en sus cursos. En mi caso particular, llevo a todas mis clases una compu

vi

PREFACIO

tadora laptop y un monitor, y todos los diseos o tpicos del anlisis tratados en clase se ilustran con la
computadora.
En esta edicin destaco an ms la conexin entre el experimento y el modelo que puede desarrollar
el experimentador a partir de los resultados del experimento. Los ingenieros (y en gran medida los cient
ficos de la fsica y la qumica) aprenden los mecanismos fsicos y sus modelos mecanicistas fundamentales
al principio de su formacin acadmica, pero en la mayor parte de sus carreras profesionales tendrn que
trabajar con estos modelos. Los experimentos diseados estadsticamente ofrecen al ingeniero una base
vlida para desarrollar un modelo emprico del sistema bajo estudio. Despus este modelo emprico pue
de manipularse (tal vez utilizando una superficie de respuesta o una grfica de contorno, o quiz matem
ticamente) como cualquier otro modelo de ingeniera. A lo largo de muchos aos de docencia he
descubierto que este enfoque es muy eficaz para despertar el entusiasmo por los experimentos diseados
estadsticamente en la comunidad de ingeniera. En consecuencia, al inicio del libro planteo la nocin de
un modelo emprico fundamental para el experimento y las superficies de respuesta y destaco la impor
tancia del mismo.
Tambin me he esforzado por presentar mucho ms rpido los puntos crticos en los que intervienen
los diseos factoriales. Para faciUtar este objetivo, condens en un solo captulo (el 3) el material intro
ductorio sobre los experimentos completamente aleatorizados con un solo factor y el anlisis de varianza.
H e amphado el material sobre los diseos factoriales y factoriales fraccionados (captulos 5 al 9) en un es
fuerzo por hacer que el material fluya con mayor eficiencia en la perspectiva tanto del lector como del
profesor y por hacer mayor hincapi en el modelo emprico. El captulo sobre las superficies de respuesta
(el 11) sigue inmediatamente al material sobre diseos factoriales y factoriales fraccionados y modelado
de regresiones. He ampHado este captulo, agregando nuevo material sobre diseos ptimos alfabticos,
experimentos con mezclas y el problema de un diseo paramtrico robusto. En los captulos 12 y 13 se
analizan experimentos que incluyen efectos aleatorios, as como algunas aplicaciones de estos conceptos
en diseos anidados y parcelas subdivididas. El captulo 14 es una descripcin general de temas importan
tes de diseo y anlisis: la respuesta no normal, el mtodo de Box-Cox para seleccionar la forma de una
transformacin, y otras alternativas; experimentos factoriales no balanceados; el anlisis de covarianza,
incluyendo covariables en un diseo factorial y mediciones repetidas.
A lo largo del libro he destacado la importancia del diseo experimental como una herramienta que
el ingeniero en ejercicio puede usar en el diseo y desarrollo de productos, as como en el desarrollo y me
joramiento de procesos. Se ilustra el uso del diseo experimental en el desarrollo de productos que sean
robustos a factores ambientales y a otras fuentes de variabilidad. Considero que el uso del diseo experi
mental en las fases inicales del ciclo de un producto puede reducir sustancialmente el tiempo y el costo de
conducirlo, redundando en procesos y productos con un mejor desempeo en campo y una mayor confiabilidad que los que se desarrollan utilizando otros enfoques.
El libro contiene ms material del que puede cubrirse sin prisas en un solo curso, por lo que espero
que los profesores puedan variar el contenido de cada curso o bien estudiar ms a fondo algunos temas,
dependiendo de los intereses de la clase. A l final de cada captulo hay un grupo de problemas (excepto en
el 1). El alcance de estos problemas vara desde ejercicios de clculo, destinados a consolidar los funda
mentos, hasta la ampliacin de principios bsicos.
Mi curso en la universidad lo enfoco principalmente en los diseos factoriales y factoriales fracciona
dos. En consecuencia, por lo general cubro el captulo 1, el captulo 2 (muy rpido), la mayor parte del ca
ptulo 3, el captulo 4 (sin incluir el material sobre bloques incompletos y mencionando slo brevemente
los cuadrados latinos), y trato en detalle los captulos 5 al 8 sobre diseos factoriales con dos niveles y di
seos factoriales fraccionados. Para concluir el curso, introduzco la metodologa de superficies de res
puesta (captulo 11) y hago un repaso general de los modelos con efectos aleatorios (captulo 12) y los
diseos anidados y en parcelas subdivididas (captulo 13). Siempre pido a los estudiantes que realicen un

PREFACIO

Vil

proyecto semestral que consiste en disear, conducir y presentar los resultados de un experimento dise
ado estadsticamente. Les pido que trabajen en equipos, pues es la manera en que se realiza la mayor
parte de la experimentacin industrial. Deben hacer la presentacin de los resultados de su proyecto de
manera oral y por escrito.

MATERIAL SUPLEMENTARIO DEL TEXTO


Con esta edicin he preparado un suplemento para cada captulo del libro. En este material suplementa
rio se desarrollan temas que no pudieron tratarse con mayor detalle en el libro. Tambin presento algunos
temas que no aparecen expresamente en el libro, pero que para algunos estudiantes y profesionistas en
ejercicio podra resultar de utilidad una introduccin de los mismos. El nivel matemtico de parte de este
material es ms elevado que el del texto. Estoy consciente de que los profesores usan este libro con una
amplia variedad de audiencias, y es posible que algunos cursos de diseo ms avanzados puedan benefi
ciarse al incluir varios de los temas del material suplementario del texto. Este material est en formato
electrnico en el CD/ROM del profesor (disponible slo en ingls) y se encuentra en el sitio web de este
libro.

SITIO W EB
En el sitio web http:Hwww.wiley.comllegacylcollegelenginlmontgomeiy316490lstudentlstudent.html est
disponible el material de apoyo para profesores y estudiantes. Este sitio se usar para comunicar informa
cin acerca de innovaciones y recomendaciones para el uso eficaz de este texto. El material suplementa
rio del texto puede encontrarse en este sitio, junto con versiones electrnicas de las series de datos
utilizadas en los ejemplos y los problemas de tarea, un plan de estudios del curso y proyectos semestrales
del curso en la Universidad Estatal de Atizona.

RECONOCIM IENTOS
Expreso mi agradecimiento a los muchos estudiantes, profesores y colegas que han usado antes este libro
y quienes me han hecho llegar tiles sugerencias para esta revisin. Las contribuciones de los doctores
Raymond H. Myers, G. Geoffrey Vining, Dennis Lin, John Ramberg, Joseph Pignatiello, Lloyd S. Nelson,
Andre Khuri, Peter Nelson, John A. Cornell, George C. Runger, Bert Keats, Dwayne Rollier, Norma Hubele, Cynthia Lowry, Russell G. Heikes, Harrison M. Wadsworth, William W. Hies, Arvind Shah, Jane
Ammons, Diane Schaub, Pat Spagon y WiUiam DuMouche, y los seores Mark Anderson y Pat Whitcomb
fueron particularmente invaluables. Mi Jefe de Departamento, el doctor Gary Hogg, ha proporcionado
un ambiente intelectualmente estimulante en el cual trabajar.
Las contribuciones de los profesionistas en activo con quienes he trabajado han sido invaluables. Es
imposible mencionarlos a todos, pero algunos de los principales son Dan McCarville y Lisa Custer de Mo
torola; Richard Post de Intel; Tbm Bingham, Dick Vaughn, Juhn Anderson, Richard Alkire y Chase
Neilson de Boeing Company; Mike Goza, Don Walton, Karen Madison, Jeff Stevens y Bob Kohm de
Alcoa; Jay Gardiner, John Butora, Dana Lesher, Lolly Marwah, Paul Tbbias y Len Masn de IBM; Ehzabeth A. Peck de The Coca-Cola Company; Sadri Khalessi y Franz Wagner de Signetics; Robert V. Baxley de Monsanto Chemicals; Harry Peterson-Nedry y Russell Boyles de Precisin Castparts Corporation;
Bill New y Randy Schmid de Alhed-Signal Aerospace; John M. Fluke, hijo, de John Fluke Manufacturing

v ii i

PREFACIO

Company; Lariy Newton y Kip Howlett de Georgia-Pacific, y Ernesto Ramos de BBN Software Products
Corporation.
Me encuentro en deuda con el profesor E.S. Pearson y con Biometrika, John Wiley & Sons, Prentice-Hall, The American Statistical Association, The Institute of Mathematical Statistics y los editores de
Biometrics por el permiso para usar material protegido por derechos de autor. Lisa Custer realiz un ex
celente trabajo de presentacin de las soluciones que aparecen en el CD/ROM del profesor, y la doctora
Cheryl Jennings realiz una correccin de estilo eficaz y de suma utilidad. Estoy agradecido con la Office
of Naval Research, la National Science Foundation, las compaas integrantes de NSF/Industry/University Cooperative Research Center in Quality and Reliability Engineering de la Universidad Estatal de
Arizona, e IBM Corporation por apoyar gran parte de mis investigaciones de estadstica y diseo experi
mental de ingeniera.
Douglas C. Montgomery
Tempe, Arizona

Contenido

Captulo 1.
M
1-2

1-3
1-4
1-5
1-6

Captulo 2.
2-1

2-2
2-3
2-4

2-5

2-6

2-7

Captulo 3.
3-1
3-2
3-3

Introduccin
Estrategia de experimentacin
Algunas aplicaciones tpicas del diseo experimental
Principios bsicos
Pautas generales para disear experimentos
Breve historia del diseo estadstico
Resumen: uso de tcnicas estadsticas en la ejq)erimentacin

8
11

13
17
19

Experimentos comparativos simples

21

Introduccin
Conceptos estadsticos bsicos
Muestreo y distribuciones de muestreo
Inferencias acerca de las diferencias en las medias, diseos aleatorizados
2-4.1 Prueba de hiptesis
2-4.2 Eleccin del tamao de la muestra
2-4.3 Intervalos de confianza
2-4,4 Caso en que a al
2-4.5 Caso en que se conocen af y a\
2-4.6 Comparacin de una sola media con un valor especificado
2-4.7 Resumen
Inferencias acerca de las diferencias en las medias, diseos de comparaciones pareadas
2-5.1 El problema de las comparaciones pareadas
2-5.2 Ventajas del diseo de comparaciones pareadas
Inferencias acerca de las varianzas de distribuciones normales
Problemas

21

22
26
33
33
40
42
44
44
45
46
47
47
50
51
54

Experimentos con un solo faetn el anlisis de varianza

60

Un ejemplo
El anlisis de varianza
Anlisis del modelo con efectos fijos
3-3.1 Descomposicin de la suma de cuadrados total
3-3.2 Anlisis estadstico
3-3.3 Estimicin de los parmetros del modelo
3-3.4 Datos no balanceados

60
63
65
66
69
74
75
ix

CONTENIDO

3-4

3-5

Verificacin de la adecuacin del modelo

76

3-4.1

El supuesto de normalidad

77

3-4.2

Grfica de los residuales en secuencia en el tiempo

79

3-4.3

Grfica de los residuales contra los valores ajustados

80

3-4.4

Grficas de los residuales contra otras variables

86

Interpretacin prctica de los resultados

86

3-5.1
3-5.2

U n modelo de regresin
Comparaciones entre las medias de los tratamientos

87
88

3-5.3

Comparaciones grficas de medias

89

3-5.4

Contrastes

90

3-5.5
3-5.6

Contrastes ortogonales
Mtodo de Scheff para comparar todos los contrastes

93
95

3-5.7

Comparacin de pares de medias de tratamientos

3-5.8

Comparacin de medias de tratamientos con un control

3-6

Muestra de salida de computadora

3-7

Determinacin del tamao de la muestra

96
103
104
107

3-7.1

Curvas de operacin caracterstica

107

3-7.2

Especificacin de un incremento de la desviacin estndar

109

3-7.3

Mtodo para estimar el intervalo de confianza

110

3-8

Identificacin de efectos de dispersin

110

3-9

El enfoque de regresin para el anlisis de varianza


3-9.1 Estimacin de mnimos cuadrados de los parmetros del modelo

112
112

3-9.2
3-10

3-11

Captulo 4.
4-1

4-2

Prueba general de significacin de la regresin

Mtodos no paramtricos en el anlisis de varianza

114
116

3-10.1

La prueba de Kruskal-WaUis

116

3-10,2

Comentarios generales sobre la transformacin de rangos

118

Problemas

119

Bloques aleatorizados, cuadrados latinos y diseos relacionados

126

Diseo de bloques completos aleatorizados


4-1,1 Anlisis estadstico del diseo de bloques completos aleatorizados

126
127

4-1,2

Verificacin de la adecuacin del modelo

135

4-1.3

Otros aspectos del diseo de bloques completos aleatorizados

136

4-1.4

Estimacin de los parmetros del modelo y la prueba general de


significacin de la regresin

Diseo de cuadrado latino

141
144

4-3

Diseo de cuadrado grecolatino

151

4-4

Diseos de bloques incompletos balanceados


4-4.1 Anlisis estadstico del diseo de bloques incompletos balanceados

154
155

4-5

4-4.2

Estimacin de mnimos cuadrados de los parmetros

4-4.3

Recuperacin de informacin interbloques en el diseo de bloques


incompletos balanceados

Problemas

159
161
1^4

CONTENIDO

Captulo 5.
5-1
5-2
5-3

5-4
5-5
5-6
5-7

Captulo 6.
6-1
6-2
6-3
6-4
6-5
6-6
6-7

Captulo 7.
7-1
7-2
7-3
7-4
7-5
7-6
7-7
7-8

Captulo 8.
8-1
8-2
8-3
8-4
8-5
8-6
8-7
8-8

xi

Introduccin a los diseos factoriales

170

Definiciones y principios bsicos


La ventaja de los diseos factoriales
Diseo factorial de dos factores
5-3.1 Un ejemplo
5-3.2 Anlisis estadstico del modelo con efectos fijos
5-3.3 Verificacin de la adecuacin del modelo
5-3.4 Estimacin de los parmetros del modelo
5-3.5 Eleccin del tamao de la muestra
5-3.6 El supuesto de no interaccin en un modelo de dos factores
5-3.7 Una observacin por celda
Diseo factorial general
Ajuste de curvas y superficies de respuesta
Formacin de bloques en un diseo factorial
Problemas

170
174
175
175
177
185
185
189
190
191
194
201
207
211

Diseo factorial 2*

218

Introduccin
El diseo 2^
El diseo 2^
El diseo general 2*
Una sola rplica del diseo 2*
Adicin de puntos centrales en el diseo 2*
Problemas

218
219
228
242
244
271
276

Formacin de bloques y confusin en el diseo factorial 2*

287

Introduccin
Formacin de bloques de un diseo factorial 2* con rplicas
Confusin del diseo factorial 2^
Confusin del diseo factorial 2* en dos bloques
Confusin del diseo factorial 2* en cuatro bloques
Confusin del diseo factorial 2* en 2^ bloques
Confusin parcial
Problemas

287
287
288
289
296
297
299
301

Diseos factoriales firaccionados de dos niveles

303

Introduccin
La fraccin un medio del diseo 2*
La fraccin un cuarto del diseo 2*
El diseo factorial fraccionado 2/~^general
Diseos de resolucin III
Diseos de resolucin IV y V
Resumen
Problemas

303
304
317
326
337
347
349
350

x ii

CONTENIDO

Captulo 9.
9-1

9-2

9-3

9-4

9-5

Captulo 10.
10-1
10-2
10-3
10-4

10-5

10-6
10-7

10-8
10-9

Captulo 11.
11-1
11-2
11-3

Diseos factoriales y factoriales fraccionados con tres niveles y con niveles mixtos

363

Diseo factorial 3*
9-1.1 Notacin y motivacin del diseo 3*
9-1.2 El diseo 3^
9-1.3 El diseo 3
9-1.4 El diseo general 3^
Confusin en el diseo factorial 3*^
9-2.1 El diseo factorial 3* en tres bloques
9-2.2 El diseo factorial 3* en nueve bloques
9-2.3 El diseo factorial 3* en 3^ bloques
Rplicas fraccionadas del diseo factorial 3*
9-3.1 La fraccin un tercio del diseo factorial 3*^
9-3.2 Otros diseos factoriales fraccionados S'"'"
Diseos factoriales con niveles mixtos
9-4.1 Factores con dos y tres niveles
9-4.2 Factores con dos y cuatro niveles
Problemas

363
363
365
367
372
373
373
377
378
379
379
382
383
384
385
387

i\juste de modelos de regresin

392

Introduccin
Modelos de regresin lineal
Estimacin de los parmetros en modelos de regresin lineal
Prueba de hiptesis en la regresin mltiple
10-4.1 Prueba de significacin de la regresin
10-4,2 Pruebas de los coeficientes de regresin individuales y de grupos de coeficientes
Intervalos de confian2a en regresiones mltiples
10-5.1 Intervalos de confianza para los coeficientes de regresin individuales
10-5.2 Intervalo de confianza para la respuesta media
Prediccin de nuevas observaciones de la respuesta
Diagnsticos del modelo de regresin
10-7.1 Residuales escalados y PRESS
10-7.2 Diagnsticos de infiuenda
Prueba de falta de ajuste
Problemas

392
393
394
409
409
412
415
415
416
416
416
417
420
421
422

Mtodos de superficies de respuesta y otros enfoques para la optimizacin de


procesos

427

Introduccin a la metodologa de superficies de respuesta


Mtodo del ascenso ms pronunciado
Anlisis de una superficie de respuesta de segundo orden
11-3.1 Localizacin del punto estacionario
11-3.2 Caracterizacin de la superficie de respuesta
11-3.3 Sistemas de cordilleras

427
430
436
436
440
447

CONTENIDO

n -4

11-5
11-6

11-7

11-8

Captulo 12.
12-1

12-2

12-3
12-4
12-5
12-6
12-7

12-8

Captulo 13.
13-1

13-2
13-3
13-4
13-5

13-6

Captulo 14.
14-1

x ii i

11-3.4 Respuestas mltiples


Diseos experimentales para ajustar superficies de respuesta
11-4.1 Diseos para ajustar el modelo de primer orden
11-4.2 Diseos para ajustar el modelo de segundo orden
11-4.3 Formacin de bloques en los diseos de superficie de respuesta
11-4.4 Diseos (ptimos) generados por computadora
Experimentos con mezclas
Operacin evolutiva
Diseo robusto
11-7.1 Antecedentes
11-7.2 El enfoque de la superficie de respuesta para el diseo robusto
Problemas

448
455
455
456
462
466
472
484
488
488
492
500

Experimentos con factores aleatorios

511

Modelo con efectos aleatorios


Diseo factorial de dos factores aleatorios
Modelo mixto con dos factores
Determinacin del tamao de la muestra con efectos aleatorios
Reglas para los cuadrados medios esperados
Pruebas F aproximadas
Algunos temas adicionales sobre la estimacin de los componentes de la
varianza
12-7.1 Intervalos de confianza aproximados para los componentes de la varianza
12-7.2 Mtodo de grandes muestras modificado
12-7.3 Estimacin de mxima verosimilitud de componentes de la varianza
Problemas

511
517
522
529
531
535
543
543
545
547
552

Diseos anidados y en parcelas subdivididas

557

Diseo anidado de dos etapas


13-1.1 Anlisis estadstico
13-1.2 Verificacin del diagnstico
13-1.3 Componentes de la varianza
13-1.4 Diseos anidados por etapas
Diseo anidado general de m etapas
Diseos con factores anidados y factoriales
Diseo de parcelas subdivididas
Otras variantes del diseo de parcelas subdivididas
13-5.1 Diseo de parcelas subdivididas con ms de dos factores
13-5.2 Diseo de parcelas con doble subdivisin
13-5.3 Diseo de parcelas subdivididas en franjas
Problemas

557
558
563
565
566
566
569
573
578
578
580
583
584

Otros tpicos de diseo y anlisis

590

Respuestas y transformaciones no normales

590

x iv

CONTENIDO

14-1.1 Seleccin de una transformacin: el mtodo de Box-Cox


14-1.2 Modelo lineal generalizado
14-2 Datos no balanceados en un diseo factorial
14-2.1 Datos proporcionales: un caso sencillo
14-2.2 Mtodos aproximados
14-2.3 Mtodo exacto
14-3 Anlisis de covarianza
14-3.1 Descripcin del procedimiento
14-3.2 Solucin por computadora
14-3.3 Desarrollo mediante la prueba general de significacin de la regresin
14-3.4 Experimentos factoriales con covariables
14-4 Mediciones repetidas
14-5 Problemas

590
594
600
600
601
604
604
605
614
616
619
624
627

630

Bibliografia

637

Apndice
Ibbla I.
l^bla II.

Puntos porcentuales de la distribucin t

638
640

T^bla III.

Puntos porcentuales de la distribucin

641

l^bla IV.

Puntos porcentuales de la distribucin/'

642

liblaV.
-RiblaVI.

Curvas de operacin caracterstica para el anlisis de varianza del modelo con efectos fijos
Curvas de operacin caracterstica para el anlisis de varianza del modelo con efectos
aleatorios
Rangos significativos para la prueba del rango mltiple de Duncan
Puntos porcentuales del estadstico del rango studentizado
Valores crticos para la prueba de Dunnett para comparar tratamientos con un control

647

KiblaVn.
IbblaVIII.
Ihbla IX.
Dabla X.
I^bla XI.
Habla Xn.
Ib b la X n i.

ndice

Distribucin normal estndar acumulada

Coeficientes de polinomios ortogonales


Nmeros aleatorios
Relaciones de alias para diseos factoriales fraccionados 2*"'' con fc < 15 y n 64
Glosario para el uso de Design Expert

651
655
656
658
661
662
663
680
681

Introduccin

1-1

ESTRATEGIA DE EXPERIM ENTACIN

Investigadores de prcticamente todos los campos de estudio llevan a cabo experimentos, por lo general
para descubrir algo acerca de un proceso o sistema particular. En un sentido literal, un experimento es
una prueba. En una perspectiva ms formal, un experimento puede definirse como una prueba o serie de
pruebas en las que se hacen cambios deliberados en las variables de entrada de un proceso o sistema para
observar e identificar las razones de los cambios que pudieran observarse en la respuesta de salida.
Este libro trata de la planeacin y realizacin de experimentos y del anlisis de los datos resultantes a
fin de obtener conclusiones vlidas y objetivas. La atencin se centra en los experimentos de ingeniera y
las ciencias fsicas y qumicas. En ingeniera, la experimentacin desempea un papel importante en el di
seo de productos nuevos, el desarrollo de procesos de manufactura y el mejoramiento de procesos. El
objetivo en muchos casos sera desarrollar un proceso robusto, es decir, un proceso que sea afectado en
forma mnima por fuentes de variabilidad externas.
Como ejemplo de un experimento, suponga que un ingeniero metalrgico tiene inters en estudiar el
efecto de dos procesos diferentes de endurecimiento, el templado en aceite y el templado en agua salada,
sobre una aleacin de aluminio. El objetivo del experimentador es determinar cul de las dos soluciones
de templado produce la dureza mxima para esta aleacin particular. El ingeniero decide someter varios
ejemplares o muestras para ensayo de la aleacin a cada medio de templado y medir la dureza de los
ejemplares despus del templado. Para determinar cul de las soluciones es la mejor, se usar la dureza
promedio de los ejemplares tratados en cada solucin de templado.
A l examinar este sencillo experimento salen a relucir varias cuestiones importantes:
1.
2.
3.

4.

Estas dos soluciones son los nicos medios de templado de inters potencial?
Hay en este experimento otros factores que podran afectar la dureza y que deberan investigar
se o controlarse?
Cuntas muestras para ensayo de la aleacin debern probarse en cada solucin de templado?
Cmo debern asignarse las muestras para ensayo de prueba a las soluciones de templado y en
qu orden debern colectarse los datos?
1

CAPTULO 1 INTRODUCCIN

5.
6.

Qu mtodo de anlisis de datos deber usarse?


Qu diferencia en la dureza promedio observada entre los dos medios de templado se conside
rar importante?

Ibdas estas preguntas, y tal vez muchas ms, tendrn que responderse satisfactoriamente antes de llevar a
cabo el experimento.
En cualquier experimento, los resultados y las conclusiones que puedan sacarse dependen en gran
medida de la manera en que se recabaron los datos. Para ilustrar este punto, suponga que el ingeniero
metalrgico del experimento anterior utiliz ejemplares de una hornada para el templado en aceite y
ejemplares de una segunda hornada para el templado en agua salada. Entonces, cuando compare la dure
za promedio, el ingeniero no podr saber qu parte de la diferencia observada es resultado de la solucin
de templado y qu parte es el resultado de diferencias inherentes entre las hornadas.^ Por lo tanto, el m
todo utilizado para recabar los datos ha afectado de manera adversa las conclusiones que pueden sacarse
del experimento.
En general, los experimentos se usan para estudiar el desempeo de procesos y sistemas. El proceso o
sistema puede representarse con el modelo ilustrado en la figura 1-1. El proceso puede por lo general vi
sualizarse como una combinacin de mquinas, mtodos, personas u otros recursos que transforman cier
ta entrada (con frecuencia un material) en una salida que tiene una o ms respuestas observables.
Algunas variables del procesoXi,X2, ...,Xp son controlables, mientras que otras Zi, Z2, . . son no controla
bles (aunque pueden serlo para los fines de una prueba). Los objetivos del experimento podran com
prender los siguientes:

1. Determinar cules son las variables que tienen mayor influencia sobre la respuesta y.
2.
3.
4.

Determinar cul es el ajuste de lasjc que tiene mayor influencia para quey est casi siempre cerca
del valor nominal deseado.
Determinar cul es el ajuste de las x que tiene mayor influencia para que la variabilidad de y sea
reducida.
Determinar cul es el ajuste de las x que tiene mayor influencia para que los efectos de las varia
bles no controlables Zi, Z2,
z, sean mnimos.

Como se puede ver por el anlisis anterior, los experimentos incluyen muchas veces varios factores.
Habitualmente, uno de los objetivos de la persona que reaUza un experimento, llamada el experimenta*
dor, es determinar la influencia que tienen estos factores sobre la respuesta de saUda del sistema. Al enfo-

Factores controlables

*1

Entradas

Salida
Proceso

Factores no controlables

Figura 1-1 Modelo general de un proceso o sistema.

* Un especialista en diseo experimental dira que los efectos de los medios de templado y las hornadas se confundieron-, es decir, los
efectos de estos dos factores no pueden separarse.

M ESTRATEGIA DE EXPERIMENTACIN

que general para planear y llevar a cabo el experimento se le llama estrategia de experimentacin. Existen
varias estrategias que podra usar un experimentador. Se ilustrarn algunas de ellas con un ejemplo muy
sencillo.
Al autor le gusta mucho jugar golf. Desafortunadamente, no le agrada practicar, por lo que siempre
busca la manera ms sencilla para bajar su puntuacin. Algunos de los factores que l considera impor
tantes, o que podran influir en su puntuacin, son los siguientes:
1.
2.
3.

El tipo de palo usado (grande o normal).


El tipo de pelota usada (de goma de balata o de tres piezas).
Caminar cargando los palos de golf o hacer el recorrido en un carrito.
4. Beber agua o cerveza durante el juego.
5. Jugar en la maana o en la tarde.
6. Jugar cuando hace fro o cuando hace calor.
7. El tipo de spikes usados en los zapatos de golf (metlicos o de hule).
8. Jugar en un da con viento o en uno apacible.
Evidentemente, hay muchos otros factores que podran considerarse, pero supongamos que stos son los
de inters primario. Adems, teniendo en cuenta su larga experiencia en el juego, el autor decide que los
factores 5 al 8 pueden ignorarse; es decir, estos factores no son importantes porque sus efectos son tan pe
queos que carecen de valor prctico. Los ingenieros y los investigadores deben tomar a menudo este tipo
de decisiones acerca de algunos de los factores que examinan en experimentos reales.
Consideremos ahora cmo podran probarse experimentalmente los factores 1 al 4 para determinar
su efecto sobre la puntuacin del autor. Suponga que en el curso del experimento pueden jugarse un m
ximo de ocho rondas de golf. Un enfoque consistira en seleccionar una combinacin arbitraria de estos
factores, probarlos y ver qu ocurre. Por ejemplo, suponga que se selecciona la combinacin del palo
grande, la pelota de goma de balata, el carrito y el agua, y que la puntuacin resultante es 87. Sin embargo,
durante la ronda el autor not varios tiros descontrolados con el palo grande (en el golf, grande no siem
pre es sinnimo de bueno) y, en consecuencia, decide jugar otra ronda con el palo normal, manteniendo
los dems factores en los mismos niveles usados anteriormente. Este enfoque podra continuar de mane
ra casi indefinida, cambiando los niveles de uno (o quiz dos) de los factores para la prueba siguiente, con
base en el resultado de la prueba en curso. Esta estrategia de experimentacin, conocida como enfoque de
la mejor coivjetura, es comn entre ingenieros y cientficos. Funciona de manera adecuada si los experi
mentadores cuentan con una gran cantidad de conocimientos tcnicos o tericos del sistema que estn es
tudiando, as como ampha experiencia prctica. Sin embargo, el enfoque de la mejor conjetura presenta
al menos dos desventajas. Primera, supngase que la mejor conjetura inicial no produce los resultados de
seados. Entonces el experimentador tiene que hacer otra conjetura acerca de la combinacin correcta de
los niveles de los factores. Esto podra continuar por mucho tiempo, sin garanta alguna de xito. Segun
da, supngase que la mejor conjetura inicial produce un resultado satisfactorio. Entonces, el experimen
tador se ve tentado a suspender las pruebas, aun cuando no hay ningnna garanta de que se ha encontrado
la mejor solucin.
Otra estrategia de experimentacin muy comn en la prctica es el enfoque de un factor a la vez. Este
mtodo consiste en seleccionar un punto de partida, o lnea base de los niveles, para cada factor, para des
pus variar sucesivamente cada factor en su rango, manteniendo constantes los factores restantes en el ni
vel base. Despus de haber realizado todas las pruebas, se construye por lo general una serie de grficas
en las que se muestra la forma en que la variable de respuesta es afectada al variar cada factor mantenien
do los dems factores constantes. En la figura 1-2 se presenta una serie de grficas para el experimento
del golf, utilizando como lnea base los niveles de los cuatro factores; el palo grande, la pelota de goma de

CAPTULO 1 INTRODUCCIN

_L
G (grande) N (normal)
Palo

Figura 1-2

GB (goma
TP (tres
de t ^ t a )
piezas)
Pelota

I
C (caminando)

EC (en

A (agua)

Manera de t

C (cerveza)

Bebida

Resultados de la estrategia de un factor a la vez para el experimento de golf.

balata, caminar y beber agua. La interpretacin de esta grfica es directa; por ejemplo, debido a que la
pendiente de la curva de la manera de desplazarse es negativa, se concluira que hacer el recorrido en el
carrito mejora la puntuacin. Con base en estas grficas de un factor a la vez, la combinacin ptima que
se seleccionara sera el palo normal, desplazarse en el carrito y beber agua. El tipo de pelota de golf apa
rentemente carece de importancia.
La desventaja principal de la estrategia de un factor a la vez es que no puede tomar en consideracin
cualquier posible interaccin entre los factores. Hay una interaccin cuando uno de los factores no pro
duce el mismo efecto en la respuesta con niveles diferentes de otro factor. En la figura 1-3 se muestra una
interaccin entre los factores del tipo de palo y la bebida para el experimento del golf. Observe que si el
autor utiliza el palo normal, el tipo de bebida consumida prcticamente no tiene efecto alguno sobre su
puntuacin, pero si utiliza el palo grande, se obtienen resultados mucho mejores cuando bebe agua en lu
gar de cerveza. Las interacciones entre factores son muy comunes y, en caso de existir, la estrategia de un
factor a la vez casi siempre producir resultados deficientes. Muchas personas no perciben esto y, en
consecuencia, los experimentos de un factor a la vez son comunes en la prctica. (D e hecho, algunas
personas piensan que esta estrategia se relaciona con el mtodo cientfico o que es un principio slido
de ingeniera.) Los experimentos de un factor a la vez siempre son menos eficientes que otros mtodos
basados en un enfoque estadstico del diseo experimental. El tema se anaHzar con mayor detalle en el
captulo 5.
El enfoque correcto para trabajar con varios factores es conducir un experimento factorial. Se trata
de una estrategia experimental en la que los factores se hacen variar en conjunto, en lugar de uno a la vez.

TP(tres
piezas)

1
8

&

CB
(goma de
balata)
A (agua)
C (cerveza)
Tipo de bebida

Figura 1-3 Interaccin entre el


tipo de palo y el tipo de bebida para
el experimento del golf.

G (grande)

N (normal)
Tipo de palo

Figura 1-4 Experimento factorial de dos


factores que incluye el tipo de palo y el tipo
de pelota.

M ESTRATEGIA DE EXPERIMENTACIN

El concepto de diseo experimental factorial es de suma importancia, y varios captulos de este libro se
dedican a presentar experimentos factoriales bsicos, as como algunas variantes y casos especiales tiles.
Para ilustrar la forma en que se lleva a cabo un experimento factorial, considere el experimento de
golf y suponga que slo dos de los factores son de inters, el tipo de palo y el tipo de pelota. En la figura
1-4 se muestra un experimento factorial para estudiar los efectos conjuntos de estos dos factores sobre la
puntuacin de golf del autor. Observe que en este experimento factorial ambos factores tienen dos nive
les y que en el diseo se usan todas las combinaciones posibles de los niveles de ambos factores. Geom
tricamente, las cuatro corridas forman los vrtices de un cuadrado. A este tipo particular de experimento
factorial se le llama diseo factorial 2^ (dos factores, cada uno con dos niveles). Debido a que el autor
considera razonable suponer que jugar ocho rondas de golf para investigar estos factores, un plan facti
ble sera jugar dos rondas de golf con cada combinacin de los niveles de los factores, como se muestra en
la figura 1-4. Un diseador de experimentos dira que se han hecho dos rplicas del diseo. Este diseo
experimental permitira al experimentador investigar los efectos individuales (o los efectos principales)
de cada factor y determinar si existe alguna interaccin entre los factores.
En la figura 1-5 se presentan los resultados obtenidos al realizar el experimento factorial de la figura
1-4. En los vrtices del cuadrado se indican las puntuaciones de cada ronda de golf jugada con las cuatro
combinaciones de prueba. Observe que hay cuatro rondas de golf que proporcionan informacin acerca
del uso del palo normal y cuatro rondas que proporcionan informacin sobre el uso del palo grande. Al
encontrar la diferencia promedio de las puntuaciones que estn en los lados derecho e izquierdo del
cuadrado (como en la figura -5b), se tiene una medida del efecto de cambiar del palo grande al palo normal, o
Efecto del palo =

TPItres
piezas)

9 2 -I-9 4 -I-9 3 -I-9 1

88.91

8
a
P

8 8 + 9 1 -1 -8 8 -1 -9 0

= 3.25

9 2 ,94

93, 91

GB (goma
de balata)
G (grande)
N (normaO
Tipo de palo
a) Puntuaciones del experimento da golf
TP (tres
piezas)

TP (tres
piezas)

GB(goma
deba lata)

_L

_L

G (grande)
N (nomial)
Tipo de palo

GB (goma
de balata)
G (grande)
N (normal)
Tipo de palo

b) Comparacin de laa puntuaciones c) Comparacin de las puntuaciones


que conducen al efecto del palo
que conducen al efecto de la pelota

Figura 1-5

G (grande)
N (normal)
Tipo de palo
d] Comparacin de las puntuaciones
que conducen al efeao de la
interaccin pelota-palo

Puntuaciones del experimento del golf de la figura 1-4 y clculo de los efectos de los factores.

CAPTULO 1 INTRODUCCIN

Es decir, en promedio, al cambiar del palo grande al normal la puntuacin se incrementa 3.25 golpes por
ronda. D e manera similar, la diferencia promedio de las cuatro puntuaciones de la parte superior del cua
drado y de las cuatro puntuaciones de la parte inferior miden el efecto del tipo de pelota usado (ver la fi
gura l-5c):
Efecto de la pelota =

88+91 + 92-H94

88-^90^-93^-91

= 0.75

Por ltimo, puede obtenerse una medida del efecto de la interaccin entre el tipo de pelota y el tipo de
palo restando la puntuacin promedio en la diagonal de izquierda a derecha del cuadrado de la puntua
cin promedio de la diagonal de derecha a izquierda (ver la figura l-5d), cuyo resultado es
Efecto de la interaccin pelota-palo =

92-1-94-1-88-1-90

88-1-91-)-93-1-91

= 0.25

Los resultados de este experimento factorial indican que el efecto del palo es mayor que el efecto de
la pelota o que el de la interaccin. Podran usarse pruebas estadsticas para determinar si cualquiera
de estos efectos difiere de cero. D e hecho, el caso es que hay evidencia estadstica razonablemente slida
de que el efecto del palo difiere de cero y de que no es el caso para los otros dos efectos. Por lo tanto, tal
vez el autor debera jugar siempre con el palo grande.
En este sencillo ejemplo se pone de manifiesto una caracterstica muy importante del experimento
factorial; en los diseos factoriales se hace el uso ms eficiente de los datos experimentales. Note que este
experimento incluy ocho observaciones, y que las ocho observaciones se usan para calcular los efectos
del palo, de la pelota y de la interaccin. Ninguna otra estrategia de experimentacin hace un uso tan efi
ciente de los datos. sta es una caracterstica importante y til de los diseos factoriales.
El concepto de experimento factorial puede extenderse a tres factores. Suponga que el autor desea
estudiar los efectos del tipo de palo, el tipo de pelota y el tipo de bebida consumida sobre su puntuacin
de golf. Suponiendo que los tres factores tienen dos niveles, puede establecerse un diseo factorial como
el que se muestra en la figura 1-6. Observe que hay ocho combinaciones de prueba de estos tres factores
con los dos niveles de cada uno de ellos y que estos ocho ensayos pueden representarse geomtricamente
como los vrtices de un cubo. Se trata de un ejemplo de un diseo factorial 2^. Como el autor slo desea
jugar ocho rondas de golf, este experimento requerira que se juegue una ronda con cada una de las com
binaciones de los factores representadas por los ocho vrtices del cubo de la figura 1-6, Sin embargo, al
comparar esta situacin con el diseo factorial de dos factores de la figura 1-4, el diseo factorial 2^ pro
ducira la misma informacin acerca de los efectos de los factores. Por ejemplo, en ambos diseos hay
cuatro pruebas que proporcionan informacin acerca del palo normal y cuatro pruebas que proporcionan

Figura 1-6 Experimento factorial de tres factores que


incluye el tipo de palo, el tipo de pelota y el tipo de bebi
da.

1-1 ESTRATEGIA DE EXPERIMENTACIN


Ma

Caminando

plazarse

En carrito

Figura 1-7 Expeiim ento factorial de cuatro factores que incluye el tipo de
palo, el tipo de pelota, el tipo de bebida y la manera de desplazarse.

informacin acerca del palo grande, suponiendo que se repite dos veces cada corrida del diseo de dos
factores de la figura 1-4.
En la figura 1-7 se ilustra la forma en que podran investigarse los cuatro factores el palo, la pelota,
la bebida y la manera de desplazarse (caminando o en carrito) en un diseo factorial 2. Como en cual
quier diseo factorial, se usan todas las combinaciones posibles de los niveles de los factores. Puesto que
los cuatro factores tienen dos niveles, sigue siendo posible hacer la representacin geomtrica de este di
seo experimental mediante un cubo (en realidad un hipercubo).
En general, si hay k factores, cada uno con dos niveles, el diseo factorial requerira 2* corridas. Por
ejemplo, el experimento de la figura 1-7 requiere 16 corridas. Evidentemente, cuando el nmero de facto
res de inters aumenta, el nmero de corridas requeridas se incrementa con rapidez; por ejemplo, un
experimento con 10 factores en el que todos los factores tienen dos niveles requerira 1024 corridas. Esto
pronto se vuelve impracticable en lo que se refiere al tiempo y los recursos. En el experimento del golf,
el autor slo puede jugar ocho rondas, por lo que incluso el experimento de la figura 1-7 resulta demasia
do largo.
Por fortuna, cuando se trabaja con cuatro, cinco o ms factores, por lo general no es necesario probar
todas las combinaciones posibles de los niveles de los factores. Un experimento factorial fraccionado es
una variacin del diseo factorial bsico en la que slo se realiza un subconjunto de las corridas. En la fi
gura 1-8 se ilustra un diseo factorial fraccionado para la versin de cuatro factores del experimento del
golf. Este diseo requiere slo 8 corridas en lugar de las 16 originales y se llamara fraccin un medio. Si el
autor slo puede jugar ocho rondas de golf, ste es un excelente diseo en el cual estudiar los cuatro facto
res. Proporcionar informacin adecuada acerca de los efectos principales de los cuatro factores, as
como cierta informacin acerca de la forma en que interactan estos factores.
Los diseos factoriales fraccionados son muy comunes en la investigacin y el desarrollo industrial,
as como en el mejoramiento de procesos. Estos diseos se analizarn en el captulo 8.

Manera de desplazarse
Caminando

En carrito

Figura 1-8 Experimento factorial fraccionado de cuatro factores que incluye


el tipo de palo, el tipo de pelota, el tipo de bebida y la manera de desplazarse.

CAPTULO 1 INTRODUCCIN

1-2

ALG U NA S APLICACIONES TPICAS DEL DISEO EXPERIMENTAL

Los mtodos del diseo experimental han encontrado amplia aplicacin en diversas disciplinas. D e he
cho, la experimentacin puede considerarse parte del proceso cientfico y uno de los medios para conocer
el funcionamiento de sistemas y procesos. En general, el aprendizaje ocurre a travs de una serie de acti
vidades en las que se hacen conjeturas acerca de un proceso, se llevan a cabo experimentos para generar
datos del proceso y despus se usa la informacin del experimento para establecer nuevas conjeturas, lo
que lleva a nuevos experimentos, y as sucesivamente.
El diseo experimental es una herramienta de importancia fundamental en el mbito de la ingeniera
para mejorar el desempeo de un proceso de manufactura. Tkmbin tiene mltiples aplicaciones en el de
sarrollo de procesos nuevos. La aplicacin de las tcnicas del diseo experimental en las fases iniciales del
desarrollo de un proceso puede redundar en
1.
2.
3.
4.

Mejoras en el rendimiento del proceso.


Variabilidad reducida y conformidad ms cercana con los requerimientos nominales o proyectados.
Reduccin del tiempo de desarrollo.
Reduccin de los costos globales.

Los mtodos del diseo experimental desempean tambin un papel importante en las actividades
del diseo de ingeniera, donde se desarrollan productos nuevos y se hacen mejoramientos en los produc
tos existentes. Entre las aphcaciones del diseo experimental en el diseo de ingeniera se encuentran:
1.
2.
3.
4.

La evaluacin y comparacin de configuraciones de diseos bsicos.


La evaluacin de materiales alternativos.
La seleccin de los parmetros del diseo para que el producto tenga un buen funcionamiento en
una amplia variedad de condiciones de campo, es decir, para que el producto sea robusto.
La determinacin de los parmetros clave del diseo del producto que afectan el desempeo del
mismo.

El uso del diseo experimental en estas reas puede redundar en productos cuya fabricacin sea ms sen
cilla, en productos que tengan un desempeo y confiabilidad de campo mejorados, en costos de produc
cin ms bajos y en tiempos ms cortos para el diseo y desarrollo del producto. A continuacin se
presentan varios ejemplos que ilustran algunas de estas ideas.

EJEMPLO M
.....................................................................................................................................
Caracterizacin de un proceso
En el proceso de fabricacin de tarjetas de circuitos impresos se utiliza una mquina de soldadura lquida.
La mquina limpia las tarjetas en un fundente, las somete a un proceso de precalentamiento y despus las
hace pasar por una onda de soldadura lquida mediante una transportadora. En este proceso de soldadu
ra se hacen las conexiones elctricas y mecnicas de los componentes recubiertos de plomo en la tarjeta.
El proceso opera actualmente con un nivel de defectos aproximado de 1%. Es decir, cerca de 1% de
las juntas de soldadura de una tarjeta son defectuosas y requieren correccin manual. Sin embargo, debi
do a que la tarjeta de circuitos impresos promedio contiene ms de 2000 juntas de soldadura, incluso un
nivel de defectos de 1% representa un ntimero demasiado alto de juntas de soldadura que requieren co
rreccin. Al ingeniero responsable del proceso en esta rea le gustara usar un experimento diseado
para determinar cules son los parmetros de la mquina que influyen en la ocurrencia de los defectos de
soldadura y qu ajustes deberan hacerse en dichas variables para reducir los defectos de soldadura.

1-2 ALGUNAS APLICACIONES TPICAS DEL DISEO EXPERIMENTAL

En la mquina de soldadura lquida hay diversas variables que pueden controlarse. stas incluyen:
1.
2.
3.
4.
5.
6.
7.

La temperatura de la soldadura.
La temperatura del precalentamiento.
La velocidad de la transportadora.
El tipo de fundente.
La gravedad especfica del fundente.
La profundidad de la onda de soldadura.
El ngulo de la transportadora.

Adems de estos factores controlables, hay otros que no es sencillo manejar durante el proceso de fabri
cacin, aunque podran controlarse para los fines de una prueba. stos son:
1. El espesor de la tarjeta de circuitos impresos.
2. El tipo de componentes usados en la tarjeta.
3. La disposicin de los componentes en la tarjeta.
4. El operador.
5. La rapidez de produccin.
En esta situacin, el inters del ingeniero es caracterizar la mquina de soldadura lquida; es decir,
quiere determinar los factores (tanto los controlables como los no controlables) que afectan la ocurrencia
de defectos en las tarjetas de circuitos impresos. Para ello puede disear un experimento que le permitir
estimar la magnitud y direccin de los efectos de los factores; es decir, cunto cambia la variable de res
puesta (defectos por unidad) cuando se modifica cada factor, y si la modificacin de los factores en con
junto produce resultados diferentes que los obtenidos mediante el ajuste individual de los factores; es
decir, existe interaccin entre los factores? En ocasiones a un experimento como ste se le llama experi
mento tamiz o de exploracin exhaustiva. D e manera tpica, los experimentos tamiz incluyen el uso de di
seos factoriales fraccionados, como en el ejemplo del golf de la figura 1-8.
La informacin obtenida de este experimento tamiz se usar para identificar los factores crticos del
proceso y determinar la direccin del ajuste de dichos factores a fin de conseguir una reduccin adicional
del nmero de defectos por unidad. El experimento tambin puede proporcionar informacin acerca de
los factores que deberan controlarse con mayor atencin durante el proceso de fabricacin a fin de evi
tar los niveles elevados de defectos y el desempeo errtico del proceso. Por lo tanto, una consecuencia
del experimento podra ser la apUcacin de tcnicas como las cartas de control a una o ms de las varia
bles del proceso (la temperatura de la soldadura, por ejemplo), aunadas a las cartas de control de la pro
duccin del proceso. Con el tiempo, si se consigue una mejora sensible del proceso, quiz sea posible
basar la mayor parte del programa de control del mismo en el control de las variables de entrada del pro
ceso en lugar de aplicar cartas de control a la produccin.

EJEMPLO V 2 ...............................................................................................................................................
Optimizacin de un proceso
En un experimento de caracterizacin, el inters suele centrarse en determinar las variables del proceso
que afectan la respuesta. El siguiente paso lgico es la optimizacin, es decir, determinar la regin de los
factores importantes que conduzca a la mejor respuesta posible. Por ejemplo, si la respuesta es el rendi

10

CAPTULO 1 INTRODUCCIN

miento, se buscara la regin del rendimiento mximo, mientras que si la respuesta es la variabilidad de
una dimensin crtica del producto, se buscara una regin de variabilidad mnima.
Supongamos que el inters se centra en mejorar el rendimiento de un proceso qumico. Por los resul
tados de un experimento de caracterizacin se sabe que las dos variables ms importantes del proceso que
influyen en el rendimiento son la temperatura de operacin y el tiempo de reaccin. El proceso opera ac
tualmente a 145Fy con 2.1 horas de tiempo de reaccin, produciendo rendimientos de cerca de 80%. En
la figura 1-9 se muestra una vista desde arriba de la regin tiempo-temperatura. En esta grfica las lneas
de rendimiento constante se unen para formar los contornos de respuesta, y se muestran las lneas de con
torno para rendimientos de 6 0 ,7 0 ,8 0 ,9 0 y 95 por ciento. Estos contornos son las proyecciones en la re
gin tiempo-temperatura de las secciones transversales de la superficie del rendimiento correspondiente
a los rendimientos porcentuales arriba mencionados. A esta superficie se le llama en ocasiones superficie
de respuesta. El personal del proceso no conoce la verdadera superficie de respuesta de la figura 1-9, por
lo que se necesitarn mtodos experimentales para optimizar el rendimiento con respecto al tiempo y la
temperatura.
Para localizar el rendimiento ptimo, es necesario llevar a cabo un experimento en el que se hagan
variar conjuntamente el tiempo y la temperatura, es decir, un experimento factorial. En la figura 1-9 se
muestran los resultados de un experimento factorial inicial reahzado con dos niveles tanto del tiempo
como de la temperatura. Las respuestas que se observan en los cuatro vrtices del cuadrado indican que,
para incrementar el rendimiento, los cambios deberan hacerse en la direccin general del aumento de la

Tiempo (horas)

Figura 1-9 Grfica de contorno del rendimiento como una fun


cin del tiempo de reaccin y la temperatura de reaccin, la cual
ilustra la experimentacin para optimizar un proceso.

1-3 PRINCIPIOS BSICOS

11

temperatura y la reduccin del tiempo de reaccin. Se realizaran algunas corridas adicionales en esta di
reccin, y esta experimentacin adicional llevara a la regin del rendimiento mximo.
Una vez que se ha encontrado la regin del rendimiento ptimo, el siguiente paso tpico sera realizar
un segundo experimento. El objetivo de este segundo experimento es desarrollar un modelo emprico del
proceso y obtener una estimacin ms precisa de las condiciones de operacin ptimas para el tiempo y la
temperatura. A este enfoque para la optimizacin de un proceso se le llama la metodologa de superficies
de respuesta, la cual se examina en detalle en el captulo 11. El segundo diseo ilustrado en la figura 1-9 es
un diseo central compuesto, uno de los diseos experimentales ms importantes que se usan en los estu
dios de optimizacin de procesos.

EJEMPLO 1-3

...............................................................................................................................................

Ilustracin del diseo de un producto


Con frecuencia los mtodos de diseo experimental pueden aplicarse en el proceso de diseo de un pro
ducto. Para ilustrar esto, suponga que un grupo de ingenieros est diseando el gozne de la puerta de un
automvil. La caracterstica de calidad del producto que les interesa es el esfuerzo amortiguador, es de
cir, la capacidad de retencin del tope que impide que la puerta se cierre cuando el vehculo se estaciona
en una pendiente. El mecanismo amortiguador consta de un resorte de hojas y un cilindro. Cuando la
puerta se abre, el cilindro se desplaza por un arco que hace que el resorte de hojas se comprima. Para ce
rrar la puerta es necesario vencer la fuerza del resorte, la cual produce el esfuerzo amortiguador. El equi
po de ingenieros considera que el esfuerzo amortiguador es una funcin de los siguientes factores:

1. La distancia que se desplaza el cilindro.


2.
3.
4.
5.

La
La
La
La

altura del resorte del pivote a la base.


distancia horizontal del pivote al resorte.
altura libre del resorte auxiliar.
altura libre del resorte principal.

Los ingenieros pueden construir un prototipo del mecanismo del gozne en el que es posible variar to
dos estos factores dentro de ciertos rangos. Una vez que se han identificado los niveles apropiados de es
tos cinco factores, puede disearse un experimento que conste de varias combinaciones de los niveles de
los factores, y el prototipo del gozne puede probarse con estas combinaciones. Se obtendr as in form acin respecto de los factores que tienen una mayor influencia sobre el esfuerzo amortiguador del tope y,
mediante el anlisis de esta informacin, podr mejorarse el diseo del tope.

1-3

PR INCIPIO S BSICOS

Si quiere llevarse a cabo un experimento como los descritos en los ejemplos 1-1 al 1-3 con la mayor efi
ciencia posible, es necesario utilizar un enfoque cientfico para planearlo. El diseo estadstico de experi
mentos se refiere al proceso para planear el experimento de tal forma que se recaben datos adecuados
que puedan analizarse con mtodos estdsticos que llevarn a conclusiones vlidas y objetivas. El enfo
que estadstico del diseo experimental es necesario si se quieren sacar conclusiones significativas de los
datos. Cuando el problema incluye datos que estn sujetos a errores experimentales, la metodologa esta
dstica es el tnico enfoque objetivo de anlisis. Por lo tanto, cualquier problema experimental incluye dos

12

CAPTULO 1 INTRODUCCIN

aspectos: el diseo del experimento y el anlisis estadstico de los datos. Estos dos aspectos se encuentran
ntimamente relacionados porque el mtodo de anlisis depende directamente del diseo empleado.
Ambos temas se tratan en este libro.
Los tres principios bsicos del diseo experimental son la realizacin de rplicas, la aleatorizacin y
la formacin de bloques. Por realizacin de rplicas se entiende la repeticin del experimento bsico. En
el experimento metalrgico analizado en la seccin 1-1, una rplica consistira en el tratamiento de una
muestra con el templado en aceite y el tratamiento de una muestra con el templado en agua salada. Por lo
tanto, si se tratan cinco ejemplares en cada medio de templado, se dice que se han obtenido cinco rpli
cas. La realizacin de rplicas posee dos propiedades importantes. Primera, permite al experimentador
obtener una estimacin del error experimental. Esta estimacin del error se convierte en una unidad de
medicin bsica para determinar si las diferencias observadas en los datos son en realidad estadsticamen
te diferentes. Segunda, si se usa la media muestra! (por ejemplo,);) para estimar el efecto de un factor en
el experimento, la realizacin de rplicas permite al experimentador obtener una estimacin ms precisa
de este efecto. Por ejemplo, si es la varianza de una observacin individual y hay n rplicas, la varianza
de la media muestral es

n
La consecuencia prctica de lo anterior es que si se hicieron n = 1 rplicas y se observ = 145 (tem
plado en aceite) yyj = 147 (templado en agua salada), probablemente no podrn hacerse inferencias satis
factorias acerca del efecto del medio de templado; es decir, la diferencia observada podra ser resuhado del
error experimental. Por otra parte, si n fue razonablemente grande y el error experimental fue lo suficiente
mente pequeo, y se observ < y 2, podra concluirse con una certeza razonable que el templado en agua
salada produce una dureza mayor en esta aleacin de aluminio particular que el templado en aceite.
Hay una diferencia importante entre rplicas y mediciones repetidas. Por ejemplo, suponga que una
oblea de sihcio se graba con un proceso de grabado qumico con plasma para oblea nica, y que se hacen
tres mediciones de una dimensin crtica de esta oblea. Estas mediciones no son rplicas; son una forma
de mediciones repetidas y, en este caso, la variabilidad observada en las tres mediciones repetidas es reflejo
directo de la variabilidad inherente del sistema o instrumento de medicin. Como otro ejemplo, suponga
que, como parte de un experimento en la manufactura de semiconductores, se procesan simultneamente
cuatro obleas en un horno de oxidacin con una velocidad del flujo de gas y un tiempo particulares y que
se hace despus una medicin del espesor del xido en cada oblea. D e nueva cuenta, la medicin de las
cuatro obleas no son rplicas sino mediciones repetidas. En este caso reflejan las diferencias entre las
obleas y otras fuentes de variabilidad dentro de esa operacin de horneado particular. En las rplicas se
reflejan las fuentes de variabihdad tanto entre las corridas como (potencialmente) dentro de las mismas.
La aleatorizacin es la piedra angular en la que se fundamenta el uso de los mtodos estadsticos en
el diseo experimental. Por aleatorizacin se entiende que tanto la asignacin del material experimental
como el orden en que se realizarn las corridas o ensayos individuales del experimento se determinan al
azar. Uno de los requisitos de los mtodos estadsticos es que las observaciones (o los errores) sean varia
bles aleatorias con distribuciones independientes. La aleatorizacin hace por lo general que este supues
to sea vhdo. La aleatorizacin correcta del experimento ayuda tambin a sacar del promedio los
efectos de factores extraos que pudieran estar presentes. Por ejemplo, suponga que los ejemplares del
experimento descrito antes presentan slo ligeras diferencias en el espesor y que la efectividad del medio
de templado puede ser afectado por el espesor del ejemplar. Si todos los ejemplares sometidos al templa
do en aceite son ms gruesos que los sometidos al templado en agua salada, quiz se est introduciendo
un sesgo sistemtico en los resultados experimentales. Este sesgo estorba en uno de los medios de templa

1-4 PAUTAS GENERALES PARA DISEAR EXPERIMENTOS

13

do y, en consecuencia, invalida los resultados obtenidos. Al hacer la asignacin aleatoria de los ejempla
res al medio de templado este problema se aligera en parte.
Es muy comn el uso de programas de computadora para auxiliar a los experimentadores a seleccio
nar y construir diseos experimentales. Estos programas presentan a menudo las corridas del diseo ex
perimental de manera aleatoria. Por lo general este modo aleatorio se crea utilizando un generador de
nmeros aleatorios. Incluso con estos programas de computadora, con frecuencia seguir siendo necesa
rio que el experimentador haga la asignacin del material experimental (como las obleas en los ejemplos
de semiconductores mencionados antes), de los operadores, de los instrumentos o herramientas de medi
cin, etc., que se utilizarn en el experimento. Puede recurrirse a tablas de nmeros aleatorios para ase
gurar que las asignaciones se hacen al azar.
En ocasiones los experimentadores se encuentran con situaciones en las que la aleatorizacin de un
aspecto del experimento es complicada. Por ejemplo, en un proceso qumico, la temperatura puede ser
una variable muy difcil de modificar, haciendo casi imposible la aleatorizacin completa de este factor.
Existen mtodos de diseo estadstico para resolver las restricciones sobre la aleatorizacin. Algunos de
estos enfoques se revisarn en captulos subsecuentes (ver en particular el captulo 13).
La formacin de bloques es una tcnica de diseo que se utihza para mejorar la precisin de las com
paraciones que se hacen entre los factores de inters. Muchas veces la formacin de bloques se emplea
para reducir o eliminar la variabilidad transmitida por factores perturbadores; es decir, aquellos factores
que pueden influir en la respuesta experimental pero en los que no hay un inters especfico. Por ejemplo,
en un experimento de un proceso qumico pueden requerirse dos lotes de materia prima para realizar to
das las corridas necesarias. Sin embargo, podra haber diferencias entre los lotes debido a la variabilidad
de un proveedor a otro y, en caso de no haber un inters especfico en este efecto, los lotes de materia pri
ma se consideraran un factor perturbador. En general, un bloque es un conjunto de condiciones experi
mentales relativamente homogneas. En el ejemplo del proceso qumico, cada lote de materia prima
formara un bloque, ya que es de esperarse que la variabihdad dentro de un lote sea menor que la variabihdad entre lotes. D e manera tpica, cOmo en este ejemplo, cada nivel del factor perturbador pasa a ser un
bloque. Entonces el experimentador divide las observaciones del diseo estadstico en grupos que se co
rren en cada bloque. En varias partes del texto se estudia en detalle la formacin de bloques, incluyendo
los captulos 4,5, 7, 8,9 ,1 1 y 13. En el captulo 2, seccin 2-5.1, se presenta un ejemplo sencillo para ilus
trar la estructura bsica de la formacin de bloques.
Los tres principios bsicos del diseo experimental, la aleatorizacin, la realizacin de rplicas y la
formacin de bloques son parte de cada uno de los experimentos. Se ilustrarn y resaltarn repetidamen
te a lo largo de este libro.

1-4

PA U T A S GENERALES PA R A DISEA R EXPERIMENTOS

Para aplicar el enfoque estadstico en el diseo y anhsis de un experimento, es necesario que todos los
que participan en el mismo tengan desde el principio una idea clara de qu es exactamente lo que va a es
tudiarse, cmo van a colectarse los datos, y al menos una comprensin cualitativa de la forma en que van a
anahzarse estos datos. En la tabla 1-1 se muestra un esquema general del procedimiento recomendado. A
continuacin se presenta una breve explicacin de este esquema y se elaboran algunos de los puntos cla
ve. Para mayores detalles, ver Coleman y Montgomery [27], as como las referencias al final del libro.
Tkmbin es til el material complementario para este captulo.
i . Identificacin y enunciacin del problema. Este punto podra parecer muy obvio, pero es comn que
en la prctica no sea sencillo darse cuenta de que existe un problema que requiere experimentacin, y

14

CAPTULO 1

INTRODUCCIN

Tabla 1-1

Pautas generales para disear un experim ento

1. Identificacin y exposicin del problema.


2. Eleccin de los factores, los niveles y los rangos."
3. Seleccin de la variable de respuesta."
4. Eleccin del diseo experimental.
5. Realizacin del experimento.
6. Anlisis estadstico de los datos.
7. Conclusiones y recomendaciones.

Planeacin previa
al experimento

En la prctica, los pasos 2 y 3 suelen hacerse simultneamente o en el orden inverso.

tampoco es fcil desarrollar una enunciacin clara, con la que todos estn de acuerdo, de este problema.
Es necesario desarrollar todas las ideas acerca de los objetivos del experimento. Generalmente, es impor
tante solicitar aportaciones de todas las reas involucradas: ingeniera, aseguramiento de calidad, manu
factura, mercadotecnia, administracin, el cliente y el personal de operacin (el cual por lo general
conoce a fondo el proceso y al que con demasiada frecuencia se ignora). Por esta razn, se recomienda un
enfoque de equipo para disear experimentos.
En la mayora de los casos es conveniente hacer una lista de los problemas o las preguntas especficas
que van a abordarse en el experimento. Una enunciacin clara del problema contribuye sustancialmente
a menudo para alcanzar una mejor comprensin de los fenmenos bajo estudio y la solucin final del pro
blema. Tkmbin es importante tener presente el objetivo global; por ejemplo, se trata de un proceso o
sistema nuevo (en cuyo caso el objetivo inicial posiblemente ser la caracterizacin o tamizado de los fac
tores) o se trata de un sistema maduro que se conoce con profundidad razonable y que se ha caracterizado
con anterioridad (en cuyo caso el objetivo puede ser la optimizacin)? En un experimento puede haber
muchos objetivos posibles, incluyendo la confirmacin (el sistema se comporta de la misma manera aho
ra que en el pasado?), el descubrimiento (qu ocurre si se exploran nuevos materiales, variables, condi
ciones de operacin, etc.?) y la estabihdad (bajo qu condiciones las Variables de respuesta de inters
sufren una degradacin seria?). Obviamente, las cuestiones especficas que habrn de abordarse en el ex
perimento se relacionan de manera directa con los objetivos globales. Con frecuencia en esta etapa de la
formulacin del problema muchos ingenieros y cientficos se percatan de que no es posible que un experi
mento comprensivo extenso responda las cuestiones clave y de que un enfoque secuencal en el que se uti
lice una serie de experimentos ms pequeos es una estrategia ms adecuada.
2. Eleccin de los factores, los niveles y los rangos. (Como se indica en la tabla 1-1, los pasos 2 y 3 mu
chas veces se hacen simultneamente o en orden inverso.) Cuando se consideran los factores que pueden
influir en el desempeo de un proceso o sistema, el experimentador suele descubrir que estos factores
pueden clasificarse como factores potenciales del diseo o bien como factores perturbadores. Los facto
res potenciales del diseo son aquellos que el experimentador posiblemente quiera hacer variar en el ex
perimento. Es frecuente encontrar que hay muchos factores potenciales del diseo, por lo que es
conveniente contar con alguna clasificacin adicional de los mismos. Algunas clasificaciones tiles son
factores del diseo, factores que se mantienen constantes y factores a los que se permite variar. Los facto
res del diseo son los que se seleccionan realmente para estudiarlos en el experimento. Los factores que
se mantienen constantes son variables que pueden tener cierto efecto sobre la respuesta, pero que para
los fines del experimento en curso no son de inters, por lo que se mantendrn fijos en un nivel especfico.
Por ejemplo, en un experimento de grabado qumico en la industria de los semiconductores puede haber
un efecto, que es nico, de la herramienta especfica para el grabado qumico con plasma que se utiliza en
el experimento. Sin embargo, sera muy difcil variar este factor en un experimento, por lo que el experi
mentador puede decidir llevar a cabo todas las corridas experimentales en un grabador qumico particu
lar (idealmente tpico). D e este modo, este factor se mantiene constante. Como un ejemplo de factores

1-4 PAUTAS GENERALES PARA DISEAR EXPERIMENTOS

15

a los que se p em ite variar, las unidades experimentales o los materiales a los que se aplican los factores
del diseo no son homogneos por lo general, no obstante lo cual con frecuencia se ignora esta variabili
dad de una unidad a otra y se confa en la aleatorzacin para compensar cualquier efecto del material o la
unidad experimental. Muchas veces se trabajar con el supuesto de que los efectos de los factores que se
mantienen constantes y de los factores a los que se permite variar son relativamente pequeos.
Por otra parte, los factores perturbadores pueden tener efectos considerables que deben tomarse en
consideracin, a pesar de que no haya inters en ellos en el contexto del experimento en curso. Los factores
perturbadores suelen clasificarse como factores controlables, no controlables o de ruido. Un factor pertur
bador controlable es aquel cuyos niveles pueden ser ajustados por el experimentador. Por ejemplo, el expe
rimentador puede seleccionar lotes diferentes de materia prima o diversos das de la semana para conducir
el experimento. La estructura bsica de la formacin de bloques, comentada en la seccin anterior, suele ser
til para trabajar con factores perturbadores controlables. Si un factor perturbador no es controlable en el
experimento, pero puede medirse, muchas veces puede usarse el procedimiento de anlisis denominado
anlisis de covarianza para compensar este efecto. Por ejemplo, la humedad relativa en el medio ambiente
del proceso puede afectar el desempeo del proceso, y si la humedad no puede controlarse, probablemente
podr medirse y tratarse como una covariable. Cuando un factor que vara de manera natural y no controla
ble en el proceso puede controlarse para los fines de un experimento, con frecuencia se le llama factor de
ruido. En tales situaciones, es comn que el objetivo sea encontrar los ajustes de los factores controlables
del diseo que minimicen la variabilidad transmitida por los factores de ruido. En ocasiones a esto se le lla
ma el estudio de robustez del proceso o el problema de robustez del diseo. La formacin de bloques, el
anlisis de covarianza y los estudios de robustez del proceso se comentan ms adelante.
Una vez que el experimentador ha seleccionado los factores del diseo, debe elegir los rangos en los
que har variar estos factores, as como los niveles especficos con los que se realizar^i las corridas. Tam
bin deber pensarse cmo van a controlarse estos factores en los valores deseados y cmo van a medirse.
Por ejemplo, en el experimento de la soldadura lquida, el ingeniero ha definido 12 variables que pueden
afectar la ocurrencia de defectos de soldadura. El ingeniero tambin tendr que tomar una decisin en
cuanto a la regin de inters para cada variable (es decir, el rango en el que se har variar cada factor) y
en cuanto al nmero de niveles de cada variable que usar. Para ello se requiere del conocimiento del proce
so. Este conocimiento del proceso suele ser una combinacin de experiencia prctica y conocimientos teri
cos. Es importante investigar todos los factores que pueden ser de importancia y no dejarse influir
demasiado por la experiencia pasada, en particular cuando uno se encuentra en las fases iniciales de la expe
rimentacin o cuando el proceso no est del todo maduro.
Cuando el objetivo del experimento es el tamizado de los factores o caracterizacin del proceso, por lo
general es mejor mantener reducido el nmero de niveles de los factores. En general, dos niveles funcionan
bastante bien en los estudios de tamizado de factores. Elegir la regin de inters tambin es importante. En el
tamizado de factores, la regin de inters deber ser relativamente grande; es decir, el rango en el que se ha
cen variar los factores deber ser amplio. Conforme se sepa ms acerca de las variables que son importantes y
de los niveles que producen los mejores resultados, la regin de inters se har por lo general ms estrecha.
3. Seleccin de la variable de respuesta. Para seleccionar la variable de respuesta, el experimentador de
ber tener la certeza de que esta variable proporciona en realidad informacin til acerca del proceso bajo
estudio. En la mayora de los casos, el promedio o la desviacin estndar (o ambos) de la caracterstica me
dida ser la variable de respuesta. No son la excepcin las respuestas mltiples. La eficiencia de los instru
mentos de medicin (o error de medicin) tambin es un factor importante. Si la eficiencia de los
instrumentos de medicin es inadecuada, el experimentador slo detectar los efectos relativamente gran
des de los factores o quiz sean necesarias rplicas adicionales. En algimas situaciones en que la eficiencia
de los instrumentos de medicin es pobre, el experimentador puede decidir medir varias veces cada unidad

16

CAPTULO 1 INTRODUCCIN

experimental y usar el promedio de las mediciones repetidas como respuesta observada. Suele ser de importancia determinante identificar los aspectos relacionados con la definicin de las respuestas de inters y cmo
van a medirse antes de llevar a cabo el experimento. En ocasiones se emplean experimentos diseados para
estudiar y mejorar el desempeo de los sistemas de medicin. Para un ejemplo, ver el captulo 12.
Se reitera lo crucial que es exponer todos los puntos de vista y la informacin del proceso en los pasos
1 al 3 anteriores. Se hace referencia a esto como planeacin previa al experimento. Coleman y Montgomery [27] proporcionan hojas de trabajo que pueden ser tiles en la planeacin previa al experimento.
Vase tambin la informacin complementaria del texto para ms detalles y un ejemplo del uso de estas
hojas de trabajo. En muchas situaciones, no es posible que una sola persona posea todos los conocimien
tos requeridos para hacer esto adecuadamente. Por lo tanto, se hace una amplia recomendacin para el
trabajo en equipo durante la planeacin del experimento. La mayor parte del xito gravitar en tom o a
qu tan bien se haya hecho la planeacin previa del experimento.
4. Eleccin del diseo experimental. Si las actividades de planeacin previas al experimento se realizan
como es debido, este paso es relativamente sencillo. La eleccin del diseo implica la consideracin del
tamao de la muestra (nmero de rplicas), la seleccin de un orden de corridas adecuado para los ensa
yos experimentales y la determinacin de si entran en juego o no la formacin de bloques u otras restric
ciones sobre la aleatorizacin. En este libro se revisan algunos de los tipos ms importantes de diseos
experimentales, y puede usarse en ltima instancia como un catlogo para seleccionar el diseo experi
mental apropiado para una amplia variedad de problemas.
Existen tambin varios paquetes interactivos de software de estadstica que soportan esta fase del di
seo experimental. El experimentador puede introducir la informacin del nmero de factores, los nive
les y los rangos, y estos programas presentarn a la consideracin del experimentador una seleccin de
diseos o recomendarn un diseo particular. (Nosotros preferimos ver varias alternativas en lugar de
confiar en la recomendacin de la computadora en la mayora de los casos.) Estos programas proporcio
nan tambin por lo general una hoja de trabajo (con el orden aleatorizado de las corridas) que se usar en
la conduccin del experimento.
Al seleccionar el diseo, es importante tener en mente los objetivos experimentales. En muchos ex
perimentos de ingeniera se sabe de antemano que algunos de los niveles de los factores producirn valo
res diferentes de la respuesta. En consecuencia, el inters se centra en identificar
factores causan esta
diferencia y en estimar la magnitud del cambio de la respuesta. En otras situaciones podra haber ms in
ters en verificar la uniformidad. Por ejemplo, pueden compararse dos condiciones de produccin A y B,
donde A es el estndar y B es una alternativa con una eficiencia de costos mayor. El experimentador esta
r interesado entonces en demostrar que, por ejemplo, no hay ninguna diferencia en el rendimiento entre
las dos condiciones.
5. Realizacin del experimento. Cuando se lleva a cabo el experimento es vital monitorear con atencin el
proceso a fn de asegurarse de que todo se est haciendo conforme a la planeacin. Los errores en el proce
dimiento experimental en esta etapa destruirn por lo general la validez experimental. Poner en un primer
plano la planeacin es crucial para el xito. Es fcil subestimar los aspectos de logstica y planeacin cuando
se corre un experimento diseado en un ambiente complejo de manufactura o de investigacin y desarrollo.
Coleman y Montgomery [27] sugieren que antes de llevar a cabo el experimento, es conveniente en
muchas ocasiones realizar algunas corridas piloto o de prueba. Estas corridas proporcionan informa
cin acerca de la consistencia del material experimental, una comprobacin del sistema de medicin,
una idea aproximada del error experimental y la oportunidad de poner en prctica la tcnica experi
mental global. Esto ofrece tambin una oportunidad para revisar, de ser necesario, las decisiones toma
das en los pasos 1 al 4.

1-5 BREVE HISTORIA DEL DISEO ESTADSTICO

17

6. Anlisis estadstico de los datos. Debern usarse mtodos estadsticos para analizar los datos a fin de
que los resultados y las conclusiones sean objetivos y no de carcter apreciativo. Si el experimento se ha
diseado correctamente y si se ha llevado a cabo de acuerdo con el diseo, los mtodos estadsticos nece
sarios no deben ser complicados. Existen varios paquetes de software excelentes diseados para auxiliar
en el anlisis de datos, y muchos de los programas usados en el paso 4 para seleccionar el diseo cuentan
con una interfase directa para el anhsis estadstico. Con frecuencia se encuentra que los mtodos grfi
cos simples desempean un papel importante en el anlisis e interpretacin de datos. Debido a que mu
chas de las preguntas que el experimentador quiere responder pueden insertarse en el marco de la prueba
de hiptesis, los procedimientos para probar hiptesis y estimar intervalos de confianza son muy tiles en
el anlisis de datos de un experimento diseado. Muchas veces es muy til tambin presentar los resulta
dos de varios experimentos en trminos de un modelo emprico, es decir, mediante una ecuacin derivada
de los datos que expresa la relacin entre la respuesta y los factores importantes del diseo. El anlisis re
sidual y la verificacin de la adecuacin del modelo son tambin tcnicas de anlisis importantes. Ms
adelante se revisarn en detalle estos temas.
Recuerde que los mtodos estadsticos no pueden demostrar que un factor (o factores) posee un
efecto particular, slo proporcionan pautas generales en cuanto a la confiabilidad y la validez de los resul
tados. Aplicados en forma correcta, los mtodos estadsticos no permiten la demostracin experimental
de nada, pero s sirven para medir el error posible en una conclusin o asignar un nivel de confianza a un
enunciado. La ventaja principal de los mtodos estadsticos es que agregan objetividad al proceso de
toma de decisiones. Las tcnicas estadsticas, aunadas a una buena ingeniera o conocimiento del proceso
y el sentido comn, llevarn por lo general a conclusiones slidas.
7. CoTtctsioms y recomendaciones. Una vez que se han analizado los datos, el experimentador debe sacar
conclusiones prcticas acerca de los resultados y recomendar un curso de accin. Los mtodos grficos sue
len ser tiles en esta etapa, en particular para presentar los resultados. Tkmbin debern realizarse corridas
de seguimiento o pruebas de confirmacin para validar las conclusiones del experimento.
A lo largo del proceso completo es importante tener presente que la experimentacin es una parte
esencial del proceso de aprendizaje, en la que se formulan hiptesis tentativas acerca de un sistema, se
realizan experimentos para investigar estas hiptesis y se formulan nuevas hiptesis con base en los resul
tados, y as sucesivamente. Esto sugiere que la experimentacin es iterativa. Por lo general es un gran
error disear un solo experimento comprensivo y extenso al principio de un estudio. Un experimento exi
toso requiere conocer los factores importantes, los rangos en los que debern hacerse variar estos facto
res, el nmero apropiado de niveles que debern usarse y las unidades de medicin apropiadas para estas
variables. En general, no se conocen las respuestas precisas de estas cuestiones, pero se aprende acerca de
ellas sobre la marcha. A medida que avanza un programa experimental, es comn abandonar algunas va
riables de entrada e incorporar otras, modificar la regin de exploracin de algunos factores o incorporar
nuevas variables de respuesta. Por consiguiente, generalmente la experimentacin se hace en forma secuencial y, como regla general, no deber invertirse ms de 25% de los recursos disponibles en el primer
experimento. Con esto se asegurar que se contar con los recursos suficientes para realizar las corridas
de confirmacin y que se alcanzar en ltima instancia el objetivo final del experimento.

1-5

BREVE H ISTO RIA DEL DISEO ESTADSTICO

Ha habido cuatro eras del desarrollo moderno del diseo experimental estadstico. La era agrcola fue
encabezada por el trabajo pionero de Sir Ronald A. Fisher en los aos 1920 y principios de la dcada de
1930. En este periodo, Fisher fue el responsable de las estadsticas y el anlisis de datos en la Estacin

18

CAPTULO 1 INTRODUCCIN

Agrcola Experimental de Rothamsted en las cercanas de Londres, Inglaterra. Fisher se percat de que
las fallas en la forma en que se llevaba a cabo el experimento que generaba los datos obstaculizaban con
frecuencia el anlisis de los datos de los sistemas (en este caso sistemas agrcolas). Mediante la interac
cin con mltiples cientficos e investigadores de diversos campos, Fisher desarroll las ideas que lleva
ron a los tres principios bsicos del diseo experimental que se revisan en la seccin 1-3: la aleatorizacin,
la realizacin de rplicas y la formacin de bloques. Fisher incorpor de manera sistemtica pl pensa
miento y los principios estadsticos en el diseo de las investigaciones experimentales, incluyendo el con
cepto de diseo factorial y el anlisis de varianza. Sus libros [44a, b] tuvieron profunda influencia en el uso
de la estadstica, particularmente en la agricultura y las ciencias biolgicas relacionadas. Para una exce
lente biografa de Fisher, ver Box [21].
Si bien es cierto que la aplicacin del diseo estadstico en ambientes industriales se inici en la dca
da de 1930, el catalizador de la segunda era, o era industrial, fue el desarrollo de la metodologa de super
ficies de respuesta (MSR) por parte de Box y Wilson [20]. Estos autores se percataron y explotaron el
hecho de que muchos experimentos industriales son fundamentalmente diferentes de sus contrapartes
agrcolas en dos sentidos; 1) la variable de respuesta puede observarse por lo general (casi) de inmediato,
y 2) el experimentador puede obtener pronto informacin crucial de un pequeo grjpo de corridas que
puede usarse para planear el siguiente experimento. Box [12f] denomina inmediatez y secuencialidad a es
tas dos caractersticas de los experimentos industriales. En los 30 aos siguientes, la MSR y otras tcnicas
de diseo se generalizaron en las industrias qumica y de proceso, sobre todo en el trabajo de investiga
cin y desarrollo. George Box fue el lder intelectual de este movimiento. Sin embargo, la aplicacin del
diseo estadstico a nivel de plantas o procesos de manufactura todava no estaba muy generalizada.
Algunas de las razones de ello incluyen la capacitacin inadecuada de ingenieros y otros especialistas en
procesos en los conceptos y los mtodos estadsticos bsicos, as como la falta de recursos de computacin
y software de estadstica que fueran fciles de usar para apoyar la aplicacin de experimentos diseados
estadsticamente.
El inters creciente de la industria occidental en pl mejoramiento de calidad que empez a fines de la
dcada de 1970 anunci la tercera era del diseo estadstico. El trabajo de Genichi Tkguchi (Ikguchi y Wu
[109], Kackar [62] y Ikguchi [108a, b]) tuvo un impacto significativo en el aumento del inters y el uso de
los experimentos diseados. Thguchi propugnaba por el uso de experimentos diseados para lo que deno
min el diseo paramtrico robusto, es decir,
1.
2.
3.

Hacer procesos insensibles a los factores ambientales o de otra ndole que son difciles de con
trolar.
Fabricar productos insensibles a la variacin transmitida por los componentes.
Encontrar los niveles de las variables del proceso que obliguen a la media a un valor deseado
mientras que al mismo tiempo se reduzca la variabilidad en tom o a este valor.

Tkguchi propuso diseos factoriales altamente fraccionados y otros arreglos ortogonales junto con algu
nos mtodos estadsticos nuevos para resolver estos problemas. La metodologa resultante gener mu
chas discusiones y controversias. Parte de la controversia surgi porque en Occidente la metodologa de
Tguchi fue defendida al principio (y sobre todo) por empresarios, y no se haba hecho la revisin escruta
dora adecuada de la ciencia estadstica fundamental. Para fines de la dcada de 1980, los resultados de
esta revisin indicaron que aun cuando los conceptos y los objetivos enfocados en la ingeniera de Thguchi
tenan bases slidas, existan problemas sustanciales con su estrategia experimental y sus mtodos para el
anlisis de los datos. Para detalles especficos de estas cuestiones, ver Box [12d], Box, Bisgaard y Fung
[14], Hunter [59a, b], Myers y Montgomery [85a] y Pignatiello y Ramberg [94]. Gran parte de estas preo

1-6 RESUMEN: USO DE TCNICAS ESTADSTICAS EN LA EXPERIMENTACIN

19

cupaciones se resumen tambin en el amplio panel de discusin del nmero de mayo de 1992 de Technometrics (ver Nair, et al. [86]).
Hubo al menos tres resultados positivos de la controversia desatada por Tkguchi. Primero, el uso de
los experimentos diseados se hizo ms generalizado en las industrias con piezas discretas, incluyendo la
industria de manufacturas automotrices y aeroespaciales, de electrnica y semiconductores, y muchas
otras, que anteriormente hacan poco uso de esta tcnica. Segundo, se inici la cuarta era del diseo esta
dstico. Esta era ha incluido un renovado inters general tanto por parte de investigadores como de profe
sionales en ejercicio en el diseo estadstico y el desarrollo de varios enfoques nuevos y tiles para los
problemas experimentales en el mundo industrial, incluyendo alternativas a los mtodos tcnicos de 1&guchi que permiten que sus conceptos de ingeniera se lleven a la prctica de manera eficaz y eficiente.
Algunas de estas alternativas se revisarn e ilustrarn en captulos subsecuentes, en particular en el cap
tulo 11. Tercero, la educacin formal en diseo experimental estadstico se est haciendo parte de los pro
gramas de ingeniera en las universidades, tanto a nivel de licenciatura como de posgrado. La integracin
exitosa de una buena prctica del diseo experimental en la ingeniera y las ciencias es un factor clave en
la competitividad industrial futura.

1-6

RESUMEN: U SO DE TCNICAS ESTADSTICAS EN LA


EXPERIM ENTACIN

Gran parte de la investigacin en la ingeniera, las ciencias y la industria es emprica y hace un uso extensi
vo de la experimentacin. Los mtodos estadsticos pueden incrementar en gran medida la eficiencia de
estos experimentos y con frecuencia pueden fortalecer las conclusiones as obtenidas. El uso correcto de
las tcnicas estadsticas en la experimentacin requiere que el experimentador tenga presentes los puntos
siguientes:
1. Uso de conocimientos no estadsticos del problema. Los experimentadores suelen poseer amplios co
nocimientos de sus respectivos campos. Por ejemplo, un ingeniero civil que trabaja en un problema de hi
drologa cuenta de manera tpica con considerable experiencia prctica y capacitacin acadmica formal
en esta rea. En algunos campos existe un cuerpo enorme de teora fsica en el cual indagar para explicar
las relaciones entre los factores y las respuestas. Este tipo de conocimientos no estadsticos es invaluable
para elegir los factores, determinar los niveles de los factores, decidir cuntas rplicas correr, interpretar
los resultados del anhsis, etc. El uso de la estadstica no es sustituto de la reflexin sobre el problema.
2. Maitener el diseo y el anlisis tan simple como sea posible. Es necesario no exagerar en el uso de
tcnicas estadsticas complejas y sofisticadas. Los mtodos de diseo y anlisis relativamente simples son
siempre los mejores. En este punto cabe hacer hincapi nuevamente en el paso 4 del procedimiento reco
mendado en la seccin 1-4, S un diseo se hace de manera cuidadosa y correcta, el anhsis casi siempre
ser relativamente directo. Sin embargo, si el diseo se estropea grandemente por ineptitud, no es posible
que incluso la estadstica ms compleja y elegante salve la situacin.
3. Tmer presente la diferencia entre significacin prctica y significacin estadstica. Debido justamen
te a que dos condiciones experimentales producen respuestas medias que son estadsticamente diferen
tes, no existe ninguna seguridad de que esta diferencia sea de la magnitud suficiente como para tener
algn valor prctico. Por ejemplo, un ingeniero puede determinar que una modificacin en el sistema de
inyeccin de combustible de un automvil puede producir un mejoramiento promedio real en el rendi
miento del combustible de 0.1 mi/gal. ste es un resultado estadsticamente significativo. Sin embargo, si

20

CAPTULO 1 INTRODUCCIN

el costo de la modificacin es de $1000, la diferencia de 0.1 mi/gal probablemente ser muy pequea para
poseer algn valor prctico.
4. Los experimentos son generalmente iterativos. Recuerde que en la mayora de las situaciones no es
conveniente disear un experimento demasiado comprensivo al principio de un estudio. U n diseo exito
so requiere conocer los factores importantes, los rangos en los que estos factores se harn variar, el nme
ro apropiado de niveles para cada factor y los mtodos y las unidades de medicin adecuados para cada
factor y respuesta. En general, ningn experimentador est en posicin de responder estas cuestiones al
principio del experimento, sino que las respuestas aparecen sobre la marcha. Esto habla en favor del en
foque iterativo o secuencial analizado anteriormente. Desde luego, hay situaciones en las que un experi
mento comprensivo es totalmente apropiado pero, como regla general, la mayora de los experimentos
debern ser iterativos. Por consiguiente, no deber invertirse ms de 25% de los recursos para la experi
mentacin (corridas, presupuesto, tiempo, etc.) en el experimento inicial. Con frecuencia estos esfuerzos
iniciales constituyen slo experiencias de aprendizaje, y es necesario contar con recursos suficientes para
alcanzar los objetivos finales del experimento.

Experimentos
comparativos simples

En este captulo se examinan los experimentos para comparar dos condiciones (llamadas en ocasiones
tratamientos), a las cuales es comn denominar experimentos comparativos simples. Se empieza con el
ejemplo de un experimento que se realiza para determinar si dos formulaciones diferentes de un produc
to producen resultados equivalentes. El estudio lleva a revisar varios conceptos bsicos de la estadstica,
como variables aleatorias, distribuciones de probabilidad, muestras aleatorias, distribuciones de muestreo y pruebas de hiptesis.

2a

IN T R O D U C C IO N

La fuerza de la tensin de adhesin del mortero de cemento portland es una caracterstica importante del
producto. Un ingeniero est interesado en comparar la fuerza de una formulacin modificada en la que se han
agregado emulsiones de ltex de polmeros durante el mezclado, con la fuerza del mortero sin modificar. El
experimentador ha reimido 10 observaciones de la fuerza de la formulacin modificada y otras 10 observacio
nes de la fonnulacin sin modificar. Los datos se muestran en la tabla 2-1. Podra hacerse referencia a las dos
formulaciones diferentes como dos tratamientos o como dos niveles del factor formulaciones.
En la figura 2-1 se grafican los datos de este experimento. A esta representacin se le llama diagrama
de puntos. D el examen visual de estos datos se obtiene la impresin inmediata de que la fuerza del morte
ro sin modificar es mayor que la fuerza del mortero modificado. Esta impresin se confirma al comparar
las fuerzas de la tensin de adhesinprom edio,yi = 16.76 kgl^cm^ para el mortero modificado y^2 = 17.92
kgf/cm^ para el mortero sin modificar. Las fuerzas de la tensin de adhesin promedio de estas dos mues
tras difieren en lo que parece ser una cantidad no trivial. Sin embargo, no es evidente que esta diferencia
sea de la magnitud suficiente para implicar que las dos formulaciones son en realidad diferentes. Quizs
esta diferencia observada en las fuerzas promedio sea el resultado de fluctuaciones del muestreo y las dos
formulaciones sean idnticas en realidad. Posiblemente otras dos muestras produzcan el resultado con
trario, con la fuerza del mortero modificado excediendo la de la formulacin sin modificar.
Puede usarse una tcnica de la inferencia estadstica llamada prueba de hiptesis (algunos autores
prefieren el trmino prueba de significacin) para auxiliar al experimentador en la comparacin de estas
21

22

CAPTULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES


Tabla 2-1

Datos de la fuerza de la tensin de


adhesin del experimento de la
formulacin del cem ento portland

Mortero
modificado

Mortero sin
modificar

yij
16.85
16.40
17.21
16.35
16.52
17.04
16.96
17.15
16.59
16.57

>'?,
17.50
17.63
18.25
18.00
17.86
17.75
18.22
17.90
17.96
18.15

j
1
2
3
4
5
6
7
8
9
10

dos formulaciones. La prueba de hiptesis permite que la comparacin de las dos formulaciones se haga
en trminos objetivos, con el conocimiento de los riesgos asociados si se llega a una conclusin equivoca
da. Antes de presentar los procedimientos de la prueba de hiptesis en experimentos comparativos sim
ples, se har una breve revisin de algunos conceptos elementales de la estadstica.

2-2

CONCEPTOS ESTADSTICOS BSICOS

A cada una de las observaciones del experimento del cemento portland citado anteriormente se le llama
ra una corrida. Observe que las corridas individuales difieren, por lo que existen fluctuaciones, o ruido,
en los resultados. Es comn llamar a este ruido el error experimental o simplemente el error. Se trata de
un error estadstico, lo cual significa que se origina por la variacin que no est bajo control y que gene
ralmente es inevitable. La presencia del error o ruido imphca que la variable de respuesta, la fuerza de la
tensin de adhesin, es una variable aleatoria. Una variable aleatoria puede ser discreta o continua. Si el
conjunto de todos los valores posibles de la variable aleatoria es finito o contablemente infinito, entonces
la variable aleatoria es discreta, mientras que si el conjunto de todos los valores posibles de la variable
aleatoria es un intervalo, entonces la variable aleatoria es continua.

Descripcin grfica de la variabilidad


Es frecuente usar mtodos grficos simples como ayuda para analizar los datos de un experimento. El

diagrama de puntos, ilustrado en la figura 2-1, es un recurso muy til para representar un cuerpo reduci
do de datos (digamos hasta unas 20 observaciones). El diagrama de pimtos le permite al experimentador
ver de inmediato la localizacin o tendencia central de las observaciones y su dispersin. Por ejemplo, en
el experimento de la fuerza de tensin de adhesin del cemento portland, el diagrama de puntos revela

15

16

17

18

Fuerza
(kgf/cm^)
= 16.76

y 2 17.92

19

20
- Mortero modificado

= Mortero sin modificar

Figura 2-1 Diagrama de puntos de los datos de la fuerza de la tensin de adhesin de la tabla 2-1.

2-2 CONCEPTOS ESTADSTICOS BSICOS


0.15 -

i 0,10

23

30 -

20

I
i

0.05

0.00

10

60

n
65

70

75

tr tti n _ L
80

85

Recuperacin de metal (rendimiento)

Figura 2-2 Histograma de 200 observaciones de la recuperacin de metal (rendimiento) en


un proceso de fundicin.

que probablemente las dos formulaciones difieran en la fuerza promedio, pero que ambas producen
aproximadamente la misma variacin en la fuerza.
Cuando los datos son muy numerosos, es difcil distinguir las observaciones graficadas en un diagra
ma de puntos, y en tal caso sera preferible un histograma. En la figura 2-2 se presenta el histograma de
200 observaciones de la recuperacin de metal (o rendimiento) en un proceso de fundicin. El histogra
ma muestra la tendencia central, la dispersin y la forma general de la distribucin de los datos. Recuerde
que un histograma se construye dividiendo el eje horizontal en intervalos (generalmente de longitud
igual) y trazando un rectngulo sobre el intervaloy-simo con el rea del rectngulo proporcional a n, el
nmero de observaciones incluidas en ese intervalo.
El diagrama de c^ja (o diagrama de c^ a y bigotes) es una manera muy til de representar grfica
mente los datos. En un diagrama de caja se muestra el mnimo, el mximo, los cuartiles inferior y superior
(el percentil 25 y el percentil 75, respectivamente) y la mediana (el percentil 50) en una caja rectangular
alineada horizontal o verticalmente. La caja se extiende del cuartil inferior al cuartil superior y se traza
una lnea por la mediana que atraviesa la caja. Se trazan dos lneas (o bigotes) que se extienden de los ex
tremos de la caja hasta (de manera tpica) los valores mnimo y mximo. (Existen diversas variantes de los
diagramas de caja que tienen reglas diferentes para denotar los puntos mustrales extremos. Ver Montgomery y Runger [83d] para ms detalles.)
En la figura 2-3 se muestran los diagramas de caja de las dos muestras de la fuerza de la tensin de
adhesin en el experimento del mortero de cemento portland. En esta representacin se revela con toda
claridad la diferencia en la fuerza promedio entre las dos formulaciones. Indica asimismo que ambas for
mulaciones producen distribuciones de la fuerza razonablemente simtricas con una variabihdad o dis
persin similar.
Los diagramas de puntos, los histogramas y los diagramas de caja son tiles para resumir la informa
cin de una muestra de datos. Para describir con mayor detalle las observaciones que podran presentarse
en una muestra, se usa el concepto de distribucin de probabilidad.

Distribuciones de probabilidad
La estructura de la probabilidad de una variable aleatoria, por ejemplo), se describe mediante su distri
bucin de probabilidad. Cuando y es discreta, es comn hacer referencia a su distribucin de probabili-

24

CAPTULO 2

EXPERIMENTOS COMPARATIVOS SIMPLES


Diagramas de caja y bigotes

Formulacin del mortero

Figura 2-3 Diagramas de caja del experimento de la fuerza de la ten


sin de adhesin del cemento portland,

dad, por ejemplo p(y), como la fundn de probabilidad de y. Cuando y es continua, es comn hacer
referencia a su distribucin de probabilidad, por ejemplo/(y), como la funcin de densidad de probabili
dad de y.
En la figura 2-4 se ilustran dos distribuciones de probabilidad hipotticas, una discreta y la otra conti
nua. Observe que en la distribucin de probabiUdad discreta es la altura de la funcinp(yy) la que repre
senta la probabilidad, mientras que en el caso continuo, es el rea bajo la curva /(y) asociada con un

a) Una distribucin discreta

Figura 2-4

Distribuciones de probabilidad discreta y continua.

2-2 CONCEPTOS ESTADSTICOS BSICOS

25

intervalo dado la que representa la probabilidad. Un resumen cuantitativo de las propiedades de las dis
tribuciones de probabilidad sera el siguiente:
0<p{yj)<l
P { y = y ) = P{ y )

y discreta:

todos los valores de yj


todos los valores de y

1
todos los

valores de yy

y continua:

o^f(y)
P{a:<y^b)^ f'f( y )d y

Media, varianza y valores esperados


La meda, fi, de una distribucin de probabilidad es una medida de su tendencia central o localizacin.
Matemticamente, la media se define como
/ >/( y) dy

y continua

^yp{y)

>-discreta

(2-1)
ioay

La media tambin puede expresarse en trminos del valor esperado o valor promedio a la larga de la va
riable aleatoria y como

fi = E{y) =

f yf(y)<fy

y continua

^yp(y)

> discreta

(2-2)
toda>>

donde E denota el operador del valor esperado.


La variabilidad o dispersin de una distribucin de probabilidad puede medirse con la varianza, la
cual se define como
/r .( - V " f(y)^

y continua
>-discreta

(2-3)

to d sy

Observe que la varianza puede expresarse exclusivamente en trminos del valor esperado debido a que
(2-4)
Por ltimo, el uso de la varianza es tan frecuente que resulta conveniente definir un operador de la va
rianza V tal que
(2-5)

26

CAPTULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES

Los conceptos de valor esperado y varianza se usan constantemente a lo largo de este libro, y puede
ser til revisar varios resultados elementales relacionados con estos operadores. Si_y es una variable alea
toria con media n y varianza
y c es una constante, entonces

1.

E{c)=c

1.

E{y) = /i

3.

4.

E{cy) = cE{y) = cu
V(c)=0

5.

V(y)=a^

6.

V( cy) ~ c^V(y)

Si hay dos variables aleatorias, por e j e m p lo ,c o n E(yi) =


(Tj, se tiene

7.

K(yi) =

yy^ con (^2) = fi i y

E{y^+y^)=E{y^)+E{y^)=

Es posible demostrar que

8-

V( yi +y 2 ) = V i y , ) + V ( y , ) + 2 Cow(y y , )

donde
C o v j'i,y ,) = E{(y, - //j)(y , - n ^ ) ]

(2-6)

es la covarianza de las variables aleatorias^i yy^. La covarianza es una medida de la asociacin lineal en
tre
y _V2- Ms especficamente, puede demostrarse que si y-^ y
son independientes,^ entonces
CovO-i, y-) = 0. Tambin puede demostrarse que
9-

V(yi - y 2 ) = V ( y , ) + V ( y , ) -

2 Cov ( y

y, )

Si yi y y 2 son independientes, se tiene

10.

V ( y , y , ) = V {y, )+V{y, ) = a+al

11 .

E { y ,- y ,) = E iy , y E { y ,) = ^ n ,- , i,

Sin embargo, observe que, en general,


12.

E ^
\y2.

^E(y,)
E{y,)

sin importar si y^ y y^ son independientes o no.

2-3

M UESTREO Y DISTRIBUCIO NES DE MUESTREO

Muestras aleatorias, media muestral y varianza muestral


El objetivo de la inferencia estadstica es sacar conclusiones acerca de una poblacin utilizando una
muestra de la misma. La mayora de los mtodos que se estudiarn aqu incluyen el supuesto de que se
1 Observe que el recproco no es necesariamente verdadero; es decir, puede tenerse Cov (Vi,3 '2 ) = Oy no obstante esto no implica que
las variables sean independientes. Para un ejemplo, ver Hies y M ontgomeiy ([55] pp. 128-129).

2-3 MUESTREO Y DISTRIBUCIONES DE MUESTREO

27

usan muestras aleatorias. Es decir, si la poblacin contiene N elementos y va a seleccionarse una muestra
d e de ellos, y si cada una de l asN\ / ( N- n) \ nl muestras posibles tiene una probabilidad igual de ser esco
gida, entonces al procedimiento empleado se le llama maestreo aleatorio. En la prctica, en ocasiones es
difcil obtener muestras aleatorias, para lo cual pueden ser tiles las tablas de nmeros aleatorios, como
la tabla XI del apndice.
En la inferencia estadstica se utilizan profusamente cantidades calculadas a partir de las observacio
nes de la muestra. Un estadstico se dene como cualquier funcin de las observaciones de una muestra
que no contiene parmetros desconocidos. Por ejemplo, suponga que;yi,y2,
representa una muestra.
Entonces la media muestral

(2-7)

y la vaanza muestral

yy
n-1

------

(2-8)

son estadsticos. Estas cantidades son medidas de la tendencia central y la dispersin de la muestra, res
pectivamente. En ocasiones se usa S = ViS^, llamada la desviacin estndar muestral, como medida de
dispersin. Los ingenieros suelen preferir el uso de la desviacin estndar para medir la dispersin debi
do a que se expresa en las mismas unidades que la variable de inters y.

Propiedades de la media y la varianza mustrales


La media muestraly es un estimador puntual de la media poblacional fi , y\ a varianza muestral es un es
timador puntual de la varianza poblacional (/. En general, un estimador de un parmetro desconocido es
un estadstico que corresponde con dicho parmetro. Observe que un estimador puntual es una variable
aleatoria. Al valor numrico particular de un estimador, calculado a partir de los datos mustrales, se le
llama una estimacin. Por ejemplo, suponga que quiere estimarse la media y la varianza de la resistencia a
la ruptura de un tipo particular de fibra textil. Se prueba una muestra aleatoria de m = 25 ejemplares de
prueba de la fibra y se registra la resistencia de cada uno de ellos. La media y la varianza mustrales se cal
culan de acuerdo con las ecuaciones 2-7 y 2-8, respectivamente, obtenindose^ = 18.6 y S ^ = 1.20. Por lo
tanto, la estimacin de es y = 18.6 y la estimacin de
es 5^ = 1.20.
U n buen estimador puntual debe tener varias propiedades. Dos de las ms importantes son las si
guientes:
1.

2.

El estimador puntual deber ser insesgado. Es decir, el parmetro que se est estimando deber
ser el promedio o valor esperado a la larga del estimador puntual. Aun cuando la ausencia de ses
go es deseable, esta propiedad por s sola no siempre hace que un estimador sea adecuado.
Un estimador insesgado deber tener la varianza mnima. Esta propiedad establece que el esti
mador puntual de varianza mnima tiene una varianza que es menor que la varianza de cualquier
otro estimador del parmetro en cuestin.

28

CAPTULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES

Es sencillo demostrar que y y 5^ son estimadores insesgados de /My o^, respectivamente. Considere
primero y. Al utilizar las propiedades del valor esperado, se tiene
yi
E{y)^E

n
l y ,
\ =1
/

1
= f
porque el valor esperado de cada observacin^, es^a. Por lo tanto,y es un estimador insesgado de^.
Considere ahora la varianza muestral 5^. Se tiene

E(S^)=E

L"l
n -1
donde 55 =

E(SS)

- y f es la snma de cuadrados corregida de las observaciones y. Entonces


E(SS)=E

(2-9)
L(=i

= i t y - ny^

(2-10)
Por lo tanto.
E{ S ^ ) =

y se observa que

es un estimador insesgado de

EiSS)

2-3 MUESTREO Y DISTRIBUCIONES DE MUESTREO

29

Grados de libertad
A la cantidad - 1 de la ecuacin 2-10 se le llama el nmero de grados de libertad de la suma de cuadra
dos 55. Se trata de un resultado muy general; es decir, si y es una variable aleatoria con varianza y
55 =
tiene v grados de libertad, entonces
(SS\

(2-11)

=o

El nmero de grados de libertad de una suma de cuadrados es igual al nmero de elementos independien
tes en dicha suma de cuadrados. Por ejemplo, 55 =
en la ecuacin 2-9 consiste en la suma de
los cuadrados de los n elementos y i ~ y , y 2 ~y, -- ; J' ~ P- No todos estos elementos son independientes
porque 2 Lj (>>, ->>) = O, de hecho, slo n - 1 de ellos son independientes, lo cual implica que 55 tiene - 1
grados de libertad.
La distribucin normal y otras distribuciones de muestreo
En muchas ocasiones la distribucin de probabilidad de un estadstico particular puede determinarse si se
conoce la distribucin de probabilidad de la poblacin de la que se tom la muestra. A la distribucin de
probabilidad de un estadstico se le llama la distribucin de muestreo. A continuacin se revisan breve
mente varias distribuciones de muestreo tiles.
Una de las distribuciones de muestreo ms importantes es la distribucin normal. Siy es una variable
aleatoria normal, la distribucin de probabilidad de y es
1

- 00 C y c a o

f { y) =

(2-12)

donde - < / < < < es la media de la distribucin y > Oes la varianza. En la figura 2-5 se ilustra la distri
bucin normal.
Debido a que las corridas mustrales que difieren como resultado del error experimental a menudo
se encuentran descritas adecuadamente en la distribucin normal, sta desempea un papel fundamental
en el anlisis de los datos de experimentos diseados. Ihmbin es posible definir muchas distribuciones
de muestreo importantes en trminos de variables aleatorias normales. Con frecuencia se usa la notacin
y ~ NQi, a^) para denotar que y sigue una distribucin normal con media fi y varianza o^.
Un caso especial importante de la distribucin normal es la distribucin normal estndar; es decir,
// = O y
= 1. Se observa que si ~ N(ji, a^), la variable aleatoria
z=

Figura 2-5

La distribucin normal.

y~fi

(2-13)

30

CAPTULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES

sigue la distribucin normal estndar, denotada z ~ N ( 0 ,1). A la operacin ilustrada en la ecuacin 2-13
suele llamrsele la estandarizacin de la variable aleatoria normal_y. En la tabla I del apndice se presen
ta la distribucin normal estndar acumulada.
En muchas tcnicas estadsticas se supone que la variable aleatoria sigue una distribucin normal El
teorema del lmite central es con frecuencia una justificacin de la normalidad aproximada.

TEOREM A 2 - 1 ...............................................................................................................................................
1 teorema del lmite central
Si:Vi,>'2,
es una sucesin de n variables aleatorias independientes que tienen una distribucin idntica
con E(yi) = n y V(y) = (ambas finitas) y x =
+ ... +
entonces

Jna^
tiene una distribucin N ( 0 , 1) aproximada en el sentido de que, si F(z) es la funcin de la distribu
cin de 2 y 4>(2) es la funcin de la distribucin de la variable aleatoria N ( 0 ,1), entonces lm ^ [F(z)/
^(z)] = 1.

Este resultado establece en esencia que la suma de n variables aleatorias independientes que tienen una
distribucin idntica sigue una distribucin aproximadamente normal. En muchos casos esta aproxima
cin es adecuada para valores muy pequeos de n, digamos n < 10, mientras que en otros casos se necesi
ta un valor grande de n, digamos n > 100. Frecuentemente se considera que el error de un experimento
surge de una manera aditiva de varias fuentes independientes; por consiguiente, la distribucin normal se
convierte en un modelo recomendable para el error experimental combinado.
Una importante distribucin de muestreo que puede definirse en trminos de variables aleatorias
normales es la distribucin o ji-cuadrada. Si Zj, Z2, --., z*. son variables aleatorias que tienen una distri
bucin normal e independiente con media Oy varianza 1, cuya abreviatura es N ID (0 ,1), entonces la varia
ble aleatoria
x=z+zl+-+zl
sigue la distribucin ji-cuadrada con k grados de libertad. La funcin de densidad de la distribucin
ji-cuadrada es
^>0

2*/2r k
.2)

(2-14)

En la figura 2-6 se ilustran varias distribuciones ji-cuadrada. La distribucin es asimtrica, o sesgada,


con media y varianza
fi = k
a^=2k
respectivamente. En la tabla III del apndice se presentan los puntos porcentuales de la distribucin
ji-cuadrada.

2-3 MUESTREO Y DISTRIBUCIONES DE MUESTREO

31

Como un ejemplo de una variable aleatoria que sigue la distribucin ji-cuadrada, suponga que
yi, )
es una muestra aleatoria de una distribucin N i/i, a^). Entonces

SS

,
^

---------- (2-15)

Es decir, SS/(^ sigue una distribucin ji-cuadrada con n - 1 grados de libertad.


Muchas de las tcnicas utilizadas en este libro requieren el clculo y la manipulacin de sumas de
cuadrados. El resultado dado en la ecuacin 2-15 es de suma importancia y aparece en mltiples ocasio
nes; cuando una suma de cuadrados de variables aleatorias normales se divide por ( f sigue la distribucin
ji-cuadrada.
Al examinar la ecuacin 2-8, se observa que la varianza muestral puede escribirse como
(2-16)

Si las observaciones de la muestra son NID(//, (f), entonces la distribucin de es [<^/(n ~


Por lo
tanto, la distribucin de muestreo de la varianza muestral es una constante multiplicada por la distribu
cin ji-cuadrada si la poblacin tiene una distribucin normal.
Si 2 y
son variables aleatorias independientes normal estndar y ji-cuadrada, respectivamente, la
variable aleatoria

, =-

sigue la distrbucin t con k grados de libertad, denotada

r[(fc-l-l)/2]

(2-17)

ylxl/k
La funcin de densidad de t es

V ^ r ()fc /2)[(/V)t)+l]<*^'>'"

<<

(2-18)

y la media y la varianza de son /< = Oy = k/(k - 2) para k > 2, respectivamente. En la figura 2-7 se ilus
tran varias distribuciones t. Observe que si A: = <, la distribucin t se convierte en la distribucin normal

32

CAPTULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES

Figura 3-7

Varias distribuciones t.

estndar. En la tabla II del apndice se presentan los puntos porcentuales de la distribucin t. Si)'i,>2,
y es una muestra aleatoria de una distribucin NQi,
entonces la cantidad
y-fi
(2-19)
t=
se distribuye como t con - 1 grados de libertad.
La ltima distribucin de muestreo que consideraremos es la distribucinF. S x y x l soo dos varia
bles aleatorias ji-cuadradaindependientes co n u y v grados de libertad, respectivamente, entonces el co
ciente
xHu
(2-20)
sigue la distribucin F con u grados de libertad en el numerador y v grados de libertad en el denominador.
Si X es una variable aleatoria F con mgrados de libertad en el numerador y v grados de libertad en el deno
minador, entonces la distribucin de probabilidad d e x es
(u+v\
VJ

h(x) =

r f-V
[2

Figura 2-8 Varias distribuciones F.

(u + v )/2

'v\

UJ

.V,

x +1

(2-21)

33

2-4 INFERENCIAS ACERCA DE LAS DIFERENCIAS EN LAS MEDIAS, DISEOS ALEATORIZADOS

En la figura 2-8 se ilustran varias distribuciones F. Esta distribucin es muy importante en el anlisis esta
dstico de experimentos diseados. En la tabla IV del apndice se presentan los puntos porcentuales de la
distribucin F,
Como un ejemplo de un estadstico que sigue una distribucin F, suponga que se tienen dos poblacio
nes normales independientes con varianza comn o^. Siyn.>i23 .
es una muestra aleatoria de i ob
servaciones de la primera poblacin y si>'2dJ'22j >
muestra aleatoria de observaciones de la
segunda, entonces
l

donde Si y S \ son las dos varianzas mustrales. Este resultado se sigue directamente de las ecuaciones
2-15 y 2-20.

2-4

INFERENCIAS ACERCA DE LAS DIFERENCIAS EN LAS MEDIAS,


DISEOS ALEATORIZADOS

Estamos preparados ahora para volver al problema del mortero de cemento portland de la seccin 2-1.
Recuerde que se estaban investigando dos formulaciones diferentes para determinar si difieren en la
fuerza de la tensin de adhesin. En esta seccin se examina cmo pueden analizarse los datos de este ex
perimento comparativo simple utilizando procedimientos de prueba de hiptesis e intervalos de confian
za para comparar las medias de dos tratamientos.
A lo largo de esta seccin se supone que se usa un diseo experimental completamente aleatorizado.
En este diseo, los datos se consideran como si fueran una muestra aleatoria de una distribucin normal.
2'4*1

Prueba de hiptesis

Se retoma ahora el experimento del cemento portland introducido en la seccin 2-1. Recuerde que el in
ters se encuentra en comparar la fuerza de dos formulaciones diferentes: una del mortero sin modificar y
una del mortero modificado. En general, estas dos formulaciones pueden considerarse como dos niveles
del factor formulaciones. Sea que>'ii,>j2, ...,
represente las observaciones del primer nivel del
factor y que^21, , y represente las observaciones del segundo nivel del factor. Se supone que
las muestras se sacan al azar de dos poblaciones normales independientes. En la figura 2-9 se ilustra la
situacin.

Muestra
Nivel 1 del factor

.....y ^ ^

Nivel 2 del factor

Figura 2-9 La situacin del muestreo para la pnieba t de dos muestras.

34

CAPTULO 2

EXPERIMENTOS COMPARATIVOS SIMPLES

U n modelo de los datos


Con frecuencia los resultados de un experimento se describen con un modelo. Un modelo estadstico sim
ple que describe los datos de un experimento como el que acaba de describirse es
i = 1,2
j - 1 , 2,

donde y,j es la observacin ;-sima del nivel i del factor, fjL es la media de la respuesta para el nivel -simo
del factor, y e es una variable aleatoria normal asociada con la observacin ;-sima. Se supone que las e
son NID(0, a \ ), i = 1,2. Se acostumbra hacer referencia a e como el componente del error aleatorio del
modelo. Puesto que las m e d i a s y s o n constantes, se observa directamente a partir del modelo que las
y a son NID(m a \ ), i = 1,2, como se acaba de suponer arriba. Para ms informacin acerca de los modelos
de los datos, referirse al material suplementario del texto.
Hiptesis estadsticas
Una hiptesis estadstica es un enunciado o afirmacin ya sea acerca de los parmetros de una distribu
cin de probabilidad o de los parmetros de un modelo. La hiptesis refleja alguna coi^etura acerca de la
situacin del problema. Por ejemplo, en el experimento del cemento portland, puede pensarse que las
fuerzas de la tensin de adhesin promedio de las dos formulaciones del mortero son iguales. Esto puede
enunciarse formalmente como

donde es la fuerza de la tensin de adhesin promedio del mortero modificado y /<2 es la fuerza de ten
sin de enlace promedio del mortero sin modificar. Al enunciado
se le llama la hiptesis nula y
^ fi 2 se le llama la hiptesis alternativa. A la hiptesis alternativa que se especifica aqu se le llama
hiptesis alternativa de dos colas porque sera verdadera si
< Ut O si /^i > fi 2Para probar una hiptesis se proyecta un procedimiento para tomar una muestra aleatoria, calcular
un estadstico de prueba apropiado para despus rechazar o no estar en posicin de rechazar la hiptesis
nula / q. Parte de este procedimiento consiste en especificar el conjunto de valores del estadstico de
prueba que llevan al rechazo de
A este conjunto de valores se le llama la regin crtica o regin de re
chazo de la prueba.
Pueden cometerse dos tipos de errores cuando se prueban hiptesis. Si la hiptesis nula se rechaza
cuando es verdadera, ha ocurrido un error tipo I. Si la hiptesis nula no se rechaza cuando es falsa, se ha
cometido un error tipo II. Las probabilidades de estos dos errores se expresan con smbolos especiales:
a = P(error tipo I) = /*(rechazar

es verdadera)

^ = P(error tipo II) = /*(dejar de r e c h a z a r |

es falsa)

En ocasiones es ms conveniente trabajar con la potencia de la prueba, donde


Potencia = 1 -

= /*(rechazar

\ // es falsa)

El procedimiento general en la prueba de hiptesis es especificar un valor de la probabilidad a del error


tipo I, llamada con frecuencia el nivel de significacin de la prueba, y despus disear el procedimiento
de prueba de tal modo que la p rob abilidad d el error tipo II tenga un valor convenientemente pequeo.

2-4 INFERENCIAS ACERCA DE LAS DIFERENCIAS EN LAS MEDIAS, DISEOS ALEATORIZADOS

35

La prueba t de dos muestras


Considere que puede suponerse que las varianzas de las fuerzas de la tensin de adhesin fueron idnti
cas para ambas formulaciones del mortero. Entonces el estadstico de prueba que deber usarse para
comparar las medias de dos tratamientos en el diseo completamente aleatorizado es
(2-24)
5
d o n d e y )>2 son las medias mustrales, y 2 son los tamaos de las muestras,
varianza comn af =
calculada a partir de

es una estimacin de la

y
y 5j son las dos varianzas mustrales individuales. Para determinar si deber rechazarse
se comparara tg con la distribucin t con i -l- 2 - 2 grados de libertad. Si |o| >
donde
^aii ni+Tii- 1
punto porcentual a /2 superior de la distribucin t con 1 -1- 2 ~ 2 grados de libertad, en
tonces se rechazara
y se concluira que las fuerzas promedio de las dos formulaciones del mortero de
cemento portland difieren. A este procedimiento de prueba se le llama generalmente la prueba t de dos
muestras.
Este procedimiento puede justificarse de la siguiente manera. Si el muestreo se est haciendo de dis
tribuciones normales independientes, entonces la distribucin d e3^1-y^ es A ^ i - / 2)
+ l/ 2)]lo tanto, si se conociera a^, y si
= /U2 fuera verdadera, la distribucin de

(2-26)

sera JV(0,1). Sin embargo, al sustituir a con 5^ en la ecuacin 2-26, la distribucin de Z cambia de la nor
mal estndar a la distribucin t con n^ + n ^ - 2 grados de libertad. Ahora bien, si
es verdadera, o de la
ecuacin 2-24 se distribuye como
y, por consiguiente, se esperara que 100(1 - a ) por ciento de los
valores de ,, estn entre
+j_2 y Kn.n, +j-2 Una muestra que produjera un valor de q que estuviera
fuera de estos lmites sera inusual si la hiptesis nula fuera verdadera y es evidencia de que
deber re
chazarse. Por lo tanto, la distribucin t con 1 1 ^ +
grados de hbertad es la distribucin de referencia
apropiada para el estadstico de prueba q. Es decir, describe el comportamiento de q cuando la hiptesis
nula es verdadera. Observe que a es la probabilidad del error tipo I de la prueba.
En algunos problemas quiz quiera rechazarse
nicamente si una de las medias es mayor que la
otra. Por lo tanto, se especificara una hiptesis alternativa de una co\&H{.pLi > f 2 yHo slo se rechazara
si h > a,,+j-2- Si se desea rechazar
slo s i e s menor que/2, entonces la hiptesis alternativa es
<
f i 2, y Ha se rechazara si
Para ilustrar el procedimiento, considere los datos del cemento portland de la tabla 2-1. Para estos
datos, se encuentra que
Mortero modiGcado
= 1&76 kgf / cm^

Mortero sin modiGcar


y 2 = 17.92 kgf / cm^

Si = 0.100

S = 0.061

51=0.316

5^=0.247

= 10

2 = 10

36

CAPTULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES

Puesto que las desviaciones estndar mustrales son razonablemente similares, no es improcedente con
cluir que las desviaciones estndar (o las varianzas) poblacionales son iguales. Por lo tanto, puede usarse
la ecuacin 2-24 para probar las hiptesis

Adems, i -I- 2 2 = 10 -I-10 - 2 = 18, y si se elige a = 0.05, entonces ifo'/Wi =


se rechazara si el valor
numrico del estadstico de prueba
ig = 2.101, o si q < -o.025, is = -2.101. Estos lmites de la re
gin crtica se ilustran en la distribucin de referencia ( con 18 grados de libertad) de la figura 2-10.
A l utilizar la ecuacin 2-25 se encuentra que

1 + n ^ - 2
_ 9(0.100)-H9(0.061)
1 0 - 1- 1 0 - 2

= 0.081

y el estadstico de prueba es
3^1->'2

16.76-17.92
0.284V ij+ij
= -9.13
Puesto que = -9.13 < -^0,025. is = -2.101, se rechazara q y se concluira que las fuerzas de la tensin de
adhesin promedio de las dos formulaciones del mortero de cemento portland son diferentes.

Figura 2-10
io.025, 18 =

La distribucin t con 18 grados de libertad con la regin crtica


2.101.

2-4 INFERENCIAS ACERCA DE LAS DIFERENCIAS EN LAS MEDL\S, DISEOS ALEATORIZADOS

37

El uso de valores P en la prueba de hiptesis


Una manera de reportar los resultados de una prueba de hiptesis es estableciendo que la hiptesis nula
fue rechazada o no para un valor de a o nivel de significacin especfico. Por ejemplo, en el experimento
del mortero de cemento portland anterior puede decirse que //://1 = fj-2 se rechaz con el nivel de signifi
cacin 0.05. Esta enunciacin de las conclusiones es con frecuencia inadecuada porque no le ofrece al res
ponsable de la toma de decisiones idea alguna de si el valor calculado del estadstico de prueba apenas
rebas la regin de rechazo o si se adentr bastante en la misma. Adems, al darse los resultados de esta
manera se les impone a otros usuarios de la informacin el nivel de significacin predefinido. Este enfo
que puede ser insatisfactorio porque algunos responsables de la toma de decisiones podran sentirse inc
modos con los riesgos que implica el valor a = 0.05.
Para evitar estas dificultades, en la prctica se ha adoptado extensivamente el enfoque del valor i El
valor P es la probabilidad de que el estadstico de prueba asuma un valor que sea al menos tan extremo
como el valor observado del estadstico cuando la hiptesis nula
es verdadera. Por lo tanto, un valor/*
transmite mucha informacin acerca del peso de la evidencia en contra de H( y, por consiguiente, el res
ponsable de la toma de decisiones puede llegar a una conclusin con cualquier nivel de significacin espe
cificado. En trminos ms formales, el valor se define como el nivel de significacin menor que llevara
a rechazar la hiptesis nula
Se acostumbra decir que el estadstico de prueba (y los datos) es significativo cuando se rechaza la hi
ptesis nula; por lo tanto, el valor P puede considerarse como el menor nivel a en el que los datos son sig
nificativos. Una vez que se conoce el valor P, el responsable de la toma de decisiones puede determinar la
medida en que los datos son significativos sin que el analista de los datos imponga formalmente un nivel
de significacin preseleccionado.
No siempre es sencillo calcular el valor P exacto de una prueba. Sin embargo la mayora de los progra
mas de computacin modernos para reahzar anUsis estadsticos reportan valores P, y pueden obtenerse
tambin en algunas calculadoras porttiles. A continuacin se indicar cmo obtener una aproximacin
del valor P para el experimento del mortero de cemento portland. Por la tabla II del apndice, para una
distribucin t con 18 grados de libertad, la probabilidad menor en el rea de la cola es 0.0005, para la cual
^0.0005,18 = 3.922. Ahora bien, | q | = 9.13 > 3.922, de donde, ya que la hiptesis alternativa es de dos colas,
se sabe que el valor P debe ser menor que 2(0.0005) = 0.001. Algunas calculadoras porttiles tienen la ca
pacidad para calcular valores P. Una de ellas es la HP-48. Utilizando esta calculadora se obtiene el valor P
para el valor q = -9.13 del experimento de la formulacin del mortero de cemento portland como
P = 3.68 X 10**. Por lo tanto, la hiptesis nula/fg:/*i =
se rechazara con cualquier nivel de significacin
a > 3.68 X 10-*.
Solucin por computadora
Hay muchos paquetes de software de estadstica que cuentan con la capacidad para probar hiptesis esta
dsticas. En la tabla 2-2 se presenta la salida del procedimiento para la prueba t de dos muestras de Minitab aplicado al experimento de la formulacin del mortero de cemento portland. Observe que la salida
incluye algunos estadsticos concisos acerca de las dos muestras (la abreviatura SE Mean [SE media]
se refiere al error estndar de la media, s 1 4 ) , as como alguna informacin sobre los intervalos de con
fianza para la diferencia en las dos medias (los cuales se revisan en las secciones 2-4.3 y 2-6). El programa
tambin prueba la hiptesis de inters, permitiendo que el analista especifique la naturaleza de la hipte
sis alternativa (not = [no = ] significa
^ /j) y la eleccin de a (a = 0.05 en este caso).
La salida incluye el valor calculado de el valor P (llamado el nivel de significacin) y la decisin que
debera tomarse dado el valor especificado de a. Observe que el valor calculado del estadstico t difiere hgeramente del valor que se calcul manualmente aqu y que el valor P que se reporta es P = 0.0000. Mu-

38
Tabla 2 -2

CAPTULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES


Prueba t de dos muestras usando Minitab para el experimento del mortero de cem ento pordand
Prueba t de dos muestras e intervalo de confianza

Two s a m p L e T for M o d i f i e d vs Un m o d
Modified
U n mo d

N
10
10

Mea n
16.774
17.922

St D ev
0.309
0.248

SE Mea n
0.098
0.078

95% CI for mu M o d i f i e d - mu Unmod: ( - 1 * 4 1 1 ,


-0.885)
t- Tes t mu M o d i f i e d = mu U n m o d <vs not =): T = - 9 . 1 6
P = 0 . 0 0 0 0 DF = 18
Bo t h use P o o l e d St De v = 0 . 2 8 0

chos paquetes de software no reportarn un valor F real menor que 0.0001 y en su lugar presentan un
valor por omisin. ste es el caso aqu.

Verificacin de los supuestos en la prueba t


Para utilizar el procedimiento de la prueba t se establecen los supuestos de que ambas muestras se toman
de poblaciones independientes que pueden describirse con una distribucin normal, que las desviaciones
estndar o las varianzas de ambas poblaciones son iguales, y que las observaciones son variables aleato
rias independientes. El supuesto de independencia es crtico, pero si el orden de las corridas est aleatorizado (y, de ser apropiado, se seleccionan al azar otras unidades y materiales experimentales), este
supuesto por lo general se satisfar. Los supuestos de la igualdad de las varianzas y la normalidad son fci
les de verificar utilizando una grfica de probabilidad normal.
En general, la graficacin de probabilidades es una tcnica para determinar si los datos mustrales se
ajustan a una distribucin hipotetizada con base en un examen visual subjetivo de los datos. El procedi
miento general es muy simple y puede realizarse rpidamente con la mayora de los paquetes de software
de estadstica. En el material suplementario del texto se analiza la construccin manual de las grficas de
probabilidad normal.
Para construir una grfica de probabilidad, primero se ordenan de menor a mayor las observaciones
de la muestra. Es decir, la muestra^1, 3^2^>> se ordena comoy^lyy^2),
d o n d e e s la observacin
menor, (2) es la segunda observacin menor, y as sucesivamente, cony(, la mayor. Las observaciones or
denadas
se grafican entonces contra sus respectivas frecuencias acumuladas observadas (/' - 0.5)/n. La
escala de la frecuencia acumulada se ha dispuesto de tal modo que si la distribucin hipotetizada describe
de manera adecuada los datos, los puntos graficados estarn aproximadamente sobre una lnea recta; si
los puntos graficados muestran una desviacin significativa de una recta, el modelo hipotetizado no es
apropiado. Generalmente, determinar si los datos graficados pertenecen o no a una recta es una decisin
subjetiva.
Para ilustrar el procedimiento, suponga que quiere verificarse el supuesto de que la fuerza de la ten
sin de adhesin en el experimento de la formulacin del mortero de cemento portland sigue una distri
bucin normal. Inicialmente slo se consideran las observaciones de la formulacin del mortero sin
modificar. En la figura 2-1 la se ilustra una grfica de probabilidad normal generada por computadora. La
mayora de las grficas de probabilidad normal muestran 100(/ - 0.5)/ en la escala vertical izquierda (y en
ocasiones se muestra 100[1 - (/ - 0.5)/] en la escala vertical derecha), con el valor de la variable graficado
en la escala horizontal. Algunas grficas de probabilidad normal convierten la frecuencia acumulada en
un valor z normalizado. Una lnea recta, elegida de manera subjetiva, se ha trazado en medio de los pun-

2-4 INFERENCIAS ACERCA DE LAS DIFERENCIAS EN LAS MEDL^S, DISEOS ALEATORIZADOS

39

a) Mortero sin modificar

b) Mortero modificado

Figura 2-11 Grcas de piobabilidad normal de la fuerza de la tensin de


adhesin en el experimento del cemento portland.

tos graficados. Al trazar la lnea recta, uno deber guiarse ms por los puntos de la parte media de la grfi
ca que por los puntos extremos. Una buena regla emprica es trazar la recta aproximadamente entre los
puntos de los cuartiles 25 y 75. As se determin la recta de la figura 2 -lla . Para evaluar la proximidad
de los puntos a la lnea recta, imagine un lpiz grueso colocado sobre la recta. Si este lpiz imaginario cu
bre todos los puntos, entonces una distribucin normal describe de manera adecuada los datos. Puesto
que los puntos de la figura 2-1 la pasaran la prueba del lpiz grueso, se concluye que la distribucin nor
mal es un modelo apropiado para la fuerza de la tensin de adhesin del mortero sin modificar. En la fi
gura 2-llft se presenta la grfica de probabilidad normal para las 10 observaciones de la fuerza de la
tensin de adhesin del mortero modificado. D e nueva cuenta, se concluira que es razonable el supuesto
de una distribucin normal.
Es posible obtener una estimacin de la media y la desviacin estndar directamente de la grfica de
probabilidad normal. La media se estima como el percentil 50 de la grfica de probabilidad y la desviacin
estndar se estima como la diferencia entre los percentiles 84 y 50. Esto significa que el supuesto de la
igualdad de las varianzas poblacionales en el experimento del cemento portland puede verificarse compa
rando las pendientes de las dos rectas de las figuras 2 -llo y 2-116. Ambas rectas tienen pendientes muy si

40

CAPTULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES

milares, por lo que el supuesto de la igualdad de las varianzas es razonable. Si se viola este supuesto,
deber usarse la versin de la prueba t que se describe en la seccin 2-4.4. En el material suplementario
del texto hay ms informacin acerca de la verificacin de los supuestos de la prueba t.
Cuando ocurren violaciones importantes de los supuestos, se afectar el desempeo de la prueba t.
En general, las violaciones de pequeas a moderadas no son motivo de preocupacin particular, pero no
deber ignorarse cualquier falla de) supuesto de independencia, as como los indicios claros de que no se
satisface el supuesto de normalidad. Tnto el nivel de significacin de la prueba como la capacidad para
detectar diferencias entre las medias sern afectados adversamente por el incumplimiento de estos su
puestos. Un recurso para resolver este problema son las transformaciones. Este tema se analiza con ma
yor detalle en el captulo 3. Tambin es posible utilizar procedimientos no paramtricos para la prueba de
hiptesis cuando las observaciones provienen de poblaciones no normales. Referirse a Montgomery y
Runger [83d] para ms detalles.

Una justificacin alternativa de la prueba t


La prueba t de dos muestras que acaba de presentarse depende en teora del supuesto fundamental de
que las dos poblaciones de las que se seleccionaron las muestras al azar son normales. Aun cuando el su
puesto de normalidad es necesario para desarrollar formalmente el procedimiento de prueba, como ya
se mencion, las desviaciones moderadas de la normalidad no afectarn seriamente los resultados. Puede
argumentarse (por ejemplo, ver Box, Hunter y Hunter [18]) que el uso de un diseo aleatorizado
permite probar hiptesis sin ningn supuesto respecto de la forma de la distribucin. En resumen, el razo
namiento es el siguiente. Si los tratamientos no tienen ningn efecto, todas las [20!/(10!10!)] = 184,756
formas posibles en que podran ocurrir las 20 observaciones son igualmente posibles. Hay un valor de
para cada uno de estos 184,756 posibles arreglos. Si el valor de q que se obtiene en reahdad de los datos es
inusualmente grande o inusualmente pequeo con referencia al conjunto de los 184,756 valores posibles,
es una indicacin de que
^ fJ-2A este tipo de procedimiento se le llama prueba de aleatorizacin. Puede demostrarse que la prueba
t es una buena aproximacin de la prueba de aleatorizacin. Por lo tanto, se usarn aqu pruebas t (y otros
procedimientos que pueden considerarse aproximaciones de pruebas de aleatorizacin) sin prestar de
masiada atencin al supuesto de normalidad. sta es una de las razones por las que un procedimiento
simple, como las grficas de probabiUdad normal, es adecuado para verificar el supuesto de normalidad.

2 -4 .2

E leccin del tamao de la muestra

La eleccin de un tamao de la muestra apropiado es uno de los aspectos ms importantes de cualquier


problema de diseo experimental. La eleccin del tamao de la muestra y la p rob ab ilid ad d el error tipo
II guardan una estrecha relacin. Suponga que se estn probando las hiptesis

y que las medias no son iguales, por lo que =jUi- ^ 2- Puesto queio:|i = no es verdadera, la preocupa
cin principal es cometer la equivocacin de no rechazar io- La probabilidad del error tipo II depende de
la verdadera diferencia en las medias d. A una grfica de contra d para un tamao particular de la mues
tra se le llama la curva de operacin caracterstica, o curva OC, de la prueba. El error y3 tambin es una
funcin del tamao de la muestra. En general, para un valor dado de , el error y3 se reduce cuando el ta*
mao de la muestra se incrementa. Es decir, es ms fcil detectar una diferencia especificada en las me
dias para tamaos grandes de la muestra que para los tamaos pequeos.

Z-4 INFERENCIAS ACERCA DE LAS DIFERENCIAS EN LAS MEDIAS, DISEOS ALEATORIZADOS

41

En la figura 2-12 se muestra un juego de curvas de operacin caracterstica para las hiptesis

paraelcasoenquelasdosvarianzaspoblacionales(Ti^ ya^ son desconocidas pero iguales (a f = o \ = a ^ )


y para un nivel de significacin de a = 0.05. Las curvas tambin parten del supuesto de que los tamaos de
las muestras de las dos poblaciones son iguales; es decir, rii = rt2 = n. El parmetro del eje horizontal de la
figura 2-12 es
,

U l - i 2
2a

H
2a

La divisin de | | por 2a permite al experimentador usar el mismo juego de curvas, independientemente


del valor de la varianza (la diferencia en las medias se expresa en unidades de desviacin estndar). Por
otra parte, el tamao de la muestra usado para construir las curvas es en realidad n* = 2n - 1.
Al examinar estas curvas, se observa lo siguiente:

1. Entre ms grande sea la diferencia en las medias,

-U2, menor ser la probabilidad del error tipo II


para un tamao de la muestra y un valor de a dados. Es dedr, para un tamao de la muestra y un valor
de a especificados, la prueba detectar con mayor facilidad las diferencias grandes que las pequeas.
Cuando el tamao de la muestra se hace ms grande, la probabilidad del error tipo II se hace ms pe
quea para una diferencia en las medias y im valor de a dados. Es decir, para detectar xma diferencia
especificada, puede aumentarse la potencia de la prueba incrementando el tamao de la muestra.

Las curvas de operacin caracterstica son con frecuencia tiles para seleccionar el tamao de la
muestra que debe usarse en un experimento. Por ejemplo, considere el problema del mortero de cemento
portland comentado antes. Suponga que si las dos formulaciones difieren en la fuerza promedio hasta en
0.5 kgf/cm^ sera deseable detectarlo con una probabilidad alta. Por lo tanto, puesto que /i =

Figura 2-12 Curvas de operacin caracterstica para la prueba t de dos


colas con a = 0.05. (Reproducida con permiso de Operating Characteristics Curves for the Common Statistical Tfests of Significance, C.L. Ferris, F.E. Grubbs y C.L. Weaver,
of Mathematical Statistics.)

42

CAPTULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES

0.5 kgfc'cm^ es la diferencia crtica en las medias que quiere detectarse, se encuentra que d, el parmetro
del eje horizontal de la curva de operacin caracterstica de la figura 2-12, es
j
2a

_ 0 .5 _ 0.25
2o
a

Desafortunadamente, d incluye al parmetro desconocido a. Sin embargo, suponga que con base en la ex
periencia previa se piensa que es altamente improbable que la desviacin estndar de cualquiera de las
observaciones de la fuerza exceda 0.25 kg^cm^. Entonces al usar a = 0.25 en la expresin anterior para d
se obtiene d = 1. Si quiere rechazarse la hiptesis nula 95% de las veces cuando//j -/<2 = 0,5, entonces^ =
0.05, y en la figura 2-12 conp = 0.05 y d = 1 se obtiene * = 16, aproximadamente. Por lo tanto, puesto
que n* = 2 - 1, el tamao de la muestra requerido es
*-t-l

16-1-1

y se usaran los tamaos de las muestras


= j = = 9.
En el ejemplo que se ha venido considerando, el experimentador utiliz en realidad un tamao de la
muestra de 10. Quizs el experimentador decidi incrementar ligeramente el tamao de la muestra a fin
de prevenir la posibilidad de que la estimacin previa de la desviacin estndar comn o haya sido dema
siado conservadora y quiz fuera un poco mayor que 0.25.
Las curvas de operacin caracterstica desempean con frecuencia un papel importante en la elec
cin del tamao de la muestra en los problemas de diseo experimental. Su utilizacin a este respecto se
revisa en captulos subsecuentes. Para un anlisis de los usos de las curvas de operacin caracterstica en
otros experimentos comparativos simples similares a la prueba t de dos muestras, vase Montgomery y
Runger [83d].

2-4.3

Intervalos de confianza

Aun cuando la prueba de hiptesis es un procedimiento til, en ocasiones no cuenta la historia completa.
Muchas veces es preferible proporcionar un intervalo dentro del cual cabra esperar que estara incluido
el valor del parmetro o los parmetros en cuestin. A las declaraciones de estos intervalos se les llama in
tervalos de confianza. En muchos experimentos de ingeniera e industriales, el experimentador sabe de
antemano que las medias yUi y 2difieren; por consiguiente, la prueba de la hiptesis 1 =
es de escaso
inters. Por lo general el experimentador estara ms interesado en un intervalo de confianza para la dife
rencia en las medias /i, - //jPara definir un intervalo de confianza, suponga que 6 es un parmetro desconocido. Para obtener
una estimacin del intervalo de 6, es necesario encontrar dos estadsticos L y U tales que la declaracin de
probabilidad

P {L< e< U )= \-a

(2-27)

Le<U

(2-28)

sea verdadera. Al intervalo

se le llama intervalo de confianza de 100(1 - a) por ciento para el parmetro d . La interpretacin de este
intervalo es que si, en mustreos aleatorios repetidos, se construye gran nmero de estos intervalos, 100(1
- a) por ciento de eUos contendrn el verdadero valor de 6. A los estadsticos L y Us e les llama los lmites

2-4 INFERENCIAS ACERCA DE LAS DIFERENCIAS EN LAS MEDIAS, DISEOS ALEATORIZADOS

43

de confianza inferior y superior, respectivamente, y a 1 - a se le llama el coeficiente de confianza. Si a =


0.05, a la ecuacin 2-28 se le llama intervalo de confianza de 95% para e. Observe que los intervalos de
confianza tienen una interpretacin de frecuencia; es decir, no se sabe si la declaracin es verdadera para
esta muestra especfica, pero s se sabe que el mtodo usado para generar el intervalo de confianza produ
ce declaraciones correctas en 100(1 - ) por ciento de las veces.
Suponga que quiere encontrarse un intervalo de confianza de 100(1 ct) por ciento para la verdadera
diferencia de las medias/i - / 2
problema del cemento portland. El intervalo puede deducirse de la
siguiente manera. El estadstico

T
se distribuye como

Por lo tanto.

- t <x/2,wi +H22

a/2,Hi+n2-2

l ~ a

'M
1

=l-a

(2-29)

Al comparar las ecuaciones 2-29 y 2-27, se observa que


y

yi

- ii

/^2

(2-30)
es un intervalo de confianza de 100(1 - a) por ciento para
- fi 2 La estimacin real del intervalo de confianza de 95% para la diferencia en la fuerza de la tensin de
adhesin promedio de las formulaciones del mortero de cemento portland se encuentra haciendo la si
guiente sustitucin en la ecuacin 2-30:
16.76-17.92- (Z 1 0 1 )0 .2 8 4 V ^ ^
- /<2
< 16.76- 17.92+(2.101)0.284V^+T
- 1 . 1 6 - 0 . 2 7 < / i - / 2 -1.16+ 0.27
- 1 . 4 3 < ^ i A2 - 0 .8 9

Por lo tanto, el intervalo de confianza de 95% estimado para la diferencia en las medias se extiende de
-1.43 kgf/cm^ a -0.89 kgf/cm^ Expresado en otros trminos, el intervalo de confianza es^Mj -^2 = - 11 6
k g t W 0.27 kg^cm^ o la diferencia en las fuerzas promedio es -1.16 kgf/cm^ y la precisin de esta esti
macin es de 0.27 kgl^cm^. Observe que como
= Ono est incluida en este intervalo, los datos no
apoyan la hiptesis de que/i = con el nivel de significacin de 5%. Es probable que la fuerza media de
la formulacin sin modificar exceda la fuerza media de la formulacin modificada. Observe que en la ta-

44

C A PiU LO 2

EXPERIMENTOS COMPARATIVOS SIMPLES

bla 2-2 Minitab tambin report este intervalo de confianza cuando se llev a cabo el procedimiento de la
prueba de hiptesis.

2-'4.4

Caso en que a f ^ a \

Si se est probando
^0

y no hay bases para suponer que las varianzas o f y a l son iguales, entonces es necesario hacer ligeras mo
dificaciones en la prueba t de dos muestras. En este caso el estadstico de prueba es
P-31)

V 1 2
Este estadstico no se distribuye exactamente como t. No obstante, t es una buena aproximacin de la dis
tribucin de to si se usa

1
^ = 7 72- / . 2
(^1 ' )
1 - 1

/j,
I

.2
('^2 / 2 )
2 - 1

(2-32)

para los grados de libertad. Una indicacin clara de la desigualdad de las varianzas en una grfica de pro
babilidad normal sera una situacin que requerira esta versin de la prueba t. El lector no deber encon
trar problemas para desarrollar una ecuacin para encontrar ese intervalo de confianza para la diferencia
en las medias en el caso de varianzas desiguales.

2-4.5

Caso en que se conocen <rf y a ]

Si las varianzas de ambas poblaciones se conocen, entonces las hiptesis

pueden probarse utilizando el estadstico


(2-33)

Si ambas poblaciones son normales, o si los tamaos de las muestras son lo suficientemente grandes para
aplicar el teorema del lmite central, la distribucin de
es N ( 0 , 1) si la hiptesis nula es verdadera. Por
lo tanto, la regin crtica se encontrara utilizando la distribucin normal en lugar de la distribucin t.
Especficamente, Hq se rechazara si | Zq | > Z/2, donde Z /2 es el punto porcentual a/2 superior de la dis
tribucin normal estndar.

2-4 INFERENCIAS ACERCA DE LAS DIFERENCIAS EN LAS MEDL\S, DISEOS ALEATORIZADOS

45

A diferencia de la prueba t de las secciones anteriores, en la prueba de las medias con varianzas cono
cidas no se requiere el supuesto de que el muestreo se haga de poblaciones normales. Puede aplicarse el
teorema del lm ite, central para justificar una distribucin normal aproximada para la diferencia en las
medias mustrales
~
El intervalo de confianza de 100(1 - a ) por ciento para^i -^ 2 cuando las varianzas se conocen es
(2-34)

Como ya se seal, el intervalo de confianza es con frecuencia un complemento til del procedimiento de
prueba de hiptesis.

2-4.6

Comparacin de una sola media con un valor especificado

Algunos experimentos incluyen la comparacin de la media ^ de una sola poblacin con un valor especifi
cado, por ejemplo Uq. Las hiptesis son

Si la poblacin es normal con varianza conocida, o si la poblacin no es normal pero el tamao de la mues
tra es lo suficientemente grande para aplicar el teorema del lmite central, entonces la hiptesis puede
probarse utilizando una aplicacin directa de la distribucin normal. El estadstico de prueba es

(T/V

(2-35)

Si

= fJLaes verdadera, entonces la distribucin de Zq es A(0,1). Por lo tanto, la regla de decisin para
es rechazar la hiptesis nula si | Zq > Z/2. El valor de la media/o especificado en la hiptesis
nula se determina por lo general mediante una de las tres formas siguientes. Puede ser resultado de evi
dencia, conocimientos o experimentacin previos. Puede ser resultado de alguna teora o modelo que
describe la situacin bajo estudio. Por ltimo, puede ser resultado de especificaciones contractuales.
El intervalo de confianza de 100(1 - a ) por ciento para la verdadera media poblacional es
y~Z^i^al4<n<y+Z^,^al4

(2-36)

EJEMPLO 2 - 1 .................................................................................................................................................
Un proveedor ofrece lotes de tela a un fabricante de textiles. El fabricante desea saber si la resistencia a la
ruptura promedio excede 200 psi. D e ser as, el fabricante aceptar el lote. La experiencia pasada indica
que un valor razonable para la varianza de la resistencia a la ruptura es lOO(psi)^. Las hiptesis que debe
rn probarse son

Observe que se trata de una hiptesis alternativa de una cola. Por lo tanto, el lote se aceptara slo si la hi
ptesis nula H q.h = 200 pudiera rechazarse (es decir, si Zq > Z).

46

CAPTULO 2

EXPERIMENTOS COMPARATIVOS SIMPLES

Se seleccionan cuatro ejemplares aleatoriamente, y la resistencia a la ruptura promedio observada es


y = 214 psi. El valor del estadstico de prueba es

7/V

10/ V4

Si se especifica un error tipo I de a = 0.05, en la tabla I del apndice se encuentra que Z = Z0.05 = 1.645.
Por lo tanto, io se rechaza y se concluye que la resistencia a la ruptura promedio del lote excede 200 psi.

Cuando no se conoce la varianza de la poblacin, es necesario establecer el supuesto adicional de que


la poblacin sigue una distribucin normal, aunque las desviaciones moderadas de la normalidad no afec
tarn seriamente los resultados.
Para probar
= fiQ en el caso de la varianza desconocida, se usa la varianza muestral para esti
mar o^. A l sustituir o con S en la ecuacin 2-35, se obtiene el estadstico de prueba

La hiptesis nula
/u = Ug se rechazara si | g | > tan., -1>donde t^/2, n-1 denota el punto porcentual a/2
superior de la distribucin t con n - \ grados de libertad. El intervalo de confianza de 100(1 - ) por ciento
es en este caso
(2-38)

2-4.7

Resumen

En las tablas 2-3 y 2-4 se resumen los procedimientos de prueba estudiados aqu para las medias muestraes. Se muestran las regiones crticas para hiptesis alternativa tanto de una como de dos colas.

la b ia 2 -3

Hiptesis

H i'./K flo

Pruebas para medias con varianza conocida

Estadstico de prueba

"

a /- J ^

Criterios de rechazo

2 o < -Z

Ha-th =f^2
yi - ? 2
Hvt^l <

2 o < -Z
V1
Z > Z

2-5 INFERENCIAS ACERCA DE LAS DIFERENCIAS EN LAS MEDIAS, DISEOS DE COMPARACIONES PAREADAS

47

labia 2-4 Pruebas para medias de distribuciones normales,


__________varianza desconocida_________________________

Hiptesis

Estadstico de prueba Criterios de rechazo

= fia

Uol> t.

= ^0
Hyfi>
si al = al
=f^2

Uol^ ^0/2,1)
1 n,
V =l + fl2 2
si a ^ (Tj

Mofli =
Hi-Hi <

fo<-c,v
,

^1-^2
V1

"2
O> ,v

V=

2-5

2'5.1

iJL L ^+(A U hf
2 -1

INFERENCIAS ACERCA DE LAS DIFERENCIAS E N LAS M EDIAS,


DISEOS DE COM PARACIONES PAREADAS
El problema de las comparaciones pareadas

En algunos experimentos comparativos simples puede conseguirse un mejoramiento significativo de la


precisin haciendo comparaciones de observaciones pareadas del material experimental. Por ejemplo,
considere una mquina para probar la dureza que presiona una barra con una punta afilada sobre un
ejemplar de prueba de metal con una fuerza conocida. Al medir la profundidad de la depresin producida
por la punta, se determina la dureza del ejemplar de prueba. En esta mquina pueden instalarse dos pun
tas diferentes y aun cuando la precisin (la variabilidad) de las mediciones hechas con las dos puntas pa
rece ser la misma, se sospecha que una de las puntas produce diferentes lecturas de la dureza que la otra.
Sera posible realizar im experimento de la siguiente manera. Podran seleccionarse al azar varios
ejemplares de prueba del metal (por ejemplo, 20). La mitad de estos ejemplares de prueba podran pro
barse con la punta 1 y la otra mitad con la punta 2. La asignacin exacta de los ejemplares a las puntas se
determinara de manera aleatoria. Puesto que se trata de un diseo completamente aleatorzado, la dure
za promedio de las dos muestras podra compararse utilizando la prueba t descrita en la seccin 2-4.
Al reflexionar un poco al respecto, se descubrira una seria desventaja del diseo completamente
aleatorzado en este problema. Suponga que los ejemplares de prueba del metal se cortaron de barras di

48

CAPTULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES

ferentes que se fabricaron a temperaturas diferentes o que no fueran exactamente homogneos en cual
quier otra forma que pudiera afectar la dureza. Esta falta de homogeneidad entre los ejemplares
contribuir a la variabilidad de las mediciones de la dureza y tender a inflar el error experimental, ha
ciendo ms difcil detectar una diferencia real entre las puntas.
Para protegerse de esta posibilidad, considere un diseo experimental alternativo. Suponga que cada
ejemplar de prueba tiene el tamao suficiente para que puedan hacerse en l dos determinaciones de la
dureza. Este diseo alternativo consistira en dividir cada ejemplar de prueba en dos secciones, para des
pus asignar de manera aleatoria una punta a una mitad de cada ejemplar de prueba y la otra punta a la
otra mitad. El orden en que se prueban las puntas en un ejemplar de prueba particular se seleccionara al
azar. El experimento, cuando se llev a cabo de acuerdo con este diseo con 10 ejemplares de prueba,
produjo los datos (codificados) que se muestran en la tabla 2-5.
Un modelo estadstico que describe los datos de este experimento puede expresarse como
\i = 1, 2

d o n d e e s la observacin de la dureza para la punta i en el ejemplar de pruebaj, fi es la verdadera dureza


promedio de la punta i-sima, es un efecto sobre la dureza debido al ejemplar de pruebay-simo, y sj es
el error experimental aleatorio con media cero y varianza a f . Es decir, a f es la varianza de las mediciones
de la dureza hechas con la punta 1 y ct ^ es la varianza de las mediciones de la dureza hechas con la punta 2.
Observe que si se calcula la diferencia pareada ;-sima
dj = y i j - y 2 j

7 = 1 , 2 , . . . , 10

(2-40)

el valor esperado de esta diferencia es

= ^(yij-y2j)
= E(y,.)-E (y,j)

Es decir, pueden hacerse inferencias acerca de la diferencia en las lecturas de la dureza promedio de las
dos puntas/i -/2 haciendo inferencias acerca de la media de las d i f e r e n c i a s O b s e r v e que el efecto adi-

Tabla 2-5

Datos del experimento de


la prueba de la dureza

Ejemplar de prueba Punta 1 Punta 2


7
6
1
2
3
3
3
3
5
4
4
3
5
8
8
6
3
2
7
2
4
8
9
9
9
5
4
10
4
5

2-5 INFERENCIAS ACERCA DE LAS DIFERENCIAS EN LAS MEDIAS, DISEOS DE COMPARACIONES PAREADAS

49

tivo de las de los ejemplares de prueba se cancela cuando las observaciones estn pareadas de esta ma
nera.
Probar
= fi^ es equivalente a probar
H ,.n, = 0
El estadstico de prueba para esta hiptesis es
d

r =

(2-41)

donde
(2-42)
es la media maestral de las diferencias y
~W

VI

1/2

;=1

(2-43)

y-1

-1

-1

es la desviacin estndar muestral de las diferencias.


= Ose rechazara si | q 1 >
- 1- Debido a
que las observaciones de los niveles del factor estn pareadas en cada unidad experimental, a este pro
cedimiento suele llamrsele prueba t pareada.
Por los datos de la tabla 2-S, se encuentra
dj = 7 - 6 = l
d ,= Z -l= \
d^ = 3 _ 3 = 0

d, = 2 - 4 = - 2

d j= 3 -5 = -2

dg = 9 - 9 = 0

=4-3=1

d, = 5 - 4 = 1

dj = 8 - 8 = 0

dj=4-5= -l

Por lo tanto,

1/2
ri3-5^ (-i)n
5 .=

10-1

n -1

1/2

1.20

Suponga que se elige ex = 0.05. Entonces, para tomar una decisin se calculara to y H qse rechazara si | qI
^ ^0.025, 9 ~ 2.262.
El valor calculado del estadstico de prueba t pareada es

0.10

1 .2 0 /Vio
= -0 .2 6

Figura 2-13 La distribucin de referencia (t con 9 grados de libertad)


para el problema de la prueba de la dureza.

y como Iq I =0.26:^ o.025.9 = 2.262, la hiptesis


= Ono puede rechazarse. Es decir, no hay evidencia
que indique que las dos puntas producen lecturas de la dureza diferentes. En la figura 2-13 se muestra la
distribucin de con 9 grados de libertad, la distribucin de referencia para esta prueba, con el valor de
indicado en relacin con la regin crtica.
En la tabla 2-6 se muestra la salida de computadora del procedimiento para la prueba t pareada de
Minitab para este problema. Observe que el valor P para esta prueba es P = 0.80, lo cual implica que no
puede rechazarse la hiptesis nula con ningn nivel de significacin razonable.

2'5.2

Ventajas del diseo de comparaciones pareadas

A l diseo que se utiliz en reaUdad para este experimento se le llama diseo de comparaciones pareadas,
el cual ilustra el principio de la formacin de bloques comentado en la seccin 1-3. D e hecho, es un caso
especial de un tipo de diseo ms general llamado diseo de bloques aleatorizados. El trmino bloque se
refiere a una unidad experimental relativamente hom ognea (en el caso tratado aqu, los ejemplares
de prueba del metal son los bloques), y el bloque representa una restriccin sobre la aleatorizacin com
pleta debido a que las combinaciones de los tratamientos slo se aleatorizan dentro del bloque. En el ca
ptulo 4 se examina este tipo de diseos. En dicho captulo el modelo matemtico del diseo, la ecuacin
2-39, se escribe en una forma ligeramente diferente.

Tabla 2-6

Resultados de Minitab de la prueba t pareada para el ejemplo de la prueba de la dureza


Prueba t pareada e intervalo de confianza

Pa i r e d T for T1p 1 - Tip 2


Ti p 1
Tip 2
Di f f e r e n c e

Mean

4. 8 0 0
4.900

10
10

10

0.100

StDev

2.39 4
2. 2 34
1 .197

95% CI for m e a n d i f f e r e n c e : ( - 0 . 9 5 6 , 0. 756)


t-Test of m ea n d i f f e r e n c e = O (vs not = 0):
T-Value = -0.26
P - V a l u e = 0 . 79 8

SE Mean

0 . 757
0 . 706
0 . 379

2'6 INFERENCIAS ACERCA DE LAS VARIANZAS DE DISTRIBUCIONES NORMALES

51

Antes de dejar este experimento, es necesario destacar varios puntos. Observe que, aun cuando se
han hecho 2n = 2(10) = 20 observaciones, se cuenta nicamente con n - 1 = 9 grados de libertad para el
estadstico t. (Se sabe que conforme se incrementan los grados de libertad para t, la prueba se hace ms
sensible.) Al hacer la formacin de bloques o pareo, se han perdido en realidad n - \ grados de libertad,
pero se espera haber ganado un mejor conocimiento de la situacin al eliminar una fuente adicional de
variabilidad (la diferencia entre los ejemplares de prueba). Puede obtenerse una indicacin de la caUdad
de la informacin producida por el diseo pareado comparando la desviacin estndar de las diferen
cias con la desviacin estndar combinada que habra resultado si el experimento se hubiera conducido
de manera completamente aleatorizada y se hubieran obtenido los datos de la tabla 2-5. Al utilizar los da
tos de la tabla 2-5 como dos muestras independientes, la desviacin estndar combinada que se calcula
con la ecuacin 2-25 es S, = 2.32. Al comparar este valor con
= 1.20, se observa que la formacin de
bloques o pareo ha reducido la estimacin de la variabilidad en cerca de 50%. Esta informacin tambin
puede expresarse en trminos de un intervalo de confianza para^i -/<2. Utilizando los datos pareados, un
intervalo de confianza de 95% para^i - ^ 2 es
^ ^0.025,9^ /
-0.10(2.262)(1.20)/V O
-

0. 10 + 0.86

Recprocamente, al utilizar el anlisis combinado o independiente, un intervalo de confianza de 95%


para
1
~

3^ 2

^ 0 . 0 2 5 , 1

4 . 8 0 - 4 .9 0 (2 1 0 1 )( 2 .3 2 )V 5 ^
- 0.10 2.18
El intervalo de confianza basado en el anlisis pareado tiene una anchura sensiblemente menor que el in
tervalo de confianza del ansis independiente. Esto ilustra la propiedad de reduccin del ruido de la for
macin de bloques.
La formacin de bloques no es siempre la mejor estrategia de diseo. Si la variabilidad dentro de los
bloques es la misma que la variabilidad entre los bloques, la varianza de3^1- 3^2ser la misma independien
temente del diseo que se use. D e hecho, la formacin de bloques en esta situacin sera una eleccin de
diseo pobre porque la formacin de bloques produce la prdida de n - 1 grados de libertad y llevar en
realidad a un intervalo de confianza con una anchura mayor para/ 1- f i 2. En el captulo 4 se ofrece una re
visin ms amplia de la formacin de bloques.

2-6

INFERENCIAS ACERCA DE LAS VA RIA NZA S


DE DISTRIBUCIO NES NORMALES

En muchos experimentos, el inters se encuentra en las posibles diferencias en la respuesta media de dos
tratamientos. Sin embargo, en algunos experimentos es la comparacin de la variabihdad en los datos lo
que es importante. En la industria de alimentos y bebidas, por ejemplo, es importante que la variabilidad
del equipo de llenado sea pequea para que todos los empaques estn cerca del peso neto nominal o el

52

CAPTULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES

volumen del contenido neto nominal. En los laboratorios qumicos, tal vez quiera compararse la variabili
dad de dos mtodos de anlisis. A continuacin se examinan brevemente las pruebas de hiptesis y los in
tervalos de confianza para las varianzas de distribuciones normales. A diferencia de las pruebas para las
medias, los procedimientos para las pruebas de varianzas son bastante ms sensibles al supuesto de nor
malidad. En el apndice 2A de Davies [36] hay un buen anlisis del supuesto de normalidad.
Suponga que quiere probarse la hiptesis de que la varianza de una poblacin normal es igual a una
constante, por ejemplo, a l - Expresado en trminos formales, quiere probarse
.: = <

(2-44)

El estadstico de prueba para la ecuacin 2-44 es


,

55

(-1)5^

al
donde 55 = S ljy , - y Y es la suma de cuadrados corregida de las observaciones mustrales. La distribu
cin de referencia apropiada p a r a es la distribucin ji-cuadrada con n - 1 grados de libertad. La hipte
sis nula se rechaza si /^ > x l i 2 .n-iOsixl
son los puntos porcentua
les a/2 superior y 1 - (a/2) inferior de la distribucin ji-cuadrada con n - grados de libertad,
respectivamente. En la tabla 2-7 se presentan las regiones crticas para las hiptesis alternativas de una
cola. El intervalo de confianza de 100(1 - a ) por ciento para
es
( - 1 )5 "

Aa/2,n-l

(-1)5^
Al-(a/2),~l

Considere ahora la prueba de la igualdad de las varianzas de dos poblaciones normales. Si se toman
muestras aleatorias independientes de tamao j y 2 de las poblaciones 1 y 2, respectivamente, el estads
tico de prueba para
^2-47)

es el cociente de las varianzas mustrales


^o = |

(2-48)

La distribucin de referencia apropiada para Fq es la distribucin F con n ^ - l grados de libertad en el nu


merador y 2 - 1 grados de libertad en el denominador. La hiptesis nula se rechazara si
> F^,^ , _i ^_i
o si o <
-!,,-!> donde
y
denotan los puntos porcentuales a/2 superior
y 1 - (a/2) inferior de la distribucin F con i - 1 y - 1 grados de libertad. En la tabla IV del apndice
slo aparecen los puntos porcentuales para la cola superior de F; sin embargo, los puntos de las colas su
perior e inferior se relacionan por

(2-49)

2-6 INFERENCIAS ACERCA DE LAS VARIANZAS DE DISTRIBUCIONES NORMALES

Hiptesis

Criterios de rechazo

Estadstico de prueba

X\ >
Xa
(n-ir
H^.o^

< al

H {.a^

> al

H ,:al= a
H { .a \

* al

xl

< o\

o
Z l- B / 2,n -l

<x t .^ -1

xl > xlj,-
F-^1
S

F < F

^ -^,0 2 -1 ,n^-1

H ,:al= a\
H-;.al

53

"-1

H ,:al= a\
H { .a l

> a\

En el captulo 3, seccin 3-4.3, se analizan los procedimientos de prueba para ms de dos varianzas. Se re
visar tambin el uso de la varianza o la desviacin estndar como variable de respuesta en situaciones ex
perimentales ms generales.

EJEMPLO ..........................................................................................................................................................
Un ingeniero qumico investiga la variabilidad inherente de dos tipos de equipo de prueba que pueden
usarse para monitorear la produccin de un proceso. El ingeniero sospecha que el equipo antiguo, tipo 1,
tiene una varianza mayor que la del equipo nuevo. Por lo tanto, quiere probar las hiptesis

Se toman dos muestras aleatorias de = 12 y 2 = 10 observaciones, y las varianzas mustrales son


14.5 y S i = 10.8. El estadstico de prueba es

14.5

" " S i ~ 10.8

En la tabla IV del apndice se encuentra que f oos. n. 9 = 3.10, por lo que no puede rechazarse la hiptesis
nula. Es decir, se ha encontrado evidencia estadstica insuficiente para concluir que la varianza del equipo
antiguo sea mayor que la varianza del equipo nuevo.
El intervalo de confianza de 100(1 - a ) por ciento para el cociente de las varianzas poblacionales
a l I a \ es
C2
fj2
C2
*^1 r.
< _L < ^ F
r'2-50'
cZ

_ 2

C2
V
/
^2
^2 ^2

54

CAPTULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES

Para ilustrar el uso de la ecuacin 2-50, el intervalo de confianza de 95% para el cociente de las varianzas
ff? I a \ del ejemplo 2-2 es, utilizando ^ 0.035, 9,11 = 3.59 y ^0.975,9.11 = l/i"o.o25,ii.9 = 1/3.92 = 0.255,

5 4 -= '
^2

0.34<^ ^ 4.81
al

2-7

PROBLEMAS

2-1.

Se requiere que la resistencia a la ruptura de una fibra sea de por lo menos 150 psi. La e3q>eriencia pasada in
dica que la desviacin estndar de la resistencia a la ruptura es <r = 3 psi. Se prueba una muestra aleatoria de
cuatro ejemplares de prueba, y los resultados son >^1 = 145,
= 153, y, = 150 y y4 = 147.
d) Enunciar las hiptesis que el lector considere que deberan probarse en este experimento.
b) Probar estas hiptesis utilizando a = 0.05. A qu conclusiones se llega?
c) Encontrar el valor P para la prueba del inciso b.
d) Construir un intervalo de confianza de 95% para la resistencia a la ruptura promedio,
2-2. Supuestamente, la viscosidad de un detergente lquido debe promediar 800 centistokes a 25C. Se colecta
una muestra aleatoria de 16 lotes del detergente, y la viscosidad promedio es 812. Suponga que se sabe que la
desviacin estndar de la viscosidad es <r = 25 centistokes.
a) Enunciar las hiptesis que debern probarse.
b) Probar estas hiptesis utilizando a = 0.05. A qu conclusiones se llega?
c) Cul es el valor P para la prueba?
d) Encontrar un intervalo de confianza de 95% para la media.
2-3. Los dimetros de las flechas de acero producidas en cierto proceso de manufactura debern tener un prome
dio de 0.255 pulgadas. Se sabe que el dimetro tiene una desviacin estndar de a = 0.0001 pulgadas. Una
muestra aleatoria de 10 flechas tiene un dimetro promedio de 0,2545 pulgadas,
a) Establecer las hiptesis apropiadas para la media /.
b) Probar estas hiptesis utilizando a = 0,05. A qu conclusiones se llega?
c) Encontrar el valor P para esta prueba.
d) Construir un intervalo de confianza de 95% para el dimetro promedio de las flechas.
2-4. Una variable aleatoria con una distribucin normal tiene una media desconocida fi y varianza 0 ^= 9. Encon
trar el tamao de la muestra que se necesita para construir un intervalo de confianza de 95% para la media,
cuya anchura total sea de 1.0.
2-5. La vida de anaquel de una bebida carbonatada es motivo de inters. Se seleccionan 10 botellas al azar y se
prueban, obtenindose los siguientes resultados:
Das
108
124
124
106
115

138
163
159
134
139

a) Quiere demostrarse que la vida media de anaquel excede los 120 das. Establecer las hiptesis apropia
das para investigar esta afirmacin.
b) Probar estas hiptesis utilizando a = 0.01. A qu conclusiones se llega?

2-7 PROBLEMAS

2-6,

2-7.

55

c) Encontrar el valor P para la prueba del inciso b.


d) Construir un intervalo de confianza de 99% para la vida media de anaquel.
Considere los datos de la vida de anaquel del problema 2-5. La vida de anaquel puede describirse o mode
larse adecuadamente con una distribucin normal? Qu efecto tendra la violacin de este supuesto sobre
el procedimiento de prueba usado para resolver el problema 2-5?
El tiempo para reparar un instrumento electrnico es una variable aleatoria medida en horas que sigue una
distribucin normal. El tiempo de reparacin de 16 de estos instrumentos elegidos al azar es el siguiente:

159
224
222
149

280
379
362
260

Horas
101
179
168
485

212
264
250
170

a) Quiere saberse si el tiempo de reparacin promedio excede 225 horas. Establecer las hiptesis apropia
das para investigar esta cuestin.
b) Probar las hiptesis que se formularon en el inciso a. A qu conclusiones se llega? Utilizar a = 0.05.
c) Encontrar el valor P para la prueba.
d) Construir un intervalo de confianza de 95% para el tiempo de reparacin promedio.
2-8, Considere nuevamente los datos del tiempo de reparacin del problema 2-7. En opinin del lector, el tiem
po de reparacin puede modelarse de manera adecuada con una distribucin normal?
2-9. Se utilizan dos mquinas para llenar botellas de plstico con un volumen neto de 16.0 onzas. Puede suponer
se que el proceso de llenado es normal, con desviaciones estndar de ct, = 0.015 y = 0.018. El departamen
to de ingeniera de calidad sospecha que ambas mquinas llenan el mismo volumen neto, sin importar si este
volumen es 16,0 onzas o no. Se realiza un experimento tomando una muestra aleatoria de la produccin de
cada mquina.

Mquina 1__________ Mquina 2


16.02
16.03
16.01
16.04
15.96
15.97
15.98
15.96
16.05
16.01
16.05
16.02
15.99
15.99
16.02

a)
b)
c)
d)
2-10,

16.03
16.04
16.02
16.01
16.00

Enunciar las hiptesis que debern probarse en este experimento,


Probar estas hiptesis utilizando a = 0.05, A qu conclusiones se llega?
Encontrar el valor F para esta prueba,
Encontrar un intervalo de confianza de 95 %para la diferencia en el volumen de llenado promedio de las
dos mquinas,
Un fabricante de calculadoras electrnicas puede usar dos tipos de plstico. La resistencia a la ruptura de
este plstico es importante. Se sabe que <7i = CTj = 1,0 psi. De muestras aleatorias deni = 10y2 = 12se obtie
ne y, = 162,5 y = 155.0. La compaa no emplear el plstico 1 a menos que su resistencia a la ruptura ex
ceda la del plstico 2 por al menos 10 psi. Con base en la informacin muestral, deber usarse el plstico 1?
Para responder esta pregunta se deben establecer y probar las hiptesis apropiadas utihzando a = 0,01,
Construir un intervalo de confianza de 99% para la verdadera diferencia media en la resistencia a la ruptura.

56

2-11.

CAPTULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES

A continuacin se presenta el tiempo de combustin de dos cohetes qumicos con formulaciones diferentes.
Los ingenieros de diseo se interesan tanto en la media como en la varianza del tiempo de combustin.

65
81
57
66
82

2-12.

2-13.

2-14.

Tipo 1
82
67
59
75
70

Tipo 2
64
71
83
59
65

56
69
74
82
79

a) Probar la hiptesis de que las dos varianzas son iguales. Utilizar a 0.05.
b) Utilizando los resultados del inciso a, probar la hiptesis de que los tiempos de combustin promedio
son iguales. Utilizar a = 0.05. Cul es el valor P para esta prueba?
c) Comentar el papel del supuesto de normalidad en este problema. Verificar el supuesto de normalidad
para ambos tipos de cohetes,
En un artculo de Solid State Technology, Diseo ortogonal para optimizacin de procesas y su aplicacin en
el grabado qumico con plasma de G.Z. Yin y D.W, Jllie, se describe un experimento para determinar el
efecto de la velocidad del flujo de
sobre la uniformidad del grabado en una oblea de silicio usada en la
fabricacin de circuitos integrados. Los datos de la velocidad del flujo son los siguientes:

Observacin de la uniformidad

Flujo de
QF,

125
200

2,7
4.6

4.6
3.4

2.6
2.9

3.0
3.5

3.2
4,1

6
3.8
5,1

a) La velocidad del flujo de CjFs afecta la uniformidad del grabado promedio? Utilizar a = 0.05.
b) Cul es el valor P para la prueba del inciso a?
c) La velocidad del flujo de
afecta la variabilidad de una oblea a otra en la uniformidad del grabado?
Utilizar a = 0.05.
d) Tlrazar diagramas de caja que ayuden a interpretar los datos de este experimento.
Se instala un nuevo dispositivo de filtrado en una unidad qumica. Antes de instalarlo, de una muestra alea
toria se obtuvo la siguiente informacin sobre el porcentaje de impurezas; >1 = 12.5, 5/ = 101.17 y i = 8.
Despus de instalarlo, de una muestra aleatoria se obtuvo
= 10.2,
= 94.73, 2 = 9.
a) Puede concluirse que las dos varianzas son iguales? Utilizar a = 0.05.
b) El dispositivo de filtrado ha reducido de manera significativa el porcentaje de impurezas? Utilizar a =
0.05.
Se hacen 20 observaciones de la uniformidad del grabado en obleas de silicio durante un experimento de eva
luacin de un grabador de plasma. Los datos son los siguientes:
5,34
6.00
5.97
5.25

6.65
7.55
7.35
6.35

4.76
5.54
5.44
4.61

5.98
5.62
4.39
6.00

7.25
6,21
4,98
5.32

a) Construir una estimacin con un intervalo de confianza de 95% de


b) Probar la hiptesis de que
= 1.0. Utilizar a = 0.05. A qu conclusiones se llega?

2-7 PROBLEMAS

c)
d)
2-15.

57

Comentar el supuesto de normalidad y su papel en este problema.


Verificar la normalidad construyendo una grfica de probabilidad normal. A qu conclusiones se

llega?
D oce inspectores midieron el dimetro de un cojinete de bolas, utilizando cada uno dos tipos diferentes de
calibradores. Los resultados fueron

Inspector

Calibrador 1

1
2
3
4
5
6
7
8
9
10
11
12

0.265
0.265
0.266
0.267
0.267
0.265
0.267
0.267
0.265
0.268
0.268
0.265

Calibrador 2
0.264
0.265
0.264
0.266
0.267
0.268
0.264
0,265
0.265
0.267
0.268
0.269

a)

2-16.

Existe una diferencia significativa entre las medias de la poblacin de mediciones de las que se seleccio
naron las dos muestras? Utilizar a = 0.05.
h) Encontrar el valor P para la prueba del inciso a.
c) Construir un intervalo de confianza de 95 % para la diferencia en las med iciones de los dimetros prome
dio para los dos tipos de calibradores.
En un artculo de Journal ofStrain Anafysis (vol. 18, no. 2) se comparan varios procedimientos para predecir
la resistencia al corte de vigas de placas de acero. Los datos para nueve vigas en la forma del cociente de la
carga predicha y la observada para dos de estos procedimientos, los m todos Karlsruhe y Lehigh, son los si
guientes

a)

Viga

Mtodo Karlsruhe

Sl/1
S2/1
S3/1
S4/1
S5/1
S2/1
S2/2
S2/3
S2/4

1.186
1.151
1.322
1.339
1.200
1.402
1.365
1.537
1.559

Mtodo Lehigh
1.061
0.992
1.063
1.062
1.065
1.178
1.037
1.086
1.052

b)
c)

Existe alguna evidencia que apoye la afirmacin de que hay una diferencia en el desempeo promedio
entre los dos mtodos? Utilizar a = 0.05.
Cul es el valor P para la prueba del inciso a?
Construir un intervalo de confianza de 95 % para la diferencia en la carga promedio predicha y la obser

d)
e)
f)

vada.
Investigar el supuesto de normalidad en ambas muestras.
Investigar el supuesto de normalidad para la diferencia en los cocientes para los dos mtodos.
Comentar el papel del supuesto de normalidad en la prueba pareada.

58

2-17.

CAPTULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES

Se estudia la temperatura de deflexin bajo carga de dos formulaciones diferentes de un tubo de plstico
ABS. Dos muestras de 12 observaciones cada una, se preparan utilizando cada formulacin y las temperatu
ras de deflexin (en F) se presentan abajo;

206
188
205
187

2-18.
2-19.

Formulacin 1
193
192
207
210
185
194
189
178

2-21.

Formulacin 2
176
185
200
197

198
188
189
203

a) Construir las grficas de probabilidad normal para ambas muestras. Estas grficas apoyan los supuestos
de normalidad y de la igualdad de la varianza de ambas muestras?
b) Los datos apoyan la afirmacin de que la temperatura promedio de deflexin bajo carga de la formula
cin 1 excede la de la formulacin 2? Utilizar a = 0.05.
c) Cul es el valor P para la prueba del inciso a?
Referirse a los datos del problema 2-17. Los datos apoyan la afirmacin de que la temperatura promedio de
deflexin bajo carga de la formulacin 1 excede la de la formulacin 2 en al menos 3F?
En la fabricacin de semiconductores es comn el uso del grabado qumico hmedo para eliminar el silicio
de la parte posterior de las obleas antes de la metalizacin. La rapidez del grabado es una caracterstica im
portante de este proceso. Se estn evaluando dos soluciones de grabado diferentes. Se grabaron ocho obleas
seleccionadas al azar en cada solucin, y las cifras de la rapidez del grabado observada (en milsimas de pulgada/min) se muestran abajo

9.9
9.4
10.0
10.3

2-20.

177
197
206
201

Solucin 1
10.6
10.3
9.3
9.8

Solucin 2
10.2
10.6
10.0
10.2
10.7
10.4
10.5
10.3

fl) Los datos indican que la afirmacin de que ambas soluciones tienen la misma rapidez de grabado pro
medio es verdadera? Utilizar a = 0.05 y suponer la igualdad de las varianzas.
b) Encontrar un intervalo de confianza de 95 %para la diferencia en la rapidez de grabado promedio.
c) Usar grficas de probabilidad normal para investigar la adecuacin de los supuestos de normalidad e
igualdad de las varianzas.
Se estn comparando dos populares analgsicos con base en la rapidez de absorcin del cuerpo. Especfica
mente, se afirma que la tableta 1 se absorbe con el doble de rapidez que la tableta 2. Suponer que y se
conocen. Desarrollar un estadstico de prueba para

Suponga que se est probando


=H2
^ f2

2-22.

donde o y al se conocen. Los recursos para hacer el muestreo son limitados, por lo que -t- = N. Cmo
debern asignarse las N observaciones entre las dos poblaciones para obtener la prueba con la potencia ms
alta?
Desarrollar la ecuacin 2-46 para un intervalo de confianza de 100(1 - a) por ciento para la varianza de una
distribucin normal.

2-7 PROBLEMAS

2-23,
2-24.

2-25.

59

Desarrollar la ecuacin 2-50 para un intervalo de confianza de 100(1 - a) por ciento para el cociente a\ / a,
donde a y d\ son las varianzas de dos distribuciones normales.
Desarrollar una ecuacin para encontrar un intervalo de confianza de 100(1 - a) por ciento para la diferen
cia en las medias de dos distribuciones normales donde ^ a^. Aplicar la ecuacin desarrollada a los datos
del experimento del cemento portland, y encontrar un intervalo de confianza de 95%.
Construir un conjunto de datos para los que el estadstico de prueba t pareada sea muy grande, pero para el
cual el estadstico de prueba t de dos muestras o combinada usual sea pequeo. En general, describir cmo se
crearon los datos. Le da esto al lector alguna idea respecto de cmo funciona la prueba t pareada?

Experimentos con un solo


factor: el anlisis de varianza

En el captulo 2 se analizaron los mtodos para comparar dos condiciones o tratamientos. Por ejemplo, el
experimento de la ftxerza de la tensin de adhesin del cemento portland incluy dos formulaciones dife
rentes del mortero. Otra forma de describir este experimento es como un experimento con un solo factor,
con dos niveles del factor, donde el factor es la formulacin del mortero y los dos niveles son los dos mto
dos diferentes para hacer la formulacin. Muchos experimentos de este tipo involucran ms de dos nive
les del factor. En este captulo se presentan los mtodos para el diseo y el anlisis de los experimentos
con un solo factor con a niveles del mismo (o a tratamientos). Se supondr que el experimento se ha aleatorizado completamente.

3a

U N EJEMPLO

U n ingeniero de desarrollo de productos tiene inters en investigar la resistencia a la tensin de una fibra
sinttica nueva que se usar para hacer tela de camisas para caballero. El ingeniero sabe por experiencia
previa que la resistencia a la tensin se afecta por el peso porcentual del algodn utilizado en la mezcla de
materiales de la fibra. Adems, sospecha que al aumentar el contenido de algodn se incrementar la re
sistencia, al menos en un principio. Sabe asimismo que el contenido de algodn deber variar entre 10 y
40 por ciento para que el producto final tenga otras caractersticas de calidad que se desean (como la
capacidad de ser sometido a un tratamiento de planchado permanente). El ingeniero decide probar ejem
plares en cinco niveles del peso porcentual del algodn: 15,20,25,30 y 35 por ciento. lm bin decide pro
bar cinco ejemplares en cada nivel del contenido de algodn.
Se trata de un ejemplo de un experimento con un solo factor con a = 5 niveles del factor y = 5 rpli
cas. Las 25 corridas debern realizarse de manera aleatoria. Para ilustrar cmo puede aleatorizarse el or
den de las corridas, suponga que las corridas se numeran de la siguiente manera:
60

3-1 UN EJEMPLO

Peso
porcentual
del algodn
15
20
25
30
35

Nmero de corrida experimental


4
1
2
3
8
9
6
7
11
12
13
14
19
16
17
18
23
24
21
22

61

5
10
15
20
25

Ahora se selecciona un nmero aleatorio entre 1 y 25. Suponga que este nmero es 8. Entonces la obser
vacin nmero 8 (20% de algodn) se corre primero. Este proceso se repetira hasta que las 25 observa
ciones tengan asignada una posicin en la secuencia de prueba.' Muchos paquetes de software de
computadora para ayudar a los experimentadores a seleccionar y construir un diseo, ^eatorizan el or
den de las corridas utilizando nmeros aleatorios de esta manera.
Suponga que la secuencia de prueba obtenida es

Secuencia de prueba
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

Nmero de corrida
8
18
10
23
17
5
14
6
15
20
9
4
12
7
1
24
21
11
2
13
22
16
25
19
3

Peso porcentual del algodn


20
30
20
35
30
15
25
20
25
30
20
15
25
20
15
35
35
25
15
25
35
30
35
30
15

Esta secuencia de prueba aleatorizada es necesaria para evitar que los efectos de variables perturbadoras
desconocidaslas cuales quiz varen fuera de control durante el experimento contaminen los resulta
dos. Para ilustrar esto, suponga que las 25 corridas de prueba tuvieran que realizarse en el orden original
no aleatorizado (es decir, primero se prueban los cinco ejemplares con 15% de algodn, despus se prue La nica restriccin sobre la aleatorizacin en este caso, es que si se saca de nuevo el mismo nmero (es decir, 8), se descarta. Se tra
ta de una restriccin secundaria y se ignora.

62

CAPTULO 3

Tabla 3-1

EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

Datos (en Ib/pulgada^) del experimento de la resistencia a la tensin

Peso porcentual
del algodn
15
20
25
30
35

1
7
12
14
19
7

Observaciones
3
15
12
18
22
11

2
7
17
18
25
10

4
11
18
19
19
15

5
9
18
19
23
11

Tblal
49
77
88
108
54
376

Promedio
9.8
15.4
17.6
21.6
10.8
15.04

ban los cinco ejemplares con 20% de algodn, etc.). Si la mquina empleada para probar la resistencia a la
tensin presenta un efecto de calentamiento tal que entre ms tiempo est funcionando sean menores las
lecturas de la resistencia a la tensin observadas, el efecto del calentamiento contaminar potencialmen
te los datos de la resistencia a la tensin y destruir la validez del experimento.
Suponga que el ingeniero corre la prueba en el orden aleatorio que se ha determinado. En la tabla 3-1
se muestran las observaciones que obtiene para la resistencia a la tensin.
Siempre es una buena idea examinar grficamente los datos experimentales. En la figura 3-1 se mues
tran los diagramas de c^a para la resistencia a la tensin con cada nivel del peso porcentual de algodn, y
en la figura 3-2 se ilustra un diagrama de dispersin de la resistencia a la tensin contra el peso porcen
tual del algodn. En la figura 3-2, los puntos rellenos son las observaciones individuales y los crculos hue
cos son los promedios de la resistencia a la tensin observada. Ambas grficas indican que la resistencia a
la tensin se incrementa cuando el contenido de algodn se incrementa, hasta cerca de 30% de algodn.
Despus de 30% de algodn, hay un marcado descenso de la resistencia a la tensin. No hay evidencia shda que sugiera que la variabilidad de la resistencia a la tensin alrededor del promedio dependa del peso
porcentual del algodn. Con base en este anlisis grfico simple, se tienen firmes sospechas de que 1) el
contenido de algodn afecta la resistencia a la tensin y 2) alrededor de 30% de algodn produce la resis
tencia mxima.
Suponga que se quiere ser ms objetivo en el anlisis de los datos. Especficamente, imagine que
quieren probarse las diferencias entre las resistencias a la tensin promedio con todos los niveles a = 5 del
3 0 1-

:20

15

20
25
30
Peso porcentual del algodn

35

40

Figura 3-1 Diagramas de caja Je la resistencia a la tensin


contra el peso porcentual del algodn.

3-2 ELANUSISDEVARIANZA

63

3 0 1-

|2 0

o*

S
O

10

15

20

25

30

35

Peso Dorcerrtual del algodn

Figura 3-2 Diagrama de dspeisin de la resistencia


a la tensin contra el peso porcentual del algodn.

peso porcentual del algodn. Por lo tanto, el inters se centra en probar la igualdad de las cinco medias. Pu
diera parecer que este problema se resolvera realizando una prueba t para todos los pares de medias
posibles. Sin embargo, no es sta la mejor solucin de este problema, porque llevara a una distorsin con
siderable en el error tipo I. Por ejemplo, suponga que quiere probarse la igualdad de las cinco medias
usando comparaciones por pares. Hay 10 pares posibles, y si la probabilidad de aceptar correctamente la
hiptesis nula en cada prueba individual es de 1 - a = 0.95, la probabilidad de aceptar correctamente la
hiptesis nula en las 10 pruebas es de (0.95)* = 0.60 si las pruebas son independientes. Por lo tanto, ha
ocurrido un incremento sustancial en el error tipo I.
El procedimiento correcto para probar la igualdad de varias medas es el anlisis de varanza. Sin
embargo, el anlisis de varanza tiene un rango de aplicaciones mucho ms amplio que el problema ante
rior. Probablemente sea la tcnica ms til en el campo de la inferencia estadstica.

3-2

E L A N A U S IS D E V A R IA N Z A

Suponga que se tienen a tratamientos o niveles diferentes de un solo factor que quieren compararse. La
respuesta observada de cada uno de los a tratamientos es una variable aleatoria. Los datos apareceran
como en la tabla 3-2. Una entrada de la tabla 3-2 (por ejemplo, y,y) representa la observacin;-sima to-

Tkbla 3-2

Datos tpicos de un experimento de un solo factor

latamiento
(nivel)

Observaciones

1
2

yii
yu

yi2
yi2

y\

y^i

Ibtales Promedios

y^

>1.
>2.

K
yi.

y^

h.

Ll
y..

y..

64

CAPTULO 3 EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VAMANZA

mada bajo el nivel del factor o tratamiento i. Habr, en general, n observaciones bajo el tratamiento i-simo. Observe que la tabla 3-2 es el caso general de los datos del experimento de la resistencia a la tensin
de la tabla 3-1.

Modelos para los datos


Se encontrar til describir las observaciones de un experimento con un modelo. Una manera de escribir
este modelo es

j/ - l- , 2,...,
n
i
d o n d e y es la observacin i;-sima, /, es la media del nivel del factor o tratamiento -simo, y ej es un com
ponente dsl error aleatorio que incorpora todas las dems fuentes de variabilidad del experimento, inclu
yendo las mediciones, la variabilidad que surge de factores no controlados, las diferencias entre las
unidades experimentales (como los materiales de prueba, etc.) a las que se aplican los tratamientos, y el
ruido de fondo general en el proceso (ya sean la variabilidad con el tiempo, los efectos de variables am
bientales, etc.). Es conveniente considerar que los errores tienen media cero, de tal modo que(y,j) = fi.
A la ecuacin 3-1 se le llama el modelo de las medias. Una forma alternativa de escribir un modelo de
los datos es definiendo
f i =l u+T ,

i = l,2,...,a

de tal modo que la ecuacin 3-1 se convierte en


y, j=/ i+T.+,^

(3-2)

En esta forma del m odelo,// es un parmetro comn a todos los tratamientos al que se llama la meda glo
bal, y T, es un parmetro nico del tratamiento i-simo al que se le llama el efecto del tratamiento i-simo.
A la ecuacin 3-2 se le llama por lo general el modelo de los efectos.
Tknto el modelo de las medias como el de los efectos son modelos estadsticos lineales; es decir, la va
riable de respuesta3,yes una funcin lineal de los parmetros del modelo. Aun cuando ambas formas del
modelo son tiles, el modelo de los efectos se encuentra con mayor frecuencia en la literatura del diseo
experimental. Tiene cierto atractivo intuitivo por cuanto fi es una constante y los efectos de los tratamien
tos Ti representan desviaciones de esta constante cuando se aplican los tratamientos especficos.
A la ecuacin 3-2 (o a la 3-1) se le llama tambin el modelo del anlisis de varianza simple o de un
solo factor (o direccin), porque nicamente se investiga un factor. Adems, ser un requisito que el ex
perimento se lleve a cabo en orden aleatorio para que el ambiente en el que se apliquen los tratamientos
(llamados con frecuencia unidades experimentales) sea lo ms uniforme posible. Por lo tanto, el diseo
experimental es un diseo completamente aleatorizado. Los objetivos sern probar las hiptesis apropia
das acerca de las medias de los tratamientos y estimarlas. Para probar las hiptesis, se supone que los
errores del modelo son variables aleatorias que siguen una distribucin normal e independiente con me
dia cero y varianza tr^. Se supone asimismo que la varianza es constante para todos los niveles del factor.
Esto implica que las observaciones

y que las observaciones son mutuamente independientes.

3-3 ANUSIS DEL MODELO CON EFECTOS FIJOS

65

Factor fijo o aleatorio?


El modelo estadstico (ecuacin 3-2) describe dos situaciones diferentes con respecto a los efectos de los
tratamientos. Primera, los a tratamientos pudieron ser elegidos expresamente por el experimentador. En
esta situacin quieren probarse hiptesis acerca de las medias de los tratamientos, y las conclusiones se
aplicarn nicamente a los niveles del factor considerados en el anlisis. Las conclusiones no pueden ex
tenderse a tratamientos similares que no fueron considerados explcitamente. Ikmbin se podra querer
estimar los parmetros del modelo {fi, t, <r^). A ste se le llama el modelo con efectos fgos. D e manera al
ternativa, los a tratamientos podran ser una muestra aleatoria de una poblacin ms grande de trata
mientos. En esta situacin sera deseable poder extender las conclusiones (las cuales se basan en la
muestra de los tratamientos) a la totalidad de los tratamientos de la poblacin, sea que se hayan conside
rado explcitamente en el anlisis o no. Aqu las t son variables aleatorias, y el conocimiento de las r, par
ticulares que se investigaron es relativamente intil. Ms bien, se prueban hiptesis acerca de la
variabilidad de las r, y se intenta estimar su variabilidad. A ste se le llama el modelo con efectos aleatorios
o modelo de los componentes de la varianza. La revisin de experimentos con factores aleatorios se pos
pondr hasta el captulo 12.

3-3

ANLISIS DEL MODELO C O N EFECTOS R JO S

En esta seccin se desarrolla el anlisis de varianza de un solo factor para el modelo con efectos fijos. Re
cuerde que y,, representa el total de las observaciones bajo el tratamiento i-simo. Sea quej,. represente el
promedio de las observaciones bajo el tratamiento t-simo. D e manera similar, sea que y represente el
gran total de todas las observaciones y que y ^represente el gran promedio de todas las observaciones.
Expresado simblicamente,
n

Vl = 2

>>

= 1- 2 ,..., a
(3-3)

a n
X. =

=i =\

y.. = y J ^

donde N = an es el nmero total de observaciones. Se nota que el subndice punto implica la operacin
suma sobre el subndice que reemplaza.
El inters se encuentra en probar la igualdad de las a medias de los tratamientos; es decir, E(yj) =fz +
i = 1, 2,
a. Las hiptesis apropiadas son
= /2 = = A
para al menos un par (i, j )
En el modelo de los efectos, la m e d i a d e l tratamiento i-simo se descompone en dos componentes tales
que fi = ju + T. Por lo general, ^ se considera como una media global, de tal modo que

a
Esta definicin implica que

i-l

66

CAPTULO 3

EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

Es decir, los efectos del tratamiento o factor pueden considerarse como desviaciones de la media global.^
Por consiguiente, una forma equivalente de escribir las hiptesis anteriores es en trminos de los efectos
de los tratamientos r,, por ejemplo
fo:T, = r , = ...r = 0
i ;r,

para al menos una i

Por lo tanto, se habla de probar la igualdad de las medias de los tratamientos o de probar que los efectos
de los tratamientos (las r,) son cero. El procedimiento apropiado para probar la igualdad de las medias de
los a tratamientos es el anlisis de varianza.

3'3.1

Descomposicin de la suma de cuadrados total

El nombre anlisis de varianza se deriva de la particin de la variabilidad total en sus partes componen
tes. La suma de cuadrados total corregida

i-i i-\
se usa como una medida de la variabilidad global de los datos. Intuitivamente, esto es razonable porque,
si
tuviera que dividirse por el nmero apropiado de grados de libertad (en este caso, a n - l = N - 1), se
obtendra la varianza muestra! de las^. La varianza muestral es, desde luego, una medida estndar de va
riabilidad.
Observe que la suma de cuadrados total corregida SSj se puede escribir como
S S
1-1 ;=1

1=1 ;=1

-1

1=1
a

[a ,-x .)+ U - )r

(3-4)

" l y-1

(3-5)

+ 2 2 2 (y i.-y -)(y ij-y )


(=1
Sin embargo, el trmino del producto cruzado de la ecuacin 3-5 es cero, ya que
n
2 (ya = y,. - ny, = y. - (>-, / ) = O
Se tiene, por lo tanto.

SS (>'/"y-y="E (>->)'+SS ^ya1=1 j = l

1=1

i~ l ; - l

La ecuacin 3-6 establece que puede hacerse la particin de la variabilidad total de los datos, medida por
la suma de cuadrados total corregida, en una suma de cuadrados de las diferencias entre los promedios de
los tratamientos y el gran promedio, ms una suma de cuadrados de las diferencias de las observaciones
dentro de los tratamientos y el promedio de los tratamientos. Entonces, la diferencia entre los promedios
^ Para ms informacin sobre este tema, referirse al material suplementario del texto del captulo 3.

3-3 ANLISIS DEL MODELO CON EFECTOS FIJOS

67

de los tratamientos observados y el gran promedio es una medida de las diferencias entre las medias de
los tratamientos, mientras que las diferencias de las observaciones dentro de un tratamiento y el prome
dio del tratamiento, pueden deberse nicamente al error aleatorio. Por lo tanto, la ecuacin 3-6 puede es
cribirse simblicamente como
SSj. =
donde a
se le llama la suma de cuadrados debida a los tratamientos (es decir, entre los trata
mientos), y a SSe se le llama la suma de cuadrados debida al error (es decir, dentro de los tratamientos).
Hayan = N observaciones en total; por lo tanto, 55^ tiene TV- 1 grados de libertad. Haya niveles del fac
tor (y medias de a tratamientos), de donde 55-iva,jtos tiene a - 1 grados de libertad. Por ltimo, dentro de
culquier tratamiento hay n rplicas que proporcionan n - 1 grados de libertad con los cuales estimar el
error experimental. Puesto que hay a tratamientos, se tienen a(n - 1 ) = a n - a = N - a grados de libertad
para el error.
Es til examinar explcitamente los dos trminos del lado derecho de la identidad fundamental del
anlisis de varianza (ecuacin 3-6). Considere la suma de cuadrados del error

En esta forma es fcil ver que el trmino entre corchetes, si se divide por w - 1 , es la varianza muestral del
tratamiento /-simo, o

i = l, 2, ..., a

St =
7 7 -1

Ahora pueden combinarse a varianzas mustrales para obtener una sola estimacin de la varianza poblacional comn de la siguiente manera;

(w -l)5i^ +(ra-l)5,^ + ... + (-l)5^

=1

(/i-l)-l-(n-l)-h...-l-(n-l)
1=1

ss.
{N -a)
Por lo tanto, S S y ( N ~ a ) es una estimacin combinada de la varianza comn dentro de cada uno de los a
tratamientos.
D e manera similar, si no hubiera diferencias entre las medias de los a tratamientos, podra usarse la
variacin de los promedios de los tratamientos y el gran promedio para estimar o^. Especficamente

a -l

a l

es una estimacin de ( f si las medias de los tratamientos son Iguales. La razn de esto puede verse de ma
nera intuitiva de la siguiente manera. La cantidad 2JLj(y, - y , f / ( a - 1) estima o^/, la varianza de los pro

68

CAPTULO 3

EXPERIMENTOS CON UN SOLO FACTOR: EL ANUSIS DE VARIANZA

medios de los tratamientos, de donde


~ y . f l ( a - 1) debe estimar si no hay diferencias en las
medias de los tratamientos.
Se observa que la identidad del anlisis de varianza (ecuacin 3-6) nos proporciona dos estimaciones
de a^\ una basada en la variabilidad inherente dentro de los tratamientos y una basada en la variabilidad
entre los tratamientos. Si no hay diferencias en las medias de los tratamientos, estas dos estimaciones de
bern ser muy similares, y si no lo son, se sospecha que la diferencia observada puede ser causada por di
ferencias en las medias de los tratamientos. Aun cuando se ha usado un razonamiento intuitivo para
desarrollar este resultado, puede adoptarse un enfoque un tanto ms formal,
A las cantidades
SS.
fl-1

N -a
se les llama cuadrados medios. Se examinarn ahora los valores esperados de estos cuadrados medios.
Considere
E(M S^)=E

(S S^

\N ~a)

E
(ya-yt.)'
=i j=i

N -a
1
'N -a

1
N - a
1
'N -a

S E (y-^yayi.+yl)
.1=1 j=i
E

_i=l /=!

fA lyl

,.=1

Al sustituir el modelo (ecuacin 3-1) en esta ecuacin se obtiene


E{MS^) =

N -a

Entonces, al elevar al cuadrado y tomar el valor esperado de la cantidad entre corchetes, se observa que
los trminos que incluyen a. el y e ] son reemplazados por y na^, respectivamente, debido a que E{e) =
0. Adems, todos los productos cruzados que incluyen a ej tienen valor esperado cero. Por lo tanto, des
pus de elevar al cuadrado y tomar el valor esperado, la ltima ecuacin se convierte en
(M 5 J =

N -a

N/i^ + 2

+Na ^ Nfi^
1=1

E ( M S , ) = a^

3-3 ANLISIS DEL MODELO CON EFECTOS FIJOS

69

Aplicando un enfoque similar puede demostrarse tambin que^


g
i= l

Por lo tanto, como se argument heursticamente, MS^ = S S e / { N- a) estima y, si no hay diferencias en


las medias de los tratamientos (lo cual implica que t , = 0 ) ,
~ 1) tambin esti
ma
Sin embargo, observe que si las medias de los tratamientos difieren, el valor esperado del cuadrado
medio de los tratamientos es mayor que a^.
Parece claro que es posible realizar una prueba de la hiptesis de que no hay diferencias en las medias
de los tratamientos comparando
y
Se considera ahora cmo puede hacerse esta compa
racin.

3'3.2

Anlisis estadstico

Se investiga ahora cmo puede llevarse a cabo una prueba formal de la hiptesis de que no hay diferen
cias en las medias de los tratamientos (Ha-fii = f i 2 =-=Ma,c><^^ manera equivalente, io-'i = ^2 = =
0). Puesto que se ha supuesto que los errores e,y siguen una distribucin normal e independiente con me
dia cero y varianza o^, las ob serv a cio n estien en una distribucin normal e independiente con media/ -IT, y varianza
Por lo tanto, SSj es una suma de cuadrados de variables aleatorias con una distribucin
normal; por consiguiente, puede demostrarse que SS-j^a^ tiene una distribucin ji-cuadrada con ^ ^ -1 gra
dos de libertad. Adems, puede demostrarse que SSe(^ es una variable ji-cuadrada conN - a grados de li
bertad y que
es una variable ji-cuadrada con a - 1 grados de libertad si la hiptesis nula Hq:t
= O es verdadera. Sin embargo, las tres sumas de cuadrados no son necesariamente independientes, ya
que la suma de
y SS^ es SS-p El siguiente teorema, que es una forma especial de un teorema
atribuido a William Cochran, es til para establecer la independencia de SS^ y

TEOREMA 3 - 1 ...............................................................................................................................................
Teorema de Cochran
Sea Z, igual a NID(0, 1) para i = 1, 2,

v y

2; Z f = Q , + Q , + ... + Q,
V

i= l

donde s < V , y Q, tiene v, grados de libertad (t = 1,2,..., s). Entonces Qi, Q 2,


son variables aleatorias
ji-cuadrada independientes con Vj, v-2, ...,
grados de libertad, respectivamente, si y slo si
V = Vj

+V2 + . . .

Puesto que los grados de libertad de


tad, el teorema de Cochran implica que
3

Referirse al material suplementario del texto del captulo 3.

+Vj

y SS^ suman
1, el nmero total de grados de liber
y SSe/c/ son variables aleatorias ji-cuadrada con

7O

CAPTULO 3

Tabla 3-3

EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

Tabla de anlisis de varianza para el modelo con un solo factor y efectos fijos
Suma de
cuadrados

Fuente de variacin

Grados de
libertad

Cuadrado
medio

a-1

^^^Tfltaillintos

N -a

MS^

Entre los tratamientos


Error (dentro de los
tratamientos)

SSe = SSj.

Tbtal

sS r= Y 2
i-i

F,
T7

^'^Ttatamientos

M S,>

N -1

iy ,-y y

una distribucin independiente. Por lo tanto, si la hiptesis nula de que no hay diferencias en las medias
de los tratamientos es verdadera, el cociente

^ ^T ra ta m ie m o s ^

Tratam iento

S S^ /(N -a)

MS^

se distribuye como F con a - 1 y - a grados de libertad. La ecuacin 3-7 es el estadstico de prueba para
la hiptesis de que no hay diferencias en las medias de los tratamientos.
Por los cuadrados medios esperados se observa que, en general, MS^ es un estimador insesgado de o^.
Asimismo, bajo la hiptesis nula,
es un estimador insesgado de a^. Sin embargo, si la hiptesis
nula es falsa, el valor esperado de M5-natamiemos es mayor que a^. Por lo tanto, bajo la hiptesis ahernativa, el
valor esperado del numerador del estadstico de prueba (ecuacin 3-7) es mayor que el valor esperado del
denominador, y H(, deber rechazarse para valores del estadsticp de prueba que son muy grandes. Esto
imphca una regin crtica de una sola cola superior. Por lo tanto,
deber rechazarse y concluirse que
hay diferencias en las medias de los tratamientos si
Fo > ^Fa , a - l , N - a

d o n d e o se calcula con la ecuacin 3-7. D e manera alternativa, podra usarse el enfoque del valor/* para
tomar una decisin.
Es posible obtener frmulas para calcular estas sumas de cuadrados reescribiendo y simplificando las
definiciones de
y SSj en la ecuacin 3-6. Se obtiene as
=

,=i y=i

(3-8)

1 ^^

^'^Tratamientos ~

(^'^)

=1
La suma de cuadrados del error se obtiene por sustraccin como
(3-10)
El procedimiento de prueba se resume en la tabla 3-3. Se le conoce como tabla del anlisis de varianza.

EJEMPLO 3 - 1 .................................................................................................................................................
El experimento de la resistencia a la tensin
Para ilustrar el anlisis de varianza, se retoma al ejemplo que empez a comentarse en la seccin 3-1. Re
cuerde que al ingeniero de desarrollo de productos le interesa determinar si el peso porcentual del algo

3-3 ANLISIS DEL MODELO CON EFECTOS FIJOS

71

dn en una fibra sinttica afecta la resistencia a la tensin, y ha llevado a cabo un experimento


completamente aleatorizado con cinco niveles del peso porcentual del algodn y cinco rplicas. Por con
veniencia, a continuacin se repiten los datos de la tabla 3-1;

del algodn

15
20
25
30
35

7
12
14
19
7

Resistencia a la tensin observada


(Ib/pulg^)
________________
2
3
4
5
7
17
18
25
10

15
12
18
22
11

11
18
19
19
15

9
18
19
23
11

Tbtales
X-

Promedios

y.

49
77
88
108
54

9.8
15.4
17.6
21,6
10.8

y = 376

y.. = 15.04

Se usar el anlisis de varianza para p r o b a r c o n t r a la hiptesis alternativa


iiialgunas medias son diferentes. Las sumas de cuadrados requeridas se calculan como sigue:
'

'

= (7)" + ( 7 ) ' +(15)^ + + (1 5 ) ' + ( l l ) =

cc

^
^'TVatamientos

_ ^ V

636.96

= 3 [(49)^ + - + ( 5 4 ) ^ ] - ^ = 475.76
5 5 ^

^ ^ T ratam ien to s

= 636.96 - 475.76=161.20
Generalmente estos clculos se realizaran en una computadora, utilizando paquetes de software con la
capacidad de analizar datos de experimentos diseados.
En la tabla 3-4 se resume el anlisis de varianza. Observe que el cuadrado medio entre los tratamien
tos (118.94) es varias veces mayor que el cuadrado medio dentro de los tratamientos o cuadrado medio
del error (8.06). Esto indica que no es posible que las medias de los tratamientos sean iguales. En trmi
nos ms formales, puede calcularse el cociente F, Fq = 118.94/8.06 = 14.76, y comparar este valor con un
punto porcentual apropiado de la cola superior de la distribucin F^ 20- Suponga que el experimentador
ha seleccionado a = 0.05. En la tabla IV del apndice se encuentra que Fq 05,4, jo = 2.87. Puesto que F =
14.76 > 2.87, se rechaza io y se concluye que las medias de los tratamientos difieren; es decir, el peso por
centual del algodn en la fibra afecta de manera significativa la resistencia a la tensin media. Tkmbin

Tabla 3-4

Anlisis de variama de los datos de la resistencia a la tensin

Fuente de variacin
Peso porcentual del algodn
Error
Tbtal

Suma de
cuadrados

Grados de
libertad

Cuadrado
medio

475.76
161.20
636.96

4
20
24

118.94
8.06

F,
Fo= 14.76

Valor P
<0.01

72

CAPTULO 3 EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

Figura 3-3 La distribucin de referencia (F^ jo) para el estadstico de


prueba
en el ejemplo 3-1.

podra calcularse un valor P para este estadstico de prueba. En la figura 3-3 se muestra la distribucin de
referencia (^4 20) para el estadstico de prubalo. Evidentemente, el valorP es muy pequeo en este caso.
Puesto que Fg 01.4,20 = 4.43 y F o > 4.43, puede concluirse que un lmite superior del valor P es 0.01; es dedr,
P < 0.01 (el valor P exacto es P = 9.11 x lO**).

C lculos m anuales

Posiblemente el lector haya notado que la suma de cuadrados se defini en trminos de promedios; es de
cir, por la ecuacin 3-6,
SS Tratamientos

(y .-y .y

pero las frmulas de clculo se desarrollaron utilizando los totales. Por ejemplo, para calcular S5Tja,annieiitosj
se usara la ecuacin 3-9:
n i'

La razn principal de esto es por conveniencia; adems, los totales y, yy estn menos sujetos al error de
redondeo que los promedios y y y .
En general, no deber prestarse demasiada atencin a los clculos, ya que se cuenta con una amplia
variedad de programas de computadora para realizarlos. Estos programas de computadora son tambin
tiles para realizar muchos otros anlisis asociados con el diseo experimental (como el anlisis residual y
la verificacin de la adecuacin del modelo). En muchos casos, estos programas tambin ayudarn al ex
perimentador a establecer el diseo.
Cuando es necesario realizar los clculos manualmente, en ocasiones es til codificar las observacio
nes. Esto se ilustra en el ejemplo siguiente.

EJEMPLO 3 - 2 .................................................................................................................................................
Codificacin de observaciones
Los clculos del anhsis de varianza pueden hacerse con frecuencia de manera ms precisa o simplificada
codificando las observaciones. Por ejemplo, considere los datos de la resistencia a la tensin del ejemplo

3-3 ANLISIS DEL MODELO CON EFECTOS FIJOS

73

Tabla 3-5 Datos codificados de la resistencia a la tensin del ejemplo 3-2


Peso
porcentual
del algodn
15
20
25
30
35

Observaciones
1

-8
-3
-1
4
-8

-8
2
3
10
-5

0
-3
3
7
-A

-A
3
4
4
0

-6
3
4
8
-A

Tbtales
-26
2
13
33
-21

3-1. Suponga que se resta 15 de cada observacin. Los datos codificados se muestran en la tabla 3-5. Es
sencillo verificar que
2

SSy ( - 8 ) + ( - 8 ) + + ( - 4 ) - ^
SS______
Ttatam ientos =

= 636.96

25

SS^ = 161.20
Al comparar estas sumas de cuadrados con las que se obtuvieron en el ejemplo 3-1, se observa que al res
tar una constante de los datos originales las sumas de cuadrados no se modifican.
Suponga ahora que cada una de las observaciones del ejemplo 3-1 se multiplica por 2. Es sencillo veri
ficar que las sumas de cuadrados de los datos transformados son 55j- = 2547.84,
= 1903.04 y
SSe = 644.80. Estas sumas de cuadrados parecen diferir considerablemente de las que se obtuvieron en el
ejemplo 3-1, Sin embargo, si se dividen por 4 (es decir, 2% ios resultados son idnticos. Por ejemplo, para
la suma de cuadrados de los tratamientos, 1903.04/4 = 475.76, Asimismo, para los datos codificados, el
cociente F e s F = (1903.04/4)/(644.80/20) = 14.76, que es idntico al cociente F de los datos originales.
Por lo tanto, los anlisis de varanza son equivalentes.

Pruebas de aleatorzacn y anlisis de varianza


En el desarrollo del anlisis de varianza con la prueba F, se ha utilizado el supuesto de que los errores
aleatorios y son variables aleatorias que siguen una distribucin normal e independiente. Tkmbin es po
sible justificar la prueba F como la aproximacin de una prueba de aleatorzacn. Para ilustrar esto, su
ponga que se tienen cinco observaciones de cada uno de dos tratamientos y que quiere probarse la
igualdad de las medias de los tratamientos. Los datos apareceran as;
I^tamiento 1

'natamiento 2

yn
yn

y2
yu

y i3

> 23

yu
Va

> 25

Podra usarse el anlisis de varianza con la prueba F para probar


D e manera alternativa, po
dra recurrirse a un enfoque un tanto diferente. Suponga que se consideran todas las formas posibles de

74

CAPTULO 3

EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

asignar los 10 nmeros de la muestra anterior a los dos tratamientos. Hay 10!/5!5! = 252 arreglos posibles
de las 10 observaciones. Si no hay ninguna diferencia en las medias de los tratamientos, los 252 arreglos
soii igualmente posibles. Para cada uno de los 252 arreglos, se calcula el valor del estadstico F usando la
ecuacin 3-7. A la distribucin de estos valores F se le llama distribucin de aleatorizacin, y un valor
grande de F indica que los datos no son consistentes con la hiptesis
= fij- Por ejemplo, si el valor de
F que se observ realmente fue excedido slo por 5 de los valores de la distribucin de aleatorizacin, esto
correspondera con el rechazo de Hoifii = fi 2 con un nivel de significacin de a = 5/252 = 0,0198 (o
1.98%). Observe que no es necesario ningn supuesto de normalidad en este enfoque.
La dificultad con este enfoque es que, incluso en problemas relativamente pequeos, los clculos re
queridos hacen nviable la enumeracin de la distribucin de aleatorizacin exacta. Sin embargo, nume
rosos estudios han demostrado que la distribucin F comn de la teora normal es una buena
aproximacin de la distribucin de aleatorizacin exacta. Por lo tanto, incluso sin el supuesto de normali
dad, la prueba F puede considerarse como una aproximacin de la prueba de aleatorizacin. Para ms de
talles sobre las pruebas de aleatorizacin en el anlisis de varianza, ver Box, Hunter y Hunter [18].

3-3.3

Estimacin de los parmetros del modelo

Se presentan ahora los estimadores de los parmetros del modelo con un solo factor
=//+r,+^.
y los intervalos de confianza para las medias de los tratamientos. Ms adelante se demostrar que estima
dores razonables de la media global y de los efectos de los tratamientos estn dados por
^ ^ y/ = X . - X . .

(3-11)
= l, 2, ..., fl

Estos estimadores poseen un considerable atractivo intuitivo; observe que la media global se estima con
el gran promedio de las observaciones y que el efecto de cualquier tratamiento no es sino la diferencia en
tre el promedio del tratamiento y el gran promedio.
Es posible determinar con facilidad una estimacin del intervalo de confianza de la media del trata
miento z-simo. La media del tratamiento /-simo es

Un estimador puntual de/sera/i,. = A + , = y,.. Ahora bien, si se supone que ios errores siguen una dis
tribucin normal, cada y, es una NID(w ^ln). Por lo tanto, si ( f fuera conocida, podra usarse la distribu
cin normal para definir el intervalo de confianza. Al utilizar
como estimador de
el intervalo de
confianza se basara en la distribucin t. Por lo tanto, un intervalo de confianza de 100(1 y ) por ciento
para la media n del tratamiento -simo es
[m s 7
y. ~

[m s 7

y. '^^o/2 .N~iiy

Un intervalo de confianza de 100(1 - a ) por ciento para la diferencia en las medias de dos tratamientos
cualesquiera, por ejemplo
- n, sera
2M ^
y , - yj. - Kl 2 .N -a^ ^

- /M; ^ X'. X;. + ^a,2 ,

2MS^
N

(3-13)

3-3 ANLISIS DEL MODELO CON EFECTOS FIJOS

75

T E M PL O 3 ^ 3 .................................................................................................................................................
Utilizando los datos del ejemplo 3-1 pueden encontrarse las estimaciones de la meda global y de los efec
tos de los tratamientos como p. = 316I75 = 15.04 y
i = - y.. =

9.80-15.04 = -5 .2 4

^2 = yi. - y.. = 15.40-15.04 = -1-0.36


f j = 3;^ - y = 17.60-15.04 = -2 .5 6
- y = 21.60-15.04 = -t-6.56
f J = y^ - y = 10.80-15.04 = -4 .2 4
Un intervalo de confianza de 95% para la media del tratamiento 4 (30% de algodn) se calcula con la
ecuacin 3-12 como

21.60- 2.086^1^

< / , < 21.60-)-Z086j ^

2 1 . 6 0 - 2 . 6 5 < ^ , <21.60-I-Z65
Por lo tanto, el intervalo de confianza de 95% deseado es 18.95 <

< 24.25.

Intervalos de confianza simultneos


Las expresiones para los intervalos de confianza dados en las ecuaciones 3-12 y 3-13 son intervalos de con
fianza uno a la vez. Es decir, el nivel de confianza 1 - a slo se aplica a una estimacin particular. Sin em
bargo, en muchos problems, el experimentador tal vez quiera calcular varios intervalos de confianza,
uno para cada una de varias medias o diferencias entre medias. Si hay inters en r de estos intervalos de
confianza de 100(1 - ) por ciento, la probabidad de que los r intervalos sean correctos simultneamen
te es al menos 1 - m . A la probabilidad ra se le llama con frecuencia ndice de error en el modo del experi
mento o coeficiente de confianza global. El nmero de intervalos r no tiene que ser muy grande antes de
que el conjunto de intervalos de confianza se vuelva relativamente falto de informacin. Por ejemplo, si
hay r = 5 intervalos y a = 0.05 (una eleccin tpica), el nivel de confianza simultneo para el conjunto de
los cinco intervalos de confianza es de al menos 0.75, y si r = 10 y a = 0,05, el nivel de confianza simult
neo es de al menos 0,50.
Un enfoque para asegurarse de que el nivel de confianza simultneo no sea demasiado pequeo es
sustituir a/2 con a/(2r) en las ecuaciones 3-12 y 3-13 del intervalo de confianza uno a la vez. A ste se le lla
ma el mtodo de Bonferroni, y le permite al experimentador construir un conjunto de r intervalos de con
fianza simultneos para las medias de los tratamientos o las diferencias en las medias de los tratamientos
para los que el nivel de confianza global es de al menos 100(1 - a ) por ciento. Cuando r no es muy grande,
ste es un mtodo muy atinado que produce intervalos de confianza razonablemente cortos. Para ms in
formacin, referirse al material suplementario del texto del captulo 3,

3 -3 .4

D atos no balanceados

En algunos experimentos con un solo factor, puede ser diferente el nmero de observaciones que se ha
cen dentro de cada tratamiento. Se dice entonces que el diseo es no balanceado. Sigue siendo posible
aplicar el anlisis de varianza descrito arriba, pero deben hacerse ligeras modificaciones en las frmulas

76

CAPTULOS

EXPERIMENTOS CON UN SOLO FACTOR; EL ANLISIS DE VARIANZA

de las sumas de cuadrados. Sea que se hagan m, observaciones bajo el tratamiento i (i = 1 , 2 , a) y que
N =
. Las frmulas para calcular manualmente 55^ y ^Tratamiemos quedan como

i= l ;= 1

y
y"

y"

(3-15)

No se requieren ms cambios en el anlisis de varianza.


Hay dos ventajas al elegir un diseo balanceado. Primera, el estadstico de prueba es relativamente
insensible a las desviaciones pequeas del supuesto de la igualdad de las varianzas de los a tratamientos
cuando los tamaos de las muestras son iguales. No es ste el caso cuando los tamaos de las muestras son
diferentes. Segunda, la potencia de la prueba se maximiza cuando las muestras tienen el mismo tamao.

3-4

VERIFICACIN DE LA A D EC U A C I N DEL MODELO

La descomposicin de la variabilidad presente en las observaciones mediante la identidad del anlisis de


varianza (ecuacin 3-6) es una relacin puramente algebraica. Sin embargo, el uso de la particin para
probar formalmente que no hay diferencias en las medias de los tratamientos requiere que se satisfagan
ciertos supuestos. Especficamente, estos supuestos son que el modelo
y,j = f i + t , + e ^
describe de manera adecuada las observaciones, y que los errores siguen una distribucin normal e inde
pendiente con media cero y varianza constante pero desconocida. Si estos supuestos se satisfacen, el
procedimiento del anlisis de varianza es una prueba exacta de la hiptesis de que no hay diferencias en
las medias de los tratamientos.
Sin embargo, es comn que en la prctica estos supuestos no se satisfagan exactamente. Por consi
guiente, en general no es prudente confiar en el anlisis de varianza hasta haber verificado estos supues
tos. Las violaciones de los supuestos bsicos y la adecuacin del modelo pueden investigarse con facilidad
mediante el examen de los residuales. El residual de la observacin;-sima en el tratamiento i-simo se
define como
= yij - %
donde

es una estimacin de la observacin yj correspondiente que se obtiene como sigue:

= y.+ (y,-y..)
= -y,

(3-17)

La ecuacin 3-17 da el resuhado intuitivamente claro de que la estimacin de cualquier observacin en el


tratamiento i-simo no es sino el promedio del tratamiento correspondiente.
El examen de los residuales deber ser una parte automtica de cualquier anlisis de varianza. Si el
modelo es adecuado, los residuales debern estar sin estructura; es decir, no debern contener patrones
obvios. A travs de un estudio de los residuales, pueden descubrirse muchos tipos de inadecuaciones del
modelo y violaciones de los supuestos subyacentes. En esta seccin se indica cmo puede hacerse con fa
cilidad la verificacin de diagnstico del modelo mediante el anhsis grfico de los residuales y cmo re
solver varias anormalidades que ocurren comnmente.

3-4 VERIFICACIN DE LA ADECUACIN DEL MODELO

3-4.1

77

El supuesto de nonuaMdad

La verificacin del supuesto de normalidad podra hacerse grafcando un histograma de los residuales. Si
se satisface el supuesto de NID(0, o^) para los errores, esta grfica deber aparecer como una muestra de
una distribucin normal con centro en cero. Desafortunadamente, cuando se trabaja con muestras pe
queas, suelen ocurrir fluctuaciones significativas, por lo que la aparicin de una desviacin moderada de
la normalidad no implica necesariamente una violacin seria de los supuestos. Las desviaciones marcadas
de la normalidad son potencialmente serias y requieren anlisis adicional.
Un procedimiento en extremo til es construir una grfca de probabilidad normal de los residuales.
Recuerde que en el captulo 2 se utiliz una grfica de probabilidad normal de los datos originales para
verificar el supuesto de normalidad cuando se us la prueba t. En el anlisis de varianza, por lo general es
ms eficaz (y directo) hacer lo mismo con los residuales. Si la distribucin fundamental de los errores es
normal, esta grfica tendr la apariencia de una lnea recta. Para visualizar la lnea recta, deber prestarse
ms atencin a los valores centrales de la grfica que a los valores extremos.
En la tabla 3-6 se muestran los datos originales y los residuales de los datos de la resistencia a la ten
sin del ejemplo 3-L La grfca de probabilidad normal se muestra en la figura 3-4. La impresin general
que surge al examinar esta representacin es que la distribucin de los errores puede tener un ligero ses
go, con la cola derecha siendo ms larga que la izquierda. La tendencia de la grfica de probabilidad nor
mal a curvarse hacia abajo ligeramente del lado izquierdo, implica que la cola izquierda de la distribucin
de los errores sea un tanto ms delgada de lo que se anticipara con una distribucin normal; es decir, los
residuales negativos no son tan grandes (en valor absoluto) como se esperaba. Sin embargo, esta grfica
no muestra una desviacin marcada de la distribucin normal.
En general, las desviaciones moderadas de la normalidad no son motivo de gran preocupacin en el
anlisis de varianza de efectos fijos (recuerde el anlisis de las pruebas de aleatorizacin de la seccin 3-3.2).
Una distribucin de los errores que tiene colas considerablemente ms gruesas o delgadas que la distribu
cin normal es motivo de mayor preocupacin que ima distribucin sesgada. Puesto que la prueba F slo se
afecta hgeramente, se dice que el anlisis de varianza (y los procedimientos relacionados como las compa
raciones mltiples) es robusto con respecto al supuesto de normalidad. Las desviaciones de la normalidad
hacen por lo general que tanto el verdadero nivel de significacin como la verdadera potencia difieran lige
ramente de los valores anunciados, con la potencia siendo generalmente ms baja. El modelo de los efectos
aleatorios que se revisar en el captulo 12 se afecta en forma ms severa por la no normaUdad.
Tabla 3-6

Datos y residuales del ejemplo 3-1

Peso

Observaciones (/)

del algodn

1
-2 .8

15

20

12

25

14

30

-2 .6
19 (22)

25

-3 .8
(17)

10

(15)

-3 .4
(8)

35

15

1.6

5.2
(25)

11

(6)

9.8

(11)

19

2.6
(3)

15.4

1.4
(7)

19

1.4
(9)

17.6

- 2 .6
19 (24)

23

1.4
(10)

21.6

4.2
(16)

11

0.2
(23)

10.8

- 3 .4

2.6

12

(1)

18

18

0.4
(13)

18

0.4
(20)

19

22

0.4
(2)

(5)
0.8
(21)

0.2
11

(4)

S)j = y

- 0 .8
9

(14)

3.4

1.2
(12)

17

-3 .6
(18)

-2 .8
(19)

15

Los residuales se indican en el recuadro de cada celda. Los nmeros entre parntesis indican el orden en que se recolectaron los datos.

78

CAPTULO 3 EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VAIUANZA

Residual

Figura 3-4 Grfica de probabilidad normal de los residuales del ejemplo 3-1.

Una anomala muy comn que suele ponerse de manifiesto en las grficas de probabilidad normal es
un residual que es mucho ms grande que cualquier otro. A un residual as se le llama con frecuencia pun
to atpico. La presencia de uno o ms puntos atpleos puede introducir serias distorsiones en el anlisis de
varianza, por lo que cuando se localiza un punto atpico potencial, se requiere una investigacin atenta.
En muchas ocasiones, la causa del punto atpico es un error en los clculos o un error al codificar o copiar
los datos. Si no es sta la causa, las circunstancias experimentales que rodean esta corrida particular de
ben estudiarse con atencin. Si la respuesta atpica ocurre en un valor particularmente deseable (alta re
sistencia, costo bajo, etc.), el punto atpico puede ser ms informativo que el resto de los datos. Deber
tenerse cuidado de no rechazar o descartar una observacin atpica a menos que se tengan razones no es
tadsticas de peso para hacerlo. En el peor de los casos, puede terminarse con dos anlisis; uno con el pun
to atpico y uno sin l.
Existen varios procedimientos estadsticos formales para detectar puntos atpleos (por ejemplo, ver
Bam etty Lewis [8], Johny Prescott [60] y Stefansky [107]). Puede hacerse una verificacin aproximada de
los puntos atpleos examinando los residuales estandarizados

3-4 VERIFICACIN DE LA ADECUACIN DEL MODELO

79

Si los errores ,j son AT(0, o^), los residuales estandarizados debern ser aproximadamente normales con
media cero y varianza unitaria. Por lo tanto, cerca de 68% de los residuales estandarizados debern estar
incluidos dentro de los lmites 1, cerca de 95% de ellos debern estar incluidos dentro de 2 y virtual
mente todos ellos debern estar incluidos dentro de 3. Un residual mayor que 3 o 4 desviaciones estn
dar a partir de cero es un punto atpico potencial.
Para los datos de la resistencia a la tensin del ejemplo 3-1, la grfica de probabilidad normal no pro
duce indicio alguno de puntos atpleos. Adems, el residual estandarizado mayor es
^

^.3
4m ;

5.2
V 06

5.2
2.84

el cual no deber ser motivo de preocupacin.

3-4.2

Grfica de los residuales en secuencia en el tiempo

La graficacin de los residuales en el orden temporal de la recoleccin de los datos es til para detectar
correlaciones entre los residuales. Una tendencia a tener corridas de residuales positivos y negativos indi
ca una correlacin positiva. Esto implicara que el supuesto de independencia de los errores ha sido viola
do. Se trata de un problema potencialmente serio y cuya solucin es difcil, por lo que de ser posible es
importante evitar el problema cuando se colecten los datos. La aleatorizacin adecuada del experimento
es un paso importante para conseguir la independencia.
En ocasiones las habilidades del experimentador (o los sujetos) pueden cambiar conforme el experi
mento avanza, o el proceso bajo estudio puede vagar sin rumbo o volverse ms errtico. Esto producir
con frecuencia un cambio en la varianza del error con el tiempo. Esta condicin suele llevar a una grfica
de los residuales contra el tiempo que muestra una dispersin mayor en uno de sus extremos que en el
otro. Una varianza no constante es un problema potencialmente serio. En las secciones 3-4.3 y 3-4.4 se
abundar sobre el tema.
En la tabla 3-6 se muestran los residuales y la secuencia en el tiempo de la recoleccin de los datos
para el experimento de la resistencia a la tensin. En la figura 3-5 se presenta una grfica de estos residua-

_______ I
5

10

I
_

15

Tiempo

20

~5

-6

Figura 3-5

Grfica de los residuales contra el tiempo.

25

80

CAPTULO 3

EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

les contra el tiempo. No hay razn para sospechar cualquier violacin de los supuestos de independencia
o de una varianza constante.

3-4.3

Grfica de los residuales contra los valores ajustados

Si el modelo es correcto y se satisfacen los supuestos, los residuales debern estar sin estructura; en par
ticular, no debern estar relacionados con ninguna otra variable, incluyendo la respuesta predicha. Una
verificacin simple es graficar los residuales contra los valores ajustados . (Para el modelo de un experi
mento con un solo factor, recuerde que y,y = y i., el promedio del tratamiento z-simo.) Esta grfica no de
ber mostrar ningn patrn obvio. En la figura 3-6 se grafican los residuales contra los valores ajustados
para los datos de la resistencia a la tensin del ejemplo 3-1. No es evidente ninguna estructura inusual.
Un defecto que sale a relucir en ocasiones en esta grfica es una vaiianza no constante. En ocasiones la
varianza de las observaciones se incrementa cuando la magnitud de la observacin se incrementa. ste sera
el caso si el error o ruido de fondo del experimento fuera un porcentaje constante de la magnitud de la ob
servacin. (Esto ocurre comrmiente con muchos instrumentos de medicin; el error es un porcentaje de la
escala de medicin.) Si ste fuera el caso, los residuales se haran mayores conformey se hiciera ms gran
de, y la grfica de los residuales contra)^,y se vera como un embudo o un megfono con la boca hacia afuera.
Una varianza no constante tambin surge en los casos en que los datos siguen una distribucin no normal,
sesgada, porque en las distribuciones sesgadas la varianza tiende a ser una funcin de la media.
Si se viola el supuesto de la homogeneidad de las varianzas, la prueba F slo resulta afectada ligera
mente en el modelo balanceado (el mismo tamao de la muestra en todos los tratamientos) con efectos fi
jos. Sin embargo, en diseos no balanceados o en casos en que una de las varianzas es considerablemente
ms grande que las dems, el problema es ms grave. Especficamente, si los niveles del factor que tienen
las varianzas mayores corresponden tambin con los tamaos de las muestras ms pequeos, el ndice de
error tipo I real es mayor que lo previsto (o los intervalos de confianza tienen niveles de confianza reales
ms bajos que los que fueron especificados). Recprocamente, si los niveles del factor con las varianzas
mayores tienen tambin los tamaos de las muestras mayores, los niveles de significacin son mucho m e
nores que lo anticipado (los niveles de confianza son ms altos). sta es una buena razn para escoger ta
maos de las muestras iguales siempre que sea posible. Para los modelos con efectos aleatorios, las
6
5
4
3

i' 1

10

15

20

25

y.a

-2
-3

-5 -

-6

Figura 3-6

Grfica de los residuales contra los valores ajustados.

3-4 VERIFICACIN DE LA ADECUACIN DEL MODELO

81

varianzas del error diferentes pueden introducir alteraciones significativas en las inferencias sobre los
componentes de la varianza, incluso cuando se usan diseos balanceados.
El enfoque usual para abordar el problema de una varianza no constante que ocurre por las razones
expuestas antes consiste en aplicar una transformacin para estabilizar la varianza para correr despus
el anlisis de varianza en los datos transformados. En este enfoque, deber tenerse presente que las con
clusiones del anlisis de varianza se aplican a las poblaciones transformadas.
Se han dedicado considerables esfuerzos de investigacin a la seleccin de una transformacin ade
cuada. Si los experimentadores conocen la distribucin terica de las observaciones, pueden hacer uso de
esta informacin para elegir la transformacin. Por ejemplo, si las observaciones siguen la distribucin de
Poisson, se usara la transformacin de la raz cnadrada y*. =
o y'j =
Si los datos siguen la
distribucin lognormal, la transformacin logartmica >>* = log es adecuada. Para datos binomiales ex
presados como fracciones, la transformacin arcsen >>* = arcsen^y^T es til. Cuando no hay una transfor
macin obvia, el experimentador realizar por lo general la bsqueda emprica de una transformacin
que iguale la varianza independientemente del valor de la media. Al final de esta seccin se ofrecen algu
nos consejos al respecto. En los experimentos factoriales, los cuales se introducen en el captulo 5, otro
enfoque es seleccionar una transformacin que minimice el cuadrado medio de las interacciones, siendo
el resultado un experimento cuya interpretacin es ms sencilla. En el captulo 14 se revisan con mayor
detalle los mtodos para seleccionar analticamente la forma de la transformacin. Las transformaciones
que se hacen para la desigualdad de la varianza afectan tambin la forma de la distribucin del error. En
la mayora de los casos, la transformacin hace que la distribucin del error est ms cerca de la distribu
cin normal. Para ms detalles sobre las transformaciones, referirse a Bartlett [7], Box y Cox [15], Dolby
[38] y Draper y Hunter (39].
Pruebas estadsticas para la igualdad de la varianza
Aun cuando es frecuente el uso de las grficas residuales para diagnosticar la desigualdad de la varianza,
se han propuesto tambin varias pruebas estadsticas. Estas pruebas pueden considerarse como pruebas
formales de las hiptesis

i / j : el enunciado anterior no es verdadero para al menos una a ]


Un procedimiento muy utilizado es la prueba de Bartlett. El procedimiento incluye el clculo de un
estadstico cuya distribucin de muestreo est aproximada muy de cerca por la distribucin ji-cuadrada
con c - 1 grados de libertad cuando las a muestras aleatorias son de poblaciones normales independien
tes. El estadstico de prueba es
XI
donde
9 = ( i V - a ) l o g ,o S ; - 2 (,-l)log.o5/
1
c= \+ - ^ 2
3 ( f l - l ) ,1=1
Si =

N -a
y Sf es la varianza muestral de la poblacin i-sima.

82

CAPTULO 3 EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

La cantidad q es grande cuando la diferencia entre las varianzas mustrales Sf es considerablemente


grande, y es igual a cero cuando todas las Sf son iguales. Por lo tanto,
deber rechazarse para los valo
res de X o
grandes; es decir, se rechaza
slo cuando
xl
donde x l
es el punto porcentual a superior de la distribucin ji-cuadrada con a - 1 grados de libertad.
Tkmbin podra usarse el enfoque del valor P para tomar una decisin.
La prueba de Bartlett es muy sensible al supuesto de normalidad. Por consiguiente, cuando la validez
de este supuesto est en duda, no deber usarse la prueba de Bartlett.
T E M P L O 3 4 ....................................................................................................... ...................................................
Ya que el supuesto de normalidad no est en entredicho, la prueba de Bartlett puede aplicarse a los datos
de la resistencia a la tensin del experimento del peso porcentual de algodn del ejemplo 3-1. Se calculan
primero las varianzas mustrales de cada tratamiento y se encuentra que
= l L 2 , 5 j =9. 8,53 =4.3,54
= 6.8 y 5j = 8.2, Entonces
_ 4(11.2)-h4(9.8)+4(4.3)-h4(6.8)-H4(8.2)
^

20

'

9 = 201og.(8.06)-4[logi 11.2-Hog,o 9.8-Hogio 4.3-Hog, 6.8+logio 8.2]= 0.45


^5_J_
= 1.10
3(4) 14 2o;
y el estadstico de prueba es

Puesto que
os 4 ^-49, no puede rechazarse la hiptesis nula y se concluye que las cinco varianzas son
iguales. Se trata de la misma conclusin a la que se lleg al analizar la grfica de los residuales contra los
valores ajustados.

Debido a que la prueba de Bartlett es sensible al supuesto de normalidad, puede haber situaciones en
las que sera til un procedimiento alternativo. Anderson y McLean [2] presentan una atinada revisin de
algunas pruebas estadsticas de la igualdad de la varianza. La prueba de Levene modificada (ver Levene
[72] y Conover, Johnson y Johnson [31]) es un procedimiento muy til que es robusto en cuanto a las des
viaciones de la normahdad. Para probar la hiptesis de que las varianzas son iguales en todos los trata
mientos, la prueba de Levene modificada utiliza la desviacin absoluta de las observaciones y,j de cada
tratamiento de la mediana de los tratamientos, por ejemplo . Sea que estas desviaciones se denoten por

La prueba de Levene modificada evala entonces si la media de estas desviaciones es igual o no para to
dos los tratamientos. Cuando las desviaciones medias son iguales, las varianzas de las observaciones de

3 4 VERIFICACIN DE LA ADECUACIN DEL MODELO

Ikbla 3-7

Datos de la descarga pico

Mtodo de
estimacin

Observaciones
0,34
0.91
6.31
17.15

1
2
3
4
Mtodo de
estimacin
1
2
3
4

83

0.12
2.94
8.37
11.82

1.23
2.14
9.75
10.95

0.70
2.36
6.09
17.20

1.75
2.86
9.82
14.35

0.12
4.55
7.24
16.82

0.71
2.63
7.93
14.72

%
0.520
2.610
7.805
15.59

5,
0.66
1.09
1.66
2.77

Desviaciones d para la prueba de Levene modiflcada


0.18
1.70
1.495
1.56

0.40
0.33
0.565
3.77

0.71
0.47
1.945
4.64

0.18
0.25
1.715
1.61

1.23
0.25
2.015
1.24

0.40
1.94
0.565
1.23

todos los tratamientos sern iguales. El estadstico de prueba para la prueba de Levene es simplemente el
estadstico F ANOVA usual para probar la igualdad de las medias que se aplica a las desviaciones absolutas.

EJEMPLO 3 - 5 .................................................................................................................................................
Un ingeniero civil est interesado en determinar si cuatro mtodos diferentes para estimar la frecuencia
de las inundaciones producen estimaciones equivalentes de la descarga pico cuando se aplican a la misma
cuenca. Cada procedimiento se usa seis veces en la cuenca, y los datos de las descargas resultantes (en
pies cbicos por segundo) se muestran en la parte superior de la tabla 3-7. El anlisis de varianza de los
datos, el cual se resume en la tabla 3-8, implica que hay una diferencia en las estimaciones de la descarga
pico promedio obtenidas en los cuatro procedimientos. La grfica de los residuales contra los valores
ajustados, la cual se muestra en la figura 3-7, es preocupante porque la forma de embudo con la boca ha
cia afuera indica que no se satisface el supuesto de una varianza constante.
Se aplicar la prueba de Levene modificada a los datos de la descarga pico. La parte superior de la ta
bla 3-7 contiene las medianas de los tratamientos x y la parte inferior contiene las desviaciones dj alrede
dor de las medianas. La prueba de Levene consiste en realizar un anlisis de varianza estndar en las dy.
El estadstico de pruebaFque resulta en este caso esFg = 4.55, para el cual el valor P es P = 0.0137. Por lo
tanto, la prueba de Levene rechaza la hiptesis nula de que las varianzas son iguales, coincidiendo en
esencia con el diagnstico que se hizo a partir del examen visual de la figura 3-7. Los datos de la descarga
pico son im buen candidato para una transformacin de datos.

Seleccin emprica de una transformacin


Se seal ya que si los experimentadores conocieran la relacin entre la varianza de las observaciones y la
media, podran usar esta informacin como gua para la seleccin de la forma de la transformacin. Se

Tabla 3-8

Anlisis de varianza de los datos de la descarga pico

Fuente de
variacin

Suma de
cuadrados

Grados de
libertad

Cuadrado
medio

Mtodos
E nor
Tbtal

708.3471
62.0811
770.4282

3
20
23

236.1157
3.1041

Fo
76.07

Valor P
<0.001

84

CAPTULO 3 EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA


4
3
2

' O
-1

-2
-3

10

15

20

hFigura 3-7 Grfica de los residuales contra y~ para el


ejemplo 3-5.

desarrolla ahora este punto y se presenta un mtodo para seleccionar empricamente la forma de la trans
formacin requerida de los datos.
SeaE)/) = ^ la media de>', y suponga que la desviacin estndar de y es proporcional a una potencia
de la media de y tal que
oy
Quiere encontrarse una transformacin dey que produzca una varianza constante. Suponga que la trans
formacin es una potencia de los datos originales, por ejemplo
= /

(3-20)

Puede demostrarse entonces que


'

(3-21)

Evidentemente, si se hace = 1 - a, la varianza de los datos transformados y* es constante.


En la tabla 3-9 se resumen varias de las transformaciones comunes analizadas anteriormente. Obser*
ve que A = O implica la transformacin logartmica. Estas transformaciones se enlistan en el orden de
fuerza creciente. Por fuerza de una transformacin se entiende la cantidad de curvatura que induce. Una
transformacin suave aplicada a datos que se extienden en un rango estrecho tiene escaso efecto sobre el

labia 3'9

Transformaciones para estabilizar la varianza

Relacin entre
o constante

a
0
1/2
1
3/2
2

X= l - a
1
1/2
0
-1/2
-1

Tansformacin
Sin transformacin
Raz cuadrada
Log
Raz cuadrada recproca
Recproco

Comentario
Datos (nmeros) de Poisson

3-4 VERIFICACIN DE LA ADECUACIN DEL MODELO

85

1.5

1.0

0.5

7:
Cl
o

-0.5

-1

-1

logy..
Figura 3-8 Grfica de log S contra logjj para los datos de
la descarga pico del ejemplo 3-5.

anlisis, mientras que una transformacin fuerte aplicada en un rango amplio puede tener resultados dra
mticos. Con frecuencia las transformaciones tienen escaso efecto a menos que el cociente yaJymin
mayor que 2 o 3.
En muchas situaciones de diseo experimental en las que se usan rplicas, a puede estimarse empri
camente a partir de los datos. Puesto que la combinacin i-simo de los tratamientos 0 ^
=
donde 8 es una constante de proporcionalidad, pueden tomarse logaritmos para obtener
(3-22)

logCT^^ - log 6+a log/-

Por lo tanto, una grfica de log <7^ contra log//, sera una lnea recta con pendiente a. Puesto que no se co
nocen
y fi, pueden sustituirse estimaciones razonables de ellos en la ecuacin 3-22 y usar la pendiente
del ajuste de la lnea recta resultante como estimacin de a. D e manera tpica, se usara la desviacin es
tndar S y el promedio y, del tratamiento -simo (o, en trminos ms generales, la combinacin /-sima
de los tratamientos o conjunto de condiciones experimentales) para estimar (7^ y
Para investigar la posibilidad de usar una transformacin para estabilizar la varianza en los datos de
la descarga pico del ejemplo 3-5, en la figura 3-8 se grafica log S contra logy,. La pendiente de la recta que
pasa por estos cuatro puntos est cerca de 1/2 y, por la tabla 3-9, esto implica que la transformacin de la
raz cuadrada puede ser apropiada. El anlisis de varianza de los datos transformados^* =
se presenta
en la tabla 3-10, y en la figura 3-9 se muestra una grfica de los residuales contra la respuesta predicha.
Esta grfica residual muestra una mejora sensible en comparacin con la figura 3-7, por lo que se conclu-

Tabla 3 -1 0

Anlisis de varianza de los datos transformados de la descarga pico, y* = ^/y

Fuente de
variacin

Suma de
cuadrados

Grados de
libertad

Mtodos
Error
Total

32.6842
2.6884
35.3726

3
19
22

Cuadrado
medio
10.8947
0.1415

F,

V alor/

76.99

<0.001

86

CAPTULO 3

EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARJANZA

1.00

0.76
0.50
0,25

O
-0.25
-0.50
-0.75
-

1.00
j ________ L

y*
Figura 3-9 Grfica de los residuales de los datos transfor
mados contra para los datos de la descarga pico del ejem
plo 3-5.

ye que la transformacin de la raz cuadrada ha sido til. Observe que en la tabla 3-10 se han reducido los
grados de libertad del error en 1 para tomar en consideracin el uso de los datos para estimar el parme
tro de la transformacin a.
En la prctica, muchos experimentadores seleccionan la forma de la transformacin probando varias
alternativas y observando el efecto de cada transformacin en la grfica de los residuales contra la res
puesta predicha. Entonces se selecciona la transformacin que produjo la grfica residual ms satisfactoria.

3'4<4

Grficas de los residuales contra otras variables

Si se han recolectado datos de cualesquiera otras variables que posiblemente pudieran afectar la respues
ta, los residuales debern graficarse contra estas variables. Por ejemplo, en el experimento de la resisten
cia a la tensin del ejemplo 3-1, la resistencia puede ser afectada de manera significativa por el espesor de
la fibra, por lo que los residuales debern graficarse contra el espesor de la fibra. Si se usaron diferentes
mquinas de prueba para recolectar los datos, los residuales debern graficarse contra las mquinas. Los
patrones en tales grficas residuales implican que la variable afecta la respuesta. Esto sugiere que la varia
ble debera controlarse con mayor atencin en experimentos futuros o que debera incluirse en el anhsis.

3-5

INTERPRETACIO N PR ACTICA DE LOS RESULTADOS

Despus de realizar el experimento, llevar a cabo el anlisis estadstico e investigar los supuestos funda
mentales, el experimentador est listo para sacar conclusiones prcticas acerca del problema bajo estu
dio, Muchas veces esto es relativamente fcil, y ciertamente en los experimentos sencillos que se han
considerado hasta este punto, esto podra hacerse de manera un tanto informal, tal vez mediante la ins
peccin de las representaciones grficas, como los diagramas de caja y el diagrama de dispersin de las fi
guras 3-1 y 3*2. Sin embargo, en algunos casos es necesario aphcar tcnicas ms formales. En esta seccin
se presentarn algunas de ellas.

3-5 INTERPRETACIN PRCTICA DE LOS RESULTADOS

3-5.1

87

U n modelo de regresin

Los factores que intervienen en un experimento pueden ser cuantitativos o cualitativos. Un factor cuan
titativo es aquel cuyos niveles pueden asociarse con puntos en una escala numrica, como la temperatura,
la presin o el tiempo. Los factores cualitativos, por otra parte, son aquellos cuyos niveles no pueden or
denarse por magnitud. Los operadores, los lotes de materia prima y los cambios de tumo son factores
cualitativos tpicos, ya que no existe ninguna razn para ordenarlos bajo algn criterio numrico particular.
En lo que se refiere al diseo inicial y al anlisis del experimento, ambos tipos de factores se tratan de
manera idntica. El experimentador est interesado en determinar las diferencias, en caso de haberlas,
entre los niveles de los factores. Si el factor es cualitativo, como los operadores, no tiene sentido conside
rar la respuesta de una corrida subsecuente en un nivel intermedio del factor. Sin embargo, con un factor
cuantitativo como el tiempo, el experimentador tiene inters por lo general en el rango completo de los
valores usados, particularmente la respuesta de una corrida subsecuente con un nivel intermedio del fac
tor. Es decir, si se usan los niveles 1.0,2.0 y 3.0 en el experimento, tal vez quiera predecir la respuesta de
2.5 horas. Por lo tanto, el experimentador tiene con frecuencia inters en desarrollar una ecuacin de in
terpolacin para la variable de respuesta del experimento. Esta ecuacin es un modelo emprico del pro
ceso que se ha estudiado.
Al enfoque general para ajustar modelos empricos se le llama anlisis de regresin, el cual se analiza
en detalle en el captulo 10. Vase tambin el material suplementario del texto para este captulo. En esta
seccin se ilustra brevemente la tcnica utilizando los datos de la resistencia a la tensin del ejemplo 3-1.
En la figura 3-10 se presenta el diagrama de dispersin de la resistencia a la tensin y contra el peso
porcentual del algodn ;c en la tela para el experimento del ejemplo 3-1. Los crculos huecos de la grfica
son las resistencias de tensin promedio para cada valor a: del peso porcentual del algodn. A partir del
examen del diagrama de dispersin, es evidente que la relacin entre la resistencia a la tensin y el peso

2S

20

15

10

10

20

30

40

Peso porcentual del algodn

Figura 3-10 Diagrama de dispersin para los datos


de la resistencia a la tensin del ejemplo 3-1.

88

CAPTULO 3 EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

porcentual del algodn no es lineal. Como una primera aproximacin, podra intentarse ajustar un mode
lo cuadrtico para los datos, por ejemplo

d o n d e y ^ 2 son parmetros desconocidos que debern estimarse y e es un trmino del error aleatorio.
El mtodo que se usa con mayor frecuencia para estimar los parmetros en un modelo como ste es el m
todo de mnimos cuadrados. ste consiste en elegir estimaciones de las tales que minimicen la suma de
cuadrados de los errores (las e ) . El ajuste de mnimos cuadrados en el ejemplo que se considera aqu es
j>=-39.9886+ 4.596^ :-0.0886 a:^
(Si el lector no est familiarizado con los mtodos de regresin, vea el captulo 10 y el material suplemen
tario del texto para este captulo.)
En la figura 3-10 se muestra este modelo cuadrtico. No parece muy satisfactorio, ya que subestima
de manera drstica las respuestas paraje = 30% de algodn y sobrestima las respuestas parax = 25%.
Quiz pueda lograrse un mejoramiento agregando un trmino cbico enx. El ajuste con el modelo cubico
resultante es
y = 62.6114- 9.0114a:-I-0.4814JC" - 0.0076a:^
Este ajuste cbico se ilustra tambin en la figura 3-10. El modelo cbico parece mejor que el cuadrtico
porque proporciona un ajuste mejor para jc = 25 y JC = 30% de algodn.
En general, sera preferible hacer el ajuste con el polinomio de orden menor que describa adecuada
mente el sistema o proceso. En este ejemplo, el polinomio cbico parece un mejor ajuste que el cuadrti
co, por lo que la complejidad adicional del modelo cbico se justifica. Sin embargo, seleccionar el orden
del polinomio de aproximacin no siempre es fcil, y es relativamente sencillo excederse en el ajuste, es
decir, agregar polinomios de orden superior que no mejoran en realidad el ajuste pero que incrementan
la complejidad del modelo y con frecuencia demeritan su utilidad como predictor o ecuacin de interpo
lacin.
En este ejemplo, el modelo emprico podra usarse para predecir la resistencia a la tensin media
para los valores del peso porcentual del algodn dentro de la regin de experimentacin. En otros casos,
el modelo emprico podra usarse para la optimizacin del proceso, es decir, para encontrar los niveles de
las variables del diseo que dan como resultado los mejores valores de la respuesta. Ms adelante se ana
lizarn e ilustrarn en detalle estos problemas.

3 '5 .2

Comparaciones entre las medias de los tratamientos

Suponga que al hacer el anhsis de varianza en el modelo con efectos fijos se rechaza la hiptesis nula. Por
lo tanto, hay diferencias entre las medias de los tratamientos, pero no se especifica exactamente cules
medias difieren. En ocasiones pueden ser de utilidad en esta situacin las comparaciones y los anlisis
adicionales entre grupos de las medias de los tratamientos. La media del tratamiento /-simo se define
como fi = fj. + T,Yfi se estima cony,. Las comparaciones entre las medias de los tratamientos se hacen ya
sea en trminos de los totales de los tratamientos {y,} o bien de los promedios de los tratamientos {y, }. Es
comn llamar a los procedimientos para hacer estas comparaciones mtodos de comparaciones mlti
ples. En varias de las secciones siguientes se analizan los mtodos para hacer comparaciones entre las me
dias de los tratamientos individuales o de grupos de estas medias.

3-5 INTERPRETACIN PRCTICA DE LOS RESULTADOS

3-5.3

89

Comparaciones grficas de medias

Es muy sencillo desarrollar un procedimiento grfico para la comparacin de las medias despus de un
anlisis de varianza. Suponga que el factor de inters tiene a niveles y queyi , 3'2.) >%. son los promedios
de los tratamientos. Si se conoce a, el promedio de cualquier tratamiento tendra una desviacin estndar
a/V. Por consiguiente, si todas las medias de los niveles del factor son idnticas, las medias mustrales
observadas y, se comportaran como un conjunto de observaciones tomadas al azar de una distribucin
normal con mediax. y desviacin estndar cr/V. Visualice una distribucin normal con la capacidad de ser
deslizada sobre un eje abajo del cual estn graficadasy, ,^2 j ,ya.- Si todas las medias de los tratamientos
son iguales, deber haber una posicin de esta distribucin que haga evidente que los valores y, se sacaron
de la misma distribucin. Si no es ste el caso, los valores que no parecen haberse sacado de esta distri
bucin se asocian con los niveles del factor que producen respuestas medias diferentes.
La nica falla en esta lgica es que a es desconocida. Sin embargo, puede sustituirse a con
del
anlisis de varianza y usar una distribucin t con un factor de escalacin ^JMS^ / n en lugar de la distribu
cin normal. En la figura 3-11 se muestra este arreglo para los datos de la resistencia a la tensin del ejem
plo 3-1.
Para trazar la distribucin t de la figura 3-11, simplemente se multiplica el valor de la abscisa t por el
factor de escalacin
V M S 7 ^ = 7 8 ^ 5 = 1.27
y se grafica contra la ordenada de t en ese punto. Dada la gran simihtud entre la distribucin t y la normal,
excepto porque la primera es un poco ms plana cerca del centro y tiene colas ms largas, por lo general
este trazo se construye fcilmente a ojo. Si quiere obtenerse mayor precisin, en Box, Hunter y Hunter
[18] se incluye una tabla de los valores de las abscisas r y las ordenadas correspondientes. La distribucin
puede tener un origen arbitrario, aun cuando por lo general es mejor uno que est en la regin de los valo
res y que van a compararse. En la figura 3-11, el origen es 15 Ib/pulg^.
Visualice ahora el desplazamiento de la distribucin t de la figura 3-11 sobre el eje horizontal y exami
ne las cinco medias graficadas en la figura. Observe que no hay ninguna posicin de la distribucin tal que
los cinco promedios puedan considerarse como observaciones tpicas seleccionadas al azar de la distribu
cin. Esto implica que las cinco medias no son iguales; por lo tanto, la figura es una representacin grfica
de los resultados del anlisis de varianza. La figura indica que 30% de algodn produce resistencias a la
tensin mucho ms altas que 20 o 25 por ciento de algodn (las cuales son aproximadamente iguales), y
que 15 o 35 por ciento de algodn (las cuales son aproximadamente iguales) produciran resistencias a la
tensin an ms bajas.

I___________ 1_5|35___________|20
5

10

15

25

I
20

30________ |
25

Resistencia a la tensin promedio


(lh/pulg=)

Figura 3-11 Promedio de la resistencia a la tensin del experimento del peso


porcentual del algodn en relacin con una distribucin / con un factor de es
calacin
= VeTS = 127.

90

CAPTULOS

EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

Este procedimiento simple es una tcnica aproximada pero eficaz en muchos problemas de compara
ciones mltiples. Sin embargo, existen mtodos ms formales, A continuacin se presenta una breve revi
sin de algunos de estos procedimientos.

3-5.4

Contrastes

Muchos mtodos de comparaciones mltiples utilizan el concepto de contraste. Considere el problema


de la prueba de la fibra sinttica del ejemplo 3-1. Puesto que se rechaz la hiptesis nula, se sabe que algu
nos pesos porcentuales del algodn producen resistencias a la tensin diferentes que otros, pero, cules
son los que causan en realidad esta diferencia? Al principio del experimento podra sospecharse que los
niveles 4 y 5 del peso porcentual del algodn (30 y 35 por ciento) producen la misma resistencia a la ten
sin, lo cual implicara que la hiptesis por probar sera

o, de manera equivalente.

Si desde el principio del experimento se hubiera sospechado que el promedio de los niveles ms bajos del
peso porcentual del algodn (1 y 2) no difera del promedio de los niveles ms altos del peso porcentual
del algodn (4 y 5), entonces la hiptesis habra sido
fi, + f i ,

/^5 O

(3-24)

En general, un contraste es una combinacin lineal de parmetros de la forma

1=1

donde las constantes de los contrastes Cj, C j , s u m a n cero; es decir,


riores pueden expresarse en trminos de contrastes:

= 0. Las dos hiptesis ante

=0
=1

(3-25)

1=1
Las constantes de los contrastes para las hiptesis de la ecuacin 3-23 son c i ~ c 2 = c = 0, c^= + l y c =
-1, mientras que para las hiptesis de la ecuacin 3-24 son Cj = C2 = +1, Cj = O, y C4 = c, = -1.

3-5 INTERPRETACIN PRCTICA DE LOS RESULTADOS

91

Las pruebas de hiptesis que incluyen contrastes pueden hacerse de dos maneras bsicas. En el pri
mer mtodo se utiliza la prueba t. El contraste de inters se escribe en trminos de los totales de los trata
mientos, obtenindose

c= i

c,y,.

La varianza de C es
(3-26)

F (C ) = n a ^

cuando los tamaos de las muestras de cada tratamiento son iguales. Si la hiptesis nula de la ecuacin
3-25 es verdadera, el cociente

=1

ina
tiene la distribucin N ( 0 , 1). Entonces se sustituira la varianza desconocida
cuadrtico medio MS^, y se utilizara el estadstico

con su estimacin, el error

(3-27)

in M S ^ ^ cf
para probar las hiptesis de la ecuacin 3-25. La hiptesis nula se rechazara si | o | de la ecuacin 3-27 ex
cede t.a,N-aEn el segundo enfoque se utiliza la prueba F. Entonces, el cuadrado de una variable aleatoria t con v
grados de libertad es una variable aleatoria F con un grado de libertad en el numerador y v grados de li
bertad en el denominador. Por lo tanto, puede obtenerse
\2

\=l

(3-28)
.=1

como un estadstico F para probar la ecuacin 3-25. La hiptesis nula se rechazara si f >
tadstico de prueba de la ecuacin 3-28 puede escribirse como
=

MSc
MS e

Este es

55c/I
MS e

donde la suma de cuadrados de los contrastes con un solo grado de libertad es

55c

\=i

(3-29)
1=1

92

CAPTULO 3

EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

Intervalo de confianza para u n contraste

En lugar de probar hiptesis acerca de un contraste, puede ser ms til construir un intervalo de confian
za. Entonces el contraste suele expresarse en trminos de los promedios de los tratamientos y;. Suponga
que el contraste de inters es

i= l

Al sustituir las medias de los tratamientos con los promedios de los tratamientos se obtiene
c = c ,y ,

cuando los tamaos de las muestras son iguales. Si se usaMS^ para estimar
100(1 - a ) por ciento para el contraste
es

,=i

V ^

1=1

=i

^1

, el intervalo de confianza de

'

Evidentemente, si este intervalo de confianza incluye al cero, no podra rechazarse la hiptesis nula en la
ecuacin 3-25.
C ontraste estandarizado

Cuando hay inters en ms de un contraste, con frecuencia es til evaluarlos en la misma escala. Una for
ma de hacer esto es estandarizando el contraste para que su varianza sea a^. Si el contraste
se
expresa en trminos de los totales de los tratamientos como
y , al dividirlo por
se obtendr
un contraste estandarizado con varianza o^. Entonces el contraste estandarizado es en reahdad

i=i
donde
c,.
C; =

Tamaos de las m uestras desiguales

Cuando los tamaos de las muestras de cada tratamiento son diferentes, se introducen modificaciones
menores en los resultados anteriores. Primero, observe que la definicin de un contraste requiere ahora
que
2

= O

3-5 INTERPRETACIN PRCTICA DE LOS RESULTADOS

93

Otros cambios requeridos son directos. Por ejemplo, el estadstico t de la ecuacin 3-27 queda como

t o = ___

c,y.

iMS

i=l

y la suma de cuadrados de los contrastes de la ecuacin 3-29 queda como

SSc =

3 -5 .5

\i=l

Contrastes ortogonales

Un caso especial til del procedimiento de la seccin 3-5.4 es el de los contrastes ortogonales. Dos con
trastes con coeficientes {c,} y {d,} son ortogonales si
c y ,= 0
o, para un diseo no balanceado, si

Para a tratamientos, el conjunto de a - 1 contrastes ortogonales hace la particin de la suma de cuadrados


debida a los tratamientos en a - 1 componentes independientes con un solo grado de libertad. Por lo tan
to, las pruebas que se realizan en los contrastes ortogonales son independientes.
Existen varias maneras de elegir los coeficientes de los contrastes ortogonales para un conjunto de
tratamientos. En general, algn elemento en la naturaleza del experimento deber sugerir las compara
ciones que son de inters. Por ejemplo, si hay a = Z tratamientos, donde el tratamiento 1 es de control y
donde los niveles del factor en los tratamientos 2 y 3 son de inters para el experimentador, los contrastes
ortogonales apropiados podran ser los siguientes;

Uratamiento
1 (control)
2 (nivel 1)
3 (nivel 2)

Coeficientes de los
contrastes ortogonales
~2
0
1
-1
1
1

Observe que el contraste 1 con c = - 2 , 1 , 1 compara el efecto promedio del factor con el control, mientras
que el contraste 2 con d = O, -1 , 1 compara los dos niveles del factor de inters.
En general, el mtodo de contrastes (o de contrastes ortogonales) es til para lo que se llama compa
raciones preplaneadas. Es decir, los contrastes se especifican antes de llevar a cabo el experimento y de
examinar los datos. La razn de esto es que, si las comparaciones se seleccionan despus de examinar los

94

CAPTULOS

EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

datos, la mayora de los experimentadores construiran pruebas que corresponderan con las diferencias
grandes observadas en las medias. Estas diferencias grandes podran ser el resultado de la presencia de
efectos reales o podran ser el resultado del error aleatorio. Si los experimentadores se inclinan consisten
temente a escoger las diferencias ms grandes para hacer las comparaciones, inflarn el error tipo I de la
prueba porque es probable que, en un porcentaje inusualmente elevado de las comparaciones selecciona
das, las diferencias observadas sern el resultado del error. Al examen de los datos para seleccionar las
comparaciones de inters potencial se le llama con frecuencia curioseo o sondeo de datos. El mtodo de
Scheff para todas las comparaciones, el cual se comenta en la seccin siguiente, permite el curioseo o
sondeo de datos.

EJEMPLO 3 - 6 .................................................................................................................................................
Considere los datos del ejemplo 3-1. Hay cinco medias de los tratamientos y cuatro grados de libertad en
tre estos tratamientos. Suponga que antes de correr el experimento se especific la siguiente serie de
comparaciones entre las medias de los tratamientos (y sus contrastes asociados):
Contraste

Hiptesis

Q=
Q=

-y4. + 3's.
:vi.

Q = yi.

Hofii

+fis

Q = -''i. +

-y^.
-y^. - y a. - y,.

Observe que los coeficientes de los contrastes son ortogonales. Utilizando los datos de la tabla 3-4, se en
cuentra que los valores numricos de los contrastes y de las sumas de cuadrados son los siguientes:
55,

5(2)

55,

C3=- hl (49 )

5(4)

- 1 (88)

5(2)
55, =

Tabla 3-11

5(20)

-291.60
= 31.25
= 152.10
== 0.81

Anlisis de varianza de los datos de la resistencia a la tensin

Fuente de
variacin
Peso porcentual del algodn
contrastes ortogonales

= ^3
Q 4/J
+

Suma de
cuadrados

Grados de
libertad

Cuadrado
medio

F,

Valor P

475.76

118.94

14.76

<0.001

(291.60)
(31.25)
(152.10)
(0.81)

1
1
1
1

291.60
31.25
152.10
0.81

36.18
3.88
18.87
0.10

<0.001
0.06
<0.001
0.76

8.06

Error

161.20

20

Total

636.96

24

3'5 INTERPRETACIN PRCTICA DE LOS RESULTADOS

95

Estas sumas de cuadrados de los contrastes hacen la particin completa de la suma de cuadrados de los
tratamientos. Las pruebas de estos contrastes ortogonales se incorporan por lo general en el anlisis de
varianza, como se muestra en la tabla 3-11. Por los valores P se concluye que hay diferencias significativas
entre los niveles 4 y 5 y 1 y 3 del peso porcentual del algodn, pero que el promedio de los niveles 1 y 3 no
difiere del promedio de los niveles 4 y 5 con el nivel a = 0.05, y que el nivel 2 no difiere del promedio de los
otros cuatro niveles.

3-5.6

Mtodo de Scheff para comparar todos los contrastes

En muchas situaciones, los experimentadores pueden no conocer de antemano cules son los contrastes
que quieren comparar, o pueden tener inters en ms de a - 1 posibles comparaciones. En muchos experi*
mentos de exploracin, las comparaciones de inters slo se descubren despus del examen preliminar de
los datos. Scheff [98a] ha propuesto un mtodo para comparar todos y cada uno de los contrastes posi
bles entre las medias de los tratamientos. En el mtodo de Scheff, el error tipo I es a lo sumo a para cual
quiera de las comparaciones posibles.
Suponga que se ha determinado un conjunto de m contrastes
+

u = l,% ...,m

(3-31)

en las medias de los tratamientos de inters. El contraste correspondiente de los promedios de los trata
mientos
es
u = \,2 ,...,m

(3-32)

y el error estndar de este contraste es

{clin ,)

(3-33)

1=1

donde n es el nmero de observaciones en el tratamiento i-simo. Puede demostrarse que el valor crtico
contra el que deber compararse C es
(3-34)
Para probar la hiptesis de que el contraste difiere de manera significativa de cero, se compara C con
el valor crtico. Si | C | >
se rechaza la hiptesis de que el contraste
es igual a cero.
El procedimiento de Scheff puede usarse tambin para formar intervalos de confianza para todos
los contrastes posibles entre las medias de los tratamientos. Los intervalos resultantes, por ejemplo C < r < C -I- 5a , son intervalos de confianza simultneos por cuanto la probabilidad de que todos
ellos sean verdaderos simultneamente es al menos 1 - a.
Para ilustrar el procedimiento, considere los datos del ejemplo 3-1 y suponga que los contrastes de in
ters son
ri=yMi+/<3-/M4-/W5
y
Los valores numricos de estos contrastes son
Ci = + 5 ^ 3 , - A - 5 5.
= 9 .8 0 + 1 7 .6 0 -2 1 .6 0 -1 0 .8 0
= 5.00

96

CAPTULO 3

EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

y
= 9.8 0 -2 1 .6 0
= -11.80
y los errores estndar se encuentran con la ecuacin 3-33 como

"r

= , ^ 5 , 2 ( 4 / ^ ) = V8.06(1 + 1 ) / 5 = 1.80
V
1=1
Por la ecuacin 3-34, los valores crticos de 1% son
5o.ou = 5c. V(-

^0.01,2

= 2 .5 4 7 4 (4 4 ^ = 10.69

l)-^o.oi,o-i,jv-a'

1-8074(4.43)

7.58

Puesto que | Cj | < So.01,1, se concluye que el contraste


n^+
-jUs es igual a cero; es decir, no
existe evidencia slida para concluir que las medias de los tratamientos 1 y 3 como grupo difieren de las
medias de los tratamientos 4 y 5 como grupo. Sin embargo, como | C21 > Som,2>se concluye que el contras
te T2 =
-jW4 no es igual a cero; es decir, las resistencias medias de los tratamientos 1 y 4 difieren signifi
cativamente.
En muchas situaciones prcticas, querrn compararse slo pares de medias. Frecuentemente, es po
sible determinar cules son las medias que difieren probando las diferencias entre todos los pares de me
dias de los tratamientos. Por lo tanto, el inters se encuentra en los contrastes de la forma V = n-n para
toda i
Aun cuando el mtodo de Scheff podra aplicarse fcilmente a este problema, no es el procedi
miento ms sensible para tales comparaciones. Se pasa ahora a la consideracin de los mtodos diseados
especficamente para las comparaciones por pares entre todas las a medias poblacionales.

3-5.7

Comparacin de pares de medias de tratamientos

Suponga que el inters se encuentra en comparar todos los pares de a medias de tratamientos y que las hi
ptesis nulas que quieren probarse son
para toda i
A continuacin se presentan cuatro m
todos para hacer estas comparaciones.
Prueba de Tukey
Suponga que, despus de un anlisis de varianza en el que se ha rechazado la hiptesis nula de la igualdad
de las medias de los tratamientos, quieren probarse todas las comparaciones de las medias por pares:

para toda i
Tkey [ l l l d ] propuso un procedimiento para probar hiptesis para las que el nivel de sig
nificacin global es exactamente a cuando los tamaos de las muestras son iguales y es a lo sumo a cuando

3-5 INTERPRETACIN PRCTICA DE LOS RESULTADOS

97

los tamaos de las muestras no son iguales. Este procedimiento puede usarse tambin para contraer los
intervalos de confianza para las diferencias en todos los pares de medias. Para estos intervalos, el nivel de
confianza simultneo es de 100(1 - a ) por ciento cuando los tamaos de las muestras son iguales y de al
menos 100(1 - a) por ciento cuando los tamaos de las muestras no son iguales. Se trata de un procedi
miento excelente para curiosear sobre los datos cuando el inters se centra en pares de medias.
El procedimiento de Hikey hace uso de la distribucin del estadstico del rango studentzado

^MS^/n

dondej^m^ y^ninson las medias mustrales mayor y menor, respectivamente, sacadas de un grupo de p me
dias mustrales. La tabla VIII del apndice contiene los valores de q j p , f ) , los puntos porcentuales a su
periores de q, donde / es el nmero de grados de libertad asociados con MS^. Para tamaos de las
muestras iguales, la prueba de Tbkey declara que dos medias son significativamente diferentes si el valor
absoluto de sus diferencias mustrales excede
(3-35)

T. = q a , f ) j ^

D e manera equivalente, podra construirse una serie de intervalos de confianza de 100(1 - a ) por ciento
para todos los pares de medias de la siguiente manera:
^5^,.

(3-36)

Cuando los tamaos de las muestras no son iguales, las ecuaciones 3-35 y 3-36 quedan como
1
1
MS, -I
n, n.

T =

yL -yj-

V2

^1
1^
MS. -I-
^
, rij

(3-37)

V2

MS, + , i ^ j
^
"y

(3-38)

respectivamente. A la versin para tamaos de las muestras diferentes se le llama en ocasiones el procedi

miento Ttakey-Kramer.

EJEMPLO 3 - 7 .................................................................................................................................................
Para ilustrar la prueba de Tukey, se usan los datos del experimento del peso porcentual del algodn del
ejemplo 3-1. Con a = 0.05 y / = 20 grados de libertad para el error, en la tabla VIII del apndice se obtie
ne ^005(5, 20) = 4.23. Por lo tanto, por la ecuacin 3-35,

^l).05

90.05

20)

98

CAPTULO 3

y,.

y^.

9,8

10,8

EXPERIMENTOS CON UN SOLO FACTOR; EL ANLISIS DE VARIANZA

15.4

h.

17.6

21.6

Figura 3-12 Resultados de la prueba de Hikey.

Por lo tanto, cualquier par de promedios de los tratamientos que difieran en valor absoluto por ms de
5.37 implicara que el par correspondiente de medias poblacionales son significativamente diferentes.
Los cinco promedios de los tratamientos son
5;^= 9.8

=15.4

^3, =17. 6

y,. = 2 1. 6

3^5 = 10.8

y las diferencias en los promedios son


= 9 .8 -1 5 .4 =

-5.6*

y ^ - y , = 9.8-17.6=

-7.8*

y ^ _ - y , , = 9 . 8 - 2 1 . 6 = -11 .8*

-yj. = 9.8-10.8= -1.0


- 3/3 = 1 5 . 4 - 1 7 . 6 = - 2 2
55^ - y , = 1 5 . 4 - 2 1 . 6 = - 6 . 2 *
=15-4-10.8=

4.6

=17.6-21.6= -4.0
=17.6-10.8=

6.8*

y , - 5/5. = 21.6 - 10.8 =

10.8 *

Los valores marcados con asterisco indican pares de medias que son significativamente diferentes. Suele
ser til trazar una grfica, como la de la figura 3-12, donde se subraya a los pares de medias que no difie
ren significativamente. Esta grfica da una indicacin de que las medias de los tratamientos forman tres
grupos: /i y ^ 5, ^2 y Asj Y
Sin embargo, la pertenencia a estos grupos no es del todo clara.

Cuando se utiliza cualquiera de los procedimientos para probar las medias por pares, ocasionalmen
te se encuentra que la prueba F global del anlisis de varianza es significativa, pero la comparacin de las
medias por pares falla para revelar cualquier diferencia significativa. Esta situacin ocurre porque la
prueba F considera simultneamente todos los contrastes posibles en los que intervienen las medias de
los tratamientos, no slo las comparaciones por pares. Es decir, en los datos a la mano, quiz no todos los
contrastes significativos sean de la forma fi - n.
Algunos paquetes de software de computadora presentan comparaciones por pares con intervalos de
confianza. Para el procedimiento de Ibkey, estos intervalos se calcularan con la ecuacin 3-36 o la 3-38,
dependiendo de si los tamaos de las muestras son iguales o no.
La deduccin del intervalo de confianza de Hikey de la ecuacin 3-36 para tamaos de las muestras
iguales es directa. Para el estadstico del rango studentizado q se tiene
mx(y, - ^ , ) - m n ( y ,
yMSJn

~ l-a

3-5 INTERPRETACINPRCnCADELOSRESULTADOS

99

Si mx(y, -|t) - mn(y, - / ,) es menor o igual que qJfi,f)^MS^ I n, debe ser verdadero que | (y, -fi) fi) I < q j fi , f ) ^ M ^ Jn para cada par de medias. Por lo tanto,

= l-a
Al reordenar esta expresin para aislar ~fi entre las desigualdades se llegar al conjunto de intervalos
de confianza simultneos de 100(1 ~ a ) por ciento dado en la ecuacin 3-38.
1 mtodo de la diferencia significativa mnima (LSD) de Fisher
En este procedimiento se utiliza el estadstico F para probar

= n

y,-y.

(3-39)

1
1
MS, +

II
Suponiendo una hiptesis alternativa de dos colas, los pares de medias(y/ij se declararan significativa
mente diferentes si |y. -y, \ > r/2
(1/ n + l / rij). A la cantidad
LSD = t o/2,Ar-o

se le llama diferencia significativa mnima. Si el diseo es balanceado,


pMS,
LSD ~ ^a/2,N-ay ^

(3-40)
= n.2 = =

= n, y
(3-41)

Para usar el procedimiento LSD de Fisher, simplemente se compara la diferencia observada entre
cada par de promedios con la LSD correspondiente. Si |y, -y \ > LSD, se concluye que las medias poblacionales /j, y fi difieren.

EJEMPLO 3-8 ..........................................................................................................................................


Para ilustrar el procedimiento, si se usan los datos del experimento del ejemplo 3-1, la LSD con a = 0.05 es

Por lo tanto, cualquier par de promedios de los tratamientos que difiera del valor absoluto por ms de
3.75 implicara que el par correspondiente de medias poblacionales es significativamente diferente. Las
diferencias en los promedios son
- P i = 9 .8 -1 5 .4 = - 5 . 6 *
A -^3. = 9 . 8 - 1 7 . 6 =

-7.8*

- ? 4 . = 9 . 8 - 2 1 . 6 = -1 1 .8 *
- >5. = 9 .8 -1 0 .8 =

-1.0

>>2.->>3. = 1 5 . 4 - 1 7 . 6 = - 1 2
>2,-)>4. = 1 5 . 4 - 2 1 . 6 = - 6 . 2 *
=15.4-10.8=

4.6*

= 1 7 . 6 - 2L6= -4.0*
j's.-Ps. = 1 7 . 6 - 1 0 . 8 =

6.8*

- jij = 2 L 6 -1 0 .8 =

10.8*

100

CAPTULO 3

EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VAIUANZA

y,.

>5-

^2-

^3-

y^-

9,8

10.8

15.4

17.6

21.6

Figura 3-13

Resultados del procedimiento LSD.

Los valores marcados con asterisco indican pares de medias que son significativamente diferentes.
En la figura 3-13 se resumen los resultados. Evidentemente, los nicos pares de medias que no difieren
significativamente son I y 5 y 2 y 3 , y e l tratamiento 4 produce una resistencia a la tensin significativa
mente mayor que los otros tratamientos.

Observe que el riesgo global a puede inflarse de manera considerable al utilizar este mtodo. Espec
ficamente, cuando a se hace ms grande, el error tipo I del experimento (el cociente del nmero de expe
rimentos en los que se comete al menos un error tipo l y el nmero total de experimentos) se hace grande.
Prueba del rango mltple de Duncan
Un procedimiento muy utilizado para comparar todos los pares de medias es la prueba del rango mltiple
desarrollada por Duncan [41]. Para aplicar la prueba del rango mltiple de Duncan cuando los tamaos
de las muestras son iguales, los a promedios de los tratamientos se arreglan en orden ascendente, y el
error estndar de cada promedio se determina como
(3-42)
Para tamaos de las muestras desiguales, se sustituye n en la ecuacin 3-42 con la media armnica
{nj,donde

del

(3-43)
=X

Observe que si i =
= = n^, = n. En la tabla de Duncan de los rangos significativos (tabla VII
del apndice) se obtienen los valores r^(p,f) para p = 2,3,...,a, donde a es el nivel de significacin y / e s el
nmero de grados de libertad del error. Estos rangos se convierten en un conjunto de a - 1 rangos mni
mos de significacin (por ejemplo, Rp) para p = 2, 3, ..., a calculando
Rp =

(P, f)S-y,

para;? = 2 , 3 , . . . , a

(3-44)

Entonces, se prueban las diferencias observadas entre las medias, empezando con la ms grande contra la
menor, la cual se comparara con el rango mnimo de significacin i?. Despus se calcula la diferencia de
la mayor y la segunda menor y se compara con el rango mnimo de significacin _ j. Estas comparacio
nes se continan hasta que todas las medias se han comparado con la media mayor. Por ltimo, se calcula
la diferencia entre la segunda media mayor y la menor y se compara con el rango mnimo de significacin
1. Este proceso se contina hasta que se han considerado las diferencias entre todos los a ( a - 1)/2 pa
res de medias posibles. Si una diferencia observada es mayor que el rango de significacin mnima corres
pondiente, se concluye que el par de medias en cuestin es significativamente diferente. Para evitar

3-5 INTERPRETACION PRACTICA DE LOS RESULTADOS

101

contradicciones, ninguna de las diferencias entre un par de medias se considera significativa si las dos m e
dias en cuestin se localizan entre otras dos medias que no difieren significativamente.

EJEMPLO 3 - 9 ................. ...............................................................................................................................


La prueba del rango mltiple de Duncan puede aplicarse al experimento del ejemplo 3-1. Recuerde que
MS^ = 8.06, AA = 25, = 5, y hay 20 grados de libertad del error. Al arreglar los promedios de los trata
mientos en orden ascendente, se tiene
9.8
y5. = 10-8
yi. = 15.4
?3.=17.6
y,, = 21 .6
El error estndar de cada promedio es 5- = V8.06/5 = 1.27. En el conjunto de rangos significativos de la
tabla VII del apndice para 20 grados de libertad y a = 0.05, se obtiene ^005(2, 20) = 2.95, /-q05(3, 20) =
3.10, /o.o5(4, 20) = 3.18 y roo5(5, 20) = 3.25. Por lo tanto, los rangos de significacin mnima son
i?,=r.,(2,20)S,__ =(2.95)(1.27)=3.75

R , = r , ,,(3, 20)5- = (ai0)(1.27)= 3.94

20)5,^ =(ai8)(1.27)= 4.04


R s = r , U 5 , 20)5- = (3.25)(1.27)= 4.13
Los resultados de las comparaciones seran
4
4
4
4
3
3
3
2
2
5

vs.
vs.
vs.
vs.
vs.
vs.
vs.
vs.
vs.
vs.

1
5
2
3
1
5
2
1
5
1

21.6 -21 .6-21.6 -21.6 -17.6 -17.6 -17.6 -15.4 -15.4 -10.8 --

9.8 =
10.8 =
15.4 =
17.6 =
9.8 =
10.8 =
15.4 =
9.8 =
10.8 =
9.8 =

11.8
10.8
6.2
4.0
7.8
6.8
2.2
5.6
4.6
1.0

>
>
>
>
>
>
<
>
>
<

4.13
4.04
3.94
3.75
4.04
3.95
3.75
3.94
3.75
3.75

(.R5)

(Ri)
(K)
(R2)
(^3)
(?2)
(^ 2)

Por el anlisis se observa que hay diferencias significativas entre todos los pares de medias con excepcin
de la 3 y la 2 y la 5 y la 1. En la figura 3-14 se muestra una grfica en la que esas medias que no son significa
tivamente diferentes aparecen subrayadas. Observe que en este ejemplo la prueba del rango mltiple de
Duncan y el mtodo LSD llevan a conclusiones idnticas.

9.8

h.

>2.

10.8

16.4

Figura 3-14

>4.
17.6

21.6

Resultados de la prueba de rango mltiple de Duncan.

102

CAPTULO 3 EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

En la prueba del rango mltiple de Duncan se requiere una diferencia observada ms grande para de
tectar pares significativamente diferentes de medias, cuando el nmero de medias incluidas en el grupo
aumenta. D e esta forma, en el ejemplo anterior ij = 3.75 (dos medias) mientras q u ei?3 = 3.94 (tres me
dias). Para dos medias, el valor crtico R 2 ser exactamente igual al valor LSD de la prueba t. Los valores
ra(p,f) de la tabla VII del apndice se eligen de tal modo que se obtenga un nivel de proteccin especifi
cado. Es decir, cuando se comparan dos medias que estn p pasos aparte, el nivel de proteccin es
(1 y* donde a es el nivel de significacin especificado para dos medias adyacentes. Por lo tanto, el n
dice de error de reportar al menos una diferencia significativa incorrecta entre dos medias es 1 - (1 - a y ~ \
cuando el tamao del grupo esp . Por ejemplo, si a = 0.05, entonces 1 - (1 - 0.05)^ = 0.05 es el nivel de sig
nificacin para comparar el par de medias adyacentes, 1 - (1 - 0.05)^ = 0.10 es el nivel de significacin
para medias que estn un paso aparte, y as sucesivamente.
En general, si el nivel de proteccin es a, las pruebas de las medias tienen un nivel de significacin
que es mayor o igual que a. Por consiguiente, el procedimiento de Duncan tiene una gran potencia; es de
cir, es muy eficaz para detectar diferencias entre medias cuando existen diferencias reales. Por esta razn,
la prueba del rango mltiple de Duncan es muy popular.
La prueba de Newman-Keuls
Esta prueba fue creada por Newman [90]. Debido a que un inters renovado en la prueba de Newman fue
generado por Keuls [64], al procedimiento se le llama la prueba de Newman-Keuls. Operacionalmente, el
procedimiento es similar a la prueba del rango mltiple de Duncan, salvo porque las diferencias crticas
entre las medias se calculan en una forma un tanto diferente. Especficamente, se calcula una serie de va
lores crticos
K = ^ P J )S -y ,.

P = X % ...,a

(3-45)

donde qjp ,f) es el punto porcentual a superior del rango studentizado para grupos de medias de tamao
p y con/grados de libertad del error. Una vez que se calculan los valores con la ecuacin 3-45, los pares
de medias extremos en los grupos de tamaop se comparan conKj, exactamente igual que en la prueba del
rango mltiple de Duncan.
Qu mtodo de comparacin por pares debe usarse?
Ciertamente, ima pregunta lgica en este punto es qu mtodo de comparacin por pares debe usarse.
Desafortunadamente, no hay una respuesta precisa para esta pregunta, y los especiaKstas en estadstica
estn con frecuencia en desacuerdo en cuanto a la utilidad de los diferentes procedimientos. Carmer y
Swanson [24] han realizado estudios de simulacin Montecarlo con varios procedimientos de compara
ciones mltiples, incluyendo algunos que no se han considerado aqu. Estos autores reportan que el m
todo de la diferencia significativa mnima es una prueba muy eficaz para detectar diferencias reales en las
medias si se aplica slo despus de que la prueba F en el anlisis de varianza sea significativa en 5%. Re
portan asimismo un buen desempeo en la deteccin de diferencias reales con la prueba del rango mlti
ple de Duncan. Esto no es motivo de sorpresa, ya que estos dos mtodos son los ms poderosos de los que
se han comentado aqu. Sin embargo, estos mtodos no incluyen el ndice de error en el modo del experi
mento, Debido a que el mtodo de TUkey efecta un control sobre el ndice de error global, muchos expe
rimentadores prefieren su uso.
La prueba de Newman-Keuls es ms conservadora que la prueba del rango mltiple de Duncan por
cuanto a que el ndice de error tipo I es menor. Especficamente, el error tipo I del experimento es a para
todas las pruebas que incluyen el mismo nmero de medias. Por consiguiente, debido a que a es por lo ge
neral bajo, la potencia de la prueba de Newman-Keuls casi siempre es menor que la de la prueba del ran
go mltiple de Duncan. Para demostrar que el procedimiento de Newman-Keuls lleva a una prueba con
menor potencia que la prueba del rango mltiple de Duncan, se observa por una comparacin de las ta

3-S INTERPRETACIN PRCTICA DE LOS RESULTADOS

103

blas VII y VIII del apndice que parap > 2 s e tiene (p /) > r^(p,f)- Es decir, es ms difcil declarar que
un par de medias es significativamente diferente al utilizar la prueba de Newman-Keuls que cuando se
usa el procedimiento de Duncan. Esto se ilustra a continuacin para el caso en que a = 0.01, a = 8 y / = 20:
p
rom(p, 20)
90.0i(Pj 20)

2
4.02
4.02

3
4.22
4.64

5
4.40
5.29

4
4.33
5.02

6
4.47
5.51

7
4.53
5.69

8
4.58
5.84

Como se seal antes, existen otros procedimientos de comparaciones mltiples. Algunos artculos
que describen estos mtodos son los de Miller [78], O Neill y Wetherill [91] y Nelson [89]. Tkmbin se re
comienda el libro de Miller [77].

3'5 .8

Comparacin de medias de tratamientos con un control

En muchos experimentos, uno de los tratamientos es un control, y el analista se interesa en comparar


cada una de las medias de los a - 1 tratamientos restantes con el control. Por lo tanto, slo es necesario ha
cer a - 1 comparaciones. Un procedimiento para hacer estas comparaciones ha sido desarrollado por
Dunnett [42]. Suponga que el tratamiento a es el control y que quieren probarse las hiptesis

para i = 1 ,2 ,..., a - 1 . El procedimiento de Dunnett es una modificacin de la prueba t comiin. Para cada
hiptesis se calculan las diferencias observadas en las medias mustrales
= l, 2, .. ., fl- 1
La hiptesis nula

se rechaza utilizando un ndice a de error tipo I si


(3-46)

MS^

donde la constante da(a - l , f ) se da en la tabla IX del apndice. (Pueden hacerse pruebas tanto de una
como de dos colas.) Observe que a es el nivel de significacin conjunto asociado con las a - 1 pruebas.

EJEMPLO 3 - 1 0 ...............................................................................................................................................
Para ilustrar la prueba de Dunnett, considere el experimento del ejemplo 3-1, asumiendo que el trata
miento 5 es el control. En este ejemplo, a = 5 , a - l = 4 ,/= 2 0 y /i( = /i = 5. Con el nivel de 5%, en la tabla
IX del apndice se encuentra que o.o5(4, 20) = 2,65. Por lo tanto, la diferencia crtica es
^ ( 4 ,2 0 ) ^ = .6 5 j M

= 4.76

(Observe que se trata de una simplificacin de la ecuacin 3-46 que resulta de un diseo balanceado.) Por
lo tanto, cualquier media de los tratamientos que difiera del control por ms de 4.76 se declarara signifi
cativamente diferente. Las diferencias observadas son
1 vs.
2 vs.
3 v s.
4 vs.

5;
-^ 5
5; >'2 -^ 5
5 :^3' - 1 7
5: ^4 -^ 5

= 9.8 - 10.8= -1.0


= 15.4 - 10.8= 4.6
. 6 - 1 0 . 8 =
6.8
= 21.6 - 10.8= 10.8

104

CAPTULO 3

EXPERIMENTOS CON UN SOLO FACTOR; EL ANLISIS DE VARLANZA

Slo las diferencias>>3


-y^ indican alguna diferencia significativa cuando se comparan con el con
trol; por lo tanto, se concluye que
^ fis y
^
Cuando se hace la comparacin de los tratamientos con un control, una buena idea es usar ms obser
vaciones para el tratamiento de control (por ejemplo, n^) que para los dems tratamientos (por ejemplo,
n), suponiendo un nmero igual de observaciones para los a - 1 tratamientos restantes. El cociente n jn
deber elegirse de tal modo que sea aproximadamente igual a la raz cuadrada del nmero total de trata
mientos. Es decir, se elige nJn = Va?

3-6

M UESTRA DE SALIDA DE CO M PU TA D O R A

Hay una gran cantidad de programas de computadora para apoyar el diseo experimental y la realizacin
de anlisis de varianza. En la figura 3-15 se muestra la salida de uno de estos programas, Design-Expert,
utilizando los datos del experimento con un solo factor del ejemplo 3-1. La suma de cuadrados correspondien
te al Modelo (Model) es la 55iiatamientos usual de un diseo con un solo factor. Esa fuente se identifica adi
cionalmente como A . Cuando hay ms de un factor en el experimento, la suma de cuadrados (Sum of
Squares) del modelo se descompondr en varias fuentes (A,B, etc.). Observe que el resumen del anlisis
de varianza de la parte superior de la salida de computadora contiene las sumas de cuadrados, los grados de
libertad (D F , degrees of freedom), los cuadrados medios (Mean Square) y el estadstico de pruebafo
(F Valu) acostumbrados. La columna Prob > F es el valor P (de hecho, el lmite superior del valor P,
ya que a las probabiUdades menores que 0.0001 se les asigna el valor por omisin 0.0001).
Adems del anhsis de varianza bsico, el programa presenta informacin adicional til. La cantidad
R cuadrada (R-Squared) se define como
Total

636.96

y se interpreta en trminos generales como la proporcin de la variabilidad en los datos exphcada por el
modelo del anlisis de varianza. Por lo tanto, en los datos para probar la resistencia de la fibra sinttica, el
factor peso porcentual del algodn explica cerca de 74.69% de la variabilidad en la resistencia a la ten
sin. Evidentemente, debe tenerse O <
1, siendo ms deseables los valores ms grandes. En la sahda
se presentan tambin otros estadsticos en R^.
ajustada (Adj R-Squared) es una variante del esta
dstico R^ comn que refleja el nmero de factores presentes en el modelo. Puede ser un estadstico t
en experimentos ms complejos en los que intervienen varios factores en el diseo, cuando quiere eva
luarse el impacto de aumentar o disminuir el nmero de trminos del modelo. Desviacin estndar
(Std. Dev.) es la raz cuadrada del cuadrado medio del error, V8.060 = 2.839, y C.V. es el coeficiente
de variacin, definido como (^AS e / y)100. El coeficiente de variacin mide la variabilidad no explicada
o residual de los datos como un porcentaje de la media (Mean) de la variable de respuesta. PRESS
son las siglas de Prediction Error Sum o f Squares (suma de cuadrados del error de prediccin) y es una me
dida de la adecuacin con que es posible que el modelo del experimento predecir las respuestas en un
nuevo experimento. Son deseables valores pequeos de PRESS. Alternativamente, puede calcularse una
R^ para predicciones con base en PRESS (ms adelante se indicar cmo hacer esto). Esta Rl^^ (Pred
R-Squared) para el problema tratado aqu es 0.6046, el cual no es irrazonable, considerando que el mo
delo explica cerca de 75% de la variabilidad del experimento en curso. El estadstico Prediccin adecua
da (Adeq Precisin) se calcula dividiendo la diferencia entre la respuesta predicha mxima y la
respuesta predicha mnima por la desviacin estndar promedio de todas las respuestas predichas. Son
deseables valores grandes de esta cantidad, y los valores que exceden cuatro indican por lo general que el
modelo tendr un desempeo razonable en la prediccin.

Utilice el mouse para posicionarse en una celda y su definicin.


Response: Strength
in psi
ANOVA for Selected Factorial Model
Analysis of variance tabla [Partial sum of squares]
Sum of
Squares

Source

Model

Residual

LackofFit
Pur Error
Cor Total

475.76

DF
4

475.76
161.20
0.000
161.20
636.96

4
20
0
20
24

Mean
Square

118.94

F
Valu

Prob > F

14.76

<0.0001

14.76

<0.0001

118.94
8.06

significativo

8.06

Elvalor F del Modelo de 14.76 Implica que el modelo es significativo. Slo hay una probabilidad de
0.01% de que un "Valor F del Mo^lo" de esta magnitud pudiera ocurrir debido a ruido.
Los valores de Trob > P menores que 0.0500 indican que lostrminos del modelo son significativos.
En este caso A son trminos significativos del modelo.
Los valores mayores que 0.1000 indican que los trminos del modelo no son significativos.
Si hay muchos trminos del modelo no significativos (sin contar los que se necesitan para apoyar
lajerarquizacin), la reduccin del modelo puede mejorarlo.
Std. Dev.
Mean
C.V.
PRESS

R-Squared
Adj R-Squared
Pred R-Squared
Adeq Precisin

2.84
15.04
18.88
251.88

0.7469
0.6963
0.6046
9.294

La "R cuadrada predicha


de 0.6046 concuen:la razonablemente con la"R cuadrada ajustada" de
0.6963. Una diferencia mayor que 0.20 entre la cuadrada predicha" y la cuadrada ajustada"
indica un posible problema con el modelo y/o los datos.
"Precisin adecuada" mide la relacin de la seal a ruido. Es deseable una relacin mayor que 4.
La relacin de 9.294 indica una seal adecuada para usar este modelo para navegar el espacio
del diseo.
Treatment Means (Adiustad, HF Necessarv)
Estimotod
Standard
Error
Mean

1-15
2-20
3-25
4-30
5-35
Treatment

1 vs 2
1 vs3
1 vs 4
1 vs5
2 vs3
2 vs4
2 vs5
3 vs 4
3 vs 5
4 vs 5

1.27
1.27
1.27
1.27
1.27

9.80
15.40
17.60
21.60
10.80

Mean
Difference

-5.60
-7.80
-11.80
-1.00
-2.20
-6.20
4.60
-4.00
6.80
10.80

DF
1
1
1
1
1
1
1
1
1
1

Standard
Error

1.80
1.80
1.80
1.80
1.80
1.80
1,80
1.80
1.80
1.80

tfo r Ho
Coeff=0

-3.12
-4.34
-6.57
-0.56
-1.23
-3.45
2.56
-2.23
3.79
6.01

Prob > |t

0.0054
0.0003
<0.0001
0.5838
0.2347
0.0025
0.0186
0.0375
0.0012
<0.0001

Los valores de "Prob > |t|"menores que 0.0500 indican que la diferencia en las medias de los
dos tratamientos es significativa.
Los valores de
Prob > |t|"mayores que 0.1000 indican que ladiferencia en las medas de los
dos tratamientos no es significativa.
Figura 3-15

Salida de computadora de Deign-Expert para el ejemplo 3-1.

106

CAPTULO 3

EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

Diagnostic Case Statistics


Standard Actual Predicted
Order
Valu
Valu

1
2

3
4
5
6

7.00
7.00
15.00
11.00

9.00

12.00

17.00

12.00

9
10

11
12

13
14
15
16
17
18
19
20

21
22

23
24
25

18.00
18.00
14.00
18.00
18.00
19.00
19.00
19.00
25.00
22.00

19.00
23.00
7.00
10.00
11.00

15.00
11.00

9.80
9.80
9.80
9.80
9.80
15.40
15.40
15.40
15.40
15.40
17.60
17.60
17.60
17.60
17.60
21.60
21.60
21.60
21.60
21.60
10.80
10.80
10.80
10.80
10.80

Residual

-2.80
-2.80
5.20
1.20
-0.80
-3.40
1.60
-3.40
2.60
2.60
-3.60
0.40
0.40
1.40
1.40
-2.60
3.40
0.40
-2.60
1.40
-3.80
-0.80

Leverage

0.200
0.200
0.200

0.200
0.200
0.200
0.200

0.200
0.200
0.200
0.200
0.200

0.200
0.200
0.200
0.200
0.200
0.200

0.200
0.200
0.200
0.200

0.20

0.200

0.20

0.200
0.200

4.20

Student
Residual

-1.103
-1,103
2.048
0.473
-0.315
-1.339
0.630
-1.339
1.024
1.024
-1.418
0.158
0.158
0.551
0.551
-1.024
1.339
0.158
-1.024
0.551
-1.496
-0.315
0.079
1.654
0.079

Cook's
Distance

0.061
0.061

0.210

0.011

0.005
0.090
0.020

0.090
0.052
0.052
0.100
0.001
0.001

0.015
0.015
0.052
0.090
0.001

0.052
0.015
0.112

0.005
0.000

0.137
0.000

Outlier t

-1.109
-1.109
2.245
0.463
-0.308
-1.368
0.620
-1.368
1.025
1.025
-1.457
0.154
0.154
0.542
0.542
-1.025
1.368
0.154
-1.025
0.542
-1.548
-0.308
0.077
1.735
0.077

Proceder con las grficas de diagnstico (el icono siguiente en progresin). Asegurarse de examinar;
1) La grfica de probabilidad normal de los residuales studentizados para verificar la normalidad
de los residuales.
2) Los residuales studentizados contra los valores predichos para verificarla constante del error.
3) Los puntos atpicos tcontra el orden de las corridas para buscar puntos atpleos,
es decir, valores influyentes o importantes
4) La grfica de Box-Cox para las^jansfonnaclones de potencia.
SI todos los estadsticos del modelo y las grficas de diagnstico estn correctos, finalizarcon el icono
Model Graphs (Grficas del Modelo).
Figura 3-15

(Continuacin.)

Se hace la estimacin de las medias (Estimated Mean) de los tratamientos y se muestra el error es
tndar (Standard Error) (o desviacin estndar muestral de la media de cada tratamiento,
/n).
Las diferencias entre pares de medias (Mean Difference) de los tratamientos se investigan utilizando el
mtodo LSD de Fisher descrito en la seccin 3-5.7.
El programa de computadora tambin calcula y despliega los residuales, segn se definen en la ecua
cin 3-16. El programa producir tambin todas las grficas de los residuales que se comentaron en la sec
cin 3-4. En la salida se muestran asimismo varios diagnsticos residuales ms. Algunos de ellos se
revisarn ms adelante.
Por ltimo, observe que el programa de computadora incluye tambin algunas guas para hacer la in
terpretacin. Esta informacin aconsejable es muy comn en muchos paquetes de estadstica para
computadoras personales. Al leer estas guas, recuerde que estn escritas en trminos muy generales, y
quiz no se ajusten exactamente a los requerimientos de redaccin del reporte de un experimentador par
ticular. Esta salida aconsejable puede ser eliminada por el usuario.

3'7 DETERMINACIN DEL TAMAO DE LA MUESTRA


3 -7

107

D E T E R M IN A C I N D E L T A M A O D E L A M U E S T R A

En cualquier problema de diseo experimental, una decisin crtica es la eleccin del tamao de la mues
tra; es decir, determinar el nmero de rplicas que deben correrse. En general, si el experimentador tiene
inters en detectar efectos pequeos, se necesitan ms rplicas que cuando el experimentador se interesa
en detectar efectos grandes. En esta seccin se analizan varios enfoques para determinar el tamao de la
muestra. Aun cuando la revisin se centra en un diseo con un solo factor, la mayora de los mtodos pue
den usarse en situaciones experimentales ms complejas.

3 '7 .1

Curvas de operacin caracterstica

Recuerde que una curva de operacin caracterstica es una grfica de la probabilidad del error tipo 11 de
una prueba estadstica para un tamao de la muestra particular contra un parmetro que refleja la medi
da en que la hiptesis nula es falsa. El experimentador puede usar estas curvas como gua en la seleccin
del nmero de rplicas para que el diseo sea sensible a diferencias potenciales importantes en los trata
mientos.
Se considera la probabilidad del error tipo II del modelo con efectos fijos para el caso en que se usa el
mismo tamao de las muestras en cada tratamiento, por ejemplo
/3 = 1 - P{Rechazar

= 1 - ^{^0 >

es falsa}
es falsa}

Para evaluar el enunciado de probabilidad de la ecuacin 3-47, es necesario conocer cul es la distribu
cin del estadstico de prueba si la hiptesis nula es falsa. Puede demostrarse que, si 7/q es falsa, el esta
dstico Fq =
se distribuye como una variable aleatoriaF no central con a - \ y N - a
grados de libertad y parmetro de no centralidad . Si = O, la distribucin F no central se convierte en la
distribucin F (central) comn.
Las curvas de operacin caracterstica que se presentan en la parte V del apndice se usan para eva
luar el enunciado de probabilidad de la ecuacin 3-47. En estas curvas se grafica la probabilidad del error
tipo II O?) contra un parmetro
donde
u

n i

La cantidad
est relacionada con el parmetro de no centralidad . Se cuenta con curvas para a = 0.05
y a = 0.01 y un rango de grados de libertad para el numerador y el denominador.
Al usar las curvas de operacin caracterstica, el experimentador debe especificar el parmetro <1>.
Con frecuencia es difcil hacer esto en la prctica. Una manera de determinar O es elegir los valores reales
de las medias de los tratamientos para los que querra rechazarse la hiptesis nula con una alta probabili
dad. Por lo tanto, si jUi, f i i , H a
las medias de los tratamientos especificadas, la t de la ecuacin 3-48
se encuentra como r, = fi ~/, donde f = (l/a )2 ^j ^ es el promedio de las medias de los tratamientos
individuales. Se requiere asimismo una estimacin de o^. En ocasiones se cuenta con este valor por expe
riencia previa, un experimento anterior o una prueba preliminar (como se sugiri en el captulo 1), o por
una estimacin discrecional. Cuando no se tiene la seguridad acerca del valor de a^, los tamaos de las
muestras podran determinarse para un rango de valores posibles de (f, a fin de estudiar el efecto de este
parmetro sobre el tamao de la muestra requerido, antes de hacer la eleccin final.

108

CAPTULO 3

EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARLWZA

EJEMPLO 3 - 1 1 ...............................................................................................................................................
Considere el experimento de la resistencia a la tensin descrito en el ejemplo 3-1. Suponga que el experi
mentador est interesado en rechazar la hiptesis nula con una probabilidad de al menos 0.90 si las me
dias de los cinco tratamientos son
/< i= ll

;2=12

^3=15

/4=18

Planea utilizar a = 0.01. En este caso, puesto que

/<5=19

= 75, se tiene J = (1/5)75 = 15 y

Tj = / i j - ^ = 1 1 - 1 5 = - 4
^2 =

1 2 -1 5 = - 3

T^= f i ^ - J i = l 5 - 1 5 =

^4 = i 4 -J< = 1 8 -1 5 =

t, =

^ ,-]1 = 1 9 -1 5 =

Por lo tanto,
= 50. Suponga que el experimentador piensa que la desviacin estndar de la resis
tencia a la tensin con cualquier nivel particular del peso porcentual del algodn no ser mayor que cr=3
psi. Entonces, al utilizar la ecuacin 3-48, se tiene
s

5(3)^
Se usa la curva de operacin caracterstica para a - l = 5 - l = 4 con AT- o = a(n - 1 ) = 5(n - 1 ) grados de
libertad del error y a = 0.01 (ver la parte V del apndice). Como primera conjetura para el tamao de la
muestra requerido, se prueba con w = 4 rplicas. Esto produce
= 1.11(4) = 4.44,0 = 2.11 y 5(3) = 15
grados de libertad del error. Por consiguiente, en la parte V se encuentra que =0.30. Por lo tanto, la po
tencia de la prueba es aproximadamente 1 - f i = 1 - 0.30 = 0.70, que es menor que el 0.90 requerido, por
lo que se concluye que n = 4 rplicas no son suficientes. Procediendo de manera similar, puede construir
se la siguiente tabla;
n
4
5
6

$2
4.44
5.55
6.66

2.11
2.36
2.58

a(n -l)
15
20
25

0.30
0.15
0.04

Potencia (1 ~P)
0.70
0.85
0.96

Por lo tanto, deben realizarse al menos n = i5 rplicas para ootener una prueba con la potencia requerida.
El nico problema con este enfoque para usar las curvas de operacin caracteristica es que por lo general
es difcil seleccionar el conjunto de las medias de los tratamientos en el que se basar la decisin del tama
o de la muestra. U n enfoque alternativo es seleccionar un tamao de la muestra tal que si la diferencia
entre las medias de dos tratamientos cualesquiera excede un valor especificado, la hiptesis nula deber
rechazarse. Si la diferencia entre las medias de dos tratamientos cualesquiera es tan grande como A pue
de demostrarse que el valor mnimo de
es

3-7 DETERMINACIN DEL TAMAO DE LA MUESTRA

10 9

Puesto que ste es un valor mnimo de


el tamao de la muestra correspondiente que se obtiene de la
curva de operacin caracterstica es un valor conservador; es decir, proporciona una potencia al menos
tan grande como la que especific el experimentador.
Para ilustrar este enfoque, suponga que en el experimento de la resistencia a la tensin del ejemplo
3-1, el experimentador quisiera rechazar la hiptesis nula con una probabilidad de al menos 0.90 si las me
dias de dos tratamientos cualesquiera difieren hasta en 10 psi. Entonces, suponiendo que <7 = 3 psi, se en
cuentra que el valor mnimo de
es

2(5)(3*)
y, por el anhsis del ejemplo 3-11, se concluye que se necesitan n = 6 rplicas para obtener la sensibilidad
deseada cuando a = 0.01.

3'7.2

Especificacin de un incremento de la desviacin estndar

Este enfoque es t en ocasiones para elegir el tamao de la muestra. Si las medias de los tratamientos no
difieren, la desviacin estndar de una observacin elegida al azar es a. Sin embargo, si las medias de los
tratamientos son diferentes, la desviacin estndar de una observacin elegida al azar es

+
\i=i

Si se escoge un porcentaje P para el incremento de la desviacin estndar de una observacin, ms all del
cual quiera rechazarse la hiptesis de que las medias de todos los tratamientos son iguales, esto es equiva
lente a escoger

de donde

r/V

:V(1 + 0.01P ) ' - 1(V^)

(3-50)

Por lo tanto, para un valor especificado de P, 3> puede calcularse con la ecuacin 3-50 y despus usar las
curvas de operacin caracterstica de la parte V del apndice para determinar el tamao de la muestra re
querido.

110

CAPTULO 3

EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

Por ejemplo, en el experimento de la resistencia a la tensin del ejemplo 3-1, suponga que se desea
detectar un incremento de la desviacin estndar de 20% con una probabilidad de al menos 0.90 y a ~
0.05. Entonces
3>=

0.66V/

La referencia a las curvas de operacin caracterstica indica que se necesita n ~ 9 para obtener la sensibi
lidad deseada,

3'7.3

Mtodo para estimar el intervalo de confianza

En este enfoque se supone que el experimentador quiere expresar los resultados finales en trminos de
intervalos de confianza y que est dispuesto a especificar por anticipado cul es el ancho que desea para
estos intervalos de confianza. Por ejemplo, suponga que en el experimento de la resistencia a la tensin
del ejemplo 3-1 se quiere que un intervalo de confianza de 95% para la diferencia en la resistencia a la
tensin media de dos pesos porcentuales del algodn cualesquiera sea 5 psi y una estimacin previa de a
es 3. Entonces, al utilizar la ecuacin 3-13, se encuentra que la precisin del intervalo de confianza es
2MSg
^al2,N-a'
Suponga que se prueba con n = 5 rplicas. Entonces, al usar
precisin del intervalo de confianza es

= 3^ = 9 como una estimacin de MS e, la

2.086^ 1^ ^ = 1 9 6
que es ms preciso que el requerimiento. Al probar Con n = 4 se obtiene
1 1 3 z Jm = 4 . 5 2
4
Al probar con n = 3 se obtiene
. Z 2 2 S J^ M
'> = 5 4 6
Evidentemente, n = 4 es el tamao de la muestra menor que llevar a la precisin deseada.
El nivel de significacin consignado en el ejemplo anterior se aplica a un solo intervalo de confianza.
Sin embargo, puede usarse el mismo enfoque general si el experimentador desea especificar de antemano
un conjunto de intervalos de confianza acerca del cual se hace un enunciado de confianza simultneo o
coivjnnto (ver los comentarios acerca de los intervalos de confianza stmuhneos de la seccin 3-3.3). A de
ms, los intervalos de confianza podran construirse con respecto a contrastes ms generales en las m e
dias de los tratamientos, que la comparacin por pares ilustrada antes.

3^8

IDENTIFIC AC I N DE EFECTOS DE DISPERSIN

Nos hemos enfocado aqu en el uso del anlisis de varianza y de otros mtodos relacionados para determi
nar los niveles del factor que resultan en diferencias entre las medias de los tratamientos o los niveles del
factor. Se acostumbra referirse a estos efectos como efectos de localizacin. Cuando ocurri la desigual-

3-8 IDENTIFICACIN DE EFECTOS DE DISPERSIN

Tabla 3-12

111

Datos del experimento de fundicin

Observaciones

Algoritmo para
controlar la
proporcin
4.93(0.05)
4.85(0.04)
4.83(0.09)
4.89(0.03)

4.86(0.04)
4.91(0.02)
4.88(0.13)
4.77(0.04)

4.95(0.06)
4.85(0.05)
4.75(0.15)
4.86(0.05)

4.75(0.05)
4.79(0.03)
4.90(0.11)
4.94(0.05)

4.79(0.03)
4.75(0.03)
4.82(0.08)
4.79(0.03)

4.88(0.05)
4.85(0.02)
4.90(0.12)
4.76(0.02)

dad de la varianza con los diferentes niveles del factor, se utilizaron transfonnaciones para estabilizar la
varianza y mejorar as las inferencias hechas sobre los efectos de localizacin. Sin embargo, en algunos
problemas el inters se centra en descubrir si los diferentes niveles del factor afectan la variabilidad; es
decir, el inters est en descubrir efectos de dispersin potenciales. Esto ocurrir siempre que la desvia
cin estndar, la varianza o cualquier otra medida de la variabilidad se use como variable de respuesta.
Para ilustrar estos conceptos, considere los datos de la tabla 3-12, los cuales se obtuvieron de un expe
rimento diseado en una fundicin de aluminio. El aluminio se produce combinando almina con otros
ingredientes en una celda de reaccin y aplicando calor al hacer pasar una corriente elctrica a travs de
la celda. La almina se agrega de manera continua a la celda para mantener la proporcin apropiada de la
misma con respecto a los otros ingredientes. En este experimento se investigaron cuatro algoritmos para
controlar la proporcin. Las variables de respuesta estudiadas se relacionaron con el vohaje de la celda.
Especficamente, un sensor registra el vohaje de la celda varias veces cada segundo, produciendo miles de
mediciones del voltaje durante cada corrida del experimento. Los ingenieros del proceso decidieron usar
como variables de respuesta el voltaje promedio y la desviacin estndar del voltaje de la celda (indicado
entre parntesis) en la corrida experimental. El voltaje promedio es importante porque afecta la tempe
ratura de la celda, y la desviacin estndar del voltaje (llamada ruido del crisol por los ingenieros del
proceso) es importante porque afecta la eficiencia global de la celda.
Se llev a cabo un anlisis de varianza para determinar si los diferentes algoritmos para controlar la
proporcin afectan el voltaje promedio de la celda. ste revel que el algoritmo para controlar la propor
cin no tuvo ningn efecto de localizacin; es decir, al cambiar los algoritmos para controlar la propor
cin no hubo ningn cambio en el voltaje promedio de la celda. (Referirse al problema 3-28.)
Para investigar los efectos de dispersin, lo mejor suele ser utilizar
log(j)

log(s^)

como variable de respuesta, ya que la transformacin logartmica es eficaz para estabilizar la variabilidad
en la distribucin de la desviacin estndar muestral. Puesto que todas las desviaciones estndar del vol
taje del crisol son menores que la unidad, se usar
> - = - ln ( )
como la variable de respuesta. En la tabla 3-13 se presenta el anlisis de varianza para esta respuesta, el
logaritmo natural del ruido del crisol. Observe que la eleccin de un algoritmo para controlar la pro
porcin afecta el ruido del crisol; es decir, el algoritmo para controlar la proporcin tiene un efecto de disTabla 3-13

Anlisis de variama del logaritmo natural del ruido del crisol

Fuente de variacin
Algoritmo para controlar la proporcin
Error
Tbtal

Suma de
cuadrados

Grados de
libertad

Cuadrado
medio

6.166
1.872
8.038

3
20
23

2.055
0.094

Fo
21.96

Valor P
<0.001

112

CAPTULOS

2.00

EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

3.00

4.00

Ruido del crisol logartmico promedio [-1n (s)]

Figura 3-16 Ruido del crisol logartmico promedio [-ln()] de


cuatro alpritm os para controlar la proporcin en relacin con una
distribucin t escalada con factor de escalamiento .jM S ^ J =
V0.094 / 6 = 0 . m

persin. Las pruebas estndares de la adecuacin del modelo, incluyendo las grficas de probabilidad
normal de los residuales, indican que no hay problemas con la validez del experimento. (Referirse al pro
blema 3-29.)
En la figura 3-16 se grafica el logaritmo promedio del ruido del crisol de cada algoritmo para controlar
la proporcin y se presenta tambin una distribucin t escalada que se usa como distribucin de referencia
para discriminar entre los algoritmos de la proporcin. Esta grfica revela con toda claridad que el algorit
mo 3 para controlar la proporcin produce ms mido del crisol o una desviacin estndar del voltaje de la
celda mayor que los otros algoritmos. No parece haber gran diferencia entre los algoritmos 1, 2 y 4.

3-9

EL ENFOQUE DE REGRESIN PA R A EL ANLISIS DE V A R IA N ZA

Se ha ofrecido un desarrollo intuitivo o heurstico del anlisis de varianza. Sin embargo, es posible pre
sentar un desarrollo ms formal. El mtodo ser de utihdad ms adelante para entender los fundamentos
del anlisis estadstico de diseos ms complejos. Llamada la prueba general de significacin de la regre
sin, el procedimiento consiste en esencia en encontrar la reduccin en la suma de cuadrados total para
ajustar el modelo con todos los parmetros incluidos y la reduccin en la suma de cuadrados cuando el
modelo se restringe a la hiptesis nula. La diferencia entre estas dos sumas de cuadrados es la suma de
cuadrados de los tratamientos con la que puede realizarse la prueba de la hiptesis nula. El procedimien
to requiere los estimadores de mnimos cuadrados de los parmetros en el modelo del anlisis de varian
za. Se dieron ya (en la seccin 3-3.3) las estimaciones de estos parmetros; sin embargo, ahora se presenta
un desarrollo formal.

3'9.1

Estimacin de mnimos cuadrados de los parmetros del modelo

Se desarrollan ahora los estimadores de los parmetros en el modelo con un solo factor
y j = f i + T+ej

utilizando el mtodo de mnimos cuadrados. Para encontrar los estimadores de mnimos cuadrados de /i y
r primero se forma la suma de cuadrados de los errores

(3'51)
1 -1

j= l

i= l j - l

3-9 EL ENFOQUE DE REGRESIN PARA EL ANLISIS DE VARIANZA

113

y se eligen despus los valores d e// y t , por ejemplo /i y f ,, que minimicenL . Los valores adecuados seran
las soluciones de las a + 1 ecuaciones simultneas
dL
dfi }>.i
dL
ar,

= 0

= 0

/ = 1, 2,..., a

i.i

Al derivar la ecuacin 3-51 con respecto a

y al igualar con cero se obtiene

1=1 J=1
y
n
- 2 2 (3'i/ A - / ) = 0

1 = 1, 2,..., a

de la que, despus de simplificar, se obtiene


Nfi+n^ + n f 2 +

= y

nfi+n^t^
nfi

=y^
+ni^

Tifi.

(3-52)

+ n i, = y,

A las a + 1 ecuaciones (ecuacin 3'52) con a + 1 incgnitas se les llama las ecuaciones normales de
mnimos cuadrados. Observe que si se suman la ltimas a ecuaciones normales, se obtiene la primera
ecuacin normal. Por lo tanto, las ecuaciones normales no son linealmente independientes, y no existe una
solucin nica para//, Tj, ...,
Esta dificultad puede superarse mediante varios mtodos. Puesto que los
efectos de los tratamientos se han definido como desviaciones de la media global, parece razonable apli
car la restriccin
2

^ -= O

(3-53)

i= l

Utilizando esta restriccin, se obtiene como solucin de las ecuaciones normales


^ = yh = yL -y..

(3-54)
= 1, 2,..., a

Evidentemente, esta solucin no es nica y depende de la restriccin (ecuacin 3-53) que se ha elegi
do. Al principio esto puede parecer desafortunado porque dos experimentadores diferentes podran ana
lizar los mismos datos y obtener resultados diferentes si aplican restricciones diferentes. Sin embargo,
ciertas (unciones del parmetro del modelo son estimadas de manera nica, independientemente de la
restriccin. Algunos ejemplos son r, - t, que se estimara con
= y - y ., y la media del tratamien
to i-simo //, = / / -t- r que se estimara con
fl+ t = y.
Puesto que el inters se encuentra generalmente en las diferencias entre los efectos de los tratamien
tos y no en sus valores reales, no produce preocupacin alguna que tno pueda estimarse de manera ni-

114

CAPTULO 3

EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

ca. En general, cualquier funcin de los parmetros del modelo que sea una combinacin lineal del
miembro del lado izquierdo de las ecuaciones normales (ecuaciones 3-52) puede estimarse de manera
nica. A las funciones que se estiman de manera nica independientemente de la restriccin que se use se
les llama funciones estimables. Para ms informacin, ver el material suplementario del texto de este ca
ptulo. Nos encontramos listos para usar estas estimaciones de los parmetros en un desarrollo general
del anlisis de varianza.

3-9.2

Prueba general de significacin de la regresin

Una parte fundamental de este procedimiento es escribir las ecuaciones normales del modelo. Estas
ecuaciones siempre podrn obtenerse formando la funcin de mnimos cuadrados y derivndola con res
pecto a cada parmetro desconocido, como se hizo en la seccin 3-9.1. Sin embargo, se cuenta con un m
todo ms sencillo. Las reglas siguientes permiten escribir directamente las ecuaciones normales del
modelo de cualquier diseo experimental:
REGLA 1. Hay una ecuacin normal para cada parmetro del modelo que va a estimarse.
REGLA 2. El miembro derecho de cualquier ecuacin normal es slo la suma de todas las observa
ciones que contienen el parmetro asociado con esa ecuacin normal particular.
Para ilustrar esta regla, considere el modelo con un solo factor. La primera ecuacin normal
corresponde al parmetro por lo tanto, el miembro derecho esy , ya que todas las observacio
nes incluyen a fi.
REGLA 3. El miembro izquierdo de cualquier ecuacin normal es la suma de todos los parmetros
del modelo, donde cada parmetro est multiplicado por el nmero de veces que aparece en el
total del miembro derecho. Los parmetros se escriben con un acento circunflejo (") para indicar
que son estimadores y no los verdaderos valores de los parmetros.
Por ejemplo, considere la primera ecuacin normal en un experimento con un solo factor. D e acuer
do con las reglas anteriores, sta sera
N fl+ n ti+ n 2 + >-nT^ = y
porque /i. aparece en las N observaciones, slo aparece en las n observaciones hechas bajo el primer tra
tamiento, ^2 aparece slo en las n observaciones tomadas bajo el segundo tratamiento, etc. Por la ecua
cin 3-52 se verifica que la ecuacin presentada arriba es correcta. La segunda ecuacin normal
correspondera a
y es
nfl+nT^ = y^
porque slo las observaciones del primer tratamiento contienen a Tj (esto da>>i. como miembro derecho),
^ y Ti aparecen exactamente n veces en3^1, y todas las dems r aparecen cero veces. En general, el miem
bro izquierdo de cualquier ecuacin normal es el valor esperado del miembro derecho.
Ahora bien, considere encontrar la reduccin en la suma de cuadrados ajustando un modelo particu
lar a los datos. Al ajustar un modelo a los datos se expHca parte de la variabilidad; es decir, la variabili
dad no explicada se reduce en cierta cantidad. La reduccin en la variabilidad no explicada es siempre la
suma de las estimaciones de los parmetros, cada una de ellas multiplicada por el segundo miembro de la

3-9 EL ENFOQUE DE REGRESIN PARA EL ANLISIS DE VARIANZA

115

ecuacin normal que corresponde al parmetro especfico. Por ejemplo, en un experimento con un solo
factor, la reduccin debida al ajuste del modelo completo yj =
+ T + ;/ es
R{n, T)=py,, + i A +2yi. +
V *
= w ..+ z
(=1

La n o t a c i n r ) significa la reduccin en lasuma de cuadrados a partir del ajuste del modelo que con
tiene a / y {t,}. a (^ , r) se le llama en ocasiones la suma de cuadrados de regresin del modelo com
pleto yj = fi + Ti + ej. El nmero de grados de libertad asociado con una reduccin en la suma de
cuadrados, tal como RQi, r), siempre es igual al nmero de ecuaciones normales linealmente indepen
dientes. El resto de la variabilidad no explicada por el modelo se encuentra con

. -

P-5<i)

/=! J=1

Esta cantidad se usa en el denominador del estadstico de prueba de


= =
= 0.
A continuacin se ilustra la prueba general de significacin de la regresin para un experimento con
un solo factor y se demuestra que produce el anlisis de varianza de un solo factor comn. El modelo es
y.j = fi + r, -I- j, y las ecuaciones normales se encuentran con las reglas anteriores como
Nfi+ni^
nfi

j -I-
+nz^

= y
= >>2

nfi

= y.

Compare estas ecuaciones normales con las que se obtuvieron en la ecuacin 3-52.
Al aplicar la restriccin
= O, los estimadores de ^ y r, son
A=

ii = y.-y..

1 = 1, 2,..., a

La reduccin en la suma de cuadrados debida al ajuste de este modelo completo se encuentra con la ecua
cin 3-55 como
I
T )= /ix ,+ 5 ] i y,
i-l
a

=a)y.+S
i-1
=

1-1

y^ .y^-y.-'Z
;-.i

116

CAPTULO 3

EXPERIMENTOS CON UN SOLO FACTOR: EL ANUSIS DE VARIANZA

que tiene a grados de libertad porque haya ecuaciones normales linealraente independientes. La suma de
cuadrados del error es, por la ecuacin 3-56,

yl

y tiene N - a grados de libertad.


Para encontrar la suma de cuadrados que resulta de los efectos de los tratamientos (el {r}), se consi
dera que el modelo se restringe a la hiptesis nula; es decir, t, = Opara toda i. El modelo reducido es^-y =
f i + E. Hay una sola ecuacin normal para este modelo:
Nfi = y
y el estimador d e// es /t = y . Por lo tanto, la reduccin en la suma de cuadrados que resulta de ajustar el
modelo reducido que slo contiene a // es

N
Puesto que hay una sola ecuacin normal para este modelo reducido, (a ) tiene un grado de libertad. La
suma de cuadrados debida al {r,}, dado que// ya est incluida en el modelo, es la diferencia e n t r e r ) y
7?(), que es
R { t\ h ) = R { n , t ) - R { n )

= i?(Modelo Completo) - ?(Modelo Reducido)

con a - 1 grados de libertad, que por la ecuacin 3-9 se identifica como


puesto de normalidad usual, el estadstico apropiado para probar /fo:

Estableciendo el su
= Tj = =
= O es

F,
o
/{N -a )
_/=i j=i
que se distribuye como
bajo la hiptesis nula. Se trata, desde luego, del estadstico de prueba para
el anhsis de varianza de un solo factor.

3-10
3-10.1

M ETODOS N O PARAM ETRICOS EN EL ANLISIS DE VARLANZA


La prueba de Kniskal'Wallis

En situaciones en las que el supuesto de normalidad no est justificado, el experimentador quiz quiera
usar un procedimiento alternativo del anUsis de varianza con la prueba F que no dependa de este su-

3-10 METODOS NO PARAMETRICOS EN EL ANAUSIS DE VARJANZA

117

puesto. Kniskal y Wallis [68] han desarrollado este procedimiento. La prueba de Kniskal-Wallis se usa
para probar la hiptesis nula de que los a tratamientos son idnticos contra la hiptesis alternativa de que
algunos de los tratamientos generan observaciones que son mayores que otras. Debido a que el procedi
miento est diseado para ser sensible al probar las diferencias en las medias, en ocasiones es conveniente
considerar la prueba de Kruskal-Wallis como una prueba de la igualdad de las medias de los traamientos.
La prueba de Kruskal-Wallis es una alternativa no paramtrca del anlisis de varianza usual.
Para realizar la prueba de Kruskal-Wallis, primero se hace la clasificacin en rangos de las y,y observa
ciones en orden ascendente y cada observacin se reemplaza con su rango, por ejemplo i?,y, asignndole a
la observacin menor el rango 1. En el caso de empates (observaciones que tienen el mismo valor), se
asigna el rango promedio a cada una de las observaciones empatadas. Sea i, la suma de los rangos del tra
tamiento i-simo. El estadstico de prueba es
R]

N {N W f

(3-57)

n.

donde n es el nmero de observaciones del tratamiento -simo, N es el nmero total de observaciones y


1
=
N -1

(3-58)

Observe que 5^ es slo la varianza de los rangos. Si no hay empates,


prueba se simplifca a
H=

= N (N + 1)/12, y el estadstico de

12
7 V (^ -H )^

n,

(3-59)

Cuando el nmero de empates es moderado, habr pequeas diferencias entre las ecuaciones 3-57 y 3-59,
y puede usarse la forma ms simple (ecuacin 3-59). Si las n son razonablemente grandes, por ejemplo
n > 5, H se distribuye aproximadamente como x^-i bajo la hiptesis nula. Por lo tanto, si

la hiptesis nula se rechaza. Tkmbin podra usarse el enfoque del valor F.

EJEMPLO 3 - 1 2 ...............................................................................................................................................
En la tabla 3-14 se muestran los datos del ejemplo 3-1 y sus rangos correspondientes. Puesto que hay un
nmero bastante grande de empates, la ecuacin 3-57 se usa como el estadstico de prueba. Por la ecua
cin 3-58 se encuentra
S^ =

N -1

24

5497.79-

= 53:03

25(26)'

118

CAPTULO 3

Tabla 3-14

EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

Datos y rangos para el experimento de la resistencia a la tensin del ejemplo 3-1


Peso porcentual del algodn

15
yy
7
7
15
11
9
K,

20
Ry
2.0
2.0
12.5
7.0
4.0
27.5

3^2,12
17
12
18
18

25
J ,

30
Rsj
11.0
16.5
16.5
20.5
20.5
85.0

>'3;
14
18
18
19
19

9.5
14.0
9.5
16.5
16.5
66.0

y^i
19
25
22
19
23

35
R,
20.5
25.0
23.0
20.5
24.0
113.0

y^j
7
10
11
15
11

%
2.0
5.0
7.0
12.5
7.0
33.5

y el estadstico de prueba es
N (N + lf
4

H-

53.03

5245.0-

25(26)"

= 19.25
Puesto que H >
13.28, se rechazara la hiptesis nula y se concluira que los tratamientos difie
ren. (El valor P para H = 19.25 es P = 0.0002.) Se trata de la misma conclusin obtenida por el anlisis de
varianza usual con la prueba F.
3 -1 0 .2

Com entarios generales sobre la transformacin de rangos

Al procedimiento utilizado en la seccin anterior de reemplazar las observaciones con sus rangos se le lla
ma la transformacin de rangos. Es una tcnica muy poderosa y til. Si se aplicara la prueba F comn a
los rangos en lugar de a los datos originales, se obtendra
^0 =

(3-60)

como el estadstico de prueba (ver Conover [20], p. 337). Observe que cuando el estadstico H de Kruskal-Wallis se incrementa o decrementa, F^ tambin se incrementa o decrementa, por lo que la prueba de
Kruskal-Wallis es equivalente a aplicar el anlisis de varianza comn a los rangos.
La transformacin de rangos tiene una amplia aplicabilidad en los problemas de diseo experimental
para los que no existe ninguna alternativa no paramtrica para el anlisis de varianza. Esto incluye mu
chos de los diseos de captulos subsecuentes de este libro. Si los datos estn en rangos y se aplica la prue
ba F comn, el resultado es un procedimiento aproximado que tiene buenas propiedades estadsticas (ver
Conover e Imn [30a, b]). Cuando existe preocupacin acerca del supuesto de normahdad o por el efecto
de puntos atpleos o valores absurdos, se recomienda que el anlisis de varianza comn se realice tanto
en los datos originales como en los rangos. Cuando ambos procedimientos producen resultados similares,
probablemente los supuestos del anlisis de varianza se satisfacen razonablemente, y el anlisis estndar
es satisfactorio. Cuando los dos procedimientos difieren, deber darse preferencia a la transformacin de
rangos, ya que es menos posible que sea distorsionada por una condicin de no normalidad o la presencia
de observaciones inusuales. En tales casos, tal vez el experimentador quiera investigar el uso de transfor

341 PROBLEMAS

119

maciones para la falta de normalidad y examinar los datos y el procedimiento experimental a fin de deter
minar si hay puntos atpleos y por qu han ocurrido.

3<11
3-1.

PROBLEMAS
Se estudia la resistencia a la tensin del cemento portland. Pueden usarse econmicamente cuatro diferentes
tcnicas de mezclado. Se han colectado los siguientes datos:
Resistencia a la tensin (Ib/pulg^)

Tcnica de mezclado

3000
3300
2900
2700

3129
3200
2800
2600

1
2
3
4

2890
3150
3050
2765

2865
2975
2985
2600

o) Probar la hiptesis de que las tcnicas de mezclado afectan la resistencia del cemento. Utilizar a = 0.05.
b) Construir una representacin grfica como se describi en la seccin 3-5.3 para comparar las resistencias
a la tensin promedio de las cuatro tcnicas de mezclado. A qu conclusiones se llega?
c) Usar el mtodo LSD de Fisher con a = 0.05 para hacer comparaciones entre pares de medias.
d) Construir una grfica de probabilidad normal de los residuales. Qu conclusiones se sacaran acerca de
la validez del supuesto de normalidad?
e) Graficar los residuales contra la resistencia a la tensin predicha. Comentar la grfica.
f) Hacer un diagrama de dispersin de los resultados como ayuda para la interpretacin de los resultados
de este experimento.
3-2. a) Resolver de nuevo el inciso b del problema 3-1 utilizando la prueba del rango mltiple de Duncan con a
= 0.05. Hay alguna diferencia en las conclusiones?
b) Resolver de nuevo el inciso b del problema 3-1 utilizando la prueba de Hikey con a = 0.05, Se llega a las
mismas conclusiones con la prueba de Tbkey que las obtenidas con el procedimiento grfico y/o con la
prueba del rango mltiple de Duncan?
c) Explicar la diferencia entre los procedimientos de Duncan y de TUkey.
3-3. Considere nuevamente el problema 3-1. Encontrar un intervalo de confianza de 95% para la resistencia a la
tensin media del cemento portland que produce cada una de las cuatro tcnicas de mezclado. Encontrar
tambin un intervalo de confianza de 95% para la diferencia en las medias de las tcnicas 1 y 3. Sirve esto de
ayuda para interpretar los resultados del experimento?
3-4. Se llev a cabo un experimento a fin de determinar si cuatro temperaturas de coccin especficas afectan la
densidad de cierto tipo de ladrillo. El experimento produjo los siguientes datos:
Densidad

Tfemperatura
100
125
150
175
a)
b)

21.8
21.7
21.9
21.9

21.9
21.4
21.8
21.7

21.7
21.5
21.8
21.8

21.6
21.4
21.6
21.4

21.7
21.5

La temperatura de coccin afecta la densidad de los ladrillos? Utilizar a = 0.05.


Es apropiado comparar las medias utilizando la prueba del rango mltiple de Duncan (por ejemplo) en
este experimento?
c) Analizar los residuales de este experimento. Se satisfacen los supuestos del anlisis de varianza?
d) Construir una representacin grfica de los tratamientos como se describi en la seccin 3-5.3. Esta
grfica resume adecuadamente los resultados del anlisis de varianza del inciso a?

120

CAPTULO 3

EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARLWZA

3-5.

Resolver de nuevo el inciso d del problema 3-4 utilizando el m todo LSD de Fisher. A qu conclusiones se
llega? Explicar en detalle cmo se modific la tcnica para tomar en cuenta los tamaos de las muestras desi
guales.

3-6.

Un fabricante de televisores est interesado en el efecto de cuatro tipos diferentes de recubrimientos para cines
copios de color sobre la conductividad de un cinescopio. Se obtienen los siguientes datos de la conductividad:

Tipo de recubrimiento

Conductividad

1
2

143
152
134
129

3
4

141
149
136
127

150
137
132
132

146
143
127
129

a)
b)
c)

3-7.
3-8.

Hay alguna diferencia en la conductividad debida al tipo de recubrimiento? Utilizar a = 0.05.


Estimar la media global y los efectos de los tratamientos.
Calcular la estimacin de un intervalo de confianza de 95% para la media del tipo de recubrimiento 4.
Calcular la estimacin de un intervalo de confianza de 99% para la diferencia media entre los tipos de re
cubrimiento 1 y 4.
d) Probar todos los pares de medias utilizando el mtodo LSD de Fisher con a = 0.05.
e) Usar el mtodo grfico comentado en la seccin 3-5.3 para comparar las medias. Cul es el tipo de recu
brimiento que produce la conductividad ms alta?
f) Suponiendo que el recubrimiento tipo 4 es el que se est usando actualmente, qu se recomendara al
fabricante? Quiere minimizarse la conductividad.
Considere nuevamente el experimento del problema 3-6. Analizar los residuales y sacar conclusiones acerca
de la adecuacin del modelo,
En un artculo deACIMateri als Journal (vol. 84, pp. 213-216) se describen varios experimentos para investi
gar el varillado del concreto para eliminar el aire atrapado. Se us un cilindro de 3 x 6 pulgadas; y el nmero
de veces que esta barra se utiliz es la variable del diseo. La resistencia a la compresin resultante de la
muestra de concreto es la respuesta. Los datos se muestran en la tabla siguiente:

Nivel de varillado
10
15
20
25

3-9.

Resistencia a la compresin
1530
1610
1560
1500

1530
1650
1730
1490

1440
1500
1530
1510

a) Hay alguna diferencia en la resistencia a la compresin debida al nivel de varillado? Utilizar a = 0.05.
b) Encontrar el valor P para el estadstico F del inciso a.
c) Analizar los residuales de este experimento. Qu conclusiones pueden sacarse acerca de los supuestos
fundamentales del modelo?
d) Construir una representacin grfica para comparar las medias de los tratamientos, como se describi
en la seccin 3-5.3.
En un artculo de EnvironmentInternational (vol. 18, no. 4) se describe un experimento en el que se investig
la cantidad de radn liberado en las duchas. Se us agua enriquecida con radn en el experimento, y se pro
baron seis dimetros diferentes de los orificios de las regaderas. Los datos del experimento se muestran en la
siguiente tabla:

3-11 PROBLEMAS

Dimetro de
los orificios

Radn liberado (%) .


80
75
74
67
62
60

0.37
0.51
0.71
1.02
1.40
1.99

3-10.

121

83
75
73
72
62
61

83
79
76
74
67
64

85
79
77
74
69
66

a) El tamao de los orificios afecta el porcentaje promedio del radn liberado? Utilizar a = 0.05.
b) Encontrar el valor P para el estadstico F del inciso a.
c) Analizar los residuales de este experimento.
d) Encontrar un intervalo de confianza de 95% para el porcentaje promedio de radn liberado cuando el
dimetro de los orificios es 1.40.
e) Construir una representacin grfica para comparar las medias de los tratamientos, como se describi
en la seccin 3-5.3. Qu conclusiones pueden sacarse?
Se determ in el tiem po de respuesta en m ilisegundos para tres diferentes tipos de circuitos que p o
dran usarse en un m ecanism o de desconexin autom tica. Los resultados se muestran en la siguiente
tabla:

Tiempo de respuesta

Tipo de circuito
1
2
3

9
20
6

12
21
5

10
23
8

8
17
16

15
30
7

a)

3-11.

Probar la hiptesis de que los tres tipos de circuitos tienen el mismo tiempo de respuesta. Utilizar
a = 0.01.
b) Usar la prueba de TUkey para comparar pares de medias de los tratamientos. Utilizar a = 0.01.
c) Usar el procedimiento grfico de la seccin 3-5.3 para comparar las medias de los tratamientos, Qu
conclusiones pueden sacarse? Cmo se comparan con las conclusiones del inciso b l
d) Construir un conjunto de contrastes ortogonales, suponiendo que al principio del experimento se sospe
chaba que el tiempo de respuesta del circuito tipo 2 era diferente del de los otros dos.
e) Si el lector fuera el ingeniero de diseo y quisiera minimizar el tiempo de respuesta, qu tipo de circuito
seleccionara?
f) Analizar los residuales de este experimento. Se satisfacen los supuestos del anlisis de varianza b
sico?
Se estudia la vida efectiva de los fluidos aislantes en una carga acelerada de 35 kV. Se han obtenido datos de
una prueba para cuatro tipos de fluidos. Los resultados fueron los siguientes:

Tipo de fluido
1
2
3
4

Vida (en horas) con 35 kV de carga


17.6
16.9
21.4
19.3

18.9
15.3
23.6
21.1

16.3
18.6
19.4
16.9

17.4
17.1
18.5
17.5

20.1
19.5
20.5
18.3

21.6
20.3
22.3
19.8

122

312.

CAPTULOS

EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

a) Hay algn indicio de que los fluidos difieran? Utilizar a = 0.05.


b) Cul fluido seleccionara el lector, dado que el objetivo es conseguir la vida efectiva ms larga?
c) Analizar los residuales de este experimento. Se satisfacen los supuestos del anlisis de varianza bsico?
Se estudian cuatro diferentes tipos de diseos de un circuito digital de computadora para comparar la canti
dad de ruido presente. Se obtienen los siguientes datos:

Diseo del circuito


1
2
3
4

3-13.

Ruido observado
19
80
47
95

20
61
26
46

19
73
25
83

30
56
35
78

8
80
50
97

a) La cantidad de ruido presente es la misma para los cuatro diseos? Utilizar a = 0.05.
b) Analizar los residuales de este experimento. Se satisfacen los supuestos del anlisis de varianza?
c) Qu diseo del circuito se seleccionara para usarlo? El ruido bajo es mejor.
Se pide a cuatro qumicos que determinen el porcentaje de alcohol metlico en cierto compuesto qumico.
Cada qumico hace tres determinaciones, y los resultados son los siguientes:

Qumico
1
2
3
4

Porcentaje de alcohol metlico


84.99
85.15
84.72
84.20

84,04
85.13
84.48
84.10

84.38
84.88
85.16
84.55

a)
b)
c)
3-14.

Los qumicos difieren significativamente? Utilizar a = 0.05.


Analizar los residuales de este experimento.
Si el qumico 2 es un empleado nuevo, construir un conjunto razonable de contrastes ortogonales que
podra haberse usado al principio del experimento.
Se someten a estudio tres marcas de bateras. Se sospecha que las vidas (en semanas) de las tres marcas son
diferentes. Se prueban cinco bateras de cada marca con los resultados siguientes:

Semanas de vida

a)
b)
c)

Marca 1

Marca 2

100
96
92
96
92

76
80
75
84
82

Marca 3
108
100
96
98
100

Las vidas de estas tres marcas son diferentes?


Analizar los residuales de este experimento.
Construir la estimacin de un intervalo de confianza de 95% para la vida media de la batera marca 2.
Construir la estimacin del intervalo de confianza de 99% para la diferencia media entre las vidas de las
bateras marcas 2 y 3.

3-11 PROBLEMAS

3-15.

123

d) Qu marca seleccionara el lector para usarla? Si el fabricante reemplazara sin cargo cualquier batera
que dure menos de 85 semanas, qu porcentaje esperara reemplazar la compaa?
Se estn investigando cuatro catalizadores que pueden afectar la concentracin de un componente en una
mezcla lquida de tres componentes. Se obtienen las siguientes concentraciones:

Catalizador

3-16.

58.2
57.2
58.4
55.8
54.9

56.3
54.5
57.0
55.3

50.1
54.2
55.4

a) Lx)s cuatro catalizadores tienen el mismo efecto sobre la concentracin?


b) Analizar los residuales de este experimento.
c) Construir la estimacin de un intervalo de confianza de 99% para la respuesta media del catalizador 1.
Se llev a cabo un experimento para investigar la eficacia de cinco materiales aislantes. Se probaron cuatro
muestras de cada material con un nivel elevado de voltaje para acelerar el tiempo de falla. Los tiempos de fa
lla (en minutos) se muestran abajo:

Material
1
2
3
4
5

3-17.

4
52.9
49.9
50.0
51.7

110
1
880
495
7

Tiempo de falla (minutos)


157
194
2
4
1256
5276
7040
5307
5
29

178
18
4355
10,050
2

a) Los cinco materiales tienen el mismo efecto sobre el tiempo de falla?


b) Graficar los residuales contra la respuesta predicha. Construir una grfica de probabilidad normal de los
residuales. Qu informacin transmiten estas grficas?
c) Con base en la respuesta del inciso b, realizar otro anlisis de los datos del tiempo de falla y sacar las con
clusiones apropiadas.
Un fabricante de semiconductores ha desarrollado tres mtodos diferentes para reducir el conteo de partcu
las en las obleas. Los tres mtodos se prueban en cinco obleas y se obtiene el conteo de partculas despus del
tratamiento. Los datos se muestran abajo:

Mtodo
1
2
3

31
62
53

10
40
27

Conteo
21
24
120

4
30
97

1
35
68

a) Todos los mtodos tienen el mismo efecto sobre el conteo promedio de partculas?
b) Graficar los residuales contra la respuesta predicha. Construir una grfica de probabilidad normal de los
residuales. Hay motivo de preocupacin potencial acerca de la validez de los supuestos?
c) Con base en la respuesta del inciso b, realizar otro anlisis de los datos del conteo de partculas y sacar las
conclusiones apropiadas.

124

3-18.

3-19.
3-20.

3-21.

3-22.

3-23.

3-24,

3-25,

3-26.

3-27.

3-28.

3-29,

3-30.

CAPTULO 3

EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

Considere la prueba de la igualdad de las medias de dos poblaciones normales, donde las varianzas son des
conocidas pero se suponen iguales. El procedimiento de prueba apropiado es la prueba t agrupada o combi
nada. Demostrar que la prueba t combinada es equivalente al anlisis de varianza de un solo factor.
Demostrar que la varianza de la combinacin lineal
es
.
En un experimento con efectos fijos, suponga que hay n observaciones para cada uno de cuatro tratamientos.
Sean
los componentes con un solo grado de libertad de los contrastes ortogonales. Demostrar que
Utilizar la prueba de Bartlett para determinar si el supuesto de la igualdad de las varianzas se satisface en el
problema 3'14. Utilizar a = 0.05. Se lleg a la misma conclusin respecto de la igualdad de las varianzas con
el examen de las grcas de los residuales?
Utilizar la prueba de Levene modificada para determinar si el supuesto de las varianzas iguales se satisface
en el problema 3-14, Utilizar a = 0.05. Se lleg a la misma conclusin respecto de la igualdad de las varian
zas con el examen de las grficas de los residuales?
Referirse al problema 3-10. Si quiere detectarse una diferencia mxima en los tiempos de respuesta prome
dio de 10 milisegundos con una probabilidad de al menos 0.90, qu tamao de la muestra deber usarse?
Cmo se obtendra una estimacin preliminar de a^?
Referirse al problema 3-14.
a) Si quiere detectarse una diferencia mxima en la vida de las bateras de 10 horas con una probabilidad de
al menos 0.90, qu tamao de la muestra deber usarse? Comentar cmo se obtendra una estimacin
preliminar de
para responder esta pregunta,
b) Si la diferencia entre las marcas es lo suficientemente grande para que la desviacin estndar de una ob
servacin se incremente en 25%, qu tamao de la muestra deber usarse si quiere detectarse esto con
una probabilidad de al menos 0.90?
Considere el experimento del problema 3-14, Si quiere construirse un intervalo de confianza de 95% para la
diferencia en las vidas medias de dos bateras que tenga una precisin de 2 semanas, cuntas bateras de
cada marca deben probarse?
Suponga que cuatro poblaciones normales tienen m e d i a s = 50,;2 = 60./^3 = 50y//4 = 60. Cuntas obser
vaciones debern hacerse en cada poblacin para que la probabilidad de rechazar la hiptesis nula de la
igualdad de las medias poblacionales sea al menos 0,90? Suponer que a = 0.05 y que una estimacin razona
ble de la varianza de error es
= 25.
Referirse al problema 3-26.
) En qu forma cambiara la respuesta si una estimacin razonable de la varianza del error experimental
fuera cr^ = 36?
b) En qu forma cambiara la respuesta si una estimacin razonable de la varianza del error experimental
fuera
= 49?
c) Puede sacarse alguna conclusin acerca de la sensibilidad de la respuesta dada en esta situacin
particular acerca de cmo afecta la estimacin de o la decisin referente al tamao de la muestra?
d) Puede hacerse alguna recomendacin acerca de cmo debera usarse este enfoque general para elegir n
en la prctica?
Referirse al experimento de la fundicin de aluminio descrito en la seccin 3-8, Verificar que los mtodos
para controlar la proporcin de almina no afectan el voltaje promedio de la celda. Construir una grfica de
probabihdad normal de los residuales, Graficar los residuales contra los valores predichos. Existe algn in
dicio de que se violan algunos de los supuestos fundamentales?
Referirse al experimento de la fundicin de aluminio de la seccin 3-8, Verificar el anlisis de varianza del
ruido del crisol que se resume en la tabla 3-13. Examinar las grficas de los residuales usuales y comentar la
validez del experimento.
Se investigaron cuatro diferentes velocidades de alimentacin en un experimento con una mquina CNC que
produce una pieza que se usa en la unidad de potencia auxiliar de un avin. El ingeniero de manufactura a
cargo del experimento sabe que una dimensin crtica de la pieza de inters puede ser afectada por la veloci
dad de alimentacin. Sin embargo, la experiencia previa indica que es probable que slo estn presentes

3-11 PROBLEMAS

125

efectos de dispersin. Es decir, al cambiarse la velocidad de alimentacin no se afecta la dimensin prome


dio, pero podra afectarse la variabilidad dimensional. El ingeniero realiza cinco corridas de produccin con
cada velocidad de alimentacin y obtiene la desviacin estndar de la dimensin crtica (en 10-^ mm) Los da
tos se muestran abajo. Suponer que todas las corridas se hicieron en orden aleatorio.
Velocidad de alimentacin
(pulgadas/minuto)_______
10
12

14
__________16_____________

__________ Corrida de produccin


1
2
3
4
0.09
0,10
0.13
0.08
0.06
0,09
0.12
0.07
0.11
0.08
0.08
0.05
0.19
0.13
0.15
0.20

5
0.07
0.12
0,06
0.11

a) La velocidad de alimentacin tiene algn efecto sobre la desviacin estndar de esta dimensin crtica?
b) Usar los residuales de este experimento para investigar la adecuacin del modelo. Hay algn problema
con la validez experimental?
3-31. Considere los datos del problema 3-10,
a) Escribir las ecuaciones normales de mnimos cuadrados para este problema y resolverlas para
uti
lizando la restriccin usual
= 0> Estimar r, - fj.
b) Resolver las ecuaciones del inciso a utilizando la restriccin 1 3 = 0 Los estimadores i y fi son los mis
mos que se encontraron en el inciso a? Por qu? Estimar ahora - ^2y comparar la respuesta con la del
inciso a. Qu afirmacin puede hacerse respecto de estimar los contrastes en las r,?
c) Estimar ^ + Ti , 2t, - - tj, y ^
Tj utilizando las dos soluciones de las ecuaciones normales. Com
parar los resultados obtenidos en cada caso.
3-32. Aplicar la prueba general de significacin de la regresin en el experimento del ejemplo 3-1. Demostrar que
el procedimiento produce los mismos resultados que el anlisis de varianza usual.
3-33. Usar la prueba de Kruskal-Wallis en el experimento del problema 3-11. Comparar las conclusiones obtenidas
con las del anlisis de varianza usual.
3-34. Usar la prueba de Kruskal-Wallis en el experimento del problema 3-12. Los resultados son comparables con
los encontrados por el anlisis de varianza usual?
3-35, Considere el experimento del ejemplo 3-1. Suponga que la observacin mayor de la resistencia a la tensin se
registr incorrectamente como 50. Qu efecto tiene esto sobre el anlisis de varianza usual? Qu efecto
tiene sobre la prueba de Kruskal-Wallis?

Bloques aleatorzados,
cuadrados latinos y diseos
relacionados

4-1

DISEO DE BLOQUES COMPLETOS ALEATORIZADOS

En cualquier experimento, la variabilidad que surge de un factor perturbador puede afectar los resulta
dos. En general, un factor perturbador puede definirse como un factor del diseo que probablemente
tenga un efecto sobre la respuesta, pero en el que no existe un inters especfico. En ocasiones un factor
perturbador es desconocido y no controlable; es decir, se desconoce la existencia de ese factor e incluso
puede tener niveles variables mientras se est realizando el experimento. La aleatorzacin es la tcnica
de diseo que se utiliza para protegerse contra estos factores perturbadores que estn al acecho. En
otros casos, el factor perturbador es conocido pero no controlable. Si por lo menos puede observarse el
valor que asume el factor perturbador en cada corrida del experimento, es posible hacer la compensacin
correspondiente en el anlisis estadstico mediante el uso del anlisis de covarianza, una tcnica que se
revisar en el captulo 14. Cuando la fuente de variabilidad perturbadora es conocida y controlable, pue
de usarse una tcnica de diseo llamada formacin de bloques para eliminar de manera sistemtica su
efecto sobre las comparaciones estadsticas entre los tratamientos. La formacin de bloques es una tcnica de diseo en extremo importante que se utiliza ampliamente en la experimentacin industrial, y es la
materia de este captulo.
Para ilustrar la idea general, suponga que quiere determinarse si cuatro puntas diferentes producen o
no lecturas diferentes en una mquina para probar la dureza. Un experimento como ste podra ser parte
de un estudio de la aptitud en la calibracin de los instrumentos. La mquina funciona presionando la
punta en un ejemplar de prueba de metal, y por la profundidad de la depresin resultante puede determi
narse la dureza del ejemplar. El experimentador ha decidido obtener cuatro observaciones para cada
punta. Hay un solo factorel tipo de puntan, y un diseo completamente aleatorizado de un solo factor
consistira en asignar al azar cada una de las 4 x 4 = 16 corridas a una unidad experimental, es decir, a un
ejemplar de prueba de metal, y observar qu resulta de la lectura de la dureza. Por lo tanto, se necesita
ran 16 ejemplares de prueba de metal en este experimento, uno por cada corrida del diseo.
Existe un problema potencialmerte serio con un experimento por completo aleatorizado en esta si
tuacin de diseo. Si los ejemplares de prueba de metal difieren ligeramente en sus durezas, como podra

126

4-1 DISEO DE BLOQUES COMPLETOS ALEATORIZADOS

Tabla 4-1

1 27

Diseo de bloques completos aleatorizados para el


experimento de la prueba de la dureza
Ejemplar de prueba

Tipo de punta
1
2
3
4

9.3
9.4
9.2
9.7

9.4
9.3
9.4
9.6

9.6
9.8
9.5
10.0

10,0
9.9
9.7
10.2

ocurrir si se tomaran de lingotes que se produjeron con temperaturas diferentes, las unidades experimen
tales (los ejemplares de prueba) contribuirn a la variabilidad observada en los datos de la dureza. Como
resultado, el error experimental reflejar tanto el error aleatorio como la variabilidad entre los ejempla
res de prueba.
El objetivo sera hacer el error experimental tan pequeo como fuera posible; es decir, querra elimi
narse del error experimental la variabilidad entre los ejemplares de prueba. Un diseo para lograr esto
requiere que el experimentador pruebe cada punta una vez en cada uno de los cuatro ejemplares de prue
ba. A este diseo, que se muestra en la tabla 4-1, se le llama diseo de bloques completos aleatorizados
(RCBD, randomized complete block design). La respuesta observada es la dureza en la escala C de Rockwell
menos 40. La palabra completos indica que cada bloque (ejemplar de prueba) contiene todos los tratamien
tos (puntas). Al utilizar este diseo, los bloques o ejemplares de prueba forman una unidad experimental
ms homognea en la cual comparar las puntas. D e hecho, esta estrategia de diseo mejora la precisin
de las comparaciones entre las puntas al eliminar la variabilidad entre los ejemplares de prueba. Dentro de
un bloque, el orden en que se prueban las cuatro puntas se determina aleatoriamente. Observe la simili
tud de este problema de diseo con el de la seccin 2-5, donde se analiz la prueba t pareada. El diseo de
bloques completos aleatorizados es una generalizacin de ese concepto.
El RCBD es uno de los diseos experimentales ms utilizados. Son numerosas las situaciones en las
que el RCBD es apropiado. Las unidades de equipo o maquinaria de prueba son con frecuencia diferen
tes en sus caractersticas de operacin y seran un factor de formacin de bloques tpico. Lotes de materia
prima, personas y el tiempo tambin son fuentes de variabihdad perturbadora comunes en un experimen
to que pueden controlarse de manera sistemtica mediante la formacin de bloques.
La formacin de bloques tambin puede ser til en situaciones que no incluyen necesariamente fac
tores perturbadores. Por ejemplo, suponga que un ingeniero qumico est interesado en el efecto de la ve
locidad de alimentacin del catalizador sobre la viscosidad de un polmero. Sabe que hay varios factores,
como la fuente de la materia prima, la temperatura, el operador y la pureza de la materia prima, que son
muy difciles de controlar en proceso en gran escala. Por lo tanto, decide probar en bloques la velocidad
de alimentacin del catalizador, donde cada bloque consiste en alguna combinacin de estos factores no
controlables. D e hecho, est utilizando los bloques para probar la robustez de su variable de proceso (la
velocidad de ahmentacin) para las condiciones que no puede controlar con facilidad. Para un anlisis
ms ampho de este punto, ver Coleman y Montgomeiy [27].

4-1.1

Anlisis estadstico del diseo de bloques completos aleatorizados

Suponga que se tienen, en general, a tratamientos que van a compararse y b bloques. El diseo de bloques
completos aleatorizados se muestra en la figura 4-1. Hay una observacin por tratamiento en cada blo
que, y el orden en que se corren los tratamientos dentro de cada bloque se determina al azar. Debido a

128

CAPTULO 4

Bloque 1

BLOQUES ALEATORIZADOS, CUADRADOS LATINOS Y DISEOS RELACIONADOS

Bloque 2

Bloque b
y it

^11
>21
J'32

Figura 4-1 El diseo de bloques completos aleatorizados.

que la nica aleatorizacin de los tratamientos se hace dentro de los bloques, con frecuencia se dice que
los bloques representan una restriccin sobre la aleatorizacin.
El modelo estadstico del RCBD puede escribirse de varias maneras. El tradicional es el modelo de

los efectos:
1

y i = f i+ T i+ P + e j

= 1, 2,..., a

; = 1, 2 ,...,6

(4-1)

donde fi es la media global, r, es el efecto del tratamiento i-simo, es el efecto del bloque_/-simo, y es
el trmino del error NID(0, c^) usual. Se considerar inicialmente que los tratamientos y los bloques son
factores fijos. Como en el modelo del diseo experimental con un solo factor del captulo 3, el modelo de
los efectos para el RCBD es un modelo sobreespecificado. En consecuencia, los efectos de los tratamien
tos y los bloques se consideran por lo general como desviaciones de la media global, por lo que

.=1

= O y 2
y=i

Ihmbin es posible usar un modelo de las medias para el RCBD, por ejemplo
i = l,

donde//,y = n + r+ ^. Sin embargo, en este captulo se usar el modelo de los efectos de la ecuacin 4-1.
En un experimento en el que se use el RCBD, el inters se encuentra en probar la igualdad de las me
dias de los tratamientos. Por lo tanto, las hiptesis de inters son
ij:a l menos una/<, ^
Puesto que la media del tratamientoi-simo es = (l/))2j^,(i + r,-HjS,) = n - l - u n a manera equivalen
te de escribir las hiptesis anteriores es en trminos de los efectos de los tratamientos, por ejemplo
//o :T i= T 2 = --- = r , = 0
7/,: T,.

O para al menos una i

Sea y,, el total de observaciones hechas bajo el tratamiento i,y^ el total de observaciones del bloque j ,y
el gran total de las observaciones y N = ab el nmero total de observaciones. Expresado matemticamente.

4-1 DISEO DE BLOQUES COMPLETOS ALEATORIZADOS

129

y>. = 'Z y i J

i = h 2 ,...,a

(4-2)

a
y.j = ' Z y

; = i , 2,..

(4-3)

y
y. = 2 ya = 3',. = X;
=1 y=i
/=1
yi

(4-4)

D e manera similar, _y, es el promedio de las observaciones hechas bajo el tratamiento i,yj es el promedio
de las observaciones del bloque j, y es el gran promedio de todas las observaciones. Es decir,
y i. = y i. / *

y.j = y . /a

y jN

(4-5)

La suma de cuadrados total corregida puede expresarse como


o

E E (ya - X.)' = 5 ; [(y,. - X. ) H y .j - y.. ) + ( n - y,. - y.j + y. ) f


1= 1 y=i
(=1 j-i

(4-6)

Al desarrollar el miembro del lado derecho de la ecuacin 4-6 se obtiene


E E
i = l 7 -1

(X - X.)' = * 2

(X. - X.)' + E iy.j - y . )'

i~ l

j~ l

fl

g fe

+-lZ Z
(X- y-. - h + X.)' +
J=1
a b
+^2 E
i-l

;=1 Jml

(yi. - y. )(y.; - y .)

(y.j - y. )(ya ~ y , - y.j + y . )

a b

+ 2^ S
(=1 j~i

~ y ) ( n y i- - y .j + y . )

Mediante procedimientos algebraicos simples, pero laboriosos, se prueba que los tres productos cruzados
son cero. Por lo tanto.

1-1 7=1

(Xff X.)' =

i= l
a

(y . - y., y

+ 2 E

(y.j - y. f

(X - y.j - y>. + y y

(4-?)

representa una particin de la suma de cuadrados total. Al expresar simblicamente las sumas de cuadra
dos de la ecuacin 4-7, se tiene

^ ^Tratam ientm ^ ^Bloques

(4*8)

Puesto que hay N observaciones, SS t tiene N - 1 grados de libertad. Hay a tratamientos y b bloques,
de donde 55iya,anentos Y
ticncH fl - 1 y 6 - 1 grados de Ubertad, respectivamente. La suma de cuadra

130

CAPTULO 4 BLOQUES ALEATORIZADOS, CUADRADOS LATINOS Y DISEOS RELACIONADOS

dos del error es slo la suma de cuadrados entre las celdas menos la suma de cuadrados de los tratamien
tos y los bloques. Hay ab celdas con a b - 1 grados de libertad entre ellas, de donde SSe tiene a b - l - { a - l )
- ( b - l ) - { a - l ) ( b - 1) grados de libertad. Adems, la suma de los grados de libertad del lado derecho de
la ecuacin 4-8 es igual al total del lado izquierdo; por lo tanto, al establecer los supuestos de normalidad
usuales para los errores, puede usarse el teorema 3-1 para demostrar que 55Ttamientos/o^>
Y
SSe/ct^son variables aleatorias ji-cuadrada con distribuciones independientes. Cada suma de cuadrados
dividida por sus grados de libertad es un cuadrado medio. Puede demostrarse que el valor esperado de los
cuadrados medios, si los tratamientos y los bloques son fijos, es

i
^Bloques;

"

E iM S^) = a^
Por lo tanto, para probar la igualdad de las medias de los tratamientos, se usara el estadstico de prueba
T"

MS,
--- TrAtamientos
MS.

que se distribuye como


(a-j)(fc-i) si la hiptesis nula es verdadera. La regin crtica es la cola superior de
la distribucin F, y H q se rechazara si Fo > f
T&mbin podra haber inters en comparar las medias de los bloques porque, en caso de que la dife
rencia entre estas medias no sea considerable, quiz no sea necesaria la formacin de bloques en experi
mentos futuros. Por los cuadrados medios esperados, aparentemente la hiptesis H q:^ = O puede
probarse comparando el estadstico F q =
con f ( a - i ) ( i . - i ) - Sin embargo, recuerde que la
aleatorizacin slo se ha aplicado a los tratamientos dentro de los bloques; es decir, los bloques represen
tan una restriccin sobre la aleatorizacin. Qu efecto tiene esto sobre el estadstico Fg = MS^^g.
Existen diferentes puntos de vista para abordar esta cuestin. Por ejemplo, Box, Hunter y Hunter [18] sealan que la p ru eb af del anlisis de varianza comn puede justificarse exclusivamente con base
en la aleatorizacin,^ sin el uso directo del supuesto de normalidad. Agregan que en la prueba para com
parar las medias de los bloques no puede recurrirse a dicha justificacin debido a la restriccin sobre la
aleatorizacin; pero si los, errores son NID(0, o^), puede usarse el estadstico F^ =
para
comparar las medias de los bloques. Por otra parte, Anderson y McLean [2] argumentan que la restric
cin sobre la aleatorizacin impide que este estadstico sea una prueba significativa para comparar las
medias de los bloques y que este cociente F es en realidad ima prueba de la igualdad de las medias de los
bloques ms la restriccin sobre la aleatorizacin (a la que llaman el error de la restriccin; ver Anderson
y McLean [2] para detalles adicionales).
Entonces, qu se hace en la prctica? Debido a que con frecuencia el supuesto de normadad es
cuestionable, considerar Fg = MSbi,
como una prueba F exacta para la igualdad de las medias de
los bloques no es una buena prctica general. Por esa razn, esta prueba f no se incluye en la tabla del
anlisis de varianza. Sin embargo, como un procedimiento aproximado para investigar el efecto de la va
riable formacin de bloques, examinar el cociente
es muy razonable. Si este cociente es muy
1 D e hecho, la distribucin ' de la teora normal es una aproximacin de la distribucin de aleatorizacin generada al calcular F a
partir de cada asignacin posible de las respuestas a los tratamientos.

4-1 DISEO DE BLOQUES COMPLETOS ALEATORIZADOS


Tabla 4-2

Anlisis de varianza de un diseo de bloques completos aleatorizados

Fuente de
variacin

Grados de
libertad

Suma de cuadrados

'Aatamientos
Bloques

131

Cuadrado medio

a-1
SS,Bloques

Error

SSe

Tbtal

SSr

'^*^TtBtaniicnt08
fl-1
^^Bloques
b -1
SSe

b-1

Fo
MS,

N -

grande, implica que el factor formacin de bloques tiene un efecto considerable y que la reduccin del
ruido obtenida por la formacin de bloques probablemente fue til para mejorar la precisin de la com
paracin de las medias de los tratamientos.
El procedimiento suele resumirse en un esquema de anlisis de varianza, como el que se muestra en
la tabla 4-2. En general, los clculos se realizaran con un paquete de software de estadstica. Sin embar
go, es posible obtener frmulas de clculo manual de las sumas de cuadrados para los elementos de la
ecuacin 4-7 expresndolos en trminos de los totales de los tratamientos y los bloques. Estas frmulas de
clculo son
(4-9)

N
SS.Tratamientos = -
SS Bloques 4

(4-10)

1 ^
2L
2
r 'N

(4-11)

y la suma de cuadrados del error se obtiene por sustraccin como


(4-12)

EJEMPLO 4 - 1 .................................................................................................................................................
Considere el experimento de la prueba de la dureza de la seccin 4-1. Hay cuatro puntas y cuatro ejempla
res de prueba de metal. Cada punta se prueba una vez en cada ejemplar, resultando un diseo de bloques
completos aleatorizados. Los datos obtenidos se repiten por conveniencia en la tabla 4-3. Recuerde que
el orden en que se probaron las puntas en un ejemplar particular se determin al azar. Para simplificar los
Tabla 4-3

Diseo de bloques completos aleatorizados para el


experimento de la prueba de la dureza

Tipo de punta
1
2
3
4

1
9,3
9,4
9,2
9,7

Ejemplar de prueba (bloque)


2
3
9,4
9.6
9,3
9.8
9.4
9,5
9.6
10.0

4
10.0
9.9
9.7
10.2

132

CAPTULO 4

BLOQUES ALEATORIZADOS. CUADRADOS LATINOS Y DISEOS RELACIONADOS

Tabla 4-4

Datos codificados del experimento de la prueba de la dureza


Ejemplar de prueba (bloque)

Tipo de punta

y.

1
2
3
4

-2
-1
-3
2

-1
-2
-1
1

1
3
0
5

5
4
2
7

3
4
-2

yj

-4

-3

18

20 = x .

15

clculos, los datos originales se codifican restando 9.5 de cada observacin y multiplicando el resultado
por 10. Se obtienen as los datos de la tabla 4-4. Las sumas de cuadrados se obtienen de la siguiente manera;
y:

N
1 5 4 . 0 0 - ^ ^ = 129.00
16

ss

SS B lo q u e s

y.'

N
= i [(-4)^ + (-3 )" +(9)" +(18)"
^ ^Tratamientos

( 20)"
16

= 82.50

Bloques

= 129.00- 3 8 .5 0 - 82.50= 8.00


En la tabla 4-5 se presenta el anlisis de varianza. Utilizando a = 0.05, el valor crtico de F es i^o.05,3,9 =
3.86. Puesto que 14.44 > 3.86, se concluye que el tipo de punta afecta la lectura de la dureza media. El va
lor P para la prueba tambin es muy pequeo. Adems, al parecer los ejemplares (bloques) difieren de
manera significativa, ya que el cuadrado medio de los bloques es grande en relacin con el error.
Es interesante observar los resultados que se habran obtenido si no se hubiera tenido conocimiento
de los diseos de bloques aleatorizados. Suponga que se usaran cuatro ejemplares, asignando al azar las
puntas a cada uno de ellos, y que resultara (por casualidad) el mismo diseo que el de la tabla 4-3. El an
lisis incorrecto de estos datos como un diseo completamente aleatorizado de un solo factor se presenta
en la tabla 4-6.
Tabla 4-5

Anlisis de varianza del experimento de la prueba de la dureza

Fuente de
variacin

Cuadrado
medio

^0

V alor/

12.83

14.44

0.0009

27.50

8.00

0.89

129.00

15

Suma de
cuadrados

Grados de
libertad

Ttatamientos (tipo
de punta)

38.50

Bloques (ejemplares)

82.50

Error
Tbtal

4-1 DISEO DE BLOQUES COMPLETOS ALEATORIZADOS

Tabla 4-6

133

Anlisis incorrecto del experimento de la prueba de la dureza


como un diseo completamente aleatorizado

Fuente de
variacin
Tipo de punta
Error
Total

Suma de
cuadrados

Grados de
libertad

38.50
90.50
129.00

3
12
15

Cuadrado
medio
12.83
7.54

1.70

Puesto que -Fo,o5,3,i2 = 3,49, no puede rechazarse la hiptesis de la igualdad de las mediciones de la dureza
media de las cuatro puntas. Por lo tanto, el diseo de bloques aleatorizados reduce lo suficiente la canti
dad de ruido en los datos para que las diferencias entre las cuatro puntas sean detectadas. Esto ilustra un
punto muy importante. Si un experimentador no recurre a la formacin de bloques cuando debera ha
berlo hecho, el efecto puede ser inflar el error experimental a tal grado que las diferencias importantes
entre las medias de los tratamientos sean indetectables.

Muestra de salida de computadora


En la figura 4-2 se muestra la salida de computadora condensada obtenida con Design-Expert para los da
tos de la prueba de la dureza del ejemplo 4-1. Recuerde que en el anlisis original de la tabla 4-5 se utiliza
ron datos codificados. (Las respuestas originales se codificaron restando 9.5 y multiplicando el resultado
por 10.) El anlisis de computadora utiliz las respuestas originales. Por consiguiente, las sumas de cua
drados de la figura 4-2 son iguales a las de la tabla 4-5 divididas entre 100 (observe que Design-Expert ha
redondeado las sumas de cuadrados con dos cifras decimales).
Los residuales se enlistan en la parte inferior de la sada de computadora. stos se calculan como
^a = y i - %
y, como se demostrar ms adelante, los valores ajustados son
^i = y j - y i . - y . j + y . .

= y + yj - y , de donde
(4-i3)

En la seccin siguiente se indicar cmo se usan los residuales en la yerifcacin de la adecuacin del modelo.
Comparaciones mltiples
Si los tratamientos en un RCBD son fijos, y el anlisis indica una diferencia significativa en las medias de
los tratamientos, al experimentador le interesarn por lo general comparaciones mtiltiples para descubrir
cules son los tratamientos cuyas medias difieren. Para ello puede utilizarse cualquiera de los procedi
mientos de comparaciones mltiples del captulo 3 (seccin 3-5). Simplemente se sustituye en las frmulas de la seccin 3-5 el nmero de rplicas (n) en el diseo completamente aleatorizado de un solo factor
con el nmero de bloques (6). Asimismo, es necesario recordar usar el nmero de grados de libertad del
error para el bloque aleatorizado [{a - 1)( - 1)] en lugar de los grados de libertad del diseo completa
mente aleatorizado [a{n - 1)].
En la salida de Design-Expert de la figura 4-2 se ilustra el procedimiento LSD de Fisher. Observe que
si se usa a = 0.05, se concluira que //j = fi-i- Ahora bien, puesto que^j < j'i. ^ y 2, (es decir, las medias^2. y
abarcan algunas de las medias restantes), una conclusin inmediata sera que/i =/2 = ( 3- Adems, ^4
es diferente de las otras tres medias. Se concluye por lo tanto que la punta tipo 4 produce una dureza m e
dia que es significativamente ms alta que las lecturas de la dureza media de los otros tres tipos de puntas.

CAPTULO 4

13 4

BLOQUES ALEATORIZADOS, CUADRADOS LATINOS Y DISEOS RELACIONADOS

Response: Hardness in Rockwell C


ANOVA for Selected Factorial Model
Anaiysls of variance table [Partial sum of squares]
Source

Sum of
Squares

DF

0.82
0.38

3
3

Block
Model

Mean
Square

0.38

0.13

0,080
1.29

9
15

8.889E-003

0.094
9.63
0.98
0.25

Prob > F

14.44

0 .0 0 0 9

14.44

0.0009

0.27
0.13

Residual
Cor
Total
Std. Dev.
Mean
C.V.
PRESS

F
Valu

significant

0.8280
0.7706
0,4563
15.635

R-Squared
Adj R-Squared
Pred R-Squared
Adeq Precisin

Treatment Means (Adjusted, If Necessary)


Estimated Standard
Error
Mean

9.57
9.60
9.45
9.88

1-A1
2-A2
3-A3
4-A4

0.47
0.47
0.47
0.47

Treatment

Mean
Difference

DF

Standard
Error

t for Ho
Coeff=0

Prob > 11

1 vs 2
1 vs 3
1 vs4
2 vs3
2 vs 4
3 vs 4

-0.025
0.13
-0.30
0.15
-0.27
-0.43

1
1
1
1
1
1

0.067
0.067
0.067
0.067
0.067
0.067

-0.38
1.87
-4.50
2.25
-4.12
-6.37

0.7163
0.0935
0.0015
0.0510
0.0026
0,0001

Standard
Order

1
2
3
4
5

6
7
8
9
10
11
12
13
14
15
16
Fi;ra

Actual
Valu

Predlcted
Valu

Residual

Leverage

Student
Residual

Cook's
Dlstance

Outlier
t

9.30
9.40
9.60
10.00
9.40
9.30
9.80
9.90
9.20
9.40
9.50
9.70
9.70
9.60
10.00
10.20

9.35
9.38
9.67
9.90
9.38
9.40
9.70
9.93
9.22
9.25
9.55
9.78
9.65
9.68
9.97
10.20

-0.050
0.025
-0.075
0.100
0.025
-0.100
0.100
-0.025
-0.025
0.150
-0.050
-0.075
0.050
-0.075
0.025
0.000

0.438
0.438
0.437
0.438
0.438
0.437
0.437
0.437
0.438
0.437
0.437
0.437
0.438
0.437
0.437
0.437

-0.707
0.354
-1.061
1.414
0.354
-1.414
1.414
-0.354
-0.354
2.121
-0.707
-1.061
0.707
-1.061
0.354
0.000

0.056
0.014
0.125
0.222
0.014
0.222
0.222
0.014
0.014
0.500
0.056
0.125
0.056
0.125
0.014
0.000

-0.686
0.336
-1,069
1,512
0.336
-1.512
1.512
-0.336
-0.336
2.828
-0.686
-1.069
0.686
-1.069
0.336
0.000

4-2 Salidfi de Dcsign-Expert (condensada)

para el eiemnin

4-1.

4-1 DISEO DE BLOQUES COMPLETOS ALEATORIZADOS

Punta

Punta Punta

Punta

^
-

135

______U
3

Dureza promedio (codificada)

Figura 4-3 Las medias del tipo de punta en relacin


con una distribucin f esca,_____
lada con un factor de escalacin ^fMS^Jb = JqM T a =0.47.

Thmbin puede usarse el procedimiento grfico del captulo 3 (seccin 3-5.1) para comparar las me
dias del tipo de punta. En la figura 4-3 se grafican las cuatro medias del tipo de punta del ejemplo 4-1 en
relacin con una distribucin t escalada con un factor de escalacin
i b = V0.89/ 4 = 0.47. Esta gr
fica indica que las puntas 1 ,2 y 3 producen probablemente mediciones de la dureza promedio idnticas,
pero que la punta 4 produce una dureza media mucho ms alta. Esta figura confirma los resultados de la
prueba LSD de Fisher incluida en la salida de Design-Expert de la figura 4-2.

4-1.2

Verificacin de la adecuacin del modelo

Se ha comentado ya la importancia de verificar la adecuacin del modelo supuesto. En general, deber


estarse alerta a los problemas potenciales con el supuesto de normalidad, con la desigualdad de la varianza por tratamiento o bloque, y con la interaccin bloque-tratamiento. Como en el diseo completamente
aleatorizado, el anlisis residual es la herramienta principal que se utiliza en estos diagnsticos de verifi
cacin. En la parte inferior de la saUda de Design-Expert de la figura 4-2 se enlistan los residuales del dise
o de bloques aleatorizados. Los residuales codificados se encontraran multiplicando estos residuales
por 10. Las observaciones, los valores ajustados y los residuales de los datos codificados de la prueba de la
dureza del ejemplo 4-1 son los siguientes:

- 2.00
- 1.00
1.00
5.00
- 1.00
- 2.00
3,00
4.00
-3.00
- 1.00
0.00
2.00
2.00
1.00
5.00
7.00

-1.50
-1.25
1.75
4.00
-1.25
- 1.00
2.00
4.25
-2.75
-2.50
0.50
2.75
1.50
1.75
4.75
7.00

-0.50
0.25
-0.75
1.00
0.25
- 1.00
1.00
-0.25
-0.25
1.50
-0.50
-0.75
0.50
-0.75
0.25
0.00

En la figura 4-4 se muestra la grfica de probabilidad normal y el diagrama de puntos de estos resi
duales. N o hay indicios marcados de no normalidad y tampoco hay evidencia que apunte a la posible pre
sencia de puntos atpleos. En la figura 4-5 se muestran las grficas de los residuales por tipo de punta o

138

CAPTULO 4

b lo q u e s ALEATORIZADOS, CUADRADOS LATINOS Y DISEOS RELACIONADOS

bloque 1 en conjunto es (vn ) = //+ T i+ y 3 i= // + 5 + 2 = // + 7. En general, el tratamiento 1 incrementa


siempre la respuesta esperada 5 unidades sobre la suma de la media global y del efecto del bloque.
Aun cuando este modelo aditivo simple muchas veces es til, hay situaciones en las que resulta inade
cuado. Suponga, por ejemplo, que se estn comparando cuatro formulaciones de un producto qumico
utilizando seis lotes de materia prima; los lotes de materia prima se consideran bloques. Si una impureza
en el lote 2 afecta de manera adversa la formulacin 2, dando como resultado un rendimiento inusual
mente bajo, pero no afecta las dems formulaciones, ha ocurrido una interaccin entre las formulaciones
(o tratamientos) y los lotes (o bloques). D e manera similar, pueden ocurrir interacciones entre los trata
mientos y los bloques cuando la respuesta se mide en la escala incorrecta. Por lo tanto, una relacin que es
multiplicativa en las unidades originales, por ejemplo

es lineal o aditiva en una escala logartmica, ya que, por ejemplo,


In

) = In ^ - I - In r,.-I- In

Aun cuando este tipo de interaccin puede eHminarse con una transformacin, no todas las interacciones
pueden tratarse con tanta facilidad. Por ejemplo, una transformacin no elimina la interaccin formula
cin-lote que se seal antes. El anlisis residual y otros procedimientos de diagnstico de verificacin
pueden ser tiles para detectar la no aditividad.
Si una interaccin est presente, puede afectar seriamente el anlisis de varianza y posiblemente lo
invahde. En general, la presencia de una interaccin infla el cuadrado medio del error y puede afectar ad
versamente la comparacin de las medias de los tratamientos. En situaciones en las que ambos factores,
as como su posible interaccin, son de inters, deben usarse diseos factoriales. Estos diseos se anali
zan en detalle en los captulos 5 al 9.

Tratamientos y bloques aleatorios


Aun cuando el procedimiento de prueba se ha descrito considerando los tratamientos y los bloques como
factores fijos, se utiliza el mismo procedimiento de anhsis si los tratamientos o los bloques (o ambos) son
aleatorios. Sin embargo, hay algunas modificaciones en la interpretacin de los resultados. Por ejemplo,
si los bloques son aleatorios, como es con mucha frecuencia el caso, se espera que las comparaciones en
tre los tratamientos sean las mismas a lo largo de la poblacin de bloques de la cual se seleccionaron alea
toriamente para realizar el experimento. Estn tambin las modificaciones correspondientes en los
cuadrados medios esperados. Por ejemplo, si los bloques son variables aleatorias independientes con va
rianza comn, entonces E (M5b,,) =
-I- aff ^, donde a ^ es el componente de la varianza de los efectos
de los bloques. En cualquier situacin,
siempre est libre de cualquier efecto de bloque, y
el estadstico de prueba para la variabilidad entre los tratamientos siempre es
En situaciones en las que los bloques son aleatorios, si est presente una interaccin tratamien
to-bloque, las pruebas para las medias de los tratamientos no estn afectadas por la interaccin. La razn
de ello es que los cuadrados medios esperados de los tratamientos y del error contienen ambos el efecto
de la interaccin; por consiguiente, la prueba de las diferencias en las medias de los tratamientos puede
realizarse como de costumbre comparando el cuadrado medio de los tratamientos con el cuadrado medio
del error. Este procedimiento no proporciona ninguna informacin acerca de la interaccin.

4-1 DISEO DE BLCXJUES COMPLETOS ALEATORIZADOS

13 9

Eleccin del tamao de la muestra


La eleccin del tamao de la muestra, o nmero de bloques que deben correrse, es una decisin impor
tante cuando se usa un RCBD, Al incrementar el nmero de bloques, se incrementa el nmero de rplicas
y el nmero de grados de libertad del error, con lo cual se aumenta la sensibilidad del diseo. Cualquiera
de las tcnicas descritas en el captulo 3 (seccin 3-7) para seleccionar el nmero de rplicas que deben
correrse en un experimento completamente aleatorizado con un solo factor puede aplicarse de forma di
recta al RCBD. Para el caso de un factor fijo, las curvas de operacin caracterstica de la parte V del apn
dice pueden usarse con

aa

(4-14)

donde haya - 1 grados de libertad en el numerador y (a - l)(b - 1) grados de libertad en el denominador.

EJEMPLO 4 - 2 ...................... ..........................................................................................................................


Considere el problema de la prueba de la dureza del ejemplo 4-1. Suponga que quiere determinarse el n
mero apropiado de bloques que deben correrse si el inters se encuentra en detectar una diferencia mxi
ma real en las lecturas de la dureza media de 0.4 con una alta probabilidad, y una estimacin razonable
de la desviacin estndar de los errores es a = 0.1. (Estos valores se dan en las unidades originales; recuerde
que el anlisis de varianza se realiz usando datos codificados.) Por la ecuacin 3-49, el valor mnimo
de
es (escribiendo b, el nmero de bloques, en lugar de n)

2aa^
donde D es la diferencia mxima que quiere detectarse. Por lo tanto,

2(4)(0.1)
Si se usan = 3 bloques, entonces <I = V2.0& = V2.0(3) = 2.45, y hay (a - l)(b - 1 ) = 3(2) = 6 grados de li
bertad del error. La parte V del apndice con Vi = a - l = 3 y a = 0.05 indica que el riesgo de este diseo
es aproximadamente 0.10 (potencia = 1 - ^ = 0.90). Si se usan b = 4 bloques, O = V2.0 = V2.0(4) = 2.83,
con (a - l)(b - 1 ) = 3(3) = 9 grados de libertad del error, y el riesgo 0 correspondiente es aproximada
mente 0.03 (potencia = 1 -/? = 0,97). l e s o cuatro bloques darn como resultado un diseo con una alta
probabiUdad de detectar la diferencia entre las lecturas de la dureza meda consideradas importantes.
Debido a que los ejemplares de prueba (bloques) son baratos y estn en disponibilidad y el costo de la
prueba es bajo, el experimentador decide usar cuatro bloques.

Estimacin de valores fallantes


Cuando se usa el RCBD, en ocasiones falta una observacin en uno de los bloques. Esto puede ocurrir de
bido a descuido o error o por razones fuera del control del experimentador, tal como un dao inevitable a
una unidad experimental. Una observacin faltante introduce un nuevo problema en el anlisis debido a
que los tratamientos dejan de ser ortogonales a los bloques; es decir, no ocurren todos los tratamientos en

140

CAPTULO 4

BLOQUES ALEATORIZADOS, CUADRADOS LATINOS y DISEOS RELACIONADOS

Tabla 4-7

Diseo de bloques completos aleatorizados para el


experimento de la prueba de dureza con un valor fallante

Ejemplar de prueba (bloque)


Tipo de punta

-1
-2

-2
-1
-3

1
X

-1

cada uno de los bloques. Existen dos enfoques generales para el problema de los valores faltantes. El pri
mero es un anlisis aproximado, en el cual la observacin faltante se estima y se lleva a cabo el anlisis de
varianza usual como si la observacin estimada fuera un dato real, con los grados de libertad del error re
ducidos en 1. Este anlisis aproximado es materia de esta seccin. El segundo es un anlisis exacto, el cual
se revisa en la seccin 4-1.4.
Suponga que falta la observacin y,y del tratamiento i en el bloque j. La observacin faltante se denota
como a:. Como una ilustracin, suponga que en el experimento de la prueba de dureza del ejemplo 4-1 el
ejemplar de prueba 3 se rompi mientras se probaba la punta 2 y que no pudo obtenerse el dato para esa
punta. Los datos apareceran como en la tabla 4-7.
En general, se har que y' represente el gran total con una observacin faltante, que y represente el
total del tratamiento con una observacin faltante, y que y'j sea el total del bloque con una observacin
faltante. Suponga que quiere estimarse la observacin faltante x de tal modo que x tenga una participa
cin mnima en la suma de cuadrados del error. Puesto que SS^ =
~ y, ~ y +5';.
esto es
equivalente a elegir x para minimizar

=1

ib

" 2

Vj=i

(a

fe

\;=i

- ^( x ;

(a
ya

+ (x :

E ya

,;-i y-i

+R

donde R incluye todos los trminos en los que no interviene x. A partir de


<

+by'j - y'

( a - l ) (f o -l )

(4-15)
O, se obtiene
(4-16)

como la estimacin de la observacin faltante.


Para los datos de la tabla 4-7, se encuentra que y' = 1, y , = 6 y y' = 17. Por lo tanto, por la ecuacin
4-16,
^ 4 (1)-H 4(6)-17^
(3)(3)
Ahora puede realizarse el anUsis de varianza comn utilizndolas = 1.22 y reduciendo los grados de li
bertad del error en 1. El anlisis de varianza se muestra en la tabla 4-8. Compare los resultados de este
anlisis aproximado con los resultados obtenidos para el conjunto de datos completo (tabla 4-5).

4-1 DISEO DE BLOQUES COMPLETOS ALEATORIZADOS


Tabla 4-8

141

Anlisis de varianza aproximado del ejemplo 4-1 con un valor faltante

Fuente de variacin
Tipo de punta
Ejemplares de prueba (bloques)
Error
Tbtal

Suma de
cuadrados

Grados de
libertad

Cuadrado
medio

39.98
79.53

3
3

13.33
26,51
0,78

6.22

125.73

14

17,12

0.0008

Si son varias las observaciones fallantes, pueden estimarse escribiendo la suma de cuadrados del
error como una funcin de los valores fallantes, derivando con respecto a cada valor faltante, igualando
los resultados con cero y resolviendo las ecuaciones resultantes. D e manera alternativa, puede usarse la
ecuacin 4-16 de manera iterativa para estimar los valores faltantes. Para ilustrar el enfoque iterativo, su
ponga que faltan dos valores. Se estima arbitrariamente el primer valor faltante y despus se usa este va
lor junto con los datos reales y la ecuacin 4-16 para estimar el segundo. Entonces puede usarse la
ecuacin 4-16 para volver a estimar el primer valor faltante, y despus de esto, puede volver a estimarse el
segundo. Este proceso se contina hasta que se obtiene la convergencia. En cualquier problema con valo
res faltantes, los grados de libertad del error se reducen en una unidad por cada observacin faltante.
4 '1 .4

Estim acin de los parmetros del m odelo y la prueba general


de significacin de la regresin

Si tanto los tratamientos como los bloques son fijos, los parmetros del RCBD pueden estimarse por m
nimos cuadrados. Recuerde que el modelo estadstico lineal es
y= l + T i + ^ + e a

= l, 2,..., a

(4-17)

,; = 1. 2,..., b

A l aplicar las reglas de la seccin 3-9.2 para encontrar las ecuaciones normales del modelo de un diseo
experimental, se obtiene

fi: abfi.

+ bf, -1- b2 +

Ti: bfi

+ bfi

ti'. bfi.

-1- bia -t-1-

k -1- k +

^ y i.

-1-

K -1- k + +

= >'2

-1- b% -1-

K -1- k -1- -t-

= ya.

-1- b2

bfi

-1- a k + + a k = y..

afl

+ ti

+ h

-1- ia

afi

+ h

+ h

afl

+ i

+ h

-1-

(4-18)

= y.i
-1- a k

= y.2

-1- a h = y.b

Observe que la suma de la segunda a la (a -H l)-sim a ecuaciones de la ecuacin 4-18 es la primera


ecuacin normal, como tambin es el caso de las b ltimas ecuaciones. Por lo tanto, hay dos dependencias

142

CAPTULO 4

BLOQUES ALEATORIZADOS, CUADRADOS LATINOS Y DISEOS RELACIONADOS

lineales en las ecuaciones normales, lo cual implica que deben imponerse dos restricciones para resolver
la ecuacin 4-18. Las restricciones usuales son
,= 0
=1

= ^

(4-19)

Al utilizar estas restricciones, las ecuaciones normales se simplifican considerablemente. D e hecho, que
dan como
abfl = y
bfl + b T , = y :

= 1 ,2 ,..., a

afl+ap = y

i=l,%...,b

(4-20)

cuya solucin es
A = y.
=
-X .

= 1 ,2 ,..., a

^j = y.j~y..

j = l , 2 ,...,b

(4-21)

Al utilizar la solucin de la ecuacin normal de la ecuacin 4-21, puede encontrarse el valor estimado o
ajustado de yj como

= y .+ ( ^ ,.- x .) + ( x ; - y .)

= yL+y. j - y. .
Este resultado se us anteriormente en la ecuacin 4-13 para calcular los residuales de un diseo de blo
ques aleatorizados.
La prueba general de significacin de la regresin puede usarse para desarrollar el anUsis de varianza del diseo de bloques completos aleatorizados. Al utilizar la solucin de las ecuaciones normales dada
por la ecuacin 4-21, la reduccin en la suma de cuadrados para ajustar el modelo completo es
u

R{n, X, /3) = ^y -l-J] i i y , + 2 ] P yj


1=1
a

= y., y. + X

(?.. - y.. )yi. + ^

y^

(X; ~ y.. )x>

X^

ab

con a -\- b - 1 grados de libertad, y la suma de cuadrados del error es


55. = 2 2
a

tP
a

.,2

t b

p,

,,2

2E
(X ,J -X ,-X ;+ X .)^
=1 ;=1

ab

4 4 DISEO DE BLOQUES COMPLETOS ALEATORIZADOS

143

con (a - l)(> - 1) grados de libertad. Compare esta ltima ecuacin con SS^ en la ecuacin 4-7.
Para probar la hiptesis H o:t = O, el modelo reducido es
y ,= f^ + p j+ s^
que es un anlisis de varianza de un solo factor. Por analoga con la ecuacin 3-5, la reduccin en la suma
de cuadrados para ajustar el modelo reducido es

que tiene b grados de libertad. Por lo tanto, la suma de cuadrados debida a {r,} despus de ajustar// y
W es
= J?(ModeIo completo) - /(Modelo reducido)

- S

ab

expresin que se identifica como la suma de cuadrados de los tratamientos con a - 1 grados de libertad
(ecuacin 4-10).
La suma de cuadrados de los bloques se obtiene ajustando el modelo reducido

que tambin es un anlisis de un solo factor. De nueva cuenta, por analoga con la ecuacin 3-5, la reduc
cin en la suma de cuadrados para ajustar este modelo es

con a grados de libertad. La suma de cuadrados de los bloques {fij} despus de ajustar fi y {t,} es
R (^

H, X)

= R{n, T, 0

y
P

)-

R{fi, t )

fi

ab

Z l_ >
a
ab

con b - 1 grados de libertad, la cual se haba dado anteriormente como la ecuacin 4-11.
Se han desarrollado las sumas de cuadrados de los tratamientos, de los bloques y del error en el dise
o de bloques completos aleatorizados utilizando la prueba general de significacin de la regresin. Aun
cuando la prueba general de significacin de la regresin no se usara ordinariamente para hacer el anli
sis real de los datos en un bloque completo aleatorizado, en ocasiones el procedimiento resulta til en di
seos de bloques aleatorizados ms generales, como los que se revisan en la seccin 4-4.

144

CAPTULO 4

BLOQUES ALEATORIZAEXDS, CUADRADOS LATINOS Y DISEOS RELACIONADOS

Anlisis exacto del problema del valor fallante


En la seccin 4-1.3 se present un procedimiento aproximado para solucionar las observaciones faltantes
en el RCBD. Este anlisis aproximado consiste en estimar el valor faltante de tal modo que se minimice el
cuadrado medio del error. Puede demostrarse que el anlisis aproximado produce un cuadrado medio
sesgado de los tratamientos en el sentido de que
es mayor que E{MS) si la hiptesis nula
es verdadera. Por consiguiente, se reportan demasiados resultados significativos.
El problema del valor faltante puede analizarse exactamente utilizando la prueba general de
significacin de la regresin. El valor faltante hace que el diseo sea no balanceado, y dado que no todos
los tratamientos ocurren en todos los bloques, se dice que los tratamientos y los bloques no son ortogona
les. Este mtodo de anlisis tambin se usa en tipos ms generales de diseos de bloques aleatorizados; el
tema se analiza con mayor amplitud en la seccin 4-4. En el problema 4-26 se le pide al lector que realice
el anlisis exacto para un diseo de bloques completos aleatorizados con un valor faltante.

4-2

DISEO DE C U A D R A D O LATINO

En la seccin 4-1 se introdujo el diseo de bloques completos aleatorizados como un diseo para reducir
el error residual de un experimento al eliminar la variabilidad debida a una variable perturbadora conoci
da y controlable. Hay otros tipos de diseos que utilizan el principio de la formacin de bloques. Por
ejemplo, suponga que un experimentador estudia los efectos que tienen cinco formulaciones diferentes
de la carga propulsora utilizada en los sistemas de expulsin de la tripulacin de un avin basado en la ra
pidez de combustin. Cada formulacin se hace con un lote de materia prima que slo alcanza para pro
bar cinco formulaciones. Adems, las formulaciones son preparadas por varios operadores, y puede
haber diferencias sustanciales en las habilidades y experiencia de los operadores. Por lo tanto, al parecer
hay dos factores perturbadores que sern calculados en promedio en el diseo: los lotes de materia pri
ma y los operadores. El diseo apropiado para este problema consiste en probar cada formulacin exac
tamente una vez con cada uno de los cinco operadores. Al diseo resultante, ilustrado en la tabla 4-9, se le
llama diseo de cuadrado latino. Observe que el diseo es un arreglo cuadrado y que las cinco formula
ciones (o tratamientos) se denotan por las letras latinas^, B, C,DyE-, de ah el nombre de cuadrado lati
no. Se observa que tanto los lotes de materia prima (renglones) como los operadores (columnas) son
ortogonales a los tratamientos.
El diseo de cuadrado latino se usa para ehminar dos fuentes de variabihdad perturbadora; es decir,
permite hacer la formacin de bloques sistemtica en dos direcciones. Por lo tanto, los renglones y las co
lumnas representan en realidad dos restricciones sobre la aleatorizacin. En general, un cuadrado latino
parap factores, o cuadrado latinop x p , es un cuadrado conp renglones yp columnas. Cada una de lasp^

Tabla 4-9

Diseo del cuadrado latino para el problema de la carga propulsora

Lotes de materia
prima
1
2
3
4
5

Operadores
1

^ = 24

5 = 20
C = 24

D = 24

= 24
A = 36

C = 18

D = 38

C =19
D = 30
= 26

D = 26

= 31
^ =30

= 22

= 27

A = 26

A = 21
3 = 23

B = 20

C = 29

B = 2
C = 22
Z = 31

4-2 DISEO DE CUADRADO LATINO

145

celdas resultantes contiene una de lasp letras que corresponde a los tratamientos, y cada letra ocurre una
y slo una vez en cada rengln y columna. Algunos ejemplos de cuadrados latinos son
4x4

5X 5

6x 6

ABDC
BCAD
CDBA
DACB

ADBEC
DACBE
CBEDA
BEACD
ECDAB

ADCEBF
BAECFD
CEDFAB
DCFBEA
FBADCE
EFBADC

El modelo estadstico de un cuadrado latino es


i = l,

y = i , 2,..., p

ynk=

(4-22)

k = l, 2,..., p
d o n d e e s la observacin en el rengln /-simo y la columna /c-sima para el tratamientoy-simo,/! es la
media global, a es el efecto del rengln i-simo, t es el efecto del tratamiento
es el efecto de la
columna fc-sima, y ej^es el error aleatorio. Observe que se trata de un modelo de los efectos. El modelo es
completamente aditivo; es decir, no hay interaccin entre renglones, columnas y tratamientos. Puesto
que hay una sola observacin en cada celda, slo se necesitan dos de los tres subndices i j y k para denotar
una observacin particular. Por ejemplo, con referencia al problema de la carga propulsora de la tabla
4-9, si i = 2 y fc = 3, se encuentra automticamente que; = 4 (formulacin D ), y si / = 1 y ) = 3 (formula
cin C), se encuentra que /c = 3. sta es una consecuencia de que cada tratamiento aparezca una vez exac
tamente en cada rengln y columna.
El anlisis de varianza consiste en hacer la particin de la suma de cuadrados total de las N =p^ ob
servaciones en los componentes de los renglones, las columnas, los tratamientos y el error, por ejemplo.
S S t

Renglones

^ ^Colunmas "*^ ^T raum isntos

(4-23)

con los respectivos grados de bertad


p^-1 = p - l + p - + p - + { p - 2 ) { p - l)
Bajo el supuesto usual de que
es NID(0, o^), cada suma de cuadrados del lado derecho de la ecuacin
4-23 es, al dividir por
una variable aleatoria ji-cuadrada con una distribucin independiente. El esta
dstico apropiado para probar que no hay diferencias en las medias de los tratamientos es
M S,
.M S ,
que se distribuye comoF^_i (p_2,Q,_i) bajo la hiptesis nula, Ihmbin puede probarse la ausencia de efectos
de los renglones o la ausencia de efectos de las columnas formando el cociente de
o MSr^
con M5. Sin embargo, puesto que los renglones y las columnas representan restricciones sobre la aleatorizacin, estas pruebas quiz no sean apropiadas.
En la tabla 4-10 se presenta el procedimiento de clculo para el anlisis de varianza. Por las frmulas
de clculo para las sumas de cuadrados, se observa que el anlisis es una extensin simple del RCBD, con
la suma de cuadrados resultante de los renglones obtenida a partir de los totales de los renglones.

146

CAPTULO 4

BLOQUES ALEATORIZADOS, CUADRADOS LATINOS Y DISEOS RELACIONADOS

Tabla 4-10

Anlisis de varianza del diseo del cuadrado latino

Fuente de
variacin

Suma de cuadrados

Tratamientos

^ ^Trataiuientofi

Renglones

^ ^R englones

7, ^ /
P J .

Grados de
libertad

Cuadrado medi
p-1

Columnas

'^ ^ T ra ta m ie n rm

MS.

^^Rnelones

p -

t:.

^'^ T iatam icntos

p -

\T

p-1
^^Columnas

p-1

p -1
SS^

Error

SSg{por sustraccin)

Tbtal

S S r = 1 2 1 y f , 4
J k

(p-2)(p-l)

(p-2)(p~l)

EJEMPLO 4 - 3 ..................................................................................................................................................
Considere el problema de la carga propulsora descrito previamente, donde tanto los lotes de materia pri
ma como los operadores representan restricciones sobre la aleatorizacin. El diseo para este experi
mento, el cual se muestra en la tabla 4-9, es un cuadrado latino 5 x 5 . Despus de codificar los datos
restando 25 de cada observacin, se obtienen los datos de la tabla 4-11. Las sumas de cuadrados del total
de los lotes (renglones) y los operadores (columnas) se calculan de la siguiente manera:
ji -

= 6 8 0 -^ ^ = 6 7 6 .0 0

y /-i
1

= ^ [(-1 4 )'+ 9 '-1 -5 '-1 -3 " -1 -7 ']-


SS Operadoies

Tabla 4-11

= 68.00

p t:i
1
= ^ [ ( - 1 8 ) '- H 8 '- h ( - 4 ) '- h 5 '- h 9 '] - 255 = m o o

Datos codificados para el problema de la carga propulsora


Operadores

materia prima

1
2

A = -l
B = -8
C 7
D= 1

5 = -5
C = -l
) = 13
E= 6
5

C = -6
D= 5
= 1
A = 1
B = -5

18

-4

3
4
5

y..k

-18

Vl

A= 2
B = -2
C= 4

E ------------ 1
A = 11
B=
C ------------ 3
D=
6

-14
9
5
3
7

D = -

10 =

y.

4-2 DISEO DE CUADRADO LATINO

Tabla 4-12

147

Anlisis de varianza del experimento de la carga propulsora

Fuente de variacin
Formulaciones
Lotes de materia prima
Operadores
Error
Tbtal

Suma de
cuadrados
330.00
68.00
150.00
128.00
676.00

Cuadrado
medio
82.50
17.00
37.50
10.67

Grados de
libertad
4
4
4
12
24

Los totales para los tratamientos (las letras latinas)

Letra latina

Fo
7.73

Valor P
0.0025

sol

Total del tratamiento


18

> 1. =

B
C

X2. = -24
y.3. = -13

y.4. =

24

y.5. =

La suma de cuadrados que resulta de las formulaciones se calcula a partir de estos totales como
P

s s Fonnulaciones

^ j

18^ + (-2 4 )^ + (-13)^ +24^ +5^


5

(10)^ ^
25

La suma de cuadrados del error se encuentra por sustraccin:


55^ =

S S j

~ ^ ^Foimulaciones

= 676.00- 6 8 .0 0 -1 5 0 .0 0 - 330.00 = 128.00


El anlisis de varianza se resume en la tabla 4-12. Se concluye que hay una diferencia significativa en
la rapidez de combustin media generada por las diferentes formulaciones de la carga propulsora. Tkmbin hay indicios de que hay diferencias entre los operadores, por lo que la formacin de bloques de este
factor fue una buena precaucin. No hay evidencia slida de una diferencia entre los lotes de materia pri
ma, por lo que al parecer en este experimento particular hubo una preocupacin innecesaria en esta fuen
te de variabilidad. Sin embargo, la formacin de bloques de los lotes de materia prima es por lo general
una buena idea.

Como en cualquier problema de diseo, el experimentador debera investigar la adecuacin del mo


delo inspeccionando y grafcando los residuales. Para un cuadrado latino, los residuales estn dados por
ek = yjk - %k

= ^ y ijk - y L - y .i- y ..k + 2 y ...


El lector deber encontrar los residuales del ejemplo 4-4 y construir las grficas apropiadas.

148
Tabla 4 -1 3

CAPTULO 4

BLOQUES ALEATORIZADOS, CUADRADOS LATINOS Y DISEOS RELACIONADOS

Cuadrados latinos estndares y nmero de cuadrados latinos de varios tamaos'*

Ihmao

3x3

4x4

5x5

6x6

7x7

Ejemplos de
cuadrados estndares

ABC
BCA
CAE

ABCD
BCDA
CDAB
DABC

ABCDE
BAECD
CDAEB
DEBAC
ECDBA

ABCDEF
BCFADE
CFBEAD
DEABFC
EADFCB
FDECBA

ABCDEFG
BCDEFGA
CDEFGAB
DEFGABC
EFGABCD
FGABCDE
GABCDEF

Nmero de cuadrados
estndares

56

9408

16,942,080

Nmero total de
cuadrados latinos

12

161,280

818,851,200

61,479,419,904,000

576

P
ABC...P
B C D ...A
C D E ... B

p \ (p ~ '\ )\ X

(nmero de
cuadrados estndares)

Paite de la informacin de esta tabla se encuentra en Statistical Tbbles f r Biological, Agricultural aTtd Medical Research, 4a. edicin, de R,A. Fishery F. Yates, Oliver & Boyd^
Edimburgo. Es poco lo que se sabe de las propiedades de los cuadrados latinos ms grandes que 7 x 7 .

A un cuadrado latino en el que el primer rengln y la primera columna constan de letras escritas en
orden alfabtico se le llama cuadrado latino estndar, que es el diseo que se utiliz en el ejemplo 4-3.
Siempre es posible obtener un cuadrado latino estndar escribiendo el primer rengln en orden alfabti
co y escribiendo despus cada rengln sucesivo como la sucesin de letras que estn justo arriba, recorri
das un lugar a la izquierda. En la tabla 4-13 se resumen varios hechos importantes acerca de los cuadrados
latinos y de los cuadrados latinos estndares.
Como con cualquier diseo experimental, las observaciones del cuadrado latino debern tomarse de
manera aleatoria. El procedimiento de aleatorizacin correcto es seleccionando al azar el cuadrado em
pleado. Como se observa en la tabla 4-13, hay un gran nmero de cuadrados latinos de un tamao particu
lar, por lo que es imposible enumerar todos los cuadrados y seleccionar uno al azar. El procedimiento
usual es seleccionar un cuadrado latino de una tabla de estos diseos, como en Fisher y Yates [45], y des
pus arreglar al azar el orden de los renglones, las columnas y las letras. Esto se analiza con mayor detalle
en Fisher y Yates [45].
Ocasionalmente, falta una observacin en un cuadrado latino. Para un cuadrado latinop y. p , e \ valor
faltante puede estimarse con
p ( K .+ x

) - 2x:.

p -2 ){p -\)

donde las primas indican los totales del rengln, la columna y el tratamiento con el valor faltante, y y' es
el gran total con el valor faltante.
Los cuadrados latinos pueden ser tiles en situaciones en las que los renglones y las columnas repre
sentan los factores que el experimentador en realidad quiere estudiar y en las que no hay restricciones so
bre la aleatorizacin. Por lo tanto, los tres factores (renglones, columnas y letras), cada uno conp niveles,
pueden investigarse en slop^ corridas. En este diseo se supone que no existe interaccin entre los facto
res. Se abundar ms adelante sobre el tema de la interaccin.
Rplicas de cuadrados latinos
Una desventaja de los cuadrados latinos pequeos es que proporcionan un nmero relativamente peque
o de grados de libertad del error. Por ejemplo, un cuadrado latino 3 x 3 slo tiene dos grados de libertad
del error, un cuadrado latino 4 x 4 slo tiene seis grados de libertad del error, etc. Cuando se usan cua
drados latinos pequeos, con frecuencia es deseable hacer rplicas de los mismos para incrementar los
grados de hbertad del error.

4-2 DISEO DE CUADRADO LATINO

Tabla 4-14

149

Anlisis de varianza de un cuadrado latino con rplicas, caso 1

Fuente de
variacin

Suma de cuadrados

-i /

Ttatamientos
Renglones

Error

p~l

Columnas
Rplicas

p -1

N
2

n pi^

Grados de
libertad

zl
N

p -1

zl
N

n -1

Sustraccin

Tbtal

(p-l)[n(p + l ) - i ]
N

Cuadrado medio
*^*^'IVfltflnlientq$
p -1

MS.,
MS,

p -1

ss.
p -1
^'^Rplicaa
n -1
SS,
(p - 1 ) K

+1)-3]

np^-1

Existen varias maneras de hacer rplicas de un cuadrado latino. Para ilustrar este punto, suponga que
se hacen n rplicas del cuadrado latino 5 x 5 utilizado en el ejemplo 4-3. Esto podra haberse hecho de la
manera siguiente:
1.
2.
3.

Usando los mismos lotes y operadores en cada rplica.


Usando los mismos lotes pero operadores diferentes en cada rplica (o, de manera equivalente,
usando los mismos operadores pero lotes diferentes).
Usando diferentes lotes y diferentes operadores.

El anlisis de varianza depende del mtodo utilizado para hacer las rplicas.
Considere el caso 1, donde en cada rplica se usan los mismos niveles de los factores para la formacin
de bloques en los renglones y las columnas. Seayj^ la observacin del rengln i, el tratamiento j, la columna
k y \ a rplica /. Hay en total N = np^ observaciones. El anlisis de varianza se resume en la tabla 4-14.
Considere ahora el caso 2 y suponga que en cada rpHca se usan nuevos lotes de materia prima pero
los mismos operadores. Por le tanto, hay ahora cinco nuevos renglones (en general,/? nuevos renglones)
Tabla 4-15

Anlisis de varianza de un cuadrado latino con rplicas, caso 2

Fuente de
variacin
'^'atamientos

Suma de cuadrados
np^,
t

Renglones
Columnas

p-1

N
P

np^"

Rplicas

yl

1^1

/ i , i

Sustraccin

Tbtal

Z S S I]

i j k l

n {p -l)
p-1

n -1

Error

Grados de
libertad

(p -l)(n p -l)

y.

- N

np^-1

Cuadrado medio
'^ ^T n tam ien to s

^ ^ '^ T ra ia m ie n to s

p -1

MS,

^'^ R enilooeii

P -1
^ ^RpUcas

n -1
SS^
(p -l)(n p -l).

150

CAPTULO 4 BLOQUES ALEATORIZADOS, CUADRADOS LATINOS Y DISEOS RELACIONADOS

Tabla 4-16

Anlisis de varianza de un cuadrado latino con rplicas, caso 3

Fuente de
variacin

Grados de
libertad

Suma de cuadrados

Cuadrado medio

SS^
p~i

Ttatatnientos

npp

Renglones

^ 2 1 : ^ , ' ,- 2

'i

,,2

1:^1

't

P /=] i= l

/-I

^^Benglonc
n {p ~ )
S5.,
n (p -l)

n (p -l)

Columnas

( p - l)
P 1=1 k = l

Rplicas

J -y

Error

Sustraccin

Tbtal

-z l

^^^Ttatamicntoa
MS.

p -1

'^^Rplicas
n 1
SS,

n -1

np'^-\

i i k I

dentro de cada rplica. El anlisis de varianza se resume en la tabla 4-15. Observe que la fuente de varia
cin de los renglones mide en realidad la variacin entre los renglones dentro de las n rplicas.
Por ltimo, considere el caso 3, donde se usan nuevos lotes de materia prima y nuevos operadores en
cada rplica. Ahora la variacin que resulta tanto de los renglones como de las columnas mide la varia
cin que resulta de estos factores dentro de las rplicas. El anlisis de varianza se resume en la tabla 4-16.
Hay otros enfoques para analizar cuadrados latinos con rplicas que permiten la presencia de algu
nas interacciones entre tratamientos y cuadrados (referirse al problema 4-19).
Diseos alternados y diseos balanceados para efectos residuales
Ocasionalmente aparece un problema en el que los periodos son uno de los factores del experimento. En
general, hayp tratamientos que deben probarse enp periodos utilizando np unidades experimentales. Por
ejemplo, un analista del desempeo humano est estudiando el efecto de dos fluidos de restitucin para
la deshidratacin en 20 sujetos. En el primer periodo, a la mitad de los sujetos (elegidos al azar) se le ad
ministra el fluido v4 y a la otra mitad el fluido B. A l trmino del periodo se mide la respuesta, y se deja
transcurrir un lapso en el que se elimina cualquier efecto fisiolgico de los fluidos. Despus el experimen
tador hace que los sujetos que tomaron el fluido j4 tomen el fluido B y aquellos que tomaron el fluido B to
men el fluido j4. a este diseo se le llama diseo alternado o entrecruzado. Se analiza como un conjunto
de 10 cuadrados latinos con dos renglones (los periodos) y dos tratamientos (los tipos de fluido). Las dos
columnas en cada uno de los 10 cuadrados corresponden a los sujetos.
En la figura 4-7 se muestra la disposicin de este diseo. Observe que los renglones del cuadrado lati
no representan a los periodos y que las columnas representan a los sujetos. Los 10 sujetos que recibieron
primero el fluido A (1, 4, 6, 7, 9, 12, 13, 15, 17 y 19) se determinaron al azar.
C u a d ra d o s latin o s

III

II

IV

VI

S u je to

P a r io d o l

P e r io d o z

Figura 4-7

Un diseo alternado.

9
A
B

10
B

11
B

VII

12
A

13
A

14

B
B

IX

VIH
15

16

17
A

18
B

19 20
A

S
B

4'3 DISEO DE CUADRADO GRECOLATINO

Tabla 4-17

151

Anlisis de variania
del diseo alternado de la
figura 4'7

Grados de
libertad

Fuente de
variacin
Sujetos (columnas)
Periodos (renglones)
Fluidos (letras)
Error
Total

19
1
1
18
39

En la tabla 4-17 se resume un anlisis de varianza. La suma de cuadrados de los sujetos se calcula
como la suma de cuadrados entre los totales de los 20 sujetos corregida, la suma de cuadrados de los pe
riodos es la suma de cuadrados entre los renglones corregida, y la suma de cuadrados de los fluidos se cal
cula como la suma de cuadrados entre los totales de las letras corregida. Para ms detalles del anlisis
estadstico de estos diseos, ver Cochran y Cox [26], John [61d] y Anderson y McLean [2].
lkmbin es posible emplear diseos tipo cuadrado latino para experimentos en los que los tratamien
tos tienen un efecto residual; es decir, por ejemplo, s los datos del fluido B en el periodo 2 siguen reflejan
do algn efecto del flu ido^ tomado en el periodo 1. En Cochran y Cox [26] y John [61d] se estudian en
detalle los diseos balanceados para efectos residuales.

4-3

DISEO DE C U A D R A D O GRECOLATINO

Considere un cuadrado latinop x pL cual se le superpone un segundo cuadrado latinop x p en el que


los tratamientos se denotan con letras griegas. Si cuando se hace la superposicin los dos cuadrados tie
nen la propiedad de que cada letra griega aparece una y slo una vez con cada letra latina, se dice que los
dos cuadrados latinos son ortogonales, y al diseo obtenido se le llama cuadrado grecolatino. En la tabla
4-18 se muestra un ejemplo de un cuadrado grecolatino 4 x 4 .
El diseo de cuadrado grecolatino puede usarse para controlar sistemticamente tres fuentes de va
riabilidad extraa, es decir, para hacer la formacin de bloques en tres direcciones. El diseo permite la
investigacin de cuatro factores (renglones, columnas, letras latinas y letras griegas), cada una conp nive
les en slo p^ corridas. Existen cuadrados grecolatinos para toda p > 3, excepto p = 6.

Tabla 4-18

Rengln
1
2
3
4

Diseo del cuadrado grecolatino 4 x 4

1
Aa
B

cp
Dy

Columna
2

3
Cy

Ay
Da
C

A
Ba

4
D
Ca
By
Afi

152

CAPTULO 4

Tabla 4-19

BLOQUES ALEATORIZADOS, CUADRADOS LATINOS Y DISEOS RELACIONADOS

Anlisis de varianza de un diseo del cuadrado grecolatino

Fuente de variacin

Suma de cuadrados

Grados de libertad

Ttatamientos con letras latinas

p-1

Ttatamientos con letras griegas


Renglones
Columnas
Error
Tbtal

p -
SSColumnas

^ yX j
P /==!
SS^ (por sustraccin)
i

p-1

xj

(p-3)(p-l)
p^-1

El modelo estadstico para el diseo de cuadrado grecolatino es


7 = 1, 2,..., p
ijki

/ c - 1, 2,..., p

(4-25)

[ / = 1, 2,..., p
donde
es la observacin del rengln i y la columna / para la letra latina j y la letra griega k, 6 es el efecto
del rengln -simo, r, es el efecto del tratamiento de letra latina j, co^ es el efecto del tratamiento de letra
griega k, W, es el efecto de la columna l, y e^ es un componente N1D(0, o^) del error aleatorio. Slo son
necesarios dos de los cuatro subndices para identificar completamente una observacin.
El anlisis de varianza es muy parecido al de un cuadrado latino. Puesto que las letras griegas apare
cen exactamente una vez en cada rengln y columna, y exactamente una vez con cada letra latina, el factor
representado por las letras griegas es ortogonal a los renglones, las columnas y los tratamientos de letras
latinas. Por lo tanto, puede calcularse una suma de cuadrados debida al factor de las letras griegas a partir
de los totales de las letras griegas y el error experimental se reduce adicionalmente en esta cantidad. En la
tabla 4-19 se ilustran los detalles de los clculos. La hiptesis nula de la igualdd de tratamientos de ren
glones, columnas, letras latinas y letras griegas, se probara dividiendo el cuadrado medio correspondien
te por el cuadrado medio del error. La regin de rechazo es la cola superior del punto de la distribucin
Pp-\.

( p - 3 ) ( p - l) -

EJEMPLO 4 - 4 ........................................................................................................ .........................................


Suponga que en el experimento de la carga propulsora del ejemplo 4-3 un factor adicional, los montajes
de prueba, podra ser importante. Sea que haya cinco montajes de prueba denotados por las letras griegas
a, y3, y, (5 y f. En la tabla 4-20 se muestra el diseo de cuadrado grecolatino 5 x 5 resultante.
Observe que, debido a que los totales de los lotes de materia prima (renglones), los operadores (co
lumnas) y las formulaciones (letras latinas) son idnticos a los del ejemplo 4-3, se tiene
150.00

s s FormulacioneB = 330.00

153

4-3 DISEO DE CUADRADO GRECOLATINO

Tabla 4-20 Diseo del cuadrado grecolatino para el problema de la carga propulsora
T/itesde
materia prima
1
2
3

4
5

Operadores
1

A a = 1

By =~5
C = -1
De = 13
Ea = 6
Afi = 5

Ce = -6
Da= 5
Ep = 1
Ay = 1
Bb = -5

5/3
Cy
Dd
Ee

= -8
= -l
= 1
= -3

-18

y..i

18

D
Ey
A&
Be
Ca

-4

4
= -l
^ 2
= 2
= -2
= 4
5

5
Ed = - l

y...

Ba = -4

-14
9
5

C/3 = - 3

A e =11

= 6
9

7
10 = y ...

Los totales de los montajes de prueba (las letras griegas) son


Letra griega

Total de la prueba de ensamblaje

y..i. =

10

y..2 . = - 6

y..3. = - 3
>'-4 = - 4

y..5. =

13

Por lo tanto, la suma de cuadrados debida a los montajes de prueba es

55

- i t
P

k= \

= t P ' + ( - 6)' + ( - 3 ) ' + ( - 4 ) ' +13' ] - ^ ^ = 62.00


En la tabla 4-21 se resume el anlisis de varianza completo. Las formulaciones son diferentes significati
vamente en 1%. Al comparar las tablas 4-21 y 4-12, se observa que al sacar la variabilidad debida a los
montajes de prueba, el error experimental disminuye. Sin embargo, al disminuir el error experimental, se
han reducido tambin los grados de libertad de 12 (en el diseo del cuadrado latino del ejemplo 4-3) a 8.
Por lo tanto, la estimacin del error tiene menos grados de libertad, y la prueba puede ser menos sensible.

Tabla 4'21

Anlisis de varianza del problema de la carga propulsora


Suma de
Grados de
Fuente de variacin
cuadrados
libertad
Formulaciones
330.00
4
Lotes de materia prima
68.00
4
Operadores
150.00
4
Montajes de la prueba
62.00
4
Error
66.00
8
liDtal
676.00
24

Cuadrado
medio
82.50
17.00
37.50
15.50
8.25

Fo
10.00

Valor P
0.0033

154

CAPTULO 4

BLOQUES ALEATORIZADOS, CUADRADOS LATINOS Y DISEOS RELACIONADOS

Puede hacerse cierta ampliacin del concepto de los pares ortogonales de cuadrados latinos que for
man un cuadrado grecolatino. Un hipercuadradop x ^ es un diseo en el que se superponen tres o ms
cuadrados latinos ortogonalesp x p . E n general, hasta^ + 1 factores podran estudiarse si se dispone de
un conjunto completo dep - 1 cuadrados latinos ortogonales. En este diseo se utilizaran todos los (p +
l)(p - 1 ) = p ^ - grados de libertad, por lo que se necesita una estimacin independiente de la varianza
del error. Desde luego, no debe haber interacciones entre los factores cuando se usan hipercuadrados.

4-4

DISEOS DE BLOQUES INCOM PLETOS BALANCEADOS

En ciertos experimentos en los que se utilizan diseos de bloques aleatorizados quiz no sea posible co
rrer todas las combinaciones de los tratamientos en cada bloque. Situaciones como sta ocurren general
mente por limitaciones del aparato experimental o de las instalaciones o por el tamao fsico del bloque.
Por ejemplo, en el experimento de la prueba de la dureza (ejemplo 4-1), suponga que debido a sus dimen
siones cada ejemplar de prueba slo puede usarse para probar tres puntas. Por lo tanto, no es posible pro
bar todas las puntas en cada uno de los ejemplares. Para este tipo de problema es posible utilizar diseos
de bloques aleatorizados en los que cada tratamiento no est presente en cada bloque. Estos diseos se
conocen como diseos de bloques incompletos aleatorizados.
Cuando las comparaciones de todos los tratamientos son igualmente importantes, las combinaciones
de los tratamientos usadas en cada bloque debern seleccionarse en una forma balanceada, es decir, de
tal manera que cualquier par de tratamientos ocurra conjuntamente el mismo nmero de veces que cual
quier otro par. Por lo tanto, un diseo de bloques incompletos balanceados (BIBD, balanced incompUte
block design) es un diseo de bloques incompletos en el que dos tratamientos cualesquiera aparecen con
juntamente el mismo nmero de veces. Suponga que hay a tratamientos y que cada bloque puede conte
ner exactamente k (k < a) tratamientos. U n diseo de bloques incompletos balanceados puede
construirse tomando ( ) bloques y asignando una combinacin de tratamientos diferente a cada bloque.
Con frecuencia, sin embargo, puede obtenerse un diseo balanceado con menos de ( ^) bloques. Tkblas de
BIBD se proporcionan en Fisher y Yates [45], Davies [36] y Cochran y Cox [26].
Como un ejemplo, suponga que un ingeniero qumico piensa que el tiempo de reaccin de un proceso
qumico es una funcin del tipo de catalizador empleado. Se estn investigando cuatro catalizadores. El
procedimiento experimental consiste en seleccionar un lote de materia prima, cargar la planta poto,
aplicar cada catalizador en una corrida separada de la planta piloto y observar el tiempo de reaccin. D e
bido a que las variaciones en los lotes de materia prima pueden afectar el desempeo de los catalizadores,
el ingeniero decide usar los lotes de materia prima como bloques. Sin embargo, cada lote es apenas lo su
ficientemente grande para permitir que se prueben tres catalizadores. Por lo tanto, debe usarse un diseo

Tabla 4-22

D iseo de bloques incom pletos balanceados para el


experimento del catalizador_________________________

Bloque (lote de materia prima)

y.

1
2

73

_
67

71
72

3
4

73
75

74
75
75

68

72

75

218
214
216
777,

yj

221

224

207

218

870= X.

(catalizador)

4 4 DISEOS DE BLOQUES INCOMPLETOS BALANCEADOS

155

de bloques incompletos aleatorizados. El diseo de bloques incoinpletos balanceados para este experi
mento, junto con las observaciones registradas, se muestran en la tabla 4-22. El orden en que se corren los
catalizadores en cada bloque est aleatorzado.

4'4.1

Anlisis estadstico del diseo de bloques incoinpletos balanceados

Como de costumbre, se supone que hay a tratamientos y b bloques. Adems, se supone que cada bloque
contiene k tratamientos, que cada tratamiento ocurre r veces en el diseo (o que se hacen r rpHcas del
mismo), y que hay TV= ar = bk observaciones en total. Asimismo, el nmero de veces que cada par de tra
tamientos aparece en el mismo bloque es
a-1
Si a =
se dice que el diseo es simtrico.
El parmetro A debe ser un entero. Para deducir la relacin para A, considere cualquier tratamiento,
por ejemplo el tratamiento 1. Puesto que el tratamiento 1 aparece en r bloques y hay otros fc - 1 tratarmentos en cada uno de esos bloques, hay r{k - 1) observaciones en un bloque que contiene al tratamiento 1.
Estas r{k - 1) observaciones tambin tienen que representar a los a - 1 tratamientos restantes Aveces. Por
lo tanto, A(a - 1) = r{k - 1).
El modelo estadstico del BIBD es
y ..=

(4-26)

donde y,j es la observacin -sima en el bloque j~is\mo,n es la media global, r, es el efecto del tratamiento
i-simo, es el efecto del bloquey-simo, y e es el componente NID(0, o^) del error aleatorio. La variabi
lidad total en los datos se expresa por la suma de cuadrados totales corregida:

Puede hacerse la particin de la variabihdad total en


SSj. =

+'55BloqusE

donde la suma de cuadrados de los tratamientos est gu stad a para separar los efectos de los tratamientos
y de los bloques. Este ajuste es necesario porque cada tratamiento est representado en un conjunto dife
rente de r bloques. Por lo tanto, las diferencias entre los totales de los tratamientos no a j u s t a d o s ,>'2,,
_y tambin son afectadas por las diferencias entre los bloques.
La suma de cuadrados de los bloques es

d o n d e e s el total del bloquey-simo. -S^Bioque tiene b - 1 grados de libertad. La suma de cuadrados de los
tratamientos ajustada es

(4"29)

156
Tabla 4*23

CAPTULO 4

BLOQUES ALEATORIZADOS, CUADRADOS LATINOS Y DISEOS RELACIONADOS

Anlisis de varianza del diseo de bloques incompletos balanceados

Fuente de
variacin
ll'ataniientos
(ajustados)

Grados de
libertad

Suma de cuadrados

a -l

Xa

Bloques
Error

Cuadrado medio
Vi
^Ti'aiamieDtoS(ajustadoB)
a 1
^^Bloqucs
b-1
SSe
N - a-b +

b~l
SSepoi sustraccin)

N -a -b + 1

Tbtal

F,
^ ^^^ataiuietofi(^'iifitados)
M ,

N -1

donde Q es el total ajustado del tratamiento i-simo, el cual se calcula como


(4-30)
con n = 1 si el tratamiento i aparece en el bloque j y nj = Oen caso contrario. Los totales de los tratamien
tos ajustados siempre sumarn cero.
tiene a - 1 grados de libertad. La suma de cuadra
dos del error se calcula por sustraccin como
SS^

SSj

*5>S'Trstaiiiiemos(aju5t*dos)

^ ^Bloqucs

(4-31)

y tiene N - a - b + grados de libertad.


El estadstico apropiado para probar la igualdad de los efectos de los tratamientos es
MS.TTratamiedtos(aju5tados)
MS,
En la tabla 4-23 se resume el anlisis de varianza.

EJEMPLO 4 - 5 .................................................................................................................................................
Considere los datos de la tabla 4-22 para el experimento del catalizador. Se trata de un BIBD con a = 4,
= 4,fc = 3,r = 3,A = 2 y iV = 1 2 . El anlisis de estos datos es el siguiente. La suma de cuadrados total es
>L

12
= 6 3 ^ 1 5 6 - ^ ^ ^ = 8 1 .0 0
La suma de cuadrados de los bloques se encuentra con la ecuacin 4-28 como
^^Bloques

- i v
^^

J2

= ^[(221)" -f(207)'' + (2 2 4 )' + ( 2 1 8 )" ] -^^^^^ =55.00

4-4 DISEOS DE BLOQUES INCOMPLETOS BALANCEADOS

Tabla 4*24 Anlisis de varianza del ejemplo 4-5


Suma de
cuadrados
Fuente de variacin
22.75
Ttatamientos (ajustados
para los bloques)
55.00
Bloques
3.25
Error
81.00
Tbtal

Grados de
libertad
3

Cuadrado
medio
7.58

3
5
11

0.65

Fo
11.66

157

Valor/
0.0107

Para calcular la suma de cuadrados de los tratamientos ajustados para los bloques, primero se determinan
los totales de los tratamientos ajustados utilizando la ecuacin 4-30 como
<3i = (218) - i (221 + 224 + 218) = - 9 / 3
e , = ( 2 1 4 ) - i (207+ 224+218) = - 7 / 3
03 = ( 2 1 6 ) - ( 2 2 1 + 207 + 224) = - 4 / 3
a

= ( 2 2 2 ) - ( 2 2 1 + 207 + 2 1 8 )= 2 0 /3

La suma de cuadrados de los tratamientos ajustados se calcula con la ecuacin 4-29 como

^^
^'^
TlU
ratain
UlUIJien
Cim
to^
n^fL
sjiistA
Juauiuduos)
D^

^ 3 f( -9 / 3)^ + ( - 7 /3 ) ^ + ( - 4 / 3)^ + (2 0 / 3)^ ] ^ 22,75


(2)(4)
La suma de cuadrados del error se obtiene por sustraccin como
= iSiSj.

'SSiiMiunBiilot(jiifflados)

^^Btoqno

= 81.00 - 2 2 7 5 - 55.00 = 325


En la tabla 4-24 se muestra el anlisis de varianza. Puesto que el valor P es pequeo, se concluye que el ca
talizador empleado tiene un efecto significativo sobre el tiempo de reaccin.

Si el factor bajo estudio es jo, las pruebas para las medias de tratamientos individuales pueden ser
de inters. Si se emplean contrastes ortogonales, los contrastes deben hacerse sobre los totales de los tra
tamientos gustados, las {Q,} en lugar de las {y}. La suma de cuadrados de los contrastes es

SSc =

.1=1

donde {c,} son los coeficientes de los contrastes. Pueden usarse otros mtodos de comparacin mltiple

158

CAPTULO 4

bloques

ALEATORIZADOS, CUADRADOS LATINOS Y DISEOS RELACIONADOS

para comparar todos los pares de efectos de los tratamientos ajustados (seccin 4-4.2), los cuales se esti
man con f; = kQJ{k). El error estndar del efecto de un tratamiento ajustado es
S=

(4-32)

Xa

En el anlisis que acaba de describirse, se ha hecho la particin de la suma de cuadrados total en una
suma de cuadrados de los tratamientos ajustados, una suma de cuadrados de los bloques sin ajuste y una
suma de cuadrados del error. En ocasiones habra inters en evaluar los efectos de los bloques. Para ello
se requiere hacer una particin ahernativa de
es decir.
cc _ cc

1*'^^Bloques(ajustados)

^ ^ T ra ta m ie n to s ' ^ ^Bloques(ajustados)

Aqu,
est sin ajuste. Si el diseo es simtrico, es decir, si a b, puede obtenerse una frmula
simple para 5'5B,oq^s(ajustados)- Los totales de los bloques ajustados son
Qj ~ y.j

1^1
jS
' 1=1

(4-33)

2 ,..,,

(4-34)

B lo q u c s(aju stad o s)

El BIBD del ejemplo 4-5 es simtrico porque a = fe = 4. Por lo tanto,


Q; = ( 2 2 1 ) - | (218-)-216-1-222)= 7 /3
e ; = ( 2 2 4 ) - } (218-1-214-1-216) = 2 4 / 3
G; = (2 0 7 )-} (2 1 4 + 2 1 6 -l-222) = - 3 1 / 3
e ; = ( 2 1 8 )-i(2 1 8 + 2 1 4 -n 2 2 2 )= 0

_ 3 [(7 /3 )^ -(-(2 4 /3 )^ + (-3 1 /3 )^ + (0)^1 _


^"^Bloques(ajustados)------------------------ ( 2)(4^--------------------- DO-Uo
Asimismo,
SS Tratam ientos

Fuente de variacin
Ttataraientos (ajustados)
Ttatamientos (sin ajuste)
Bloques (sin ajuste)
Bloques (ajustados)
Error
ibtal

_ (218)" -H(214)^ -h(216)^ +(222)"

Suma de
cuadrados
22.75
11.67
55.00
66.08
3.25
81.0

(870)"
12

Grados de
libertad
3
3
3
3
5
11

Cuadrado
medio
7,58
22.03
0.65

= 11.67

Fo
11.66

Valor P

33.90

0.0010

0.0107

4'4 DISEOS DE BLOQUES INCOMPLETOS BALANCEADOS

159

En la tabla 4-25 se presenta un resumen del anlisis de varianza del BIBD simtrico. Observe que las
sumas de cuadrados asociadas con los cuadrados medios de la tabla 4-25 no producen la suma de cuadra
dos total, es decir,

SSj

+ S ^B loques(ajustadH )

Esto es consecuencia del carcter no ortogonal de los tratamientos y los bloques.


Salida de computadora
Existen varios paquetes de computadora que realizarn el anlisis de un diseo de bloques incompletos
balanceados. El procedimiento de Modelos Lineales Generales (General Linear Models) del SAS es uno
de ellos, y Minitab, un paquete de estadstica para computadoras personales de uso generalizado, es otro.
La parte superior de la tabla 4-26 es la salida del procedimiento de Modelos Lineales Generales de Mini
tab para el ejemplo 4-5. Al comparar las tablas 4-26 y 4-25, se observa que Minitab ha calculado la suma
de cuadrados de los tratamientos ajustados y la suma de cuadrados de los bloques ajustados (en la salida
de Minitab se les llama AdjSS o SS ajustada).
La parte inferior de la tabla 4-26 es un anlisis de comparaciones mltiples, en el que se utiliza l m
todo de Tkey. Se presentan los intervalos de confianza para las diferencias de todos los pares de medias y
la prueba de Tkey. Observe que el mtodo de Hikey llevara a la conclusin de que el catalizador 4 es di
ferente de los otros tres.

4'4>2

Estimacin de mnimos cuadrados de los parmetros

Considere la estimacin de los efectos de los tratamientos en el modelo BIBD. Las ecuaciones normales
de mnimos cuadrados son

T.;r/i+ rf, -I- j

= y,

^.k + ^ n,t+1$ = y
1=1
Al imponer las restricciones

i = \, 2,..., a

(4-35)

y = l , 2,..., b

= Ifij = O, se encuentra que /i = 5*.,. Adems, al utilizar las ecuaciones

para {fij} para eliminar los efectos de los bloques de las ecuaciones para {t}, se obtiene
r*t,. -

"
p=i
p*

X
y=i

Observe que el miembro del lado derecho de la ecuacin 4-36 es fcj2 donde Q es el total del tratamiento
ajustado i-simo (ver la ecuacin 4-29). Entonces, puesto que2j^in,ynpy = X%ip ^ iyn^p = py (ya Q u e =
O o 1), la ecuacin 4-36 puede reescribirse como
r(fc-l)T , -

p~\

, = kQ,

i = 1, 2,..., a

(4-37)

Tabla 4-26

Anlisis de Minitab (Modelo Lineal General) para el ejemplo 4-5

Modelo Lineal General

Factor
C a t a ly s t
Bl oc k

Type L e v e l s V a l e s
fix ed
4 12 3 4
fix ed
4 12 3 4

Ana ly s i s of V a r l a n c e for
S ource
C a t a ly s t
3 lock
Error
Total

DF
3
3
5
11

Adj SS
22.750
6 6. 0 83
3. 25 0

Seq SS
1 1 . 6 67
66.083
3.250
81 .000

Adj MS
7.5 83
22.028
0 . 65 0

11.67
33.89

0.011
0.001

T u k e y 95..0% :S i m u l t a n e o u s
R e s p on s e Var iable Time
All Pairi<i se C o m p a r i s o n s
C at a l y st = 1 s u b t r a c t e d
C at a l y st

3
4

Lowe r
-2.327
-1 . 95 2
1 .048

Center

0.2500
0.6250
3.6250

U p per
2.827
3 . 202

------------ + ----------- + ----------- + ------(-----------* ----------- )


C------------ * ----------- >

6.202

( ----------------- *---------------- '>


0.0

2.5

5.0

C a t a L y s t = 2 s u b t r a c t e d from:
Catalyst
3
4

L o wer
-2.202
0.798

C enter
0 . 37 5 0
3.3750

Upper
2 .9 5 2
5.952

------------ + ----------- + ----------- + ----(-----------* ----------- )


<------------ * ----------- >
0 .0

2.5

5.0

C a t a L y s t = 3 s u b t r a c t e d from:
C at a l y s t
4

Lowe r
0.4228

Ce nt er
3.000

Upper
5.577

---- --- ------------ ---------(----------- * ----------- >

----------------- +----------------+---------------- +------0 .0

T u k ey S i m u l t a n e o u s Tes t s
R e s p o n s e V a r i a b l e Time
All P a i r w i s e Coraparlsons a m o ng L e v e l s of C a t a l y s t
C a t a l y s t = 1 s u b t r a c t e d from:
Level
Catalyst
2

3
4

Di f f e r e n c e
of Mea n s
0.2500
0.6250
3.6250

SE of
Di f f e r en c e
0 . 6 9 82
0.6982
0 . 6 9 82

T-Value
0.3581
0.8951
5.1918

Adjusted
P-Value
0.9825
0.8085
0.0130

t-Value
0.5371
4.8338

Adjusted
P -V a l u e
0.9462
0.0175

C a t a l y s t = 2 s u b t r a c t e d from:
Level
Catalyst
3
4

Difference
of M e an s
0.3750
3.3750

SE of
Di f fe r e n c e
0 . 6 9 82
0 . 6 9 82

C a t a l y s t = 3 s u b t r a c t e d from:
Level D i f f e r e n c e
SE of
Catalyst
of M e a ns D i f f e r e n c e
43 . 0 0 0
0 .6 9 82
4.2 97

T-Value

A d )u s t e d
P -V a l u e
0.0281

2.5

5.0

4-4 DISEOS DE BLOQUES INCOMPLETOS BALANCEADOS

Por ltimo, observe que la restriccin


1), de donde se obtiene

= Oimplica que 2"


X a t,= k Q ,

161

y recuerde que r{k - 1 ) = ^ a -

i = 1,2,..., a

(4-38)

Por lo tanto, los estimadores de mnimos cuadrados de los efectos de los tratamientos en el modelo de
bloques incompletos balanceados son
/=

(4-39)

Como una ilustracin, considere el BIBD del ejemplo 4-5. Puesto que Qi = -9 /3, 0 2 = 7/3,
y 04 = 20/3, se obtiene

3 (-9 /3 )
* - (2)(4) ,

,
'V

= -4/3

_3(-7/3)_
(2)(4) -

- 3(-4/3).

3(20/3)

como se encontr en la seccin 4-4.1.

4'4 .3

Recuperacin de informacin interbloques en el diseo


de bloques incompletos balanceados

Al anlisis del BIBD presentado en la seccin 4-4.1 suele llamrsele el anlisis intrabloques porque las
diferencias de los bloques se eliminan y todos los contrastes de los efectos de los tratamientos pueden ex
presarse como comparaciones entre las observaciones del mismo bloque. Este anlisis es apropiado inde
pendientemente de si los bloques son fijos o aleatorios. Yates [113c] seal que si los efectos de los
bloques son variables aleatorias no correlacionadas con medias cero y vaiianza t7^, es posible obtener in
formacin adicional acerca de los efectos de los tratamientos t. Yates llam anlisis interbloqnes al m
todo para obtener esta informacin adicional.
Considere los totales de los bloques como una coleccin de b observaciones. El modelo para estas
observaciones (siguiendo a John [61d]) es
(4-40)
donde el trmino entre parntesis puede considerarse como el error. Los estimadores interbloques de // y
r, se encuentran minimizando la funcin de mnimos cuadrados

j-i

-i

Se obtienen as las siguientes ecuaciones normales de mnimos cuadrados;


a
f t : N f i + r ^ f,. = x,
.

Tkrf+rf

(4-41)

1> 2,..., s
p-i
pri

j.i

162

CAPTULO 4

BLOQUES ALEATORIZADOS, CUADRADOS LATINOS Y DISEOS RELACIONADOS

donde fi y z denotan los estimadores interbloques. Al imponer la restriccin


soluciones de las ecuaciones 4-41 como
fi= y ..

, = O, se obtienen las

(4-42)

b
, =

^--------

i = 1 ,2 ,..., a

(4-43)

Es posible demostrar que los estimadores interbloques {t, } y los estimadores intrabloques { i } no estn
correlacionados.
Los estimadores interbloques { t, } pueden diferir de los estimadores intrabloques { f , Por ejemplo,
los estimadores interbloques para el BIBD del ejemplo 4-5 se calculan de la siguiente manera;
=

^
,
^

10.50

6 4 M y C 7 5 0 ) ,_ 3 5 0
3 -2
_ 652-(3)(3)(72.50)
3 -2
646-(3)(3)(72.50)

Observe que los valores de 2


y se usaron en la pgina 157 para calcular los totales de los tratamien
tos ajustados en el anlisis intrabloques.
Suponga ahora que quieren combinarse los estimadores interbloques e intrabloques para obtener
una sola estimacin de la varianza mnima insesgada de cada r. Es posible demostrar que r,. y f , son insesgados y tambin que

V {t) = ^

a{T-.)

(a^

(intrabloques)

Se usa una combinacin lineal de los dos estimadores, por ejemplo


T - = a ,T , + a ,t ,

(4-44)

para estimar t. En este mtodo de estimacin, el estimador combinado insesgado de la varianza mnima
r deber tener las ponderaciones 1 = Mi/(mi -I= uJiu^ + u^, donde m, = \|V {t^ )y u 2 = W ( ,) .
Por lo tanto, las ponderaciones ptimas son inversamente proporcionales a las varianzas de y . Esto
implica que el mejor estimador combinado es

4-4 DISEOS DE BLOQUES INCOMPLETOS BALANCEADOS

163

que puede simplificarse como


kQi{o^ + k a ])-\- 2 n,yj-kry^ a
_____________________________
r. =
( r - + la (o ^ -\-ka^^)

i = \, 2 ,..., a

(4-45)

Desafortunadamente, la ecuacin 4-45 no puede usarse para estimar t , porque no se conocen las varianzas y
. El enfoque comn es estimar ct^y
a partir de los datos y sustituir estos parmetros de la
ecuacin 4-45 con las estimaciones. La estimacin que suele tomarse para
es el cuadrado medio del
error del anlisis de varianza intrabloques, o el error intrabloques. Por lo tanto,
= MS^
La estimacin de
se encuentra a partir del cuadrado medio de los bloques ajustados para los trata
mientos. En general, para un diseo de bloques incompletos balanceados, este cuadrado medio es

Xa

y=i

MS Bloques(ajustados)

(4-46)

y su valor esperado (cuya deduccin se hace en Graybill [50]) es


a(r-l)

[M 5
Por lo tanto, si

> MS^, la estimacin de

es

[^-SBloqu^ajusud, a l =
fl(r-l)
y si

< MS e, se hace

](>- 1)

(4-47)

= 0. Esto resulta en el estimador combinado

k Q ,(& ^ + k d l)+
T; =

o,

n.y.-kfy,.
V;=i
(r-A)ct^ +Xa{a^ + k d \ )

yi. - ( i / ) y .

a l >0

(4-48a)
(4-48b)

A continuacin se calculan las estimaciones combinadas para los datos del ejemplo 4-5. Por la tabla
4-25 se obtiene
= MS e = 0-65
= 22.03. (Observe que para calcularM5B,(,es(ajus,ados) se
hace uso del hecho de que ste es un diseo simtrico. En general, debe usarse la ecuacin 4-46.) Puesto
que M5Biqucs(ajustads) >
se usa la ecuacin 4-47 para estimar cr^ como
2

(22.03- 0.65)(3)

= 8.02

4 (3 - 1 )
Por lo tanto, pueden sustituirse
= 0,65 y
= 8.02 en la ecuacin 4-48a para obtener las estimaciones
combinadas que se enlistan enseguida. Por conveniencia, tambin se presentan las estimaciones intrablo-

164

CAPTULO 4

BLOQUES ALEATORIZADOS, CUADRADOS LATINOS Y DISEOS RELACIONADOS

ques e interbloques. En este ejemplo, las estimaciones combinadas estn prximas a las estimaciones intrabloques debido a que la varianza de las estimaciones interbloques es relativamente grande.

Parmetro

Estimacin intrabloques

Estimacin interbloques

Estimacin combinada

ti

- 1.12
-0.88
-0.50
2.50

10.50
-3.50
-0.50
-6.50

-1.09
- 0.88
-0.50
2.47

T4

4-5
4-1.

4-2.

PROBLEMAS
U n qumico quiere probar el efecto de cuatro agentes qumicos sobre la resistencia de un tipo particular de
tela. Debido a que podra haber variabilidad de un rollo de tela a otro, el qumico decide usar un diseo de blo
ques aleatorizados, con los rollos de tela considerados com o bloques. Selecciona cinco rollos y aplica los
cuatro agentes qumicos de manera aleatoria a cada rollo. A continuacin se presentan las resistencias a la
tensin resultantes. Analizar los datos de este experimento (utilizar a = 0.05) y sacar las conclusiones
apropiadas.
Rollo

Agente
qumico

1
2
3
4

73
73
75
73

68
67
68
71

74
75
78
75

71
72
73
75

67
70
68
69

Se estn comparando tres soluciones de lavado diferentes a fin de estudiar su efectividad para retardar el
crecimiento de bacterias en contenedores de leche de 5 galones. El anlisis se hace en un laboratorio y slo
pueden realizarse tres ensayos en un da. Puesto que los das podran representar una fuente potencial de va
riabilidad, el experimentador decide usar un diseo de bloques aleatorizados. Se hacen observaciones en
cuatro das, cuyos datos se muestran enseguida. Analizar los datos de este experimento (utilizar a = 0.05) y
sacar las conclusiones apropiadas.
Das

4-3.

4-4.
4-5.

Solucin

1
2
3

13
16
5

22
24
4

18
17
1

39
44
22

Graficar las resistencias a la tensin medias observadas para cada tipo de agente qumico en el problema 4-1
y compararlas con una distribucin t con la escalacin apropiada. Qu conclusiones se sacaran a partir de
esta representacin grfica?
Graficar los conteos de bacterias promedio para cada solucin en el problema 4-2 y compararlos con una dis
tribucin t escalada. Qu conclusiones pueden sacarse?
En un artculo de Fire Safety Journal (El efecto del diseo de boquillas en la estabilidad y el desempeo de
surtidores de agua turbulenta, vol. 4) se describe un experimento en el que se determin un factor de la for
ma para varios diseos diferentes de boquillas con seis niveles de la velocidad del flujo de salida del surtidor.

165

4-5 PROBLEMAS

El inters se centr en las diferencias potenciales entre los diseos de las boquillas, con la velocidad conside
rada como una variable perturbadora. Los datos se presentan a continuacin.

Velocidad del flujo de salida del surtidor (m/s)

Diseo de la
boquilla

11.73

14.37

16.59

20.43

23.46

28.74

1
2
3
4
5

0.78
0.85
0.93
1.14
0.97

0.80
0.85
0.92
0.97
0.86

0.81
0.92
0.95
0.98
0.78

0.75
0.86
0.89
0.88
0.76

0.77
0.81
0.89
0.86
0.76

0.78
0.83
0.83
0.83
0.75

a)

4-6.

El diseo de la boquilla afecta el factor de la forma? Comparar las boquillas con un diagrama de disper
sin y con un anlisis de varianza, utilizando a = 0.05.
b) Analizar los residuales de este experimento.
c) Qu diseos de las boquillas son diferentes con respecto al factor de la forma? Tirazar una grfica del
factor de la forma promedio para cada tipo de boquUla y compararla con una distribucin f escalada.
Comparar las conclusiones que se sacaron a partir de esta grfica con las de la prueba del rango mltiple
de Duncan.
Considere el experimento del algoritmo para controlar la proporcin de almina del captulo 3, seccin 3-8.
El experimento se llev a cabo en realidad como un diseo de bloques aleatorizados, en el que se selecciona
ron seis periodos como bloques, y se probaron los cuatro algoritmos para controlar la proporcin en cada pe
riodo. El voltaje promedio de la celda y la desviacin estndar del voltaje (indicada entre parntesis) para
cada celda son los siguientes:

Tiempo

Algoritmo
para controlar
la proporcin
1
2
3
4

4-7.

1
4.93
4.85
4.83
4.89

(0.05)
(0.04)
(0,09)
(0.03)

4.86 (0.04)
4.91 (0.02)
4.88 (0.13)
4.77 (0.04)

2
4.75
4.79
4.90
4.94

(0.05)
(0.03)
(0.11)
(0.05)

4.95
4.85
4.75
4.86

(0.06)
(0.05)
(0.15)
(0.05)

5
4.79
4.75
4.82
4.79

(0.03)
(0.03)
(0.08)
(0.03)

6
4.88
4.85
4.90
4.76

(0.05)
(0.02)
(0.12)
(0.02)

a) Analizar los datos del voltaje promedio de las celdas. (Utilizar a = 0.05.) La eleccin del algoritmo para
controlar la proporcin afecta el voltaje promedio de las celdas?
b) Realizar el anlisis apropiado de la desviacin estndar del voltaje. (Recuerde que a ste se le llam rui
do del crisol.) La eleccin del algoritmo para controlar la proporcin afecta el ruido del crisol?
c) Realizar los anlisis residuales que parezcan apropiados.
d) Qu algoritmo para controlar la proporcin debera seleccionarse si el objetivo es reducir tanto el vol
taje promedio de las celdas como el ruido del crisol?
El fabricante de una aleacin maestra de aluminio produce refinadores de textura en forma de lingotes. La
compaa produce el producto en cuatro hornos. Se sabe que cada horno tiene sus propias caractersticas
nicas de operacin, por lo que en cualquier experimento que se corra en la fundicin en el que se use ms de
un horno, los hornos se considerarn como una variable perturbadora. Los ingenieros del proceso sospechan
que la velocidad de agitacin afecta la medida de la textura del producto. Cada horno puede operarse con

166

CAPTULO 4 BLOQUES ALEATORIZADOS, CUADRADOS LATLVOS Y DISEOS RELACIONADOS

cuatro diferentes velocidades de agitacin. Se lleva a cabo un diseo de bloques aleatorizados para un refina
dor particular y los datos resultantes de la medida de la textura se muestran a continuacin;

Hom o
Velocidad de agitacin (rpm)
5
10
15
20

8
14
14
17

4
5
6
9

5
6
9
3

6
9
2
6

a)
b)
c)

4-8.
4-9.
4-10.
4-11.
4-12.

4-13,

Existe evidencia de que la velocidad de agitacin afecta la medida de la textura?


Representar los residuales de este experimento en una grfica de probabilidad nonnal. Interpretar esta grfica.
Graficar los residuales contra el horno y la velocidad de agitacin. Esta grfica proporciona alguna in
formacin til?
d) Cul sera la recomendacin de los ingenieros dcl proceso con respecto a la eleccin de la velocidad de
agitacin y del horno para este refinador de textura particular si es deseable una medida de la textura pe
quea?
Analizar los datos del problema 4-2 utilizando la prueba general de significacin de la regresin.
Suponiendo que los tipos de agentes qumicos y los rollos de tela son fijos, estimar los parmetros del modelo
t:, y
del problema 4-1.
Trazar una curva de operacin caracterstica para el diseo del problema 4-2. La prueba parece ser sensible
a las diferencias pequeas en los efectos de los tratamientos?
Suponga que falta la observacin del agente qumico 2 y el rollo 3 en el problema 4-1. Analizar el problema
estimando el valor fallante. Realizar el anlisis exacto y comparar los resultados.
Dos vahres/altantes en un bloque aleatorizado. Suponga que en el problema 4-1 faltan las observaciones del
agente qumico tipo 2 y el rollo 3 y del agente qumico tipo 4 y el rollo 4.
a) Analizar el diseo haciendo la estimacin iterativa de los valores faltantes, como se describe en la sec
cin 4-1.3.
b) Derivar SSe con respecto a los dos valores faltantes, igualar los resultados con cero y resolver las ecuacio
nes para las estimaciones de los valores faltantes. Analizar el diseo utilizando estas dos estimaciones de
los valores faltantes,
c) Deducir las frmulas generales para estimar dos valores faltantes cuando las observaciones estn en blo
ques diferentes.
d) Deducir las frmulas generales para estimar dos valores faltantes cuando las observaciones estn en el
mismo bloque.
U n ingeniero industrial est realizando un experimento sobre el tiempo de enfoque del ojo. Se interesa en el
efecto de la distancia del objeto al ojo sobre el tiempo de enfoque. Cuatro distancias diferentes son de inte
rs. Cuenta con cinco sujetos para el experimento. Debido a que puede haber diferencias entre los indivi
duos, el ingeniero decide realizar el experimento en un diseo de bloques aleatorizados. Los datos obtenidos
se presentan a continuacin. Analizar los datos de este experimento (utilizar a = 0.05) y sacar las conclusio
nes apropiadas.

Sujeto
Distancia (pies)
4
6
8
10

10
7
5
6

6
6
3
4

6
6
3
4

6
1
2
2

6
6
5
3

4'.5 PROBLEMAS

4-14.

167

Se estudia el efecto de cinco ingredientes diferentes (A, B ,C ,D y E) sobre el tiempo de reaccin de un proce
so qumico. Cada lote de material nuevo slo alcanza para permitir la realizacin de cinco corridas. Adems,
cada corrida requiere aproximadamente IV2 horas, por lo que slo pueden realizarse cinco corridas en un
da. El experimentador decide realizar el experimento como un cuadrado latino para que los efectos del da y
el lote puedan controlarse sistemticamente. Obtiene los datos que se muestran enseguida. Analizar los da
tos de este experimento (utilizar a 0.05) y sacar conclusiones.

Da

4-15.

4-16,
4-17.
4-18.
4-19,

Lote

1
2
3
4
5

^ = 8
C = 11
5 = 4
D ^6
= 4

2
=
A =
C=
> =

3
D =
A =
C=
E =
5 =

2
9
8
2

4
1
7
10
6
3

C =
Z3 =
=
S =
^ =

5
1
3
1
6
8

=
5 =
Z) =
A =
C=

3
8
5
10
8

Un ingeniero industrial investiga el efecto de cuatro m todos de ensamblaje {A, B, C y D ) sobre el tiempo de
ensamblaje de un componente de televisores a color. Se seleccionan cuatro operadores para el estudio. A de
ms, el ingeniero sabe que todos los mtodos de ensamblaje producen fatiga, de tal modo que el tiempo re
querido para el ltimo ensamblaje puede ser mayor que para el primero, independientemente del mtodo.
Es decir, se desarrolla una tendencia en el tiempo de ensamblaje requerido. Para tomar en cuenta esta fuente
de variabilidad, el ingeniero emplea el diseo del cuadrado latino que se presenta a continuacin. Analizar
los datos de este experimento (a - 0.05) y sacar las conclusiones apropiadas.

Operador

Orden de
ensamblaje

1
2
3
4

C = 10
B = 1
A^5
D = 10

D = 14
C = 18
5 = 10
A ^ IQ

A = 1
D = n
c = 11
5 = 12

4
5 =
^ =
D =
C=

8
8
9
14

Suponga que en el problema 4-14 falta la observacin del lote 3 en el da 4. Estimar el valor faltante con la
ecuacin 4-24, y realizar el anlisis utilizando este valor.
Considere un cuadrado latinop "Xp con renglones (a,), columnas (y?*.) y tratamientos ( t ) fijos. Obtener esti
maciones de mnimos cuadrados de los parmetros del modelo a
y t,.
Deducir la frmula del valor faltante (ecuacin 4-24) para el diseo del cuadrado latino.
Diseos que incluyen varios cuadrados latinos. (Ver Cochran y Cox [26] y John [61d],) El cuadrado latinop 'xp
contiene nicamentep observaciones para cada tratamiento. Para obtener ms rplicas, el experimentador
puede usar varios cuadrados, por ejemplo n. N o es relevante si los cuadrados usados son el mismo o son dife
rentes, El modelo apropiado es
7 = 1, 2 ,..., p
7 = 1, 2 ,.,,, p
= 1, 2 ,..., p
h = ,

168

4-20.
4-21.
4-22.

CAPTULO 4

BLOQUES ALEATORIZADOS, CUADRADOS LATINOS Y DISEOS RELACIONADOS

d o n d e e s la observacin del tratamiento; en el rengln i y la columna k del cuadrado /-simo. Observe


que
y
son los efectos del rengln y la columna en el cuadrado A-simo,
es el efecto del cuadrado
/z-simo y (i:p)jh es la interaccin entre los tratamientos y los cuadrados.
a) Establecer las ecuaciones normales para este modelo y resolverlas para las estimaciones de los parme
tros del modelo. Suponga que las condiciones auxiliares apropiadas de los parmetros son 2^/5,, = O,
= Oy
O
cada h,
= 0^ ^j{rp)i, = O para cada h y 'Z^{xp)^ = Opara cada j.
b) Desarrollar la tabla del anlisis de varianza para este diseo.
Comentar la forma en que pueden utilizarse las curvas de operacin caracterstica del apndice con el diseo
del cuadrado latino.
Suponga que en el problema 4-14 los datos tomados en el da 5 se analizaron incorrectamente y fue necesario
descartarlos. Desarrollar un anlisis apropiado para los datos restantes.
El rendimiento de un proceso qumico se midi utilizando cinco lotes de materia prima, cinco concentracio
nes del cido, cinco tiempos de procesamiento (A, B, C ,D y E ) y cinco concentraciones del catalizador (a, p,
y, (5, e). Se us el cuadrado grecolatino siguiente. Analizar los datos de este experimento (utilizar a = 0.05) y
sacar conclusiones.

Concentracin del cido

4-23.

Lote

1
2
3
4
5

^ = 26
= 18
C = 20
= 15
E& = 10

fi/3 = 16
C = 21
Da = 12
= 15

Cy = 19
De = 18

Dd = 16
E a = 11
Ay = 25
B e = 14

E e = 13

/3 = 16
^(3 = 2 2
B a = 17

= 24

cp = i i

= 21
Bd = 13
Ca; = 17

Dy = U

Suponga que en el problema 4-15 el ingeniero sospecha que los sitios de trabajo usados por los cuatro opera
dores pueden representar una fuente adicional de variacin. Es posible introducir un cuarto factor, el sitio de
trabajo {a,
realizar otro experimento, de donde resulta el cuadrado grecolatino siguiente. Analizar
los datos de este experimento (utilizar a = 0.05) y sacar conclusiones.

Operador
ensamblaje
1
2
3
4

4-24.
4-25.
4-26.

4-27.

1
C/3
Ba
Ad
Dy

=
=
=
=

2
11
8
9
9

By = 10
C = 12
D a = 11
Afi = 8

3
D
^y
Bfi
Ca

=
=
=
=

4
14
10
l
18

Aa =
Z)/3 =
Cy =
B =

8
12
15
6

Construir un hipercuadrado 5 x 5 para estudiar los efectos de cinco factores. Desarrollar la tabla del anlisis
de varianza para este diseo.
Considere los datos de los problemas 4-15 y 4-23. Despus de eliminar las letras griegas del problema 4-23,
analizar los datos utilizando el mtodo desarrollado en el problema 4-19.
Considere el diseo de bloques aleatorizados con un valor faltante en la tabla 4-7. Analizar los datos utilizan
do el anlisis exacto del problema del valor faltante revisado en la seccin 4-1.4. Comparar los resultados con
el anlisis aproximado de estos datos que se presenta en la tabla 4-8,
Un ingeniero estudia las caractersticas del rendimiento de combustible de cinco tipos de aditivos de gasoli
na. En la prueba de carretera el ingeniero desea usar los automviles como bloques; sin embargo, debido a

4-5 PROBLEMAS

16 9

una restriccin de tiempo, debe utilizar un diseo de bloques inconipletos. Realiza el diseo balanceado con
los cinco bloques siguientes. Analizar los datos de este experimento (utilizar a = 0.05) y sacar conclusiones.
Automvil
Aditivo

1
2
3
4
5
4-28.
4-29.

2
4
6
8
10
12
14

4-33.
4-34.
4-35.
4-36.
4-37.
4-38.

14

13
13
12
12

12
10
9

11
12

13
11
10

Construir un conjunto de contrastes ortogonales para los datos del problema 4-27. Calcular la suma de cua
drados para cada contraste.
Se estudian siete concentraciones diferentes de madera dura para determinar su efecto sobre la resistencia
del papel producido. Sin embargo, en la planta piloto slo pueden hacerse tres corridas de produccin por
da. Dado que los das pueden diferir, el analista utiliza el diseo de bloques incompletos balanceados que se
muestra abajo. Analizar los datos de este experimento (utilizar a = 0.05) y sacar conclusiones.

Concentracin de
madera dura (%)

4-30.
4-31.
4-32.

14
12
13
11

2
17
14

Das
1
114
126

117

120
120
137

141

119
117
129

145

134
149
150

120
136

143
118

123
130

127

Analizar los datos del ejemplo 4-6 utilizando la prueba general de significacin de la regresin.
Demostrar que
/ (Aa) es la suma de cuadrados ajustada de los tratamientos en un BIBD.
Un experimentador quiere comparar cuatro tratamientos en bloques de dos corridas. Encontrar un BIBD
para este experimento con seis bloques.
U n experimentador quiere comparar ocho tratamientos en bloques de cuatro corridas. Encontrar un BIBD
con 14 bloques y A = 3.
Realizar el anlisis interbloques del diseo del problema 4-27.
Realizar el anlisis interbloques del diseo del problema 4-29.
Comprobar que no existe un BIBD con parmetros o = 8, = 8, /c = 4 y fc = 16.
Demostrar que la varianza de los estimadores intrabloques { r j es k {a ~ l)a ^ /
Diseos extendidos de bloques incompletos. Ocasionalmente, el tamao del bloque cumple con la relacin a < k
< 2a. Un diseo extendido de bloques incompletos consiste en una sola rplica de cada tratamiento en cada
bloque junto con un diseo de bloques incompletos con k* = k - a . E n e l caso balanceado, el diseo de blo
ques incompletos tendr los parmetrosk* = k - a , r * = r - b y*. Desarrollar el anlisis estadstico. (Suge
rencia: en el diseo extendido de bloques incompletos, se tiene A = 2r - b -I- A*.)

Introduccin
a los diseos
factoriales

5-1

DEFINICIONES Y PRINCIPIOS BASICOS

En muchos experimentos interviene el estudio de los efectos de dos o ms factores. En general, los dise
os factoriales son los ms eficientes para este tipo de experimentos. Por diseo factorial se entiende que
en cada ensayo o rplica completa del experimento se investigan todas las combinaciones posibles de los
niveles de los factores. Por ejemplo, si el factor^ tiene a niveles y el factor B tiene b niveles, cada rplica
contiene todas las ab combinaciones de los tratamientos. Cuando los factores estn incluidos en un dise
o factorial, es comtin decir que estn cruzados.
El efecto de un factor se define como el cambio en la respuesta producido por un cambio en el nivel
del factor. Con frecuencia se le llama efecto principal porque se refiere a los factores de inters primario
en el experimento. Por ejemplo, considere el experimento sencillo de la figura 5-1. Se trata de un experi
mento factorial de dos factores en el que los dos factores del diseo tienen dos niveles. A estos niveles se
les ha denominado bajo y alto y se denotan como
y + , respectivamente. El efecto principal del
factor vi de este diseo de dos niveles puede visualizarse como la diferencia entre la respuesta promedio
con el nivel bajo de
y la respuesta promedio con el nivel alto de A . Numricamente, esto es
,

40-1-52

20+30

v 4 ------- ---------------------- -

21

Es decir, cuando el factor^ se incrementa del nivel bajo al nivel alto se produce un incremento de la res
puesta promedio de 21 unidades. D e manera similar, el efecto principal de B es
B=

30-1-52

20-1-40

= 11

Cuando los factores tienen ms de dos niveles, es necesario modificar el procedimiento anterior, ya que
existen otras formas de definir el efecto de un factor. Este punto se estudia con mayor profundidad ms
adelante.
En algunos experimentos puede encontrarse que la diferencia en la respuesta entre los niveles de un
factor no es la misma para todos los niveles de los otros factores. Cuando esto ocurre, existe una interac
170

5 4 DEFINICIONES Y PRINCIPIOS BSICOS

30

62

40

171

12

(Alto)

(Alto)

o
LU

(Bajo)

40

20

(Bajo)

------- 1--------------------11 1
(Bajo)

20

+
(Alto)

50

(Bajo)

L
(Alto)

Factor A

Factor A

Figara S-1 Experimento factorial de dos


factores con la respuesta (y) indicada en los
vrtices.

Figura 5-2 Experimento factorial de dos


factores con interaccin.

cin entre los factores. Por ejemplo, considere el experimento factorial de dos factores que se ilustra en la
figura 5-2, Con el nivel bajo del factor B (o B~), el efecto de A es
^ = 50-20=30
y con el nivel alto del factor B (o B^), el efecto de A es
^ = 1 2 - 4 0 = -2 8
Puesto que el efecto d e^ depende del nivel que se elige para el factor 5 , se observa que existe una interac
cin entre^ yB . La magnitud del efecto de la interaccin es la diferencia promedio de estos dos efectos de
A , o A B = (-28 - 30)/2 = -29. Evidentemente, en este experimento la interaccin es grande.
Estas ideas pueden ilustrarse grficamente. En la figura 5-3 se grafican los datos de las respuestas de
la figura 5-1 contra el factor^ para ambos niveles del factor B. Observe que las rectas 5 ' y
son aproxi
madamente paralelas, lo cual indica la ausencia de interaccin entre los factores^ y B. D e manera simi
lar, en la figura 5-4 se grafican los datos de las respuestas de la figura 5-2. En este caso se observa que las
rectas5 " y
no son paralelas. Esto indica una interaccin entre los factores^ y B. Grficas como stas
son de gran ayuda para interpretar las interacciones significativas y para reportar los resultados al perso
nal sin preparacin estadstica. Sin embargo, no debern utilizarse como la nica tcnica para el anlisis
de datos, ya que su interpretacin es subjetiva y su apariencia con frecuencia es engaosa.

Figura 5-3
teraccin.

Experimento factorial sin in

Figura 5-4
accin.

Experimento factorial con inter

172

CAPTULO 5

INTRODUCCIN A LOS DISEOS FACTORIALES

El concepto de interaccin puede ilustrarse de otra manera. Suponga que los dos factores del diseo
tratado son cuantitativos (temperatura, presin, tiempo, etc.). Entonces una representacin con un mo
delo de regresin del experimento factorial de dos factores podra escribirse como

donde y es la respuesta, las)8 son parmetros cuyos valores deben determinarse, ati es una variable que re
presenta al factorv4, :c2es una variable que representa al factor 5 , y e es un trmino del error aleatorio. Las
variables a:i y x 2 se definen en una escala codificada de -1 a -1-1 (los niveles bajo y alto d e ^ yB ), yx-pc2 re
presenta la interaccin entre
y Xj.
Las estimaciones de los parmetros en este modelo de regresin resultan estar relacionadas con las
estimaciones de los efectos. Para el experimento ilustrado en la figura 5-1 se encuentra que los efectos
principales d e^ y B son ^ = 2 1 y 5 = l l . Las estimaciones dey3i yySj son la mitad del valor del efecto prin
cipal correspondiente; por lo tanto, ^ = 2 1 1 2 = 10.5 y
= 11 / 2 = 5.5. El efecto de la interaccin de la
figura 5-1 es A S = 1, por lo que el valor del coeficiente de la interaccin en el modelo de regresin es
= 1 / 2 = 0.5. El parmetro /So se estima con el promedio de las cuatro respuestas, o
=(20-(-40-l-30-l-52)/4= 35.5. Por lo tanto, el modelo de regresin ajustado es
5>= 35.5+10.5 a:j -I-5.5j:2 +0.5 a:j;i:2

a) La superficie de respuesta

6) La grfica de contorno

Figura 5-5 La superficie de respuesta y la p fica de contorno para el m ode


lo = 35.5 H- 10.S,Ti -I- 5.5x^.

5'1 DEFINICIONES Y PRINCIPIOS BSICOS

173

Las estimaciones de los parmetros obtenidas de esta manera para el diseo factorial en el que todos los
factores tienen dos niveles ( - y + ) resultan ser estimaciones de mnimos cuadrados (se abundar sobre el
tema ms adelante).
El coeficiente de la interaccin
= 0.5) es pequeo en comparacin con los coeficientes de los
efectos principales y ^ ^. La interpretacin que se har de este hecho es que la interaccin es pequea y
puede ignorarse. Por lo tanto, al eliminar el trmino O.SxjXj se obtiene el modelo
y=35.5+W .5x,+5.5x^
En la figura 5-5 se muestran las representaciones grficas de este modelo. En la figura 5-5a se tiene una
grfica del plano de los valores de y generados por las diferentes combinaciones de jTi y X2 . A esta grfica
tridimensional se le llama grfica de superficie de respuesta. En la figura 5-5b se muestran las lneas de
contorno para las respuestas constantes) en el plano
Observe que como la superficie de respuesta es
un plano, la grfica de contorno contiene lneas rectas paralelas.
Suponga ahora que la contribucin de la interaccin en el experimento no fuera insignificante; es de
cir, que el coeficiente
no fuera pequeo. En la figura 5-6 se presenta la superficie de respuesta y la gr
fica de contorno del modelo
y = 35.5+ 10.5^:1 +5.5jCj +8XiJ2

a) La superficie de respuesta

b) La grfica de contorno

Figura 5-6 La superficie de respuesta y la grca de contorno para el mo


delo y = 35.5 + 10.5*1 + 5.5xi + 8x^ 3.

174

CAPTULO 5

INTRODUCCIN A LOS DISEOS FACTORIALES

(Se ha hecho que el efecto de la interaccin sea el promedio de los dos efectos principales.) Observe que
el efecto significativo de la interaccin provoca el torcimiento del plano de la figura 5~6a. Este torci
miento de la superficie de respuesta produce lneas de contorno curvas para las respuestas constantes en
el plano
como se muestra en la figura 5-66. Por lo tanto, una interaccin es una forma de curvatura
en el modelo de superficie de respuesta fundamental del experimento.
El modelo de superficie de respuesta de un experimento es de gran importancia y utilidad. El tema se
ampliar en la seccin 5-5 y en captulos posteriores.
En general, cuando una interaccin es grande, los efectos principales correspondientes tienen escaso
significado prctico. En el experimento de la figura 5-2, la estimacin del efecto principal d e^ sera
,

50+12

20-1-40

---------que es muy pequeo, y se llegara a concluir que no hay ningn efecto debido a ^ . Sin embargo, cuando se
examinan los efectos de^l con niveles diferentes del factor B, se observa que no es ste el caso. El factor y4
tiene un efecto, pero depende del nivel del factor B. Es decir, el conocimiento de la interaccin^^ es ms
titil que el conocimiento del efecto principal. Una interaccin significativa suele enmascarar la significa
cin de los efectos principales. Estos puntos se ponen de manifiesto con claridad en la grfica de la inter
accin de la figura 5-4. En presencia de una interaccin significativa, el experimentador deber por lo
general examinar los niveles de uno de los factores, por ejemplo del factor^, manteniendo fijos los nive
les de los otros factores para sacar conclusiones acerca del efecto principal d e ^ .

5-2

LA VENTAJA DE LOS DISEOS FACTORIALES

Es sencillo ilustrar la ventaja de los diseos factoriales. Suponga que se tienen dos factores^ y B, cada
uno con dos niveles. Los niveles de los factores se denotan poiA~,A^, B ryB *. Podra obtenerse informa
cin acerca de ambos factores hacindolos variar uno a la vez, como se muestra en la figura 5-7. El efecto
de cambiar el f a c t o r e s t dado
y el efecto de cambiar el factor5 est dado ^orA'B'^ A~B~. Debido a que est presente el error experimental, es deseable realizar dos observaciones, por ejem
plo, para cada combinacin de tratamientos y estimar los efectos de los factores utihzando las respuestas
promedio. Por lo tanto, se necesita un total de seis observaciones.
Si se hubiera efectuado un experimento factorial, se habra registrado una combinacin adicional
de los t r a t a m i e n t o s , A h o r a , utilizando slo cuatro observaciones, pueden hacerse dos estimacio
nes del efecto eA\A""Br-A'B~yA^B^-A~B*. D e manera similar, pueden hacerse dos estimaciones del

A-flJ __________________ L
Factor A

Figura 5-7

Experimento con un factor a la vez.

5-3 DISEO FACTORIAL DE DOS FACTORES

175

Figura 5-8 Eficiencia relativa de un diseo factorial con


respecto a un experimento de un factor a la vez (dos niveles
del factor).

efecto de B. Estas dos estimaciones de cada efecto principal podran promediarse para producir efectos
principales promedio que tienen la misma precisin que las estimaciones del experimento con un solo
factor, pero slo se requieren cuatro observaciones en total, y nosotros diramos que la eficiencia relati
va del diseo factorial con respecto al experimento de un factor a la vez es de (6/4) = 1.5. En general,
esta eficiencia relativa aumentar conforme se incremente el nmero de factores, como se muestra en
la figura 5-8.
Suponga ahora que est presente una interaccin. Si el diseo de un factor a la vez indicara que
dieron mejores respuestas quej45 , una conclusin lgica sera
sera todava mejor. Sin
embargo, si est presente una interaccin, esta conclusin puede ser una equivocacin grave. Para un
ejemplo, referirse al experimento de la figura 5-2.
En resumen, observe que los diseos factoriales ofrecen varias ventajas. Son ms eficientes que los
experimentos de un factor a la vez. Adems, un diseo factorial es necesario cuando puede haber interac
ciones presentes a fin de evitar llegar a conclusiones incorrectas. Por ltimo, los diseos factoriales permi
ten la estimacin de los efectos de un factor con varios niveles de los factores restantes, produciendo
conclusiones que son vlidas para un rango de condiciones experimentales.

5-3
5-3.1

DISEO FACTORIAL DE DO S FACTORES


U n ejemplo

Los tipos ms simples de diseos factoriales incluyen nicamente dos factores o conjuntos de tratamien
tos, Hay a niveles del factor^ y b niveles del factor B, los cuales se disponen en un diseo factorial; es de
cir, cada rplica del experimento contiene todas las ab combinaciones de los tratamientos. En general,
hay n rplicas.
Como ejemplo de un diseo factorial en el que intervienen dos factores, un ingeniero est diseando
una batera que se usar en un dispositivo que se someter a variaciones de temperatura extremas. El ni
co parmetro del diseo que puede seleccionar en este punto es el material de la placa o nodo de la bate
ra, y tiene tres elecciones posibles. Cuando el dispositivo est fabricado y se enve al campo, el ingeniero
no tendr control sobre las temperaturas extremas en las que operar el dispositivo, pero sabe por expe-

176

CAPTULO 5

^TRODUCCIN A LOS DISEOS FACTORL\LES

Tabla 5-1

Datos de la vida (en horas) para el ejemplo del diseo de la batera

Ifemperatura (F)

Tipo de
material
1
2
3

15
130
74
150
159
138
168

70
155
180
188
126
110
160

34
80
136
106
174
150

125
40
75
122
115
120
139

20
82
25
58
96
82

70
58
70
45
104
60

rienda que la temperatura probablemente afectar la vida efectiva de la batera. Sin embargo, la tempe
ratura puede controlarse en el laboratorio donde se desarrolla el producto para fines de prueba.
El ingeniero decide probar los tres materiales de la placa con tres niveles de temperatura15,70 y
125F, ya que estos niveles de temperatura son consistentes con el medio ambiente donde se usar final
mente el producto. Se prueban cuatro bateras con cada combinacin del material de la placa y la tempe
ratura, y las 36 pruebas se corren de manera aleatoria. En la tabla 5-1 se presentan los datos del
experimento y de la vida observada de la batera.
En este problema, el ingeniero quiere responder las preguntas siguientes:
1.
2.

Qu efectos tienen el tipo de material y la temperatura sobre la vida de la batera?


Existe alguna eleccin del material que produzca de manera regular una vida larga de la batera
independientemente de la temperatura'!

La segunda pregunta es de particular importancia. Quiz sea posible encontrar una alternativa del mate
rial que no resulte afectada considerablemente por la temperatura. D e ser ste el caso, el ingeniero puede
hacer que la batera sea robusta para la variacin de la temperatura en el campo. Se trata de un ejemplo
de la aplicacin del diseo experimental estadstico en el diseo de productos robustos, un problema de
ingeniera muy importante.
El anterior es un ejemplo especfico del caso general de un diseo factorial de dos factores. Para pa
sar al caso general, seay^y^t la respuesta observada cuando el factor^l tiene el nivel i-simo (i = 1, 2,..., ) y
el factor 5 tiene el nivel;-simo (/ = 1,2,..., b) en la rplica A:-sima {k = 1,2,..., n). En general, el experi
mento factorial de dos factores aparecer como en la tabla 5-2. El orden en que se hacen las abn observa
ciones se selecciona al azar, por lo que este diseo es un diseo completamente aleatorizado.

Tabla 5-2

Arreglo general de un diseo factorial de dos factores

Factor 5

Factor .<4

yni>yin>

y 211, y 212,
,y2h,

y 121, y 122,
,yi2n
>221>y222J
,y22.

yibiyib2t
,yv,n
y2bl,y2b2,
,y2bn

yM,yiii2,
-,yai

ya21>ya22<
,y^2^

yabl, yabZ!
**>ytibn

5-3 DISEO FACTORIAL DE DOS FACTORES

17 7

Las observaciones de un experimento factorial pueden describirse con un modelo. Hay varias formas
de escribir el modelo de un experimento factorial. El modelo de los efectos es
yuk =

y = 1. 2,..., b
k = ,2,...,n

(5-1)

donde fi es el efecto promedio global, t, es el efecto del nivel /-simo del factor^4 de los r e n g l o n e s , e s el
efecto del nively-simo del factor 5 de las columnas, {r^)j es el efecto de la interaccin entre r,
y i, es
un componente del error aleatorio. Se supone que ambos factores son fijos, y los efectos de los tratamien
tos se definen como las desviaciones de la media global, por lo que 2 -^iT, = Oy
= 0. D e manera si
milar, los efectos de las interacciones son fijos y se definen de tal modo que
= 0.
Puesto que hay n rplicas del experimento, hay abn observaciones en total.
Otro modelo posible de un experimento factorial es el modelo de las medias
t = 1, 2,..., a
yik~

7=
k = l,

donde la media de la celda y-sima es

Ihmbin podra usarse un modelo de regresin como en la seccin 5-1. Los modelos de regresin resultan
particularmente tiles cuando uno o ms de los factores del experimento son cuantitativos. En la mayor
parte de este captulo se usar el modelo de los efectos (ecuacin 5-1) con referencia al modelo de regre
sin en la seccin 5-5.
En el diseo factorial de dos factores, los factore's (o tratamientos) de los renglones y las columnas,/!
y B, son de igual inters. Especficamente, el inters se encuentra en probar hiptesis acerca de la igual
dad de los efectos de los tratamientos de los renglones, por ejemplo,
=
= 0
f j : al menos una T; ^ O

(5-2a)

y de la igualdad de los efectos de los tratamientos de las columnas, por ejemplo,


= ^2=--=
:al menos una

(5_2b)
^ O

Ikmbin existe inters en determinar si los tratamientos de los renglones y las columnas interactan. Por
lo tanto, tambin querra probarse
: (t/3)j = O

para todas las i, j

2c)

//j: al menos una {x^) ^ O


A continuacin se indica cmo se prueban estas hiptesis utilizando un anlisis de varianza de dos factores.

5'3 .2

Anlisis estadstico del m odelo con efectos fijos

Sea que^j denote el total de observaciones bajo el nivel i-simo del factor^ , queyy denote el total de
observaciones bajo el nivel /-sim o del factor B, que
denote el total de observaciones de la celda

178

CAPTULO 5

INTRODUCCIN A LOS DISEOS FACTORIALES

;-sima, y quey .. denote el gran total de todas las observaciones. Se definen5',Xy.,yy. yy, como los pro
medios correspondientes de los renglones, las columnas, las celdas y el gran promedio. Expresado ma
temticamente,
X-, ~

y le

y i-

i = i, 2,..., a

y
y.j=-

=i it=i

y=i,
(5-3)

y . . - t t l y .
,=i

y -

abn

La suma de cuadrados total corregida puede escribirse como

E S S

i=l j=i k=l

iy^ - y- y =2 E E

k. - x.. )+(y.j. - y...)

/= ! y = i ^=1

Hyij-yi.-y.j+y...)+(y^ik-h)f
= b n ^

;=1
a

( r , . - y, f

+ 2

;=1

^yi ~ y- f

(yij.-yi..-y.j.+yy

(yijic-yyy
,=1 ;= 1 k = l

ya que los seis productos cruzados del lado derecho de la igualdad son cero. Observe que se ha hecho la
particin de la suma de cuadrados total en una suma de cuadrados debida a los renglones, o factor
(55^); una suma de cuadrados debida a las columnas, o factor 5 {SSg); una suma de cuadrados debida a
la interaccin entre^ y B (SS^b); y una suma de cuadrados debida al error (55^). Por el ltimo componen
te del lado derecho de la igualdad de la ecuacin 5-4, se observa que debe haber por lo menos dos rplicas
( > 2) para obtener una suma de cuadrados del error.
La ecuacin 5-4 puede escribirse simblicamente como
5 5 , = 55^ + SS, + 5 5 ^ + 55^
El nmero de grados de libertad asociado con cada suma de cuadrados es

Efecto

Grados de libertad

A
B
InteraccinylB
Error
Tbtal

a -\
b -
(a - V){b - 1)
ab(n -1 )
abn -1

(5-5)

5-3 DISEO FACTORIAL DE DOS FACTORES

17 9

Esta asignacin de los abn - 1 grados de libertad totales a las sumas de cuadrados puede justificarse de la
siguiente manera: los efectos principales>l y 5 tienen a y b niveles, respectivamente; por lo tanto, tienen a
- 1 y 6 - 1 grados de libertad, como se indica. Los grados de libertad de la interaccin son slo el nmero
de grados de libertad de las celdas (que es ab - 1) menos el nmero de grados de libertad de los dos efec
tos principalesy4 yB; es decir, a b - \ - ( a - l ) - ( b - l ) = ( a - ) ( b - 1), Dentro de cada una de las ab celdas
hay - 1 grados de libertad entre las n rplicas; por lo tanto hay ab(n - 1) grados de libertad para el error.
Observe que la suma del nmero de grados de libertad en el lado derecho de la ecuacin 5-5 es igual al n
mero total de grados de libertad.
Cada suma de CHadrados dividida por sus grados de libertad es un cuadrado medio. Los valores espe
rados de los cuadrados medios son

E(MS,) = E

E(MS^)=E

E{MS^)=E

iSS,\
fl~ l

\b-\)

SS AB

E(MS,)=E

= o ^+ -

= a^ +

SS,
[abin-l)j

= o^

Observe que si es verdadera la hiptesis nula de que no hay efectos de los tratamientos de los renglones,
ni de los tratamientos de las columnas, ni interaccin, entonces MS^, MSg, M S ^ y MS^ son todas estima
ciones de
Sin embargo, si hay diferencias entre los efectos de los tratamientos de los renglones, por
ejemplo, entonces MS^ ser mayor que MS^. D e manera similar, si estn presentes efectos de los trata
mientos de las columnas o de la interaccin, entonces los cuadrados medios correspondientes sern ma
yores que MSe. Por lo tanto, para probar la significacin de los dos efectos principales y su interaccin,
simplemente se divide el cuadrado medio correspondiente por el cuadrado medio del error. Los valores
grandes de este cociente implican que los datos no apoyan la hiptesis nula.
Si se supone que el modelo (ecuacin 5-1) es adecuado y que los trminos del error eji, tienen una dis
tribucin normal e independiente con varianza constante, entonces cada uno de los cocientes de cua
drados medios MSJMS^, ASg/MS^ y MS^^bIMS^ se distribuyen como F con a - 1, 6 - l y ( a - l)(b - 1)
grados de libertad en el numerador, respectivamente, y aZ( - 1) grados de libertad en el denominador,^ y
la regin crtica sera la cola superior de la distribucin i^. El procedimiento de prueba suele resumirse en
una tabla del anlisis de varianza, como se muestra en la tabla 5-3.
En lo que a los clculos se refiere, por lo general se emplea un paquete de software de estadstica para
realizar el anlisis de varianza. Sin embargo, no es complicado obtener frmulas para calcular manual La prueba F puede considerarse como una aproximacin de una prueba de aleatorizacin, como se seal anteriormente.

180

CAPTULOS

Tabla 5-3

INTRODUCCIN A LOS DISEOS FACTORIALES

La tabla del anlisis de varianza para el diseo factorial de dos factores, modelo con efectos fijos

Fuente de
variacin

Suma de
cuadrados

Grados de
libertad

Cuadrado medio

F,

0 -1

Ttatamientos^

Tiratamentos B

SS^

b -1

Interaccin

SS^

(a -l)(b -l)

Error

ss^

ab(n - 1 )

Tbtal

SSr

MS^

p_M S,
P

MS =

MS^
M S^

a b {n -l)

abn 1

mente las sumas de cuadrados de la ecuacin 5-5. La suma de cuadrados total se calcula como de costum
bre con
a

abn

;=1 ;=1

(5-6)

Las sumas de cuadrados de los efectos principales son


1

,,2

abn

abn

(5-7)

(5-8)

Es conveniente obtener 5 5 ^ en dos pasos. Se calcula primero la suma de cuadrados entre los totales de
las ab celdas, a la que se denomina la suma de cuadrados debida a los subtotales:
1 ^
i i
ss.
y l - abn
Esta suma de cuadrados tambin contiene a 55^ y SSg. Por lo tanto, el segundo paso consiste en calcular
S S ^ como
(5-9)
Puede calcularse 55^ por sustraccin como
55^ = 5 5 , - 55^^ - 55^ - 55^

(5-10)

o
SS e = 55j.

EJEMPLO 5 - 1 .................................................................................................................................................
1 experimento del diseo de la batera
En la tabla 5-4 se presenta la vida efectiva (en horas) observada en el ejemplo del diseo de la batera que
se describi en la seccin 5-3.1. Los totales de los renglones y las columnas se indican en los mrgenes de
la tabla y los nmeros encerrados en un crculo son los totales de las celdas.

181

5-3 DISEO FACTORIAL DE DOS FACTORES

Tabla 5-4 Datos de la vida (en horas) del experimento del diseo de la batera
Tbmperatura (F)
Tipo de
70
material
15
20
34
40
1
130
155
@)
82
74
180
80
75
25
136
122
2
150
188
@
58
159
126
106
115
174
120
96
138
110
3
(g )
82
150
139
168
160

125

y-i-

@
@

770

1291

1738

yt.
70
58
70
45
104
60

998
1300
1501
3799 =x..

Las sumas de cuadrados se calculan de la siguiente manera:

,_i

= (130)' +(155)' +(74)^ + + (6 0 )' -1


SS Material

= 77,646.97

i i
abn

1
(3)(4^-[(998)' +(1300)' +(1501)^
i i>
SS Temperatura = - Y

abn

= ^ [ ( 1 7 3 8 ) ' +(1291)' +(770)^


cc

SS,.

= 10,683.72

i-1 y=i

39,118.72

cc
'^^Temporatuia

= ^ [(539)' + (229)' + + ( 3 4 2 ) ' ] - ^ ^ ^ ^ 10,68172


-39,118.72= 9613.78
SSe SSj.

^ ^Temperatura

'^ ^Inlcracdn

= 17,646-91-10,683.72- 39,118.72- 9613.78= 18,230.75


En la tabla 5-5 se muestra el anlisis de varianza. Puesto que Fo.o5.4.27 = 2.73, se concluye que hay una in
teraccin significativa entre los tipos del material y la temperatura. Adems, Fo.05,2,27 = 3.35, por lo que los
efectos principales del tipo de material y la temperatura tambin son significativos. En la tabla 5-5 tam
bin se muestran los valores P para los estadsticos de la prueba.
Como ayuda para interpretar los resultados de este experimento, es conveniente construir una grfi
ca de las respuestas promedio para cada combinacin de los tratamientos. Esta grfica se muestra en la fi
gura 5-9. El hecho de que las rectas no sean paralelas indica que la interaccin es significativa. En general,
se consigue una vida ms larga con una temperatura baja, independientemente del tipo de material. Al
cambiar de una temperatura baja a una intermedia, la vida de la batera con el material tipo 3 tiene un in-

182

CAPTULOS INTRODUCCIN A LOS DISEOS FACTORIALES

Tabla 5 >5 Anlisis de varianza de los datos de la vida de la batera

Fuente de
variacin
Tipos de material
Tfemperatura
Interaccin
Error
Tbtal

Suma de
cuadrados
10,683.72
39,118.72
9,613.78
18,230.75
77,646.97

Grados de
libertad
2
2
4
27
35

Cuadrado
medio
5,341.86
19,559.36
2,403.44
675.21

Po
7.91
28.97
3.56

Valor P
0.0020
0.0001
0.0186

cremento real, mientras que con los materiales tipos 1 y 2 disminuye. Con una temperatura de intermedia
a alta, la vida de la batera disminuye para los materiales tipos 2 y 3 y se mantiene en esencia sin cambio
para el material tipo 1. El material tipo 3 parece producir los mejores resultados si se quiere una prdida
menor de la vida efectiva cuando la temperatura cambia.

Comparaciones mltiples
Cuando el anlisis de varianza indica que las medias de los renglones o las columnas difieren, por lo gene
ral es de inters hacer comparaciones entre las medias individuales de los renglones o las columnas para
descubrir diferencias especficas. Los mtodos de comparaciones mltiples revisados en el captulo 3 son
tiles a este- respecto.
Se ilustra ahora el uso de la prueba de Tkey con los datos de la vida de la batera del ejemplo 5-1.
Observe que en este experimento, la interaccin es significativa. Cuando la interaccin es significativa, las
comparaciones entre leis medias de uno de los factores (por ejem plo,^) pueden ser oscurecidas por la in
teraccin AB. Una forma de abordar esta cuestin consiste en fijar el factor B en un nivel especfico y apli
car la prueba de Tkey a las medias del f a c t o r c o n ese nivel. Para ilustrar, suponga que en el ejemplo 5-1
el inters se encuentra en detectar las diferencias entre las medias de los tres tipos de material. Puesto
que la interaccin es significativa, esta comparacin se hace con un solo nivel de la temperatura, por
ejemplo el nivel 2 (70F). Se supone que la mejor estimacin de la varianza del error es MS^ de la tabla del
anlisis de varianza, utilizando el supuesto de que la varianza del error experimental es la misma para to
das las combinaciones de tratamientos.

175
150

li125
0
1 100

75

>

50

Material tipo 3
Material tipo 1
Material tipo 2

25
15

70

125

Temperatura (F)

Figura 5-9
plo 5-1.

Grfica tipo de material-temperatura para el ejem

5-3 DISEO FACTORIAL DE DOS FACTORES

183

Los promedios de los tres tipos de material a 70F dispuestos en orden ascendente son
yi2. - 57.25
= 119.75
y32. 145.75

(material tipo 1)
(material tipo 2)
(material tipo 3)

T0.0S =9o.o.(3v
|67521
= 4547
donde 9 o.o5(3j 27) = 3.50 se obtiene por interpolacin en la tabla VIII del apndice. Las comparaciones por
pares dan como resultado
3 vs. 1:
3 vs. 2:
2 vs. 1:

145.75 - 57.25 = 88.50 > Toos = 45.47


145.75 - 119.75 = 26.00 < Toos = 45.47
119.75 - 57.25 = 62.50 > To-os = 45.47

Este anlisis indica que con el nivel de temperatura de 70F, la vida media de la batera es la misma
para los materiales tipos 2 y 3, y que la vida media de la batera para el material tipo 1 es significativa
m ente menor.
Si la interaccin es significativa, el experimentador podra comparar las medias de todas las ab celdas
para determinar cules difieren significativamente. En este anlisis, las diferencias entre las medias de las
celdas incluyen los efectos de la interaccin, as como ambos efectos principales. En el ejemplo 5-1, esto
dara 36 comparaciones entre todos los pares posibles de las nueve medias de las celdas.
Salida de computadora
En la figura 5-10 se presenta la salida de computadora de Design-Expert para los datos de la vida de la ba
tera del ejemplo 5-1. Observe que
^ ^M odelo ~

*"^ ^Interaccin

= 10,58172+39,118.72+9613.78
= 59,416.22
y que
^ 59.41&22

Es decir, cerca de 77% de la variabilidad de la vida de la batera es explicada por el material de la placa de
la batera, la temperatura y la interaccin entre el tipo de material y la temperatura. En la salida de com
putadora se muestran tambin los residuales del modelo ajustado. A continuacin se indica cmo usar es
tos residuales para verificar la adecuacin del modelo.

184

CAPTULOS

INTRODUCCIN A LOS DISEOS FACTORIALES

Response: Life
in hours
ANOVA for Selected Factorial IModel
Analysis of varianc tabie [Partial sum of squares]
Mean
Sum of
DF
Square
Source
Squares

59416.22

7427.03

2
2
4
27
0
27
35

5341.86
19559.36
2403.44
675.21

LackofFit
Pure Error
Cor Total

10683.72
39118.72
9613.78
18230.75
0.000
18230.75
77646.97

Std. Dev.
Mean
C.V.
PRESS

25.98
105.53
24.62
32410.22

Model

Residual

A
B
AB

Diagnostics Case Statistics


Standard Actual Predicted
Valu
Order
Valu

10

130.00
74.00
155.00
180.00
150.00
159.00
188.00
126.00
138.00
168.00

11

110.00

1
2

3
4
5

6
7

17
18

160.00
34.00
80.00
40.00
75.00
136.00
106.00

19

122.00

12
13

14
15
16

20
21
22

23
24
25

26
27

28
29
30

31
32
33
34
35

36
Figura 5-10

115.00
174.00
150.00
120.00

139.00
20.00

82.00
70.00
58.00
25.00
58.00
70.00
45.00
96.00
82.00
104.00
60.00

134.75
134.75
134.75
134.75
155.75
155.75
155.75
155.75
144.00
144.00
144.00
144.00
57.25
57.25
57.25
57.25
119.75
119.75
119.75
119.75
145.75
145.75
145.75
145.75
57.50
57.50
57.50
57.50
49.50
49.50
49.50
49.50
85.50
85.50
85.50
85.50

F
Valu

Prob > F

7.91
28.97
3.56

0.0020
<0.0001
0.0186

11.00

<0.0001

significant

675.21
0.7652
0.6956
0.5826
8.178

R-Squared
Adj R-Squared
Pred R-Squared
Adeq Precisin

Residual

-4.75
-60.75
20.25
45.25
-5.75
3.25
32.25
-29.75
-

6.00

24.00
-34.00
16.00
-23.25
22.75
-17.25
17.75
16.25
-13.75
2.25
-4.75
28.25
4.25
-25.75
-6.75
-37.50
24.50
12.50
0.50
-24.50
8.50
20.50
-4.5C
10.50
-3.50
18.50
-25.50

Leverage

0.250
0.250
0.250
0.250
0.250
0.250
0.250
0.250
0.250
0.250
0.250
0.250
0.250
0.250
0.250
0.250
0.250
0.250
0.250
0.250
0.250
0.250
0.250
0.250
0.250
0.250
0.250
0.250
0.250
0.250
0.250
0.250
0.250
0.250
0.250
0.250

Salida de Design-Expert para el ejemplo 5-1.

Student
Residual
- 0.211

-2.700
0.900
2.011

-0.256
0.144
1.433
-1.322
-0.267
1.066
-1.511
0.711
-1.033
1.011

0.767
0.789
0.722
-0.611
-

0.100
0.211

1.255
0.189
-1.144
-0.300
-

1.666

1.089
0.555

0.002

0.270
0.030
0.150
0.002
0.001

0.076
0.065
0.003
0.042
0.085
0.019
0.040
0.038
0.022

0.023
0.019
0.014
0.000
0.002

0.058
0.001

0.048
0.003
0.103
0.044

0.022

0.011
0.000

0.200

0.001

-1.089
0.378
0.911
-

Cook's
Distance

0.467
-0.156
0.822
-1.133

0.044
0.005
0.031
0.008
0.001

0.025
0.048

Outlier
t

-0.207
-3.100
0.897
2.140
-0.251
0.142
1.463
-1.341
-0.262
1.069
-1.550
0.704
-1.035
1.011

-0.761
0.783
0.716
-0.604
0.098
-0.207
1.269
0.185
-1.151
-0.295
-1.726
1.093
0.548
0.022

-1.093
0.372
0.908
-0.196
0.460
-0.153
0.817
-1.139

5-3 DISEO FACTORIAL DE DOS FACTORES

5'3.3

185

Verificacin de la adecuacin del modelo

Antes de adoptar las conclusiones del anlisis de varianza, deber verificarse la adecuacin del modelo
fundamental. Como anteriormente, la herramienta primaria de diagnstico es el anlisis residual. Los
residuales del modelo factorial de dos factores son
= yjic -

(5-11)

y puesto que el valor ajustado y^. = y (el promedio de las observaciones de la celda jy-sima), la ecua
cin 5-11 queda como
^ik = yik-yi.

(5-12)

En la salida de computadora de Design-Expert (figura 5-10) y en la tabla 5-6 se muestran los residuales
de los datos de la vida de la batera del ejemplo 5-1. La grfica de probabilidad normal de estos residua
les (figura 5-11) no revela nada particularmente problemtico, aun cuando el residual negativo ms gran
de (-60.75 con 15F para el material tipo 1) se aparta un poco de los dems. El valor estandarizado de este
residual es -60.75/V675.21 = -2.34, y es el nico residual cuyo valor absoluto es mayor que 2,
En la figura 5-12 se grafican los residuales contra los valores ajustados
. Esta grfica indica una li
gera tendencia de la varianza de los residuales a incrementarse cuando la vida de la batera se incrementa.
En las figuras 5-13 y 5-14 se grafican los residuales contra los tipos del material y la temperatura, respecti
vamente. Ambas grficas indican una ligera desigualdad de la varianza, con la combinacin del trata
miento 15F y material tipo 1, teniendo posiblemente una varianza mayor que las dems.
En la tabla 5-6 se observa que la celda 15F-material tipo 1 contiene los dos residuales extremos
(-60.75 y 45.25). Estos dos residuales son los principales responsables de la desigualdad de la varianza de
tectada en las figuras 5-12 a 5-14. Al examinarse nuevamente los datos no se observa ningn problema ob
vio, tal como un error al registrar los datos, por lo que estas respuestas se aceptan como legtimas. Es
posible que esta combinacin de tratamientos particular produzca una vida de la batera ligeramente ms
errtica que las dems. Sin embargo, el problema no es lo suficientemente grave como para tener un im
pacto dramtico en el anlisis y las conclusiones.

5 '3 .4

Estimacin de los parmetros del modelo

Los parmetros del modelo de los efectos para el diseo factorial de dos factores

yak

labia 5-6

Tipo de
material
1
2
3

+Pj + ( t ^) +^iik

(5-13)

Residuales del ejemplo 5-1

15
-A.75
-60.75
-5.75
3.25
-6.00
24.00

20.25
45.25
32.25
-29.75
-34.00
16.00

Tfemperatura (F)
70
-23.25
-17.25
22.75
17.75
7 7>
16.25
-13.75
-4.75
-25.75
28.25
-6.75
4.25

125
-37.50
24.50
-24.50
8.50
10.50
-3.50

12.50
0.50
20.50
^.50
18.50
-25.50

186

CAPTULO 5

INTRODUCCIN A LOS DISEOS FACTORIALES

Residual

Figura 5-11 Grfica de probabilidad normal de los residuales del ejemplo 5-1.

pueden estimarse por mnimos cuadrados. Puesto que el modelo tiene X + a + ab parmetros que deben
estimarse, hay l -\ -a + b + ab ecuaciones normales. Al utilizar el mtodo de la seccin 3-9, no es difcil de
mostrar que las ecuaciones normales son
a

ti-.abnfi + b n ^ f,.

^ >"
/=1 ;=l

BO
60 40
20

0
-20 -4 0 -

1
5 0

_L
100 *

200

150

-eo - 0

Figura 5-12

Grfica de los residuales contra

para el ejemplo 5-1.

5-3 DISEO FACTORIAL DE DOS FACTORES

187

60
40

20
O

V2

*3

-*________ I________ 1 Tipo do material

-20

-40
-60
80
Figura 5-13 Grfica de los residuales contra el tipo de mate
rial para el ejemplo 5'1.

:bnfl+bni + n ^
j-i

fij:an/i+n'

= X..

i = 1,2,...,a

(5-14b)

= X;.

J=l,2,...,b

(5-14c)

j=i

+anfij
A

+nfi + n (T ^ \ = y a.

(5-14d)

Por conveniencia, el parmetro que corresponde a cada ecuacin normal se indica a la izquierda de las
ecuaciones 5-14.

Figura 5-14 Grfica de los residuales contra la temperatura


para el ejemplo S-1.

188

CAPTULOS

INTRODUCCIN A LOS DISEOS FACTORIALES

El modelo de los efectos (ecuacin 5-13) est sobreparametrizado. Observe que la suma de las a
ecuaciones de la ecuacin 5-14b es igual a la ecuacin 5-14ay que la suma de las b ecuaciones de la ecua
cin 5-14c es igual a la ecuacin 5-14a. Asimismo, la operacin suma de la ecuacin 5-14d sobre j para una
i particular dar la ecuacin 5-14b, y la operacin simia de la ecuacin 5-14d sobre i para una j particular
dar la ecuacin 5-14c. Por lo tanto, haya + b + 1 dependencias lineales en este sistema de ecuaciones y
no existir ninguna solucin tnica. A fin de obtener una solucin, se imponen las restricciones
^ r , = 0

(5-15a)

^ P j = 0
j=i

(5-15b)

i=l

2(r), = 0

j = l,2,...,b

(5-lSc)

= 1,2,..., a

(5-15d)

f= l

^
(T ^), = 0

Las ecuaciones 5-15a y 5-15b constituyen dos restricciones, mientras que las ecuaciones 5-15c y 5-15d for
man a + b - restricciones independientes. Por lo tanto, se tienen en total a + b + \ restricciones, el n
mero que se requiere.
Al aplicar estas restricciones, las ecuaciones normales (ecuaciones 5-14) se simplifican considerable
mente, y se obtiene la solucin

/ = y...
=
=

-X..
-X..

i = 1 , 2, .. . ,a
y = 1 ,2,. .. ,fe

fi = 1, 2,..., a

iyp)i = yi,. - yi.. - y, + y., y=

2,...,

Observe el gran atractivo intuitivo de esta solucin de las ecuaciones normales. Los efectos de los trata
mientos de los renglones se estiman con el promedio del rengln menos el gran promedio; los tratamien
tos de las columnas se estiman con el promedio de la columna menos el gran promedio, y la interaccin
i/-sima se estima con el promedio de la celda {y-sima menos el gran promedio, el efecto del rengln i-simo y el efecto de la columna ;-sima.
Al utilizar la ecuacin 5-16, el valor gustado y^j^. puede encontrarse como
X# = / M + ^ , + ^ , + A
= y..HyL-y..)+(y.j.-yJ

Hyij.-yL-y.j.+y...)
= h
Es decir, la observacin fc-sima de la celda ty-sima se estima con el promedio de las n observaciones de
esa celda. Este resultado se us en la ecuacin 5-12 para obtener los residuales del modelo factorial de
dos factores.
Puesto que se han usado restricciones (ecuaciones 5-15) para resolver las ecuaciones normales, los
parmetros del modelo no tienen estimaciones nicas. Sin embargo, ciertas funciones importantes de
los parmetros del modelo son estimables, es decir, tienen una estimacin nica independientemente de
las restricciones elegidas. U n ejemplo es r, - t + (^),- - (i^)., que podra considerarse como la verdade

5-3 DISEO FACTORIAL DE DOS FACTORES

189

ra diferencia entre los niveles j-simo y u-simo del factoryl. Observe que la verdadera diferencia entre
los niveles de cualquier efecto principal incluye un efecto de la interaccin promedio . Es este resultado
el que perturba las pruebas de los efectos principales en presencia de una interaccin, como se seal an
teriormente. En general, cualquier funcin de los parmetros del modelo que sea una combinacin lineal
del miembro izquierdo de las ecuaciones normales es estimable. Esta propiedad tambin se hizo notar en
el captulo 3 cuando se estudi el modelo de un solo factor. Para mayores detalles, ver el material suple
mentario del texto de este captulo.

5-3.5

Eleccin del tamao de la muestra

Para determinar un tamao de la muestra (el nmero de rplicas, n) apropiado en un diseo factorial de
dos factores, el experimentador puede apoyarse en las curvas de operacin caracterstica que aparecen en
la parte V del apndice. En la tabla 5-7 se muestra el valor apropiado del parmetro
as cmo los gra
dos de libertad del numerador y el denominador.
Una forma muy eficaz de emplear estas curvas consiste en encontrar el valor menor de
que corres
ponde a una diferencia especificada entre las medias de dos tratamientos cualesquiera. Por ejemplo, si la
diferencia en las medias de dos renglones cualesquiera es D, entonces el valor mnimo de O es
0 ^ = ^
(5-17)
2aa
mientras que si la diferencia en las medias de dos columnas cualesquiera es D, entonces el valor mnimo
de

es
j ^

Por ltimo, el valor mnimo de


cualesquiera es

naP^

2bo^
que corresponde a una diferencia D entre dos efectos de interaccin
<1,2 ^

------------

(5-19)

2a^[(a-)ib-)+l]
Para ilustrar el uso de estas ecuaciones, considere los datos de la vida de la batera del ejemplo 5-1.
Suponga que antes de correr el experimento se decide que la hiptesis nula deber rechazarse con una alta

labia 5-7 Parmetros de la curva de operacin caracterstica de la parte V del apndice para el diseo factorial

Factor

Grados de libertad
del numerador

Grados de libertad
del denominador

a-\

ab(n-l)

aa^
b

ab{n - 1 )

B
ba^
AB

=i
a ^ [( -l)(ft-l)+ l]

(fl-l)(fe -l)

ab{n-\)

190

CAPTULO 5 INTRODUCCIN A LOS DISEOS FACTOIUALES

probabilidad si la diferencia en la vida media de la batera entre dos temperaturas cualesquiera es hasta
de 40 horas. Por lo tanto D = 40, y si se supone que la desviacin estndar de la vida de la batera es apro
ximadamente 25, entonces por la ecuacin 5-18 se obtiene
=
2ba^
K3)(40)^

2(3)(25)^
= 1.28m
como el valor mnimo de
Suponiendo que a = 0.05, ahora puede usarse la parte V del apndice para
construir la tabla siguiente:
Vi = Grados de
= Grados de
n___________________________________ libertad del numerador_________ libertad del error
2
Z56
Tio
2
9^
3
3,84
1.96
2
18
4
5^12______
2.26
2
27

fi
0.45
0.18
0.06

Observe que con n = 4 rplicas se obtiene un riesgo/3 de cerca de 0.06, o una probabilidad aproxima
da de 94%, de rechazar la hiptesis nula si la diferencia en la vida media de la batera con dos niveles de
temperatura cualesquiera es hasta de 40 horas. Por lo tanto, se concluye que cuatro rplicas bastan para
proporcionar la sensitividad deseada siempre y cuando la estimacin usada para la desviacin estndar de
la vida de la batera no tenga un error grave. En caso de duda, el experimentador podra repetir el proce
dimiento anterior con otros valores de a para determinar el efecto que tendra una estimacin equivocada
de este parmetro sobre la sensitividad del diseo.
5 '3 .6

1 supuesto de no interaccin en un modelo de dos factores

Ocasionalmente, un experimentador siente que es apropiado un modelo de dos factores sin interaccin,
por ejemplo
i = 1,2,..., a
j = l,2 ,. .. ,b

(5-20)

k = l,2,...,n
Sin embargo, se deber ser muy cuidadoso al hacer caso omiso de los trminos de interaccin, ya que la
presencia de una interaccin significativa puede tener un impacto dramtico sobre la interpretacin de
los datos.
El anlisis estadstico de un modelo factorial de dos factores sin interaccin es directo. En la tabla 5-8
se presenta el anlisis de los datos de la vida de la batera del ejemplo 5-1, suponiendo que es vlido el moTabla 5-8

Anlisis de varianza de los datos de la vida de la batera suponiendo que no hay interaccin

Fuente de
variacin
Tipos de material
Ifemperatura
Enor
Tbtal

Suma de
cuadrados

Grados de
libertad

Cuadrado
medio

10,683.72
39,118.72
27,844.52
77,646.96

2
2
31
35

5,341.86
19,559.36
898.21

Fo
5.95
21.78

5-3 DISEO FACTORIAL DE DOS FACTORES

191

dlo sin interaccin (ecuacin S-20). Como ya se seal, los dos efectos principales son significativos. Sin
embargo, tan pronto como se efecta el anlisis residual de estos datos, se pone de manifiesto que el mo
delo sin interaccin es inadecuado. Para el modelo de dos factores sin interaccin, los valores ajustados
son
=y + - y . En la figura 5-15 se presenta la grfica deyj (los promedios de las celdas menos
el valor ajustado de esa celda) contra el valor ajustado ^1,. Ahora las cantidades jZ/y. - >U pueden conside
rarse como las diferencias entre las medias de las celdas observadas y las medias de las celdas estimadas
suponiendo que no hay interaccin. Cualquier patrn en estas cantidades sugiere la presencia de una in
teraccin. En la figura 5-15 se observa un patrn claro cuando las cantidades
pasan de positivo a
negativo, y despus de nuevo a positivo y a negativo. Esta estructura es el resultado de la interaccin entre
los tipos del material y la temperatura.

5*3.7

Una observacin por celda

En ocasiones se encuentran experimentos de dos factores con una sola rplica, es decir, en los que slo
hay una observacin por celda. Cuando hay dos factores y una sola observacin por celda, el modelo de
los efectos es

El anlisis de varianza para esta situacin se presenta en la tabla 5-9, suponiendo que ambos factores son
fijos.
Al examinar los cuadrados medios esperados, se observa que la varianza del error es no estimable;
es decir, que el efecto de la interaccin de los dos factores
y el error experimental no pueden sepa
rarse de alguna manera obvia. Por consiguiente, no se cuenta con pruebas para los efectos principales a
menos que el efecto de la interaccin sea cero. Si no hay una interaccin presente, entonces (r/3)^- = Opara
toda i y y, y un modelo plausible es

(5-22)
Si el modelo (ecuacin 5-22) es apropiado, entonces el cuadrado medio de los residuales de la tabla 5-9 es
un estimador insesgado de o^, y los efectos principales pueden probarse comparando MSj y MSg con

Figura 5*15 Grfica de


de la batera.

contra

para los datos de la vida

192
labia 5'9

CAPTULOS

INTRODUCCIN A LOS DISEOS FACTORIALES

Anl de varianza de un modelo de dos factores, una observacin por celda

Suma de
cuadrados

Fuente de
variacin
Renglones (A)

Y
^

ab

Columnas (B)

ab

Residual oAB

Sustraccin

Ib tal

a b

yy

Grados de
libertad

Cuadrado
medio

a -1

MS^

b -1

MSg

(-l)(h-l)

^^Rssidual

Cuadrado medio
esperado

"i r

ab-\

Una prueba desarrollada por Tlikey [I l l a ] es til para determinar si est presente una interaccin.
En el procedimiento se supone que el trmino de la interaccin tiene una forma particularmente simple,
a saber,
= Y^i^j
donde y es una constante desconocida. Al definir as el trmino de la interaccin, puede usarse un enfo
que de regresin para probar la significacin del trmino de la interaccin. En la prueba se hace la parti
cin de la suma de cuadrados de los residuales en un componente con un solo grado de libertad debido a
la no aditividad (interaccin) y un componente del error con (a - l)(ft -1 ) ~ 1 grados de libertad. En lo que
a los clculos se refiere, se tiene
.2

SS j -I-55b +

y.
ab

abSS^SS^

(5-23)

con un grado de libertad, y


(5-24)
con (a ~ l)(> -1 ) - 1 grados de libertad. Para probar la presencia de una interaccin, se calcula
55^

(5-25)

Si Fo > Fa_ 1, (a _ i)(, - 1) - ij debe rechazarse la hiptesis de que no hay ninguna interaccin.

EJEMPLO 5 * 2 ....................................................................................... ..........................................................


Las impurezas presentes en un producto qumico son afectadas por dos factores, la presin y la tempera
tura, En la tabla 5-10 se muestran los datos de una sola rplica de un experimento factorial. Las sumas de
cuadrados son
SS = - y ^ - ^
b i'/"
ab
= i [ 2 3 ^ + 1 3 ^ + 8 ^ ] - ^ = 2^33

5-3 DISEO FACTORIAL DE DOS FACTORES

193

Tabla S'IO Datos de las impurezas del ejemplo 5-2


Presin

Tfemperatura
(F)

25

30

35

40

45

100
125
150

5
3
1

4
1
1

6
4
3

3
2
1

5
3
2

y.

13

10

y i.
23
13
8
44 =y,.

21
ab
1
_ i ro2 _i_a2 J.112
a

44^
__ =11.60

,,2

s s r = l ' Z y i - 'ab
(=1 y=l
= 166-129.07 = 36.93

s s ^ ^ = ss^-ss^-ss,

= 36.96- 2 a 3 3 - 11.60 = ZOO


La suma de cuadrados de la no aditividad se calcula con la ecuacin 5-23 de la siguiente manera:
2

=( 5)(23 )( 9 )+( 4) ( 23 )( 6 )+ + (2 )( 8) ( 10 )=7 23 6

55^ +SSg +
SS^ =

ab

abSS^SSg
[7236-(44)(23L 33+ll. 60+129.07)]^

(3)(5)(2a33)(11.60)
4059.42

0.0985

y la suma de cuadrados del error es, por la ecuacin 5-24,


~ ^^RsBidual
= 2.00 - 0.0985=1.9015
El anlisis de varianza completo se resume en la tabla 5-11. El estadstico de prueba para la no aditivi
dad es f o = 0.0985/0.2716 = 0.36, de donde se concluye que no hay evidencia de interaccin en estos da
tos. Los efectos principales de la temperatura y la presin son significativos.

Para concluir esta seccin, se hace notar que el modelo factorial de dos factores con una observacin
por celda (ecuacin 5-22) luce exactamente igual que el modelo de bloques completos aleatotizados

194

CAPTULOS INTRODUCCIN A LOS DISEOS FACTORIALES

Tabla 5-11

Anlisis de varanza del ejemplo 5-2

Fuente de
variacin
'temperatura
Presin
No aditividad
Error
Ibtal

Suma de
cuadrados
23.33
11.60
0.0985
1.9015
36.93

Grados de
libertad
2

Cuadrado
medio
11.67
2.90
0.0985
0.2716

4
1
7
14

42.97

10.68
0.36

Valor
0.0001
0.0042
0.5674

(ecuacin 4-1). De hecho, la prueba de Tukey con un solo grado de libertad para la no aditividad puede
aplicarse directamente para probar la presencia de una interaccin en el modelo de bloques aleatorizados. Sin embargo, es necesario recordar que las situaciones expermentales que llevan al modelo de blo
ques aleaorizados y al modelo factorial son muy diferentes. En el modelo factorial, todas las ab corridas
se hacen de manera aleatoria, mientras que en el modelo de bloques aleatorizados la aleatorizacin slo
ocurre dentro del bloque. Los bloques constituyen una restriccin sobre la aleatorizacin. Por lo tanto, la
manera en que se corren los experimentos, as como la interpretacin de los dos modelos, es muy diferente.

5-4

DISEO FACTORIAL GENERAL

Los resultados del diseo factorial de dos factores pueden ampliarse al caso general en que hay a niveles
del factor j4, b niveles del factor c niveles del factor C, etc., dispuestos en un experimento factorial. En
general, habr abe n observaciones totales si se hacen n rpUcas del experimento completo. De nueva
cuenta, observe que es necesario un mnimo de dos rplicas (n ^ 2) para determinar una suma de cuadra
dos debida al error si todas las interacciones posibles estn incluidas en el modelo.
Cuando todos los factores del experimento son fijos, es sencillo formular y probar hiptesis acerca de
los efectos principales y las interacciones. Para un modelo con efectos fijos, los estadsticos de prueba
para cada efecto principal e interaccin pueden construirse dividiendo el cuadrado medio correspondien
te del efecto o interaccin por el cuadrado medio del error. Ibdas estas pruebas F sern de una cola supe
rior. El nmero de grados de libertad de cualquier efecto principal es el nmero de niveles del factor
menos uno, y el nmero de grados de libertad de una interaccin es el producto del nmero de grados de
libertad asociados con los componentes individuales de la interaccin.
Por ejemplo, considere el modelo del anlisis de varanza de tres factores:

7 = 1. 2,...,6
m

fc = l, 2,...,c
/= l,2 ,...,/i

(5-26)

Suponiendo que^, B y C son fijos, la tabla del anlisis de varanza se presenta en la tabla 5-12. Las prue
bas F para los efectos principales y las interacciones se siguen directamente de los cuadrados medios es
perados.

II

s s

"to
+

tf

I
I

!J

I
I

<Q

JS,

s?

Sf

U
oq

Oi

C<j

s s13
19 5

196

CAPTULO 5

INTRODUCCIN A LOS DISEOS FACTORIALES

En general, los clculos del anlisis de varianza se efectuaran utilizando un paquete de software de
estadstica. Sin embargo, en ocasiones resultan tiles las frmulas para calcular manualmente las sumas
de cuadrados de la tabla 5-12. La suma de cuadrados total se encuentra de la manera acostumbrada como

r - E A - j j ,

(5-27)

Las sumas de cuadrados de los efectos principales se encuentran a partir de los totales de los factores
y C(yi,) de la siguiente manera:
a

SS^ = 1
^ bcn

yL

SS,

y l.

2y=i

aben

aben

k=l

(5-28)

aben

(5-29)

(5-30)

Para calcular las sumas de cuadrados de las interacciones de dos factores, se necesitan los totales de las
celdas^ x B ,A x C y B x C . Con frecuencia es til desplegar la tabla de los datos originales en tres tablas
de dos vas para calcular estas cantidades. Las sumas de cuadrados se encuentran con

= S S ^ ^ ,^ ,-S S ,-S S ,

(5-31)

(5-33)

Observe que las sumas de cuadrados de los subtotales de dos factores se encuentran a partir de los totales
de cada tabla de dos vas. La suma de cuadrados de la interaccin de los tres factores se calcula a partir de
los totales de las celdas
de tres vas como
b

y- --S S ,-S S ,-S S ,-S S ^ -S S ,,-S S ,,

s s ABC

S u b to ta le s (^ C )

AC

(5-34a)

(5-34b)

La suma de cuadrados del error puede encontrarse restando la suma de cuadrados de cada efecto princi
pal e interaccin de la suma de cuadrados total o con
S S ^ = S S j.

(5 -3 5 )

5-4 DISEO FACTORIAL GENERAL

197

TE M PL O ..........................................................................................................................................................
El problema del embotelladlo de un refresco
Una empresa embotelladora de refrescos est interesada en obtener alturas de llenado ms uniformes en
las botellas que se fabrican en su proceso de manufactura. Tfericamente, la mquina de llenado llena cada
botella a la altura objetivo correcta, pero en la prctica, existe variacin en tomo a este objetivo, y a la embo
telladora le gustara entender mejor las fuentes de esta variabilidad y, en ltima instancia, reducirla.
El ingeniero del proceso puede controlar tres variables durante el proceso de llenado; el porcentaje
de carbonatacin (A), la presin de operacin en el llenador (B) y las botellas producidas por minuto o ra
pidez de lnea (C). Es sencillo controlar la presin y la rapidez, pero el porcentaje de carbonatacin es
ms difcil de controlar durante la manufactura real debido a que vara con la temperatura. Sin embargo,
para los fines de un experimento, el ingeniero puede controlar la carbonatacin en tres niveles: 10,12 y 14
por ciento. Elige dos niveles para la presin (25 y 30 psi) y dos niveles para la rapidez de lnea (200 y 250
bpm). El ingeniero decide correr dos rplicas de un diseo factorial con estos tres factores, haciendo las
24 corridas de manera aleatoria. La variable de respuesta observada es la desviacin promedio de la altu
ra del llenado objetivo que se observa en una corrida de produccin de botellas con cada conjunto de con
diciones. En la tabla 5-13 se muestran los datos que resultaron de este experimento. Las desviaciones
positivas son alturas de llenado arriba del objetivo, mientras que las desviaciones negativas son alturas de
llenado abajo del objetivo. Los nmeros encerrados en crculos de la tabla 5-13 son los totales de las cel
das de tres vas y,y;.,.
La suma de cuadrados total corregida que se encuentra con la ecuacin 5-27 es

j= l k = l /- I

y h - aben

\2

= 5 7 1 -^ ^ = 3 3 6 .6 2 5
Tabla 5-13

Datos de la desviacin de la altura de llenado del ejemplo 5-3

Presin de operacin (B)


30 psi
Rapidez de lnea (C)
200
250

25 psi
Rapidez de lnea (Q
200
250

Porcentaje de
carbonatacin (A)
10
12
14

Ii 0
; 0
1

1 0
? 0
6
0

1 0

15

20

Tbtalesfi x Cyj^

Tbtales^ x B

Tbtales^ x C

y^j..
C

B
A
10
12
14

25
-5
4
22

30
1
16
37

10-^

A
10
12
14

200
-5
6
25

250
1
14
34

(g )

20

i;

59

34
54

21

yj..

Vl.

75 =x...

198

CAPTULO 5

INTRODUCCIN A LOS DISEOS FACTORIALES

y las sumas de cuadrados de los efectos principales que se calculan con las ecuaciones 5-28,5-29 y 5-30 son

ss

C a rto n a ta d n

=
yj
l
Z

Rapidez -

abn

y -k .

aben

= ~ [ ( 2 6 ) ^ + ( 4 9 ) ^ ] - ^ = 22.042
Para calcular las sumas de cuadrados de las interacciones de dos factores, se deben encontrar los tota
les de las celdas de dos vas. Por ejemplo, para encontrar la carbonatacin-presin o interaccin AB, se
necesitan los totales de las celdas^ x B {y,^ } que se muestran en la tabla 5-13. Utilizando la ecuacin
5-31, se encuentra que las sumas de cuadrados son

= ^ [ ( - 5 ) ' -l-(l)' + ( ^ y + (16)' +(22)^ + ( 3 V ) ' ] - ^ ^ 25Z750-45.375


= 5.250
Para la carbonatacin-rapidez o interaccin^C se usan los totales de las celdas^ x C
tran en la tabla 5-13 y la ecuacin 5-32:

bn^(

} que se mues

aben

= ^ [ ( - 5 ) ' +( 1) ' + ( 6 ) ' -l-(14)' -l-(25)" + ( 3 4 ) ' ] - ^ ^ 252.750 - 22.042


= 0.583
La presin-rapidez o interaccin 5 C se encuentra con los totales de las celdas B x C {y i,} que se mues
tran en la tabla 5-13 y la ecuacin 5-33:

= i [(6)' -l-(15)' + (2 0 )' + ( 3 4 ) " ] - ^ ^ 45.375- 22.042


= 1.042

5-4 DISEO FACTORIAL GENERAL

199

La suma de cuadrados de la interaccin de los tres factores se encuentra con los totales de las celdas
A y - E x C {y,y^}, los cuales estn encerrados en un crculo en la tabla 5-13. Por la ecuacin 5-34a se en
cuentra
- ^ - S S

- S S , - S S , - S S ^ - S S , , - ss.

1=1 ; - l k = \

= | t ( - 4 ) ^ +(-1)^ +(-1)^ +-+(1 6 )^ + ( 2 l ) ^ ] - ^


252.750 - 45.375- 2 Z 0 4 2 - 5 .250- 0.583-1.042
= 1.083
Por ltimo, al observar que
SS S u b to ta le s (^ C )
se tiene
SS^ - SSj. = 336.625- 328.125
= 8.500
En la tabla 5-14 se resume el anlisis de varianza. Se observa que el porcentaje de carbonatacin, la
presin de operacin y la rapidez de lnea afectan significativamente el volumen de llenado. El cociente F
de la interaccin carbonatacin-presin tiene un valor P de 0.0558, lo cual indica cierta interaccin entre
estos factores.
El siguiente paso deber ser un anlisis de los residuales de este experimento. Se deja como ejercicio
para el lector, pero se seala que la grfica de probabilidad normal de los residuales y los dems diagns
ticos usuales no indican ningn motivo de preocupacin importante.
Como ayuda para la interpretacin prctica de este experimento, en la figura 5-16 se grafiean los tres
efectos principales y la interaccin AB (carbonatacin-presin). Las representaciones de los efectos princi
pales son slo grficas de los promedios de las respuestas marginales para los niveles de los tres factores.
Observe que las tres variables tienen efectos principales positivos; es decir, el incremento de la variable
mueve hacia arriba la desviacin promedio del llenado objetivo. La interaccin entre la eabonatacin y la
presin es bastante pequea, como lo indica la forma similar de las dos curvas de la figura 5-16d.
Puesto que la empresa quiere que la desviacin promedio del llenado objetivo est cerca de cero, el
ingeniero decide recomendar el nivel bajo de la presin de operacin (25 psi) y el nivel alto de la rapidez
de lnea (250 bpm, que maximizar la rapidez de produccin). En la figura 5-17 se grafca la desviacin
Tabla 5-14

Anlisis de varianza del ejemplo 5-3

Fuente de variacin
Porcentaje de carbonatacin (A)
Presin de operacin (fi)
Rapidez de lnea (C)
AB
AC
BC
ABC
Error
Tbtal

Suma de
cuadrados
252.750
45.375
22.042
5,250
0.583
1.042
1.083
8.500
336.625

Grados de
libertad
2
1
1
2
2
1
2
12
23

Cuadrado
medio
126.375
45.375
22.042
2.625
0.292
1.042
0.542
0.708

F,
178.412
64.059
31.118
3.706
0.412
1.471
0.765

Valor P
<0.0001
<0.0001
0.0001
0.0558
0.6713
0.2485
0.4867

CAPTULO 5

200

INTRODUCCIN A LOS DISEOS FACTORIALES

8
6
4

2
O
J.

-2

25

30
Presin (B)

b)

V
O
o
-2

_L

_L

200

250
Interaccin
carbonatacin-presln

Rapidez de lnea (Cl

c)

d)

Figura 5-16 Grficas de los efectos principales y la interaccin del


ejemplo 5-3. a) Porcentaje de carbonatacin (A), b) presin (B), c) ra
pidez de lnea (C), d) interaccin carbonatacin-presin.

promedio observada de la altura de llenado objetivo con los tres diferentes niveles de carbonatacin para
este conjunto de condiciones de operacin. Ahora, el nivel de la carbonatacin no puede actualmente
controlarse perfectamente en el proceso de manufactura, y la distribucin normal indicada con la lnea
continua de la figura 5-17 es una aproximacin de la variabilidad de los niveles de carbonatacin que se
8i-

Distribucin nnejorada del


porcentaje de carbonatacin

Sa
a
Is
-2

10

12

14

Porcentaje de carbonatacin (A)

Figura S-17 Desviacin promedio de la altura de llenado


con rapidez alta y presin baja para diferentes niveles de
carbonatacin.

5'5 AJUSTE DE CURVAS Y SUPERFICIES DE RESPUESTA

20 1

registran actualmente. Como el proceso es impactado por los valores del nivel de carbonatacin sacado
de esta distribucin, la fluctuacin de las alturas de llenado ser considerable. Esta variabilidad de las al
turas de llenado podra reducirse si la distribucin de los valores del nivel de carbonatacin siguieran la
distribucin normal indicada con la lnea punteada de la figura 5-17. La reduccin de la desviacin estn
dar de la distribucin del nivel de carbonatacin se consigui finalmente mejorando el control de la tem
peratura durante la manufactura.

Se seal ya que si todos los factores de un experimento factorial son fijos, la construccin del esta
dstico de prueba es directa. El estadstico para probar cualquier efecto principal o interaccin se forma
siempre dividiendo el cuadrado medio del efecto principal o la interaccin por el cuadrado medio del
error. Sin embargo, si el experimento factorial incluye uno o ms factores aleatorios, la construccin del
estadstico de prueba no siempre se hace de esta manera. Es necesario examinar los cuadrados medios es
perados para determinar las pruebas correctas. La revisin completa de los experimentos con factores
aleatorios se pospone hasta el captulo 12.

5-5

AJUSTE DE CU RV AS Y SUPERHCIES DE RESPUESTA

Se ha visto que puede resultar til ajustar una curva de respuesta a los niveles de un factor cuantitativo
para que el experimentador cuente con una ecuacin que relacione la respuesta con el factor. Esta ecua
cin podra utilizarse para hacer interpolaciones, es decir, para predecir la respuesta en niveles interme
dios entre los factores, respecto de los que se utilizaron realmente en el experimento. Cuando al menos
dos de los factores son cuantitativos, puede ajustarse una superficie de respuesta para predecir >>con va
rias combinaciones de los factores del diseo. En general, se usan mtodos de regresin lineal para ajus
tar estos modelos a los datos experimentales. Este procedimiento se ilustra en la seccin 3-5,1 para un
experimento con un solo factor. A continuacin se presentan dos ejemplos que incluyen experimentos
factoriales. Se utihzar un paquete de software de computadora para generar los modelos de regresin.
Para mayor informacin acerca del anlisis de regresin, referirse al captulo 10 y al material suplementa
rio del texto de este captulo.

EJEMPLO 5 - 4 .............................................................................................................................................. ..
Considere el experimento que se describe en el ejemplo 5-1. El factor temperatura es cuantitativo y el tipo
de material es cualitativo. Adems, hay tres niveles de la temperatura. Por consiguiente, puede calcularse
un efecto de la temperatura lineal y uno cuadrtico para estudiar la forma en que la temperatura afecta la
vida de la batera. En la tabla 5-15 se presenta la sahda condensada de Design-Expert para este experimen
to, donde se supone que la temperatura es cuantitativa y el tipo de material es cuahtativo.
El anlisis de varianza de la tabla 5-15 indica que la fuente de variabilidad modelo se ha subdividido en varios com ponentes. Los com ponentes A y A^ representan los efectos lineal y cuadrtico de
la temperatura, y B representa el efecto principal del factor tipo de material. Recuerde que el tipo de ma
terial es un factor cualitativo con tres niveles. Los trminos A B y A^B son las interacciones del factor tem
peratura lineal y cuadrtico con el tipo de material.
Los valores P indican que^4^ yA B no son significativos, mientras que el trmino
es significativo.
Con frecuencia se piensa en eliminar los trminos o factores no significativos del modelo, pero en este

Tabla 5-15

Salida de Design-Expert para el ejemplo 5-4

Response: Life
tn hr
ANOVA for Response Surface Reduced Cubc Model
:ial sum of squares]
F
Mean
Sum of
Source
Squares
DF
Square
Valu

Model

59416.22

Residual

39042.67
10683.72
76.06
2315.08
7298.69
18230.75

LackofFit
Pur Error
Cor Total

18230.75
77646.97

Std. Dev.
Mean
C.V.
PRESS

25.98
105.53
24.62
32410.22

B
AB
A^B

Term

Intercept
A-Temp
B[1]
B[21
A"
AB[1]
AB[2]
A^B[1]
A^B[2]

0.000

Coefficient
Estmate

107.58
40.33
-50.33
12.17
-3.08
1.71
-12.79
41.96
14.04

8
7

2
1
2
2
27
0
27
35

7427.03

11.00

39042.67
5341.86
76.06
1157.54
3649.35
675.21

57.82
7.91
0.11
1.71
5.40

Prob > F

<0.0001
<0.0007

significant

0.0020
0.7398
0.1991
0.0106

675.21
R-Squared
Adj R-Squared
Pred R-Squared
Adeq Precisin

DF

1
1
1
1
1
1
1
1
1

Standard
Error

Final Equation in Terms of Ceded Factors:


Life =
+ 107.58
-40.33 *A
-50.33 *B[1]
+ 12.17 *B[2]
-3.08 *A^
+ 1.71 *ABI11
-12.79 *AB[2]
+41.96 *A^B[1]
-14.04 *A^B[2]
Final Equation in Terms of Actual Factors:
Material Type
1
Life =
+ 169.38017
-2.48860 *Temp
+0.012851 *Temp2
Material Type
2
Life =
+ 159.62397
-0.17901 *Temp
+0.41627 *Temp^
Material Type
3
Life =
+ 132.76240
+0.89264 *Temp
-0.43218 *Temp^

7.50
5.30
10.61
10.61
9.19
7.50
7.50
12.99
12.99

0.7652
0.6956
0.5826
8.178
95% a
Low

92.19
-51.22
-72.10
-9.60
-21.93
-13.68
-28.18
15.30
-40.70

95% Cl
High

122.97
-29.45
-28.57
33.93
15.77
17.10
2.60
68.62
12.62

VIF
1.00
1.00

5-5 AJUSTE DE CURVAS Y SUPERFICIES DE RESPUESTA

203

caso eliminar y
y conservar
resultar en un modelo que no es jerrquico. El principio de jerar
qua establece que si un modelo contiene un trmino de orden superior (tal comoj4^5), deber contener
tambin todos los trminos de orden inferior que lo componen (A^ yA B en este caso). La jerarqua pro
mueve un tipo de consistencia interna en un modelo, y muchos constructores de modelos estadsticos si
guen rigurosamente este principio. Sin embargo, la jerarqua no es siempre una buena idea, y muchos
modelos en realidad funcionan mejor como ecuaciones de prediccin que no incluyen los trminos no sig
nificativos que propone la jerarqua. Para mayor informacin, ver el material suplementario del texto de
este captulo.
La salida de computadora incluye tambin estimaciones de los coeficientes del modelo y una ecua
cin para la prediccin final de la vida de la batera en trminos de factores codificados. En esta ecuacin,
los niveles de la temperatura son^l = - 1 , 0, -I-1, respectivamente, cuando la temperatura est en los nive
les bajo, intermedio y alto (1 5 ,7 0 ,125F). Las variables 5[1] y 5[2] son variables indicadoras codificadas
que se definen de la siguiente manera;

B[1
B[2

Tipo de material
1
2
3
0
1
-1
-1
O
1

Hay tambin ecuaciones para la prediccin de la vida de la batera en trminos de los niveles de los facto
res reales. Observe que como el tipo de material es un factor cualitativo, hay una ecuacin para la vida
predicha como una funcin de la temperatura para cada tipo de material. En la figura 5-18 se muestran

Temperatura

Figura 5-18 La vida predicha como una funcin de la temperatura para los tres ti
pos de material, ejemplo 5-4.

204

CAPTULO 5

INTRODUCCIN A LOS DISEOS FACTORLALES

las curvas de respuesta generadas por estas tres ecuaciones de prediccin. Comprense con la grfica de
la interaccin de dos factores para este experimento de la figura 5-9.

Si varios de los factores de un experimento factorial son cuantitativos, puede usarse una superficie de
respuesta para modelar la relacin entre 3^y los factores del diseo. Adems, los efectos de los factores
cuantitativos pueden representarse con efectos polinomiales con un solo grado de libertad. D e manera si
milar, es posible hacer la particin de las interacciones de factores cuantitativos en componentes de inter
accin con un solo grado de libertad. Esto se ilustra en el ejemplo siguiente.

EJEMPLO 5 - 5 ..................................................................................................................................................
Se piensa que la vida efectiva de una herramienta de corte instalada en una mquina controlada numri
camente se afecta por la velocidad de corte y el ngulo de la herramienta. Se seleccionan tres velocidades
y tres ngulos, y se lleva a cabo un experimento factorial con dos rplicas. En la tabla 5-16 se muestran los
datos codificados. Los nmeros de las celdas encerrados en crculos son los totales de las celdas {y,y.}.
En la tabla 5-17 se presenta la salida condensada de Design-Expert para este ejemplo. Los trminos^
son los efectos lineal y cuadrtico del ngulo de la herramienta, y B y B ^ son los efectos lineal y cuadrtico de la velocidad. Los trTsao,AB,A^B,AB^ yA^B^ representan los componentes lineal x hneal,
cuadrtico x hneal, hneal x cuadrtico y cuadrtico x cuadrtico de la interaccin de dos factores. Aun
cuando hay algunos valores P grandes, se han conservado todos los trminos del modelo para respetar la
jerarqua. En la ecuacin de prediccin expresada en factores codificados se utilizan los niveles - 1 , 0 y -l-1
e , A y B para representar los niveles bajo, intermedio y alto, respectivamente, de estos factores.
En la figura 5-19 se presenta la grfica de contorno de la superficie generada por la ecuacin de pre
diccin de la vida de la herramienta. El examen de esta superficie de respuesta indica que la vida mxima
de la herramienta se consigue con velocidades de corte de alrededor de 150 rpm y ngulos de la herra
mienta de 25. La grfica de la superficie de respuesta tridimensional de la figura 5-20 proporciona en
esencia la misma informacin, pero ofrece una perspectiva diferente, y en ocasiones ms til, de la super
ficie de respuesta de la vida de la herramienta. La exploracin de las superficies de respuesta es un aspec
to muy importante del diseo experimental, el cual se estudiar en detalle en el captulo 11.

Tabla 5-16

Datos del experimento de la vida de la herramienta de corte


Velocidad de corte (pulg/min)

125

(grados)

15
20
25

-2
0
2
-1
0

CD
0
-2

150

175

12

y..

-1
16
9

14

24 =x..

5-5 AJUSTE DE CURVAS Y SUPERFICIES DE RESPUESTA

labia 5-17

Salida de Design-Expert para el ejemplo 5-5

Response: Life
in Houre
ANOVA for Response Surface Reduced Order 4 Model
Source

Model

Sum of
Squares

111.00

A
B

1.33
A^B
A&
A^EF

Residual

LackofFit
Pur Error
Cor Total
Std. Dev.
Mean
C.V.
PRESS
Factor

8.00

2.67
42.67
8.00
13.00
0.000
13.00
124.00

AB
A^B
AB^
A^B*

49.00
16.00
0.000
1.33
8.00
2.67
42.67
8.00
1.44

Prob>F

9.61

0.0013

33.92
11.08
0.000
0.92
5.54
1.85
29.54
5.54

0.0003
0.0088
1.0000
0.3618
0.0431
0.2073
0.0004
0.0431

Coefficient
Estmate

DF

Standard
Error

2.00

3.50
2.00
0.000
1.00
- 1.00

1.00

-4.00
-3.00

Final Equation in Terms of Coded Factors:


Life =
+2.00

+3.50 *A
+2.00 *B
+0.000 *A^
+ 1.00 *B*

-1.00
-1.00
-4.00
-3.00

significant

1.44

R-Squared
Adj R-Squared
Pred R-Squared
Adeq Precisin

1.33
90.14
52.00

F
Valu

17

1.20

Intercept
A'Tool Angle
B-Speed

13.87

1
1
1
1
1
1
1
1
9
0
9

49.00
16.00
0.000

AB

Mean
Square

DF
8

*A*B
*A* *B
*A *B^
'A^* *B^

Final Equation in Terms of Actual Factors;


Life =
-1068.00000
+136.30000 *Tool Angle
+ 14.48000 *Speed
-4.08000 *Tool Angle*
-0.043600 *Speed*
-1.86400 *Tool Angle *Speed
+0.056000 *Tool Angle^ *Speed
+6.40000E-003 *Tool Angle *Speed*
-1.92000E-004 *Tool Angle* *Speed^

0.85
0.60
0.60
1.04
1.04
0.42
0.74
0.74
1.27

0.8952
0.8020
0.5806
8.237
9 5 % Cl
Low

0.078
2.14
0.64
-2.35
-1.35
-1.96
-2.66
-5.66
-5.88

95% a
High

3.92
4.86
3.36
2.35
3.35
-0.039
0.66
-2.34
-0.12

VIF

3.00
3.00
3.00
3.00
1.00
3.00
3.00
5.00

205

ngulo de la herramienta

Figura 5-19 Grfica de contorno bidimensional de la superficie de respuesta de la vida de


la herramienta del ejemplo 5-5.

175.0D

'25,00

162.50

^*^.50
150.00''
' 20.00

Velocidad

137,50

17,50

ngulo de la herramienta

1 2 5 .0 0 15.00

Figura S-20 Superficie de respuesta tridimensional de la vida de la herramienta del


ejemplo 5-5.

206

5-6 FORMACIN DE BLOQUES EN UN DISEO FACTORIAL

5-6

207

FORMACIN DE BLOQUES EN UN DISEO FACTORIAL

Se han revisado los diseos factoriales en el contexto de un experimento completamente aleatorizado. En


ocasiones no es factible o prctico hacer la aleatorizacin completa de todas las corridas de un diseo fac
torial. Por ejemplo, la presencia de un factor perturbador puede hacer necesario que el experimento se
corra en bloques. Los conceptos bsicos de la formacin de bloques se analizaron en el captulo 4 en el
contexto de un experimento con un solo factor. Ahora se indica la forma en que la formacin de bloques
puede incorporarse en un diseo factorial. Otros aspectos de la formacin de bloques en diseos factoria
les se presentan en los captulos 7, 8, 9 y 13.
Considere un experimento factorial con dos factores ( A y B ) y n rphcas. El modelo estadstico lineal
de este diseo es
7 = 1,2,.... 6

(5-36)

k = \ , %. . . , n
donde p y (t/S),y representan los efectos de los factores^, 5 y la interaccin^ 5 , respectivamente. Su
ponga ahora que para realizar este experimento se necesita una materia prima particular. Esta materia
prima est disponible en lotes cuyo tamao no es suficiente para permitir que se corran todas las abn com
binaciones de los tratamientos con el mismo lote. Sin embargo, si un lote contiene material suficiente
para hacer ab observaciones, entonces un diseo alternativo es correr cada una de las n rplicas utilizando
un lote separado de materia prima. Por consiguiente, los lotes de materia prima representan una restric
cin sobre la aleatorizacin o un bloque, y se corre una sola rplica de un experimento factorial completo
dentro de cada bloque. El modelo de los efectos para este nuevo diseo es
i = 1,2,..., a

yiik=

;=1
k = ,Z...,n

(5-37)

donde es el efecto del bloque fc-simo. Desde luego, dentro de un bloque el orden en que se corren las
combinaciones de los tratamientos est completamente aleatorizado.
En el modelo (ecuacin 5-37) se supone que la interaccin entre los bloques y los tratamientos es insignicante. Anteriormente se estableci el mismo supuesto en el anlisis de diseos de bloques aleatorizados. Si estas interacciones existen, no pueden separarse del componente del error. D e hecho, el
trmino del error en este modelo se compone en realidad de las interacciones (t)*,
En la
tabla 5-18 se describe el anlisis de varianza. La disposicin tiene un gran parecido con la de un diseo
factorial, con la suma de cuadrados del error reducida por la suma de cuadrados de los bloques. En lo que
a los clculos se refiere, la suma de cuadrados de los bloques se encuentra como la suma de cuadrados en
tre los totales de los n bloques {y ,*}.
En el ejemplo anterior, la aleatorizacin se restringi al interior de un lote de materia prima. En la
prctica, una diversidad de fenmenos pueden producir restricciones sobre la aleatorizacin, como el
tiempo, los operadores, etc. Por ejemplo, si el experimento factorial completo no pudo correrse en un da,
entonces el experimentador podra correr una rplica completa el da 1, una segunda rplica el da 2, etc.
Por consiguiente, cada da sera un bloque.

EJEMPLO 5 - 6 ..................................................................................................................................................
U n ingeniero estudia los mtodos para mejorar la capacidad para detectar objetivos en el campo de ac
cin de un radar. D os factores que el ingeniero considera importeintes son la cantidad de ruido de fondo,
o desorden de terreno, en el campo de accin del radar y el tipo de filtro colocado sobre la pantalla. Se

208

CAPTULO 5

Tabla 5-18

INTRODUCCIN A LOS DISEOS FACTORIALES

Anlisis de varianza de un diseo factorial de dos factores en bloques completos aleatorados

^y
a b '^

Bloques
A

^y
bn

an-Y

Cuadrado
medio esperado

Grados de
libertad

Suma de
cuadrados

Fuente de
variacin

-Habol

n -1

abn
y'
' abn

Fo

a -1

MS,
MS^

a -1

MS
MS^

b -1

' abn

AB

^ (a-l)ib-l)
(ab-l){n~l)

Sustraccin

Error
Tbtal

E E E

MS^

abn - 1

abn

disea un experimento utilizando tres niveles del desorden de terreno y dos tipos de filtro. Estos factores
se considerarn fijos. El experimento se lleva a cabo seleccionando al azar una combinacin de los trata
mientos (nivel del desorden de terreno y tipo de filtro) e introduciendo despus una seal que representa
el objetivo en el campo de accin del radar. La intensidad de este objetivo se incrementa hasta que el ope
rador lo observa. Entonces se mide el nivel de intensidad en el momento de la deteccin como la variable
de respuesta. Debido a la disponibilidad de los operadores, es conveniente seleccionar un operador y
mantenerlo en el sistema hasta que se han realizado todas las corridas necesarias. Adems, los operado
res difieren en su habilidad y capacidad para operar el sistema. Por consiguiente, parece lgico usar los
operadores como bloques. Se seleccionan cuatro operadores al azar. Una vez que se ha elegido a un ope
rador, el orden en que se corren las seis combinaciones de los tratamientos se determina aleatoriamente.
Por lo tanto, se tiene una corrida de un experimento factorial 3 x 2 en un bloque completo aleatorizado.
Los datos se presentan en la tabla 5-19.
El modelo lineal para este experimento es
p = l,2,3

y-,k =

7 = 1,2

+(r/3)^.

k = \ , 2, 3, A
donde t, representa el efecto del desorden de terreno, representa el efecto del tipo de filtro,
es la
interaccin, d,, es el efecto del bloque y ^es el componente NID(0, a^) del error. Las sumas de cuadrados
del desorden de terreno, del tipo de filtro y de su interaccin se calculan de la manera usual. La suma de

Tabla 5-19

Nivel de intensidad al detectarse el objetivo

Operadores (bloques)
Tipo de filtro
Desorden de terreno
Bajo
Intermedio
Alto

1
1

90
102
114

86
87
93

96
106
112

84
90
91

100
105
108

92
97
95

92
96
98

81
80
83

5'6 FORMACIN DE BLOQUES EN UN DISEO FACTORIAL

Tabla 5-20

209

Anlisis de varianza del ejemplo 5-6

Fuente de variacin
Desorden de terreno (G)
Tipo de filtro (F)
GF
Bloques
Error
Tbtal

Suma de
cuadrados
335.58
1066.67
77.08
402.17
166.33
2047.83

Grados de
libertad
2
1
2
3
15
23

Cuadrado
medio
167.79
1066.67
38.54
134.06
11.09

Fo
15.13
96.19
3.48

Valor/
0.0003
<0.0001
0.0573

cuadrados debida a los bloques se encuentra a partir de los totales de los operadores {y j^} de la siguiente
manera:
1

SS Bloques

= nh
~y
[(572)" +(579)' +(597)" +(530)" ] (3){2)
= 402.17

(221%f
(3)(2)(4)

En la tabla 5-20 se resume el anlisis de varianza completo de este experimento. La presentacin de


la tabla 5-20 indica que todos los efectos se probaron dividiendo sus cuadrados medios por el cuadrado
medio del error. Tinto el desorden de terreno como el tipo de filtro son significativos en el nivel de 1%,
mientras que su interaccin slo es significativa en el nivel de 10%. Por lo tanto, se concluye que tanto
el nivel del desorden de terreno como el tipo de filtro de campo usado en la pantalla afectan la habili
dad del operador para detectar el objetivo, y existe cierta evidencia de una ligera interaccin entre ambos
factores.

En el caso de dos restricciones sobre la aleatorizacin, cada una conp niveles, si el nmero de combi
naciones de los tratamientos en un diseo factorial de k factores es exactamente igual al nmero de nive
les de la restriccin, es decir, p = ab ... m, entonces el diseo factorial puede correrse en un cuadrado
latinop x p - Por ejemplo, considere una modificacin del experimento de la deteccin del objetivo en el
radar del ejemplo 5-6. Los factores de este experimento son el tipo de filtro (dos niveles) y el desorden de
terreno (tres niveles), y los operadores se consideran como bloques. Suponga ahora que debido a limita
ciones de tiempo, slo pueden hacerse seis corridas por da. Por lo tanto, los das se convierten en una se
gunda restriccin sobre la aleatorizacin, lo cual resulta en un diseo del cuadrado latino 6 x 6 , como
se muestra en la tabla 5-21. En esta tabla se han usado las letras minsculas/ygy para representar los nive
les i-simo yy-simo del tipo de filtro y del desorden de terreno, respectivamente. Es decir,/,^2 representa
el filtro tipo 1 y un desorden de terreno intermedio. Observe que se necesitan ahora seis operadores, en
lugar de los cuatro del experimento original, por lo que el nmero de combinaciones de tratamientos en
el diseo factorial 3 x 2 es exactamente igual al nmero de niveles de restriccin. Adems, en este diseo
cada operador se usara una sola vez en cada da. Las letras latinas v4, B, C, D, E y F representan las 3 x 2
= 6 combinaciones de tratamientos del diseo factorial como sigue: ^ =f j gi , B = f ^ 2>C =f j g , D = f ^ ^ E
= f ^ i y F = fiSy

210

CAPTULO 5

INTRODUCCIN A LOS DISEOS FACTORIALES

Tabla 5-21 El experimento de la deteccin del radar realizado en un cuadrado latino 6 x 6


Operador
Da
1
2
3
4
5
1
106) C(f,g, = 108)
= 81)
A (f^ , --= 90)
Fif^g,- - 90)
2
= 96)
F(f2g3 == 83)
c(f^3-- = 114)
B(f^2 = 105)
E(2gi --= 86)
3
= 102) E(f:B2 = 90)
A(figi == 92)
F(f, g, = 95)
D(f2gr -= 85)
4
84) A(f,Sr = 100)
= 110)
Elfgi == 887)
B(f^2 == 96)
5
A (f^ l --= 90)
F(f2gi == 93)
E(f2g2'-= 80)
C(f^3 = 112) D(f2g, = 92)
6
= 86)
F(f^2 = 91)
E(f2g2 = 97)
C(f^3--= 98)
B(f^2'-= 100)

6
E(f2g2 =
D(f^. =
C(f^3 =
F(f2g3 =
B(f,g2 =

88)
84)
104)
91)
98)
92)

Los cinco grados de libertad entre las seis letras latinas corresponden a los efectos principales del tipo
de filtro (un grado de libertad), el desorden de terreno (dos grados de libertad) y su interaccin (dos gra
dos de libertad). El modelo estadstico lineal de este diseo es
= l , 2 , . . . , 6
; = 1, 2,3
ijkl

(5-38)

k = l,2
1=1,2,...,6

donde Tj y son los efectos del desorden de terreno y del tipo de filtro, respectivamente, yay6, represen
tan las restricciones sobre la aleatorizacin de los das y los operadores, respectivamente. Para calcular las
sumas de cuadrados, la siguiente tabla de dos vas de los totales de los tratamientos es til;
Desorden de terreno
Bajo
Intermedio
Alto
y..k.

Filtro tipo 1
560
607
646
1813

Filtro tipo 2
512
528
543

y.i..

1072
1135
1189
3396= y.

1583

Adems, los totales de los renglones y las columnas son


Renglones (y.y*y):
Columnas (yjit)'

563
572

568
579

568
597

568
530

565
561

564
557

En la tabla 5-22 se resume el anlisis de varianza. Se ha agregado una columna a esta tabla que indica
cmo se determina el nmero de grados de libertad de cada suma de cuadrados.
Tabla 5-22 Anlisis de varianza del experimento de la deteccin en el radar realizado como un diseo factorial 3 x 2 en un
cuadrado latino

Fuente de
variacin
Desorden de terreno, G
Tipo de filtro, F
GF
Das (renglones)
Operadores
(columnas)
Error
Tbtal

Suma de
cuadrados
571.50
1469.44
126.73
4.33
428.00

Grados de
libertad
2
1
2
5
5

198.00
2798.00

20
36

Frmula general
para los grados
de libertad
a -1
b -l
ab-\
ab-\
iab-l){ab-l)

Cuadrado
medio
285.75
1469.44
63.37
0.87
85.60
9.90

Fo
28.86
148.43
6.40

Valor P
<0.0001
<0.0001
0.0071

5-7 PROBLEMAS

5-7
5-1.

211

PROBLEMAS
Se estudia el rendimiento de un proceso qumico. Se piensa que las dos variables ms importantes son la pre
sin y la temperatura. Se seleccionan tres niveles de cada factor y se lleva a cabo un experimento factorial con
dos rplicas. Los datos del rendimiento son;

Presin (psig)
Temperatura (C)

200

215

230

150

90.4
90.2
90.1
90.3
90.5
90.7

90.7
90.6
90.5
90.6
90.8
90.9

90.2
90.4
89.9
90.1
90.4
90.1

160
170

5-2.

a) Analizar los datos y sacar conclusiones. Utilizar a = 0.05.


b) Construir las grficas de los residuales apropiadas y comentar la adecuacin del modelo.
c) Bajo qu condiciones debera operarse este proceso?
Un ingeniero sospecha que el acabado superficial de una pieza metlica se afecta por la velocidad de alimen
tacin y la profundidad de corte. Selecciona tres velocidades de alimentacin y cuatro profundidades de cor
te. Despus realiza un experimento factorial y obtiene los siguientes datos;

Velocidad de alimentacin
(pulg/min)

5-3.
5-4.

Profundiad de corte (pulg)


0.15

0.18

0.20

0.25

0.20

74
64
60

79
68
73

82
88
92

99
104
96

0.25

92
86
88

98
104
88

99
108
95

104
110
99

a.30

99
98
102

104
99
95

108
110
99

114
111
107

a) Analizar los datos y sacar conclusiones. Utilizar a 0.05.


b) Construir las grficas de los residuales apropiadas y comentar la adecuacin del modelo.
c) Obtener estimaciones puntuales del acabado superficial promedio con cada velocidad de alimentacin.
d) Encontrar los valores P para las pruebas del inciso a.
Para los datos del problema 5-2, calcular la estimacin de un intervalo de confianza de 95% de la diferencia
media en la respuesta para velocidades de alimentacin de 0.20 y 0.25 pulg/min.
En un artculo de Industrial Quality Control se describe un experimento para investigar el efecto del tipo de
cristal y del tipo de fsforo sobre la brillantez de un cinescopio. La variable de respuesta es la corriente (en
microamperes) necesaria para obtener un nivel de brillantez especfico. Los datos son los siguientes:

212

CAPTULO 5

INTRODUCCIN A LOS DISEOS FACTORIALES

Tipo de fsforo

Tipo de
cristal

5-5.

280
290
285

300
310
295

290
285
290

230
235
240

260
240
235

220
225
230

a) Existe algn indicio de que alguno de los dos factores influye en la brillantez? Utilizar a = 0.05.
b) Los dos factores interactan? Utilizar a = 0.05.
c) Analizar los residuales de este experimento.
Johnson y Leone {Statistics and Experimental Design in Engineering and the Physical Sciences, John Wiley)
describen un experimento realizado para investigar la torcedura de placas de cobre. Los dos factores estudia
dos fueron la temperatura y el contenido de cobre de las placas. La variable de respuesta fue una medida de
la cantidad de torcedura. Los datos fueron los siguientes;

Contenido de cobre (%)


Temperatura (C)

40

60

80

50
75
100
125

17,20
12, 9
16,12
21,17

16,21
18,13
18,21
23,21

24,22
17,12
25,23
23,22

100
28,27
27,31
30,23
29,31

a)

5-6.

Existe algn indicio de que alguno de los dos factores afecta la cantidad de torcedura? Hay alguna in
teraccin entre los factores? Utilizar a = 0.05.
b) Analizar los residuales de este experimento.
c) Graficar la torcedura promedio con cada nivel del contenido de cobre y compararlas con una distribu
cin t con la escala apropiada. Describir las diferencias en los efectos de los diversos niveles del conteni
do de cobre sobre la torcedura. Si es deseable una torcedura baja, qu nivel del contenido de cobre
debera especificarse?
d) Supnga que no es sencillo controlar la temperatura en el medio ambiente donde van a usarse las placas
de cobre. Este hecho modifica la respuesta que se dio para el inciso c?
Se estudian los factores que influyen en la resistencia a la ruptura de una fibra sinttica. Se eligen cuatro m
quinas de produccin y tres operadores y se corre un experimento factorial utihzando fibra del mismo lote de
produccin. Los resultados son los siguientes:

Mquina
Operador

3
108
109

110
108

109
110

110
115

110
112

110
111

111
109

114
112

116
114

112
115

114
119

120
117

5-7 PROBLEMAS

5-7.

213

a) Analizar los datos y sacar conclusiones. Utilizar a = 0.05.


b) Construir las grficas de los residuales apropiadas y comentar la adecuacin del modelo.
Un ingeniero mecnico estudia la fuerza de empuje desarrollada por una taladradora. Sospecha que la velo
cidad de taladrado y la velocidad de alimentacin del material son los factores ms importantes. Selecciona
cuatro velocidades de alimentacin y usa una velocidad de taladrado alta y otra baja elegidas para represen
tar las condiciones de operacin extremas. Obtiene los siguientes resultados. Analizar los datos y sacar con
clusiones. Utilizar a = 0.05.

Velocidad de alimentacin
0.015

0.030

0.045

0.060

125

2.70
2.78

2.45
2.49

2.60
2.72

2.75
2.86

200

2.83
2.86

2.85
2.80

2.86
2.87

2.94
2.88

Velocidad de taladrado

5-8.

Se realiza un experimento para estudiar la influencia de la temperatura de operacin y tres tipos de placas de
recubrimiento de cristal, en la salida luminosa de un tubo de oscUoscopio. Se registraron los siguientes datos:

Temperatura

Tipo de
cristal

a)

5-9.
5-10.

100

125

150

580
568
570

1090
1087
1085

1392
1380
1386

550
530
579

1070
1035
1000

1328
1312
1299

546
575
599

1045
1053
1066

867
904
889

Utilizar a = 0.05 en el anlisis. Existe un efecto de interaccin significativo? El tipo de cristal o la tem
peratura afectan la respuesta? A qu conclusiones se llega?
b) Ajustar un modelo apropiado que relacione la salida luminosa con el tipo de cristal y la temperatura.
c) Analizar los residuales de este experimento. Comentar la adecuacin de los modelos que se hayan consi
derado.
Considere el experimento del problema 5-1. Ajustar un modelo apropiado a los datos de la respuesta. Usar
este modelo como gua para las condiciones de operacin del proceso.
Usar la prueba de Hikey para determinar los niveles del factor presin que son significativamente diferentes
para los datos del problema 5-1.

214

5-H.

CAPTULO 5

INTRODUCCIN A LOS DISEOS FACTORIALES

Se llev a cabo un experimento para determinar si la temperatura de coccin o la posicin en el homo afec
taban el espesor del endurecimiento de un nodo de carbono. Los datos se presentan a continuacin:

Posicin

800
570
565
583
528
547
521

5-12.
5-13.

1
36
18
30

Factor de la columna
2
3
39
20
37

36
22
33

4
32
20
34

Se piensa que la resistencia al corte de un adhesivo se afecta por la presin de aplicacin y la temperatura. Se
realiza un experimento factorial en el que ambos factores se suponen fijos. Analizar los datos y sacar conclu
siones. Realizar una prueba de no aditividad.

Presin
(Ib/pulg)
120
130
140
150
5-15.

850
565
510
590
526
538
532

Suponga que se considera que no existe ninguna interaccin. Desarrollar el modelo estadstico. Realizar el
anlisis de varlanza y probar las hiptesis sobre los efectos principales. Qu conclusiones pueden sacarse?
Comentar la adecuacin del modelo.
Deducir los cuadrados medios esperados para un anlisis de varianza de dos factores con una observacin
por celda, suponiendo que ambos factores son fijos.
Considere los siguientes datos de un experimento factorial de dos factores. Analizarlos datos y sacar conclu
siones. Realizar una prueba de no aditividad. Utilizar a = 0.05.

Factor del rengln


1
2
3
5-14.

Tbmperatura (C)
825
1063
1080
1043
988
1026
1004

Tfemperatura (F)
250
260
270
9.60
11.28
9.00
9.69
10.10
9.57
8.43
11.01
9.03
9.98
10.44
9.80

Considere el modelo de tres factores


i = 1,2,..., a
y^k =

+/?y +Yk

H M j k +^ijk

j = l,Z...,b
k = l,2,...,c

Observe que hay una sola rpUca. Suponiendo que los tres factores son fijos, desarrollar la tabla del anlisis
de varianza, incluyendo los cuadrados medios esperados. Qu se usara como error experimental para
probar las hiptesis?

5-7 PROBLEMAS

5-16.

El porcentaje de la concentracin de madera dura en la pulpa bruta, la presin de la cuba y el tiempo de coc
cin de la pulpa se investigan en cuanto a sus efectos sobre la resistencia del papel. Se seleccionan tres niveles
de la concentracin de madera dura, tres niveles de la presin y dos tiempos de coccin. Se lleva a cabo un ex
perimento factorial con dos rplicas, obtenindose los siguientes datos;

Porcentaje de la
concentracin de
madera dura

4
8

5-17.

215

Tiempo de coccin 3.0 horas


Presin
400
500
650
195.6
197.7
199.8
196.0
199.4
196.0
198.5
198.4
196.0
197.2
196.9
197.6
197.5
195.6
197.4
196.6
196.2
198.1

Tiempo de coccin 4.0 horas


Presin
400
500
650
198.4
199.6
200.6
200.4
198.6
200.9
197.5
198.7
199,6
198.1
198.0
199.0
197.6
197.0
198.5
198.4
197.8
199.8

a) Analizar los datos y sacar conclusiones. Utilizar a = 0.05.


b) Construir las grficas de los residuales apropiadas y comentar la adecuacin del modelo.
c) Bajo qu conjunto de condiciones debera operarse este proceso? Por qu?
El departamento de control de calidad de una planta de acabados textiles estudia el efecto de varios factores
sobre el teido de una tela de algodn y fibras sintticas utilizada para fabricar camisas para caballero. Se se
leccionaron tres operadores, tres duraciones del ciclo y dos temperaturas, y se tieron tres ejemplares peque
os de la tela bajo cada conjunto de condiciones. La tela terminada se compar con un patrn, y se le asign
una evaluacin numrica. Los datos se presentan enseguida. Analizar los datos y sacar conclusiones. Comen
tar la adecuacin del modelo.

Tbmperatura

Duracin del ciclo


40

50

60

5-18.

5-19.

1
23
24
25
36
35
36
28
24
27

300
Operador
2
27
28
26
34
38
39
35
35
34

3
31
32
29
33
34
35
26
27
25

1
24
23
28
37
39
35
26
29
25

350
Operador
2
38
36
35
34
38
36
36
37
34

3
34
36
39
34
36
31
28
26
24

Suponga que en el problema 5-1 quiere rechazarse la hiptesis nula con una alta probabilidad si la diferencia
entre el verdadero rendimiento promedio con dos presiones cualesquiera es mayor que 0.5. Si una estima
cin previa razonable de la desviacin estndar del rendimiento es 0.1, cuntas rplicas debern correrse?
Se estudia el rendimiento de un proceso qumico. Los dos factores de inters son la temperatura y la presin.
Se seleccionan tres niveles de cada factor; sin embargo, slo es posible hacer nueve corridas en un da. El ex-

216

CAPTULO 5 INTRODUCCIN A LOS DISEOS FACTOIUALES

perimentador corre una rplica completa en cada da. Los datos se muestran en la tabla siguiente. Analizar
los datos, suponiendo que los das son bloques.

5-20.
5-21.
5-22.

Tfcmperatura

250

Baja
Intermedia
Alta

86.3
88.5
89.1

Di al
Presin
260
84.0
87.3
90.2

250
86.1
89.4
91.7

270
87.3
90.3
93.7

Considere los datos del problema 5-5. Analizar los datos, suponiendo que las rplicas son bloques.
Considere los datos del problema 5-6. Analizar los datos, suponiendo que las rplicas son bloques.
'En\m aLxt.ca\oe. Journal ofTesting and Evaluation (vol. 16, no. 2, pp. 508-515) se investigaron los efectos de
la frecuencia de carga cclica y de las condiciones ambientales sobre el crecimiento de las fisuras por fatiga
con un esfuerzo constante de 22 MPa para un material particular. Los datos del experimento se presentan
abajo (la respuesta es el ndice de crecimiento de las fisuras por fatiga):

Frecuencia

10

0.1

5-23.

270
85.8
89.0
91.3

Da 2
Presin
260
85.2
89.9
93.2

Aire
2.29
2.47
2.48
2.12
2.65
2.68
2.06
2,38
2.24
2.71
2.81
2.08

Medio ambiente
HP
HjO salada
2.06
1,90
2.05
1,93
2.23
1,75
2,06
2.03
3.10
3.20
3.18
3.24
3.96
3,98
3.64
3.24
11.00
9,96
10.01
11,00
9.06
9.36
11,30
10.40

a) Analizar los datos de este experimento (utilizar a 0.05).


b) Analizar los residuales.
c) Repetir los anlisis de los incisos ayb utilizando ln(y) como la respuesta. Comentar los resultados.
En un artculo de IEEE Transactions on Electron Devices se describe un estudio sobre el dopado del polisilicio. El experimento que se muestra a continuacin es una variante de dicho estudio. La variable de respuesta
es la corriente fundamental.
Dopado del
polisilicio (iones)
1 X 10^

10

Tfemperatura de revenido (C)


900
950
1000
4.60
10.15
11.01
4.40
10.20
10.58
9.38
10.81
3.20
10.02
10.60
3,50

PROBLEMAS

217

a) Existe evidencia (con a = 0.05) que indique que el nivel de dopado del polisilicio o la temperatura de fi
jacin afecten la corriente fundamental?
b) Construir representaciones grficas como ayuda para interpretar este experimento.
c) Analizar los residuales y comentar la adecuacin del modelo.
d) El modelo
y = /3o

+/?2^2 + P n A + ^ 12 X1 X2 +

est apoyado por este experimento (x = nivel de dopado,


este modelo y graficar la superficie de respuesta.

= temperatura)? Estimar los parmetros de

Diseo factorial 2*

6-1

IN T R O D U C C I N

Los diseos factoriales se usan ampliamente en experimentos que incluyen varios factores cuando es ne
cesario estudiar el efecto conjunto de los factores sobre una respuesta. En el captulo 5 se presentaron los
mtodos generales para el anlisis de los diseos factoriales. Sin embargo, hay varios casos especiales del
diseo factorial general que son importantes debido a su uso generalizado en el trabajo de investigacin y
porque constituyen las bases de otros diseos de gran valor prctico.
El ms importante de estos casos especiales es el de k factores, cada uno con slo dos niveles. Estos
niveles pueden ser cuantitativos, como dos valores de temperatura, presin o tiempo, o bien cualitativos,
como dos mquinas, dos operadores, los niveles alto y bajo de un factor, o quiz la presencia o ausen*
cia de un factor. Una rplica completa de este diseo requiere 2 x 2 x ... x 2 = 2' observaciones y se le
llama diseo factorial 2*.
Este captulo se enfoca en esta clase en extremo importante de diseos. A lo largo del captulo se su
pone que 1) los factores son fijos, 2) los diseos son completamente aleatorizados y 3) se satisfacen los su
puestos de normalidad usuales.
El diseo 2* es de particular utilidad en las etapas iniciales del trabajo experimental, cuando proba
blemente se estn investigando muchos factores. Este diseo proporciona el menor nmero de corridas
con las que pueden estudiarse k factores en un diseo factorial completo. Por consiguiente, estos diseos
se usan ampliamente en los experimentos de tamizado o seleccin de factores.
Puesto que slo hay dos niveles para cada factor, se supone que la respuesta es aproximadamente li
neal en el rango elegido para los niveles de los factores. En muchos experimentos de tamizado de facto
res, cuando se acaba de iniciar el estudio del proceso o sistema, este supuesto suele ser razonable. En la
seccin 6-6 se presentar un mtodo simple para verificar este supuesto, y se anahzarn las acciones que
debern emprenderse en caso de que se viole.
218

6-2 EL DISEO

6-2

219

EL DISEO 2^

El primer diseo de la serie 2* es el que slo tiene dos factores, por ejemplo,y4 y B; cada uno se corre a dos
niveles. A este diseo se le llama diseo fctoral 2*. Los niveles de los factores pueden denominarse arbi
trariamente bajo y alto. Como un ejemplo, considere la investigacin del efecto de la concentracin
del reactivo y de la cantidad del catalizador sobre la conversin (rendimiento) de un proceso qumico. Sea
la concentracin del reactivo el factoryl, y sean 15 y 25 por ciento los dos niveles de inters. El catalizador
es el factor 5 , con el nivel alto denotando el uso de 2 libras del catalizador y el nivel bajo denotando el uso
de 1 libra. Se hacen tres rplicas del experimento, y los datos son los siguientes:

Factor
B

Combinacin de
tratamientos

^ bajo, S bajo
A alto, B bajo
A bajo, B alto
A alto, B alto

+
+

+
+

I
28
36
18
31

Rplica
II
25
32
19
30

ni
27
32
23
29

Tbtal
80
100
60
90

Las combinaciones de los tratamientos se ilustran grficamente en la figura 6-1. Por convencin, el
efecto de un factor se denota con una letra mayscula latina. Por lo tanto, A se refiere al efecto del fac
tor/4, B al efecto del factor 5 , y A B a la interaccin AB. En el diseo 2^ los niveles bajo y alto de A yB
se denotan por
y + , respectivamente, en los ejesyl yB . Por lo tanto, - en el eje A representa el nivel
bajo de la concentracin (15%), mientras que + representa el nivel alto (25%), y - en el eje B representa
el nivel bajo del catalizador, mientras que + denota el nivel alto.
Las cuatro combinaciones de tratamientos suelen representarse con letras minsculas, como se
muestra en la figura 6-1. Por la figura se observa que el nivel alto de cualquiera de los factores en una com
binacin de tratamientos se denota por la letra minscula correspondiente y que el nivel bajo de un factor
en una combinacin de tratamientos se denota por la ausencia de la letra respectiva. Por lo tanto, a repre06-90

6-60

(31 + 30 4- 29)

Alto J 1 8 * 1 9 * 2 3 )
(2 libras)
^

-S-8

II

Bajo
(1 libra)

a~100

(D-80
(28 4.25 + 27)

(36 4- 32 + 32)

H
+
Bajo
(15%)

Alto
(25%)
Concentracin
del reactivo,
A

Figura 6-1 Combinaciones de los tratamientos en el di~


seo 22.

220

CAPTULO 6 DISEO FACTORIAL

senta la combinacin de tratamientos con ^ en el nivel alto y en el nivel bajo, b representaj4 en el nivel
bajo y B en el nivel alto, y ab representa ambos factores en el nivel alto. Por convencin, se usa (1) para de
notar que ambos factores estn en el nivel bajo. Esta notacin se utiliza en todas las series 2*.
En un diseo factorial con dos niveles, el efecto promedio de un factor puede definirse como el cam
bio en la respuesta producido por un cambio en el nivel de ese factor promediado para los niveles del otro
factor. Asimismo, los smbolos (1), a, b y ab representan ahora el total de las n rplicas hechas con la com
binacin de los tratamientos, como se ilustra en la figura 6-1. Ahora el efecto d e ^ en el nivel bajo d e 5 es
[a - (l)]/n y el efecto d e ^ con el nivel alto de B es {ab - b]/n. Al promediarse estas dos cantidades se obtie
ne el efecto principal de A\
A = ~ {[a b -b ]+ [a -{l)]}

= [ ^ + - ^ - ( 1)]

(6-1)

El efecto principal promedio de 5 se encuentra a partir del efecto deB con el nivel bajo d e^ (es decir,
- (l)]/w) y con el nivel alto de A (o sea, [ab - a]ln) como
B = ^ {[a b -a ]^ [b ~ {\)]}

= ^ [a b + b ~ a -{l)\

(6-2)

El efecto de la interacciiiv4B se define como la diferencia promedio entre el efecto d e ^ con el nivel
alto de B y el efecto de A con el nivel bajo de B. Por lo tanto,
AB = ^ { { a b - b \ - { a - { \ ) \ }

= [ '+ ( l ) - - ]

(6-3)

D e manera alternativa,
puede definirse como la diferencia promedio entre el efecto de B con el
nivel alto de ^ y el efecto de B con el nivel bajo de A . Esto llevar tambin a la ecuacin 6-3.
Las frmulas de los efectos de A, B yA B pueden deducirse con otro mtodo. El efecto de^4 puede en
contrarse como la diferencia en la respuesta promedio de las dos combinaciones de tratamientos situadas
a la derecha del cuadrado de la figura 6-1 (a este promedio se le llama_y^+, porque es la respuesta prome
dio con las combinaciones de tratamientos donde^ est en el nivel alto) y las dos combinaciones de trata
mientos situadas a la izquierda del cuadrado de la figura 6-1 (o y^~). Es decir,

_ ab + a
2n

6-l-(l)
2n

= j;^ [a b + a -b -{l)]
Se trata exactamente del mismo resultado que el de la ecuacin 6-1. El efecto d eB , ecuacin 6-2, se
encuentra como la diferencia entre el promedio de las dos combinaciones de tratamientos de la parte su

6-2 E L

DISEO 2^

221

perior del cuadrado (y+) y el promedio de las dos combinaciones de tratamientos de la parte inferior
(ya-), o

_ab+b
2n

a + ( l)
2n

= [a b + b -a -(l)]
Por ltimo, el efecto de la interaccin ^ 5 es el promedio de las combinaciones de tratamientos de la dia
gonal de derecha a izquierda del cuadrado [ab y (1)] menos el promedio de las combinaciones de trata
mientos de la diagonal de izquierda a derecha (a y b), o

2n

2n

resultado que es idntico a la ecuacin 6-3.


Utilizando el experimento de la figura 6-1, los efectos promedio pueden estimarse como
A = ^ ( 9 0 - 1 - 1 0 0 - 6 0 - 80) = 8.33
S = (90-1-60-100 - 80) = -5 .0 0
2(3)^
A S = - ^ (9 0 -t-80 - 1 0 0 - 60) = 1.67

El efecto de^4 (concentracin del reactivo) es positivo; esto sugiere que al incrementar >1 del nivel bajo
(15%) al nivel alto (25%), el rendimiento se incrementar. El efecto de B (catalizador) es negativo; esto
sugiere que al incrementar la cantidad del catalizador que se agrega al proceso se reducir el rendimien
to. El efecto de la interaccin parece ser pequeo en comparacin con los dos efectos principales.
En muchos experimentos que incluyen diseos 2*, se examinar la magnitud y la direccin de los efec
tos de los factores a fin de determinar las variables que son de posible importancia. En la mayora de los
casos puede usarse el anlisis de varianza para confirmar esta interpretacin. Hay varios paquetes de soft
ware de estadstica excelentes que son tiles para establecer y analizar diseos 2*. Se cuenta tambin con
mtodos especiales que ahorran tiempo cuando los clculos se hacen manualmente.
Considere las sumas de cuadrados de^, B yAB. Observe, por la ecuacin 6-1, que se us un contraste
para estimar A , a saber
Contraste^ =

f e - (1)

(6-4)

A este contraste suele llamrsele el efecto total d e^4. A partir de las ecuaciones 6-2 y 6-3, se observa que
tambin se usan contrastes para estimar B y ^45. Adems, estos tres contrastes son ortogonales. La suma
de cuadrados de cualquier contraste puede calcularse con la ecuacin 3-29, la cual establece que la suma
de cuadrados del contraste es igual al cuadrado del contraste dividido por el nmero de observaciones en

222

CAPTULO 6

DISEO FACTORIAL 2

cada total del contraste multiplicado por la suma de cuadrados de los coeficientes del contraste. Por con
siguiente, se tienen

(6-6)
y

_ K + (l)-g -r
como las sumas de cuadrados de
5 y AB.
Al utilizar el experimento de la figura 6-1, las sumas de cuadrados de las ecuaciones 6-5,6-6 y 6-7 pue
den encontrarse como
-

. = ^ ^

208.33
= 75.00

(6-8)

y
55

-(1 2 )1 -8 3 3
4(3)

La suma de cuadrados total se encuentra como de costumbre, es decir,


S i, =

) ' l -

En general, 55^ tiene 4n - 1 grados de libertad. La suma de cuadrados del error, con 4(/i
bertad, suele calcularse por sustraccin como
SS^ = SSj - SS^ - SSg - S S ^

(6-9)
1) grados de li
(6-10)

Para el experimento de la figura 6-1, se obtiene


y2
i^i

k^i

4(3)

= 9398.00 - 9075.00 = 323.00

S S, = S S ^ ~ S S ^ - S S , - S S ^
= 3 2 3 .0 0 - 208.33- 75.00 - 8.33
= 31.34
al utilizar 55^, SSg y 5 5 ^ de la ecuacin 6-8. En la tabla 6-1 se resume el anlisis de varianza completo.
Con base en los valores P, se concluye que los efectos principales son estadsticamente significativos y que
no hay interaccin entre estos factores. Esto confirma la interpretacin de los datos que se hizo original
mente con base en las magnitudes de los efectos de los factores.
Con frecuencia resulta conveniente escribir las combinaciones de los tratamientos en el orden (l),a,

6-ZaDISE0 2>
labia 6-1

Fuente de
variacin
A
B
AB
Error
Tbtal

223

Anlisis de varianza del experimento de la figura 6-1

Suma de
cuadrados
208.33
75.00
8.33
31.34
323.00

Cuadrado
medio
208.33
75.00
8.33
3.92

Grados de
libertad
1
1
1
8
11

P,
53.15
19.13
2.13

Valor P
0.0001
0.0024
0.1826

b, ab. Se hace referencia a esto como el orden estndar (u orden de Yates, por el Dr. Frank Yates). Al
utilizar este orden estndar, se observa que los coeficientes de los contrastes usados para estimar los
efectos son
Efectos
A:
B:
AB:

(1)
-1
-1
+1

a
+1
-1
-1

b
-1
+1
-1

ab
+1
+1
+1

Observe que los coeficientes de los contrastes para estimar el efecto de la interaccin son slo el producto
de los coeficientes correspondientes de los dos efectos principales. El coeficiente de un contraste es siem
pre + 1 o -1 , y puede usarse una tabla de signos positivos y negativos como la tabla 6-2 para determinar el
signo correcto para cada combinacin de tratamientos. Los encabezados de las columnas de la tabla 6-2
son los efectos principales (A y B), la interaccin
e /, que representa el total o promedio del experi
mento completo. Observe que la columna que corresponde a / incluye nicamente signos positivos. Las
etiquetas de los renglones son las combinaciones de los tratamientos. Para encontrar el contraste para es
timar cualquier efecto, simplemente se multiplican los signos de la columna apropiada de la tabla por la
combinacin de tratamientos correspondiente y se hace la suma. Por ejemplo, para estim ar, el contras
te es -(1 ) + a - b + ab, que concuerda con la ecuacin 6-1.
1 m odelo de regresin

En un diseo factorial 2^ es sencillo expresar los resultados del experimento en trminos de un modelo de
regresin. Puesto que 2* es tan slo un diseo factorial, podra usarse un modelo de los efectos o de las
medias, pero el enfoque del modelo de regresin es mucho ms natural e intuitivo. Para el experimento
del proceso qumico de la figura 6-1, el modelo de regresin es

donde ATi es una variable codificada que representa la concentracin del reactivo yx^ es una variable codi
ficada que representa la cantidad del catalizador y las/3 son los coeficientes de regresin. La relacin en
labia 6'2

Signos algebraicos para calcular los


efectos en el diseo V

Combinacin de
tratamientos
(1)
a
b
ab

I
+
+
+
+

Efecto factorial
B
AB
A
+
+
+
+
+
+

224

CAPTULO 6

DISEO FACTORIAL Zi"

tre las variables naturales la concentracin del reactivo y la cantidad de catalizador y las variables
codificadas es
Concentracin-(Concentracin
+ Concentracin^,^) / 2
^

(Concentracin

- Concentracin

)/ 2

y
Catalizador - (Catalizador^^.^ +Catalizador^g) / 2
X

--------------------------------------------------------------------------------------------------------------- -------------

(Catalizador^, - Catalizador^^.^) / 2

Cuando las variables naturales slo tienen dos niveles, esta codificacin producir la familiar nota
cin 1 para los niveles de las variables codificadas. Para ilustrar esto en el ejemplo tratado, observe que
_ Concentracin - (15+ 25) / 2
( 2 5 - 1 5 ) /2
__ C oncentracin-20
_
Por lo tanto, si la concentracin est en el nivel alto (Concentracin = 25%), entonces ati = +1; si la con
centracin est en el nivel bajo (Concentracin = 15%), entonces
= -1 . Adems,
Catalizador- (1 + 2) / 2
(2 - l) /2
_ Catalizador-1.5
~

05

Por lo tanto, si el catalizador est en el nivel alto (Catalizador = 2 libras), entonces


dor est en el nivel bajo (Catalizador = 1 libra), entonces X2 = -1.
El modelo de regresin ajustado es
S= 2 7 .5 +

1^8.33^
2

x,1 +

= +1; si el cataliza

f- 5 .0 0 \
l

donde la ordenada al origen es el gran promedio de las 12 observaciones, y los coeficientes de regresin
y

mitad de las estimaciones de los efectos de los factores correspondientes. La razn de que el

coeficiente de regresin sea la mitad de la estimacin del efecto es que un coeficiente de regresin mide el
efecto de un cambio unitario enAC sobre la media de y, y la estimacin del efecto se basa en un cambio de
dos unidades (de -1 a -1-1), Se demostrar ms adelante que este mtodo simple para estimar los coefi
cientes de regresin consiste en producir las estimaciones de mnimos cuadrados de los parmetros. Ver
tambin el material suplementario de este captulo.
Residuales y adecuacin del m odelo

El modelo de regresin puede usarse para obtener el valor predicho o ajustado de y en los cuatro puntos
del diseo. Los residuales son las diferencias entre el valor observado y el valor ajustado de y. Por ejem
plo, cuando la concentracin del reactivo est en el nivel bajo {x^ = -1 ) y el catalizador est en el nivel bajo
(x2 = -1 ), el rendimiento predicho es
p = 2 7 .5 +
= 25.835

(8 .33 ]

( - 5 .0 0 \
( - 1)+

( - 1)

6-2 EL DISEO V

225

Hay tres observaciones en esta combinacin de tratamientos, y los residuales son


= 2 8 -2 5 .8 3 5 = 2.165
= 2 5 - 25.835=-0.835
= 2 7 - 25.835=1.165
Los valores predichos y los residuales restantes se calculan de manera similar. Para el nivel alto de la con
centracin del reactivo y el nivel bajo del catalizador,
>'=27.5+

f8.33\

(+ 1)+

f'-5.00'\

( - 1)

= 34.165

e, = 3 6 -3 4 .1 6 5 = 1 .8 3 5
C; = 3 2 - 3 4 .1 6 5 = -Z 165
= 3 2 - 34.165=-2.165
Para el nivel bajo de la concentracin del reactivo y el nivel alto del catalizador,
>>=27.5+

/8.33\

( 1)+

M.OO

(+ 1)

= 20.835

e, = 1 8 - 20.835 = -2 .8 3 5
= 1 9 - 2 0 .8 3 5 = -1 .8 3 5
e, = 2 3 - 20.835 = 2165
Por ltimo, para el nivel alto de ambos factores,
a aaN
r-5.00^
>>=27.5+ ^
(+ 1 )+
(+ 1)
= 29.165

= 3 1 -2 9 .1 6 5 = 1 .8 3 5
= 30 - 29.165 = 0.835
Ci, = 29 - 29.165=-0.165
En la figura 6-2 se presenta una grfica de probabilidad normal de estos residuales y una grfica de los re
siduales contra el rendimiento predicho. Estas grficas parecen ser satisfactorias, por lo que no hay razn
para sospechar problemas con la validez de las conclusiones.
La superficie de respuesta
El modelo de regresin

5>=27.5+

/8.33'\

M .o o \
J1 +

226

CAPITULO 6

DISEO FACTORIAL Zi-

Residual
d) Grfica de probabilidad normal

2.167

20.83

23.06

25.28
27.60
29.72
Rendimiento predicho

31.94

34.17

6) Residuales contra el rendimiento predicho


Fig u ra 6-2

Grficas de los residuales para el experimento del proce

so qumico,

puede usaise para generar grficas de superficie de respuesta. Si se desea construir estas grficas en trminos
de los niveles de los factores naturales, entonces simplemente las relaciones entre las variables naturales y las
codificadas que se dieron anteriormente se sustituyen en el modelo de regresin, de donde se obtiene
j)= 27.5+

/'8.33'| Concentracin - 20
f-5 .0 0 )/ C atalizador-1.5
+
2
2 \
5
0.5

= 18.33+0.8333Concentracin - 5.00Catalizador
En la figura 6-3a se presenta la grfica de superficie de respuesta tridimensional del rendimiento de
este modelo, y la figura 6-3b es la grfica de contorno. Puesto que el modelo es de primer orden (es decir,
contiene tnicamente los efectos principales), la superficie de respuesta ajustada es un plano. Al examinar

6-2 EL DISEO 22

227

34.17

29.72 -

2S.28 -

25.00
23.00

<^1.600

1.400

21.00

19.00
17.00

Vq. 1.000 15.00


o) Superficie de respuesta

Concentracin del reactivo


6) Grfica de contorno

Figura 6-3 Grfica de la superficie de respuesta y grfica de contorno del


experimento del proceso qumico.

la grfica de contorno se observa que el rendimiento aumenta cuando la concentracin del reactivo se in
crementa y la cantidad de catalizador disminuye. Frecuentemente se usa una superficie ajustada como
sta para encontrar la direccin del mejoramiento potencial de un proceso. Una manera formal de hacer
esto, llamada mtodo del ascenso ms pronunciado, se presentar en el captulo 11 cuando se estudien los
mtodos para realizar la exploracin sistemtica de las superficies de respuesta.

228

CAPTULO 6

6-3

EL DISEO 2^

DISEO FACTORIAL 2'-

Suponga que tres factores,^, B y C , cada uno con dos niveles, son de inters. Al diseo se le Uama diseo
factorial 2*, y en este caso la representacin geomtrica de las ocho combinaciones de tratamientos puede
hacerse con un cubo, como se muestra en la figura 6-Aa. Utihzando la notacin + y
para representar
los niveles alto y bajo de los factores, las ocho corridas del diseo 2^ pueden enhstarse como en la figura
6-46. Se le conoce en ocasiones como la matriz del diseo. Haciendo una ampliacin de la notacin de las
etiquetas revisada en la seccin 6-2, las combinaciones de los tratamientos en el orden estndar se escri
ben como (1), a, b, ab, c, ac, be y abe. Recuerde que estos smbolos representan tambin el total de las n
observaciones hechas con esa combinacin de tratamientos particular.
Existen en realidad tres notaciones diferentes para las corridas del diseo 2^ que son de uso general.
La primera es la notacin -I- y llamada con frecuencia notacin geomtrica. La segunda es el uso de las
etiquetas en letras minsculas para identificar las combinaciones de los tratamientos. La tercera y ltima
notacin utiliza 1 y Opara denotar los niveles alto y bajo, respectivamente, de los factores, en lugar de
+ y - . Estas diferentes notaciones se ilustran enseguida para el diseo 2^;

Corrida
1
2
3
4
5
6
7
8

Etiquetas

+
+

+
+ +

0
1
0
1
0
1
0
1

(1)

a
b
ab
c
ac
be

-1+
+
-1-

B
0
0
1
1
0
0
1
1

abe

c
0
0
0
0
1
1
1
1

Hay siete grados de libertad entre las ocho combinaciones de tratamientos del diseo 2^. H es grados
de libertad se asocian con los efectos principales d e^ , B y C. Cuatro grados de libertad se asocian con las
interacciones; uno con cada una de las interacciones AB, A C y B C y uno con la interaccin ABC.
Considere la estimacin de los efectos principales. Primero, considere la estimacin del efecto principaM . El efecto de A cuando B y C estn en el nivel bajo es [a - (!)]/. D e manera similar, el efecto d e ^

Factor
Corrida
1
2
3
4
5
6
7
8

+
Bajo

Alto
Factor A
a)

Figura 6-4 El diseo factorial 2.

Vista geomtrica

C
-

+
-

+
+

+
+

b) La matriz del diseo

6-3 EL DISEO V

229

cuando B est en el nivel alto y C est en el nivel bajo es [ab -b]ln. El efecto de A cuando C est en el nivel
alto y B est en el nivel bajo es [ac - c]/. Por ltimo, el efecto d e ^ cuando tanto B como C estn en el ni
vel alto es [abc-bc\ln. Por lo tanto, el efecto promedio de^4 es slo el promedio de estos cuatro efectos, o
A = ^ [a -(l)+ a b -b + a c -c + a b c -b c ]
An

(6-11)

Esta ecuacin tambin puede desarrollarse como un contraste entre las cuatro combinaciones de tra
tamientos de la cara derecha del cubo de la figura 6-5a (donde ^ est en el nivel alto) y las cuatro de la
cara izquierda (donde^4 est en el nivel bajo). Es decir, el efecto d e ^ es slo el promedio de las cuatro co
rridas donde^ est en el nivel alto fy^+) menos el promedio de las cuatro corridas donde^ est en el nivel
bajo
o
^=^yA^~yAa+ab+ac+abc

(l)+ b + c+ b c
4n

Esta ecuacin puede reescribirse como


A = [a+ab + a c + a b c ~ ( l ) b - c bc]
4n
que es idntica a la ecuacin 6-11.

a) Efectos principales

AB

AC
6) Interaccin de dos factores

c) Interaccin de los tres factores

Figura 6-5 Representacin geomtrica de los contrastes que corresponden a


los efectos principales y las interacciones del diseo 2^

230

CAPTULO 6

DISEO FACTORIAL

D e manera similar, el efecto de 5 es la diferencia en los promedios entre las cuatro combinaciones de
tratamientos de la cara frontal del cubo y las cuatro de la cara posterior. Se obtiene as

= ^ \ b + a b + b c + a b c - < l ) a c ac]
An

(6-12)

El efecto de C es la diferencia en los promedios entre las cuatro combinaciones de tratamientos de la cara
superior del cubo y las cuatro de la cara inferior, es decir,

= ^ [c+ ac+ bc+ ab c-{V )-a-b -ab]


An

(6-13)

Los efectos de la interaccin de dos factores pueden calcularse con facilidad. Una medida de la interaccin^S es la diferencia entre los efectos promedio deyl con los dos niveles de B. Por convencin, a la
mitad de esta diferencia se le llama la interaccin AB. Utilizando smbolos,

Efecto promedio de

Alto ( + )

[(a b c -b c )+ (a b -b )]

Bajo (-)

{ (a c -c )+ [g -(!)]}
2n
[abe - b c + ab - b - a c + c - a + ( l ) ]

2n

Diferencia

Zn

Puesto que la interaccin A B es la mitad de esta diferencia,

4n
La ecuacin 6-14 puede escribirse de la siguiente manera;
a b c+ a b + c+ (l)

bc+b+ac+a

4n

4n

En esta forma, resulta fcil ver que la interaccin


es la diferencia en los promedios entre las corridas
de dos planos diagonales del cubo de la figura 6-56, Utilizando un razonamiento lgico similar y con refe
rencia a la figura 6-5b, las interacciones A C y B C son
AC = ^ [(l)-a + b -a b -c + a c -b c -i-u b c ]

(6-15)

BC = ^ [ ( ) + a - b - a b - c - a c + b c + a b c ]
4n

(6-16)

6-3

La interaccin ABC se define como la diferencia promedio entre la interaccin


rentes niveles de C. Por lo tanto,

ELDISEO 2^

231

para los dos dife

ABC = { [ a b e - b e ] - [ a c - c ] - [ a - ] + [ a - (1)]}
= -^ [a b c-b c -a c+ c-a b + b + a -(l)]

(6-17)

Como antes, la in tera c ci n ^ C puede considerarse como la diferencia de dos promedios. Si se aslan las
corridas de los dos promedios, stas definen los vrtices de los dos tetraedros que componen el cubo de la
figura 6-5c.
En las ecuaciones 6-11 a 6-17, las cantidades entre corchetes son contrastes de las combinaciones de
los tratamientos. Es posible desarrollar una tabla de signos positivos y negativos a partir de los contrastes,
la cual se muestra en la tabla 6-3. Los signos de los efectos principales se determinan asociando un signo
positivo con el nivel alto y un signo negativo con el nivel bajo. Una vez que se han establecido los signos de
los efectos principales, los signos de las columnas restantes pueden obtenerse multipHcando las columnas
precedentes apropiadas, rengln por rengln. Por ejemplo, los signos de la columna A 5 son el producto
de los signos de la columna A y la columna 5 en cada rengln. El contraste de cualquier efecto puede ob
tenerse fcilmente con esta tabla.
La tabla 6-3 tiene varias propiedades interesantes: 1) Con excepcin de la colum na/, cada una de las
columnas tienen el mismo nmero de signos positivos y negativos. 2) La suma de los productos de los sig
nos de dos columnas cualesquiera es cero. 3) La columna / multiplicada por cualquiera de las columnas
deja la columna sin cambio. Es decir, I es un elemento identidad. 4) El producto de dos columnas cuales
quiera produce una columna de la tabla. Por ejemplo, A x B = AB, y

ABxB=AB^ =A
Se observa que los exponentes de los productos se forman utilizando la aritmtica mdulo 2. (Es decir, el
exponente slo puede ser Oo 1; si es mayor que 1, se reduce con mltiplos de 2 hasta que es Oo 1.) Todas
estas propiedades se derivan de la ortogonahdad de los contrastes usados para estimar los efectos.
Las sumas de cuadrados de los efectos se calculan con faciUdad, ya que cada efecto tiene un contraste
correspondiente con un solo grado de libertad. En el diseo 2^ con n rpUcas, la suma de cuadrados de
cualquier efecto es
(Contraste)^
(6-lS)

Tabla 6 -3

Signos algebraicos para calcular los efectos del diseo 2^

Combinacin de
tratamientos
(1)
a
b
ab
c
ac
be
abe

I
-1+
+
+
-1-1-1-1-

+
+
+
-1-

+
-H

Efecto factorial
C
_
+

AB

BC

-1-

+
+

__

-H
+

AC

-1+
+
+

__

__

-1+

ABC

_
+
-H
+
_

232

CAPTULO 6 DISEO FACTORIAL 1'^

EJEMPLO .........................................................................................................................................................
Recuerde el ejemplo 5-3, donde se present un estudio del efecto del porcentaje de carbonatacin, la pre*
sin de operacin y la velocidad de lnea sobre la altura de llenado de una bebida carbonatada. Suponga
que slo se usan dos niveles de carbonatacin, de tal modo que el experimento es un diseo factorial 2^
con dos rplicas. Los datos (es decir, las desviaciones de la altura de llenado de especificacin) se mues
tran en la tabla 6-4, y en la figura 6-6 se presenta la representacin geomtrica del diseo.
Al utilizar los totales bajo las combinaciones de los tratamientos que se muestran en la tabla 6-4, los
efectos de los factores pueden estimarse de la siguiente manera:
A = [ a - { \.) + a b - b + a c - c+ abc-bc]
4n
= i[l_ (-4 )+ 5 -(-i)+ 3 -(-l)+ ll-2 ]
= i[24]=a00
B = \ b + a b + b c + a b c - ( l ) a ~ c ac]
4n
= \[-l+ 5 + 2 + n -i-4 )-l-i-l)-3 ]
O
= i[1 8 ]= 2 .2 5
C = \c + a c + b c+ a b c-(l)-a -b -a b ]
4n
= i[_l +3 + 2 + ll-(-4 )-l-(-l)-5 ]
= - [ 1 4 ] = 1.75
AB = \aba b + ( l ) + a b c - b c ac+c]
4n
= ^ [5 -l-(-l)+ (-4 )+ ll~ 2 -3 + (-l)]
O

8
Tabla 6 -4

[6] =0. 75

El experimento de la altura de llenado, ejemplo 6 4

Desviacin de la
altura de llenado

Factores codificados
Corrida
1
2
3
4
5
6
7
8

Rplica 1

Rplica 2

1
1
1
1
1
1

-1
-1
-1
-1
1
1
1
1

-3
0
-1
2
-1
2
1
6

-1
1
0
3
0
1
1
5

1
1
1
1
1

Niveles del factor

Bajo (-1)
A (psi)
10
B (psi)
25
C (b/min) 200

Alto (-1-1)
12
30
250

..

6-3 EL DISEO 2
6c = 2

233

abe =11

Figura 6-6 El diseo 2^ para el experimento de la desviacin de


la altura de llenado del ejemplo 6-1.

AC = [ ( ! ) - a + b -a b -c + a c -b c + a b c ]
= i[-4 -l+ (-l)-5 _ (-l)+ 3 _ 2 + ii]
= i [2] =0. 25
BC = ^ [ ( l ) + a - b - a b - c - a c + b c + a b c ]
= i[_4+ l_(_l)_5_(_l)_3+ 2+ ll]
= -g[4]=0.50

ABC= [a b c -b c -a c + c -a b + b + a -(l)]
4n
= [11-2-3+(-1)-5+(-1)+1-(-4)]
= i [4] =0. 50
Los efectos ms grandes son para la carbonatacin {A = 3.00), la presin (B = 2.25), la velocidad (C =
1.75) y la interaccin carbonatacin-presin (AB = 0.75), si bien el efecto de la interaccin no parece te
ner un impacto tan grande sobre la desviacin de la altura de llenado como los efectos principales.
Las sumas de cuadrados se calculan con la ecuacin 6-18 de la siguiente manera:

ss.
A

ss.
SSrL

(24y
16

= 36.00

_ (18)' = 20.25
16

_ (14)'
16

= 12.25

CAPITULO 6 DISEO FACTORIAL Zi*

234

Tabla 6 -5

Resum en de la estim acin de los efectos del ejemplo 6-1

Factor
A
B
C
AB
AC
BC
AB C
Error puio
Total

Estimacin
del efecto

Sumas de
cuadrados

Contribucin
porcentual

3.00
2.25
L75
0.75
0.25
0.50
0.50

36.00
20.25
12.25
2.25
0.25
LOO
LOO
5.00
78.00

46.1538
25.9615
15.7051
2.88462
0.320513
1.28205
1.28205
6.41026

_ (6 f
16
_(2)^
s s ,c

16
_(4)^

ss,c

16

_(4)^
16

= 2.25
= 0.25
= L00

- = L00

La suma de cuadrados total es SSj- = 78.00, y por sustraccin, SS^ = 5.00. En la tabla 6-5 se resumen las
estimaciones de los efectos y las sumas de cuadrados. La columna etiquetada contribucin porcentual
mide la contribucin porcentual de cada uno de los trminos del modelo a la suma de cuadrados total. La
contribucin porcentual es con frecuencia una gua aproximada pero efectiva de la importancia relativa
de cada trmino del modelo. Observe que los efectos principales dominan en realidad este proceso, expli
cando ms de 87% de la variabilidad total, mientras que la interaccin A B explica menos de 3%.
El anlisis de varianza de la tabla 6-6 puede usarse para confirmar la magnitud de estos efectos. Por la
tabla 6-6 se observa que los efectos principales son altamente significativos (todos tienen valores P muy

Tabla 6 -6

Anlisis de varianza de los datos de la altura de llenado

Fuente de
variacin

Suma de
cuadrados

Grados de
libertad

Cuadrado
medio

Porcentaje de carbonatacin (A)


Presin (B)
Velocidad de lnea (C)
AB
AC
BC
ABC
Error
Total

36.00
20.25
12.25
2.25
0.25
LOO
1.00
5.00
78.00

1
1
1
1
1
1
1
8
15

36.00
20.25
12.25
??5
0.25
LOO
1.00
0.625

'o
57.60
32.40
19.60
3.60
0.40
1.60
1,60

Valor P
<0.0001
0.0005
0.0022
0.0943
0.5447
0.2415
0.2415

6-3 EL DISEO 2

235

pequeos). La interaccinAB es significativa con un nivel aproximado de 10%; por lo tanto, existe una li
gera interaccin entre la carbonatacin y la presin.
Quiz el lector quiera referirse al ejemplo 5-3 para la interpretacin prctica de este experimento.
Los responsables del proceso decidieron correrlo con presin baja y velocidad de linea alta, y reducir la
variabilidad de la carbonatacin controlando con mayor precisin la temperatura. Se consigui as una
reduccin sustancial en la desviacin de la altura de llenado del valor objetivo.

El modelo de regresin y la superficie de respuesta


El modelo de regresin para predecir la desviacin de la altura de llenado es

1.00 +

'3.00^

(1.15\

(2.25\

(0J5\

X2 +

donde las variables codificadas


y representan a A , B y C , respectivamente. El trmino
es la in
teraccin AB. Los residuales pueden obtenerse como la diferencia entre las desviaciones de la altura de
llenado observada y la predicha. El anlisis de estos residuales se deja como ejercicio para el lector.
En la figura 6-7 se muestra la superficie de respuesta y la grfica de contorno para la desviacin de la
altura de llenado obtenida con el modelo de regresin, suponiendo que la velocidad de lnea est en el ni
vel alto (X2 = 1). Observe que como el modelo contiene la interaccin, las lneas de contorno de la desvia
cin de las alturas de llenado constantes son curvas (o la superficie de respuesta es un plano torcido).
Es deseable operar este proceso de llenado de tal modo que la desviacin del Uenado est tan cerca de
cero como sea posible. La grfica de contorno indica que si la velocidad de lnea est en el nivel alto, en
tonces hay varias combinaciones de los niveles de la carbonatacin y la presin que satisfarn este objeti
vo. Sin embargo, ser necesario ejercer un control preciso de estas dos variables.
Solucin por computadora
Hay muchos paquetes de software de estadstica que establecern y analizarn diseos factoriales con dos
niveles. La salida de uno de estos programas de computadora, Design-Expert, se muestra en la tabla 6-7.
En la parte superior de la tabla se presenta el anlisis de varianza del modelo completo. El formato de
esta presentacin es un tanto diferente de los resultados dados en la tabla 6-6. Observe que el primer ren
gln del anlisis de varianza es un resumen global del modelo completo (todos los efectos principales y las
interacciones), y la suma de cuadrados del modelo es
+ S S , +SS^ + S S ^

= 7ao
Por lo tanto, el estadstico
0.63

15.69

est probando las hiptesis


' 01 ~ ^2 ~ ^3 ~ ^12 ~ 03 ~
i j : al menos una
O

~ ^123 O

236

CAPTULO 6

DISEO FACTORIAL 2^

-0.3750

30.00
12.00

25.00 10.00
a) La superficie de respuesta

Crbonatacin
61 La grfica de contorno

Figura 6-7 Superficie de respuesta y grfica de contorno de la desvia


cin de la altura de llenado, con la velocidad en el nivel alto (250 bpm),
ejemplo 6-1.

Tabla 6-7

Salida de Desigri'Expert para el ejemplo 6-1

Response: Fill Deviation in Hdlght


AIMOVA for SoiMted Factorial Modal
Analysis of varlam tabla [Partial sum of aquaras]
Sum of
Valu
Squara
DF
Squaras
Source
16.69
10.43
73.00
Model

A
B
C
AB
AC
BC
ABC
Residual

LackofFit
Pur Error
Cor Total
Std. Dav.
Mean
C.V.
PRESS
Factor
Intercept
A-Carbonation
B-Pressure
C'Spaed
AB
AC
BC
ABC

36.00
20.25
12.2S
2.25
0.25
1.00

36.00
20.25
12.25
2.25
0.25
1.00
1.00

.00
0.83

5.00

O
8

0.63

78.00

15

5.00
0.000

1.00
79.06

20.00
Coefficiant
Estmate

DF

1.00
1.50
1.13
0.88
0.38
0.13
0.25
0.25

sgnificant

<0.0001
0.0005
0.0022
0.0943
0.5447
0.2415
0.2415

57.60
32.40
19.60
3.60
0.40
1.60
1.60

R-Squared
Adj R-Squared
Pred R'Squarad
Adeq Precisin

0.79

Prob> F
0.0003

0.9359
0.8798
0.7436
13.416

Standard
Error
0.20
0.20
0.20
0.20
0.20
0.20
0.20
0.20

95% Cl
Low
0.54
1.04
0.67
0.42
-0.081
-0.33
-0.21
-0.21

95% a
High
1.46
1.96
1.58
1.33
0.83
0.58
0.71
0.71

VIF
1.00
1.00
1.00
1.00
1.00
1.00
1.00

Final Equation in Terma of Ceded Factora:


Fill Deviation =
+ 1.00
+ 1.50 *A
+ 1.13*8
+0.88 *C
+0.38 *A *B
+0.13 *A *C
+0.25 *B *C
+0.25 *A *B *C
Final Equation in Terma of Actual Factora:
Fill Deviation =
-225.50000
+21.00000 *Carbonation
+7.80000 *Pressura
+1.08000 Speed
-0.75000 *Carbonation *Pressure
-0.10500 *Cairbonation *Speed
-0.040000 *Pressura *Speed
+4.00000E-00: *Carbonation *Pressura *Spead
Raducad Modal:
Responso: Rll Deviation in Hoight
ANOVA for Salectad Factorial Modal
Analysis of varianca tabla [Partial aum of squaroa]
237

Tabla 6'7

(continuacin)

Sum of
Squares

Source

Model

Residual

70.75

A
B
C
AB

36.00
20.25
12.25
2.25
7.25
2.25
5.00
78.00

Lack ofFit
Pur Error
Cor Total
Std. Dev.
Mean
C.V.
PRESS

Mean
Sc]uare

F
Valu

1
1
1
1
11

36.00
20.25
12.25
2.25

54.62
30.72
18.59
3.41

0.75
0.63

DF

17.69

15

81.18
15.34
Coefficlent
Estmate

Intercept
A-Carbonation
B-Pressure
C-Speed
AB

significant

0.0917

1.20

0.3700

R-Squared
Adj R-Squared
Pred R-Squared
Adeq Precisin

1.00

Factor

Prob>F
< 0.0001
< 0.0001
0.0002
0.0012

0.66

0.81

26.84

DF

0.9071
0.8733
0.8033
15.424

Standard
Error

0.20
0.20
0.20
0.20
0.20

1.00

1.50
1.13
0.88

0.38

not sgnificant

95% Cl

9 5 % Cl

Low

High

0.55
1.05
0.68
0.43
-0.072

1.45
1.95
1.57.
1.32
0.82

VIF

1.00
1.00
1.00
1.00

Final Equation in Terms of Coded Factors:

FIN Deviation =
+ 1.00
+ 1.50 *A
+ 1.13 *B
+0.88 *C
+0.38 *A *B

Final Equation in Terms of Actual Factors:

Fill Deviation =
+9.62500
-2.62500 *Carbonaton
1.20000 *Pressure
+0.035000 *Speed
+0.15000 *Carbonation ^Pressure

Diagnostics Case Statistics


indard Actual Predicted
Order
Valu
Valu

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

238

-3.00
-1.00
0.000
1.00
-1.00
0.000
2.00
3.00
-1.00
0.000
2.00
1.00
1.00
1.00
6.00
5.00

-2.13
-2.13
0.12
0.12
-0.63
-0.63
3.13
3.13
-0.37
-0.37
1.88
1.88
1.13
1.13
4.88
4.88

Residual

-0.88
1.13
-0.12
0.88
-0.38
0.63
-1.13
-0.13
-0.63
0.37
0.13
-0.88
-0.13
-0.13
1.13
0.13

Leverage

0.313
0.313
0.313
0.313
0.313
0.313
0.313
0.313
0.313
0.313
0.313
0.313
0.313
0.313
0.313
0.313

Student
Residual

-1.300
1.671
-0.186
1.300
-0.557
0.928
-1.671
-0.186
-0.928
0.557
0.186
-1.300
-0.186
-0.186
1.671
0.186

Cook's
Distance

0.154
0.254
0.003
0.154
0.028
0.078
0.254
0.003
0.078
0.028
0.003
0.164
0.003
0.003
0.254
0.003

Outlier
t

-1.347
1.845
-0.177
1.347
-0.539
0.922
-1.845
-0.177
-0.922
0.539
0.177
-1.347
-0.177
-0.177
1.845
0.177

6-3 ELDISEO 2^

239

Puesto que F es grande, se concluira que al menos una de las variables tiene un efecto diferente de cero.
Entonces se prueba la significacin de cada efecto factorial individual utilizando el estadstico F. Estos re
sultados concuerdan con la tabla 6-6.
Abajo del anlisis de varianza del modelo completo se presentan varios estadsticos R^. La
ordina
ria es
2 _ ^^ModelQ _ ^3.00 _ -j Q78.00

y mide la proporcin de la variabilidad total explicada por el modelo. Un problema potencial con este es
tadstico es que siempre se incrementa cuando se agregan factores al modelo, incluso cuando estos facto
res no son significativos. El estadstico R^ gustada, definido como

78.00/15
es un estadstico que est ajustado para el tamao del modelo; es decir, para el nmero de factores. La
R^ ajustada puede decrecer en realidad si se agregan trminos no significativos al modelo. El estadstico
PRESS es una medida de qu tan bien predecir datos nuevos el modelo (PRESS es en realidad el acrnimo de Prediction Error Sum ofSquares suma de cuadrados del error de prediccin y se calcula a partir
de los errores de prediccin obtenidos al predecir el punto i-simo de los datos con un modelo que incluye
todas las observaciones, excepto la i-sima). Un modelo con un valor pequeo de PRESS indica que es po
sible que el modelo sea un buen predictor. El estadstico R^ de prediccin se calcula como
,

^ PRESS

P red icc i n

20.00
q q

'

Esto indica que se esperara que el modelo completo explique cerca de 74% de la variabilidad de los datos
nuevos.
La siguiente seccin de la salida presenta el coeficiente de regresin de cada trmino del modelo y el
error estndar (se, standard error) de cada coeficiente, definido como

2(8)
^^^= 0.20
Los intervalos de confianza de 95% para cada coeficiente de regresin se calculan a partir de
^ 0.0 1 5 ,N - p ^ ^ 0 )

0.015,

donde los grados de libertad de t es el nmero de grados de libertad del error; es decir, N es el nmero to
tal de corridas en el experimento (16), yp es el nmero de parmetros del modelo (8). Tkmbin se presen
ta el modelo completo en trminos de las variables codificadas y de las variables naturales.
En la ltima seccin de la tabla 6-7 se ilustra la salida despus de eliminar los trminos de las interac
ciones no significativas. Este modelo reducido contiene ahora slo los efectos principales^, B y C, y la
interaccin^^. La suma de cuadrados de los residuales o del error se compone ahora de un componen
te del error puro (Pur Error) que surge de las rplicas de los ocho vrtices del cubo, y un componen
te de falta de ^uste (Lack of Fit), compuesto por las sumas de cuadrados de las interacciones que se
eliminaron del modelo (BC, A C y ABC). D e nueva cuenta, la representacin del modelo de regresin
de los resultados experimentales se presenta en trminos de las variables codificadas y las variables na

240

CAPTULO 6 DISEO FACTORIAL 2

turales. La proporcin de la variabilidad total de la desviacin de la altura del llenado que se expKca por
este modelo es
^2 ^ ^^Moddo _ 7 ^ ^
78.00
que es menor que lai^ del modelo completo. Observe, sin embargo, que lai?^ ajustada del modelo reduci
do apenas ha cambiado ligeramente respecto de \&R^ ajustada del modelo completo, y PRESS del mode
lo reducido es considerablemente menor, lo cual produce un valor ms grande de Jtpredicda
modelo
reducido. Evidentemente, la eliminacin de los trminos no significativos del modelo completo ha produ
cido un modelo final que posiblemente funcionar con mayor eficiencia como predictor de datos nuevos.
Observe que los intervalos de confianza para los coeficientes de regresin del modelo reducido son lige
ramente ms cortos que los intervalos de confianza correspondientes en el modelo completo.
En la tiltima seccin de la sahda se presentan los residuales del modelo reducido. Design-E^ert tam
bin construir todas las grficas de los residuales que se estudiaron anteriormente.
Otros mtodos para evaluar la significacin de los efectos
El anlisis de varianza es una manera formal de determinar cules son los efectos de los factores que son
diferentes de cero. Existen varios mtodos ms que son tiles. A continuacin se indica cmo calcular el
error estndar de los efectos y cmo usar los errores estndar para construir intervalos de confianza para
los efectos. Otro mtodo, que se ilustrar en la seccin 6-5, utiliza grficas de probabilidad normal para
valorar la importancia de los efectos.
Es sencillo encontrar el error estndar de un efecto. Si se supone que hay rplicas en cada una de las
2*= corridas del diseo, y si
y,2, ...,
son las observaciones de la corrida i-sima, entonces

es una estimacin de la varianza de la corrida /-sima. Las estimaciones de la varianza del diseo 2* pue
den combinarse para dar una estimacin de la varianza global:

sta es tambin la estimacin de la varianza dada por el cuadrado medio del error en el anhsis de varian
za. La varianza de la estimacin de cada efecto es
K(Efecto) = K

('Contraste
1

K(Contraste)

Cada contraste es una combinacin lineal de los 2* totales de los tratamientos, y cada total consta de n ob
servaciones. Por lo tanto,
F(Contraste) = n i o

6-3 EL DISEO 2

241

y la varianza de un efecto es

^
2a

4 ^
El error estndar estimado se encontrara sacando la raz cuadrada de esta ltima expresin y sustituyen
do
con su estimacin S^\
se(Efecto) =

(6-20)

Observe que el error estndar de un efecto es el doble del error estndar de un coeficiente de regre
sin estimado en el modelo de regresin del diseo 2*^(ver la salida de computadora de Design-Expert del
ejemplo 6-1).
Los intervalos de confianza de 100(1 - a) por ciento para los efectos se calculan a partir de Efecto
ta/2 jvV(Efecto), donde los grados de libertad de t son slo los grados de libertad de los residuales o del
error (N - p = nmero total de corridas - nmero de parmetros del modelo).
Para ilustrar este mtodo, considere el experimento de la desviacin de la altura de llenado del ejem
plo 6-1. El cuadrado medio del error esMS^ = 0.625. Por lo tanto, el error estndar de cada efecto es (uti
lizando 5^ = MS e)
^
se(Efecto) =

25
2V a ^

y lW )
= 0.40
Entonces, o.025,8 = 2.31 y o,o25.se(Efecto) = 2.31(0.40) = 0.92, de donde ios intervalos de confianza de
95% aproximados para los efectos de los factores son
A-.

a oo o.92

B:

Z250.92

C:

1.750,92

AB: 0.750.92
AC:

0.250.92

BC: 0.50+0.92
ABC:

0.500.92

Este anlisis indica quey4, B y C son factores importantes, porque son las nicas estimaciones de los efec
tos de los factores para las que los intervalos de confianza de 95% aproximados no incluyen al cero.
Efectos de dispersin
El ingeniero de proceso que trabaj en el caso del llenado tambin se interes en los efectos de disper
sin; es decir, alguno de los factores afecta la variabilidad de la desviacin de la altura de llenado de una

242

CAPTULO 6

DISEO FACTORIAL 1''

Figura 6-8 Rangos de la desviacin de la altura de llenado del


ejemplo 6-1.

corrida a otra? Una manera de responder esta pregunta es examinando el rango de las desviaciones de la
altura de llenado para cada una de las ocho corridas del diseo 2^ Estos rangos se grafican en el cubo de la
figura 6-8. Observe que los rangos son aproximadamente iguales para las ocho corridas del diseo. Por
consiguiente, no hay evidencia slida que indique que alguna de las variables del proceso afecte directa
mente la variabiUdad de la desviacin de la altura de llenado en el proceso.

6-4

EL DISEO GENERAL 2^

Los mtodos de anlisis que se han presentado hasta este punto pueden generalizarse para el caso de un
diseo factorial 2*, es decir, un diseo con k factores que tienen dos niveles cada uno. El modelo estadsti
co para un diseo 2*^incluira k efectos principales, ( j ) interacciones de dos factores, ( 3) interacciones de
tres factores,..., y una interaccin de k factores. Es decir, para un diseo 2*^el modelo completo conten
dra l ' ^ - l efectos. Tambin se usa aqu la notacin introducida anteriormente para las combinaciones de
los tratamientos. Por ejemplo, en un diseo 2^, abd denota la combinacin de tratamientos con los facto
res^, B y ) en el nivel alto y los factores C y en el nivel bajo. Las combinaciones de los tratamientos
pueden escribirse en orden estndar introduciendo los factores uno a la vez y combinando sucesivamente
cada nuevo factor con los que lo preceden. Por ejemplo, el orden estndar de un diseo 2 es (1), a, b, ab,
c, ac, be, abe, d, ad, bd, abd, cd, acd, bed y abad.
El enfoque general para el anlisis estadstico del diseo 2^ se resume en la tabla 6-8. Como se seal
anteriormente, suele emplearse un paquete de software de computadora en este proceso de anlisis.
A estas alturas, la secuencia de pasos de la tabla 6-8 debe resultar famihar. El primer paso es estimar
los efectos de los factores y examinar sus signos y magnitudes. D e este modo el experimentador obtiene inTabla 6-8
1.
2.
3.
4.
5.
6.

Procedimiento de anlisis
para un diseo 2

Estimar los efectos de los factores


Formar el modelo inicial
Realizar las pruebas estadsticas
Refinar el modelo
Analizar los residuales
Interpretar los resultados

6-4 EL DISEO GENERAL 2

243

formacin preliminar respecto de los factores y las interacciones que pueden ser importantes, y en qu di
recciones debern ajustarse estos factores para mejorar la respuesta. Para formar el modelo inicial del
experimento, por lo general se elige el modelo completo, es decir, todos los efectos principales y las interac
ciones, siempre que se haya hecho una rplica de al menos uno de los puntos del diseo (en la seccin si
guiente se revisa una modicacin de este paso). Despus, en el paso 3 se usa el anlisis de varianza para
probar formalmente la significacin de los efectos principales y las interacciones. En la tabla 6-9 se presenta
la forma general de un anlisis de varianza para un diseo factorial 2'^ con n rplicas. El paso 4, refnar el
modelo, suele consistir en la eliminacin de las variables no significativas del modelo completo. El paso 5 es
el anlisis residual usual para verificar la adecuacin del modelo y los supuestos. En ocasiones ocurrir una
refinacin del modelo despus del anlisis residual, si se encuentra que el modelo es inadecuado o que hay
violaciones serias de los supuestos. El ltimo paso consiste generalmente en el anlisis grfico: grficas de
los efectos principales o las interacciones, o superficies de respuesta y grficas de contorno.
Aun cuando los clculos descritos se realizan por lo general con una computadora, en ocasiones es ne
cesario calcular manuahnente la estimacin de un efecto o la suma de cuadrados de un efecto. Para estimar
un efecto o calcular la suma de cuadrados de un efecto, primero debe determinarse el contraste asociado
con ese efecto. Esto puede hacerse siempre utilizando una tabla de signos positivos y negativos, como la ta
bla 6-2 o 6-3. Sin embargo, para valores grandes de k esto resulta laborioso, y puede usarse un mtodo alter
nativo. En general, el contraste del efecto A B - K se determina expandiendo el miembro derecho de
Contraste^

(6-21)

= (a l)(ft !) (fc 1)

Tabla 6-9 Anlisis de varianza de un diseo 2'


Fuente de
Suma de
variacin
cuadrados
k efectos principales
A
SS,
B
SS,
K

SS^

( ) interacciones de dos factores


AB
AC
JK
(3) interacciones de tres faaores
ABC
ABD

1
1
1
1
1

SSjf;

^^ABD

1
1
1

IJK
( ) = 1 interaccin de k factores
ABC - - K
Error
Total

Grados de
libertad

1
SS^
ss^

2 \n -l)
n2* - 1

244

CAPTULO 6

DISEO FACTORIAL

Para expandir la ecuacin 6-21 se usa el lgebra ordinaria reemplazando 1 con (1) en la expresin final.
El signo de cada grupo de parntesis es negativo si el factor est incluido en el efecto y es positivo si el fac
tor no est incluido.
Para ilustrar el uso de la ecuacin 6-21, considere un diseo factorial 2^. El contraste t A B sera
Contraste^ = ( a - l ) ( 6 - l ) ( c - l - l )
= a b c + a b + c + (l)-a c -b c -a -b
Como un ejemplo ms, en un diseo 2^, el contraste de ABCD sera
Contraste^,^ = ( - 1 ) ( 6 - l ) ( c - l ) ( d - l)(e-Hl)
= abcde -I- cde + bde + ade + bce

+ace+abe+e+abcd+cd+bd
+ a d + b c + a c + a b + {l)-a -b -c
- abcd abd - acd - bcd - ae
- b e - c e - abce - d e - abde - acde - bcde
Una vez que se han calculado los contrastes de los efectos, pueden estimarse los efectos y calcular las
sumas de cuadrados de acuerdo con
A B - K = ~1 . (Contraste
n2'

SS ab...k =

(6-22)

(6-23)

respectivamente, donde n denota el nmero de rplicas. Se cuenta tambin con un algoritmo tabular de
bido al Dr. Frank Yates que en ocasiones puede ser til para el clculo manual de las estimaciones de los
efectos y las sumas de cuadrados. Referirse al material suplementario del texto de este captulo.

6-5

U N A SOLA REPLICA DEL DISEO 2*

Incluso para un nmero moderado de factores, el nmero total de combinaciones de tratamientos en un


diseo factorial 2'' es grande. Por ejemplo, un diseo 2tiene 32 combinaciones de tratamientos, un dise
o 2^ tiene 64 combinaciones de tratamientos, etc. Debido a que por lo general los recursos son limitados,
el nmero de rplicas que el experimentador puede emplear quizs est restringido. Con frecuencia, los
recursos disponibles permiten hacer nicamente una sola rplica del diseo, a menos que el experimen
tador est dispuesto a omitir algunos de los factores originales.
Un riesgo obvio cuando se realiza un experimento que tiene una sola corrida para cada combinacin
de prueba es que el modelo puede ajustarse al ruido. Es decir, si la respuesta 3^es sumamente variable,
pueden resultar conclusiones engaosas del experimento. La situacin se ilustra en la figura 6-9a. En esta
figura, la lnea recta representa el verdadero efecto del factor. Sin embargo, debido a la variabilidad alea
toria presente en la variable de respuesta (representada por la franja sombreada), el experimentador ob
tiene en realidad las dos respuestas medidas representadas por los puntos negros. Por consiguiente, el
efecto del factor estimado est cerca de cero y el experimentador ha llegado a una conclusin errnea res
pecto de este factor. Ahora bien, si hay menos variabilidad en la respuesta, la posibilidad de una conclu
sin errnea ser ms reducida. Otra forma de asegurarse de que se obtienen estimaciones confiables de
los efectos es incrementando la distancia entre los niveles bajo (-) y alto (+ ) del factor, como se ilustra en

6-S UNA SOLA RPUCA DEL DISEO 2*

245

Efecto estimado
del factor

+
Factor, x
a) Distancia pequea entre los niveles del factor

C
O
'
Efecto estimado
del factor

_L

Factor, x
6) Separacin agresiva de los niveles del factor

Figura 6*9 El impacto de la eleccin de los niveles del factor en un diseo


no replicado.

la figura 6-9b. Observe que en esta fgura la distancia incrementada entre los niveles bajo y alto del factor
resulta en una estimacin razonable del verdadero efecto del factor.
El uso de la estrategia de una sola rplica es comn en los experimentos de exploracin cuando hay
un nmero relativamente grande de factores bajo consideracin. Debido a que en estos casos nunca pue
de tenerse la certeza absolu^ de que el error experimental es pequeo, una buena prctica en este tipo de
experimentos es separar los niveles de los factores de manera agresiva. Quizs el lector encuentre til re
leer las pautas generales para elegir los niveles de los factores del captulo 1.
Una sola rplica de un diseo 2^ se denomina en ocasiones diseo factorial no replicado. Con una
sola rplica, no se cuenta con ninguna estimacin interna del error (o error puro). Una forma de abor
dar este anlisis de un diseo factorial no replicado consiste en suponer que algunas interacciones de or
den superior son insignificantes y combinar sus cuadrados medios para estimar el error. Esto es una
apelacin al principio de efectos esparcidos; es decir, la mayora de los sistemas estn dominados por al
gunos de los efectos principales y las interacciones de orden inferior, y la mayor parte de las interacciones
de orden superior son insignificantes.

246

CAPTULO 6

DISEO FACTORIAL 2

Cuando se analizan datos de diseos factoriales no replicados, ocasionalmente ocurren interacciones


de orden superior reales. El uso de un cuadrado medio del error que se obtiene agrupando las interaccio
nes de orden superior no es apropiado en estos casos. U n mtodo de anlisis atribuido a Daniel [35a] pro
porciona una forma simple de resolver este problema. Daniel sugiere examinar una grfica de
probabilidad normal de las estimaciones de los efectos. Los efectos que son insignificantes siguen una
distribucin normal, con media cero y varianza o^, y tendern a localizarse sobre una lnea recta en esta
grfica, mientras que los efectos significativos tendrn medias diferentes de cero y no se localizarn sobre
la lnea recta. Por lo tanto, el modelo preliminar se especificar de tal modo que contenga aquellos efec*
tos que aparentemente son diferentes de cero, con base en la grfica de probabilidad normal. Los efectos
aparentemente insignificantes se combinan como una estimacin del error.

IJE M P L 0 6 - 2 .................................................................................................................................................
U n a sola rplica del d ise o 2*
Un producto qumico se fabrica en un envase presurizado. Se lleva a cabo un experimento factorial en la
planta piloto para estudiar los factores que se piensa influyen en el ndice de filtracin de este producto.
Los cuatro factores son la temperatura (A), la presin (B), la concentracin del formaldehdo (C) y la ve
locidad de agitacin (D). Cada factor est presente con dos niveles. La matriz del diseo y los datos de la
respuesta obtenidos de una sola rplica del experimento 2* se muestran en la tabla 6-10 y en la figura 6-10.
Las 16 corridas se hacen de manera aleatoria. El ingeniero del proceso est interesado en maximizar el n
dice de filtracin. Las condiciones actinales del proceso producen ndices de filtracin de alrededor de 75
gal/h. Asimismo, en el proceso actual la concentracin de formaldehdo, factor C, se usa en el nivel alto.
Al ingeniero le gustara reducir la concentracin de formaldehdo lo ms posible, pero no ha podido ha
cerlo porque siempre produce ndices de filtracin ms bajos.
El anlisis de estos datos se iniciar construyendo una grfica de probabilidad normal de las estima
ciones de los efectos. La formacin de signos positivos y negativos para las constantes de los contrastes

Tabla 6 -1 0

Nmero
de corrida
1
2
.-3
:,4 .
- s,-,-.

7
8
9 r10. :
11
. . . . .

13 '^ "
-.'14,. 15
16 ''

Experimento del ndice de filtracin en la planta piloto

Factor
A
_
+

-H
+

-1-

+
+
+
+

+
+
+
+

-H

-H

+
+

+
+
+
+

+
+

-1+
+
+
- 1-

+
+
+

Etiqueta de
la corrida

ndice de
filtracin (gal/h)

(1)
a
b
ab
c
ac
be
abe
d
ad
bd
abd
cd
ac
bcd
abcd

45
71
48
65
68
60
80
65
43
100
45
104
75
86
70
96

'

6-5 UNA SOLA RPLICA DEL DISEO 2*

247

Figura 6-10 Datos del expeiimento del ndice de filtracin en la


planta piloto para el ejemplo 6-2.

del diseo 2'*se muestra en la tabla 6-11. Apartir de estos contrastes pueden estimarse 15 efectos factoria
les, y las sumas de cuadrados se presentan en la tabla 6-12.
En la figura 6-11 se muestra la grfica de probabilidad normal de estos efectos. Tbdos los efectos que
caen sobre la recta son insignificantes, mientras que los efectos grandes estn apartados de ella. Los efec
tos importantes que surgen de este anlisis son los efectos principales do A, C y D y las interacciones
ACyAD .
Los efectos principales d e^ , C y D se gracan en la figura 6-12a. Los tres efectos son positivos, y si
slo se consideraran estos efectos principales, los tres factores se correran en el nivel alto a fin de maximizar el ndice de filtracin. Sin embargo, siempre es necesario examinar cualquier interaccin que sea
importante. Recuerde que los efectos principales no tienen mucho significado cuando estn presentes en
interacciones significativas.
Las interaccionesylC y A D se grafican en la figura 6-12. Estas interacciones son la clave para resol
ver el problema. Observe, por la interaccin^C, que el efecto de la temperatura es muy pequeo cuando
la concentracin est en el nivel alto y muy grande cuando la concentracin est en el nivel bajo, obte
nindose los mejores resultados con la concentracin baja y la temperatura alta. La interaccinAD indica
que la velocidad de agitacin!) tiene un efecto reducido con una temperatura baja, pero un efecto positi
vo grande con la temperatura alta. Por lo tanto, los mejores ndices de filtracin pareceran obtenerse
cuando^ y D estn en el nivel alto y C est en el nivel bajo. Esto permitira la reduccin de la concentra
cin de formaldehdo a un nivel ms bajo, otro de los objetivos del experimentador.

Proyeccin de Un diseo
Es posible hacer otra interpretacin de los efectos de la figura 6-11. Puesto qye B (presin) no es signifi
cativa y todas las interacciones en las que interviene B son insignificantesj5 puede descartarse del experi
mento, de tal modo que el diseo se convierte en un factorial 2^ en A, C y D con dos rplicas. Esto es fcil
de ver examinando nicamente las columnas^, C y D e n la matriz del dise que se muestra en la tabla
6-10 y observando que e s ^ coliunnas forman dos rplicas de un diseo 2^. En la tabla 6-13 se resume el
anlisis de varianza de los datos utilizando este supuesto de simplificacin. Las conclusiones que se saca
ran de este anlisis se maiftienen en esencia sin cambios respecto de las del ejemplo 6-2. Observe que al
hacer la proyeccin de la rphca nica del diseo 2* en un diseo 2^con (Jos rplicas, se tiene ahora tanto
una estimacin de la inter^^ipylCD como una estimacin del error basada eii lo que en ocasiones se de
nomina rplica oculta.

I+

I+ + + +I I + + I I I I+ +

I + I+ +I
8 + + + +I
I + + I

+ I + I + I 1+ 1+
I I I I I I I+ + + +

I + + I

+ I I + + I

1 +

+ +I I + + I I I I + + I I+ +
+ I + I + I + I I + I + I + I +

I I I I I I+ + + + + + + +
I + + I

+ I I + I+ +I

+ I 1 +

+ +I I I I+ + + +I I I I+ +
+ 1 + 1 I + I+ +I

+ I i + i

"O

I I I I+ + + +I I I I + + + +
+ 1 I ++I I ++I I ++I i +
I I + + I I + + I I + + I I+ +
I

I
248

6-5 UNA SOLA RPLICA DEL DISEO 2*

Ikbla 6-12

Trmino del
modelo
A
B
C
D
AB
AC
AD
BC
BD
CD
ABC
ABD
ACD
BCD
ABCD

Estimaciones de los efectos de los factores y sumas de


cuadrados del diseo factorial V del ejemplo 6-2

Estimacin
del efecto
21.625
3.125
9.875
14.625
0.125
-18,125
16.625
2.375
-0.375
-1.125
1.875
4.125
-1.625
-2.625
1.375

Suma de
cuadrados
1870.56
39.0625
390.062
855.563
0.0625
1314.06
1105.56
22.5625
0.5625
5.0625
14.0625
68.0625
10.5625
27.5625
7.5625

Efecto

Figura 6-11 Grfica de probabilidad normal de los efectos para el diseo factorial
2^ del ejemplo 6-2.

Contribucin
porcentual
32.6397
0.681608
6.80626
14.9288
0.00109057
22.9293
19.2911
0.393696
0.00981515
0.0883363
0.245379
1.18763
0.184307
0.480942
0.131959

249

250

CAPITULO 6

S, 90
i
r 70

DISEO FACTORIAL Z''

90
80
70
60

y 50

50

o) Grficas de los efectos principales

6) Grficas de las interacciones

Figura 6-12
plo 6-2.

Grficas de los efectos principales y las interacciones para el ejem

Tabla 6 -1 3

Anlisis de varianza del experim ento del ndice filtracin en la planta piloto en A , C y D

Fuente de
variacin
A
C
D
AC
AD
CD
ACD
Error
Total

Suma de
cuadrados
1870.56
390.06
855.56
1314.06
1105.56
5.06
10.56
179.52
5730.94

Grados de
libertad
1
1
1
1
1
1
8
15

Cuadrado
medio
1870.56
390.06
855.56
1314.06
1105.56
5.06
10.56
22.44

Fo
83.36
17.38
38.13
58.56
49.27
<1
<1

V alor
<0.0001
<0.0001
<0.0001
<0.0001
<0.0001

6-5 UNA SOLA RPUCA DEL DISEO 2*

25 1

El concepto de proyectar un diseo factorial no replicado en un diseo factorial con rplicas en me


nos factores es muy til. En general, si se tiene una sola rplica del diseo 2^ y s i h ( h < k ) factores son in
significantes y pueden descartarse, entonces los datos originales corresponden a un diseo factorial
completo con dos niveles en los k ~ h factores restantes con 2* rplicas.
Verificacin de diagnstico
Debern aplicarse las verificaciones de diagnstico usuales a los residuales de un diseo 2^. El anlisis
realizado indica que los nicos efectos significativos son ^ = 21.625, C = 9.875, D = 14.625,j4C = -18.125
y A D = 16.625. Si esto es correcto, los ndices de filtracin estimados estn dados por
18.125'!
21.625 V -1_ [9.875^ V _1_ 14.625'|
Xj -r
JC3 +
*^4
2
2 ^
K 2 i
/'16.625'!

asumen valores entre - - l y - H . E l

donde 70.06 es la respuesta promedio y las variables codificadas


ndice de filtracin predicho para la corrida (1) es
5>= 70.06+

/'21.625'\

/'18.125'\

( - 1) ( - 1)+

(9.875\
2

14.625\

( - 1)

/16.625'\

= 46.22
Puesto que el valor observado es 45, el residual e s e = > - > = 4 5 - 46.22 = -1.22. A continuacin se pre
sentan los valores d ey, ^ y e = y - ^ para las 16 observaciones.

(1)
a
b
ab
c
ac
be
abe
d
ad
bd
abd
cd
acd
bcd
abcd

y
45
71
48
65
68
60
80
65
43
100
45
104
75
86
70
96

S
46.22
69.39
46.22
69.39
74.23
61.14
74.23
61.14
44.22
100.65
44.22
100.65
72.23
92.40
72.23
92.40

e = y-j>
-1.22
1.61
1.78
^.39
^.23
-1.14
5,77
3.86
- 1.22
-0,65
0.78
3.35
2.77
-6.40
-2.23
3.60

En la figura 6-13 se muestra la grfica de probabilidad normal de los residuales. Lx)s puntos de esta grfica
se localizan razonablemente prximos a una lnea recta, brindando apoyo a la conclusin de que A, C, D,
A C y A D son los nicos efectos significativos y que se satisfacen los supuestos fundamentales del anlisis.

252

CAPTULO 6 DISEO FACTORIAL 21

Residual

Figura 6-13 Grfica de probabilidad normal de los residuales del ejemplo 6-2.

La superficie de respuesta
Las grficas de las interacciones de la figura 6-12 se utilizaron para ofrecer una interpretacin prctica de
los resultados de este experimento. En ocasiones es til emplear la superficie de respuesta para este fin.
La superficie de respuesta se genera por el modelo de regresin
70.06+

^21.625^ V ^ 1'9.875'j
ri4.625\
x^ +
2 ;
2
2
x ,x ,+

16.625^

x,x.

En la figura 6-14a se muestra la grfica de contorno de la superficie de respuesta cuando la velocidad de agita
cin est en el nivel alto (es decir, a4 = 1). Los contornos se generan a partir del modelo anterior conX4 = 1, o
j>= 77.3725+

/ 38.25]
2

Xi +

^9.875^
2

fl8.125'^
^3

Observe que los contornos son lneas curvas porque el modelo contiene un trmino de interaccin.
La figura 6-146 es la grfica de contorno de la superficie de respuesta cuando la temperatura est en
el nivel alto (es decir, Xj = 1). Cuando se hace ;ti = 1 en el modelo de regresin se obtiene
8 0 .8 7 2 5 -

Z8.25]
2

X, +

/'31.25'\
2

6-5 UNA SOLA RPLICA DEL DISEO 2*

253

Temperatura, A U t)
a l Grfica de contorno con la velocidad de agitacin (DI,

- 1

1.000 K

0.667

0.333

I'

0.000

I
I

-0 .3 3 3

-0 .6 6 7

1.000
-1.000

-0 .6 6 7

-0 ,3 3 3
0.000
0.333
ConcentracMn, C tej)

0.667

1.000

6) Grfica de conturno con la temperatura iA), x, = 1

Figura 6*14 Grficas de contomo del ndice de fltradn, ejemplo 6-2.

Estos contornos son rectas paralelas porque el modelo contiene nicamente los efectos principales de los
factores C (xj) y D (*4).
Ambas grficas de contom o indican que si se quiere maximizar el ndice de filtracin, las variables .4
(%i) y D (x;4) debern estar en el nivel alto y que el proceso es relativamente robusto para la concentracin
C. Se obtuvieron conclusiones similares a partir de las grficas de las interacciones.

La mitad de grfica nonnal de los efectos


Una alternativa para la grfica de probabilidad normal de los efectos de los factores es la mitad de grfica
nonnal. Es una grfica del valor absoluto de las estimaciones de los efectos contra sus probabilidades or*
males acumuladas. En la figura 6-15 se muestra la mitad de grfica normal de los efectos para el ejemplo
6*2, La lnea recta de la mitad de grfica normal siempre pasa por el origen y deber pasar tambin cerca del
valor de los datos del percentil cincuenta. Muchos analistas sienten que es ms fcil interpretar la mitad de

254

CAPITULO 6

DISEO FACTORIAL 2

Efecto

Figura 6-15 Mitad de grfica normal de los efectos de los factores del ejemplo 6-2.

grfica normal, en particular si slo se cuenta con pocas estimaciones de los efectos, como cuando el experi
mentador ha usado un diseo de ocho corridas. Algunos paquetes de software construirn ambas grficas.
Otros mtodos para analizar diseos ^ctoriales no replicados

El procedimiento de anlisis estndar para un diseo factorial de dos factores no replicado es la grfica
normal (o mitad de grfica normal) de los efectos estimados de los factores. Sin embargo, los diseos no
replicados son tan usados en la prctica que se han propuesto muchos procedimientos formales de anli
sis para resolver la subjetividad de la grfica de probabilidad normal. Hamada y Balakrishnan [52] com
pararon algunos de estos mtodos. Encontraron que el mtodo propuesto por Lenth [70] tiene una
potencia adecuada para detectar efectos significativos. Tmbin es fcil de implementar y, como resulta
do, est empezando a aparecer en algunos paquetes de software para analizar datos de diseos factoriales
no replicados. Se ofrece una breve descripcin del mtodo de Lenth.
Suponga que se tienen m contrastes de inters, por ejemplo Cj, C2, c . Si el diseo esu n fcitorial 2"
no replicado, estos contrastes corresponden a las m = 2* - 1 estimabioeS 'd bs efectos de los factoresi La
base del mtodo de Lenth es estimar la varianza de un contrast partir de la estimaciones ms peque
as (en valor absoluto) de los contrastes. Sean
q - 1 . 5 X mediana ( I c J )
y

', . . r
I;-

6-5 UNA SOLA RPLICA DEL DISEO 2

255

PSE denota el pseudo error estndar, y Lenth demuestra que es un estimador razonable de la varianza
del contraste cuando no hay muchos efectos activos (significativos). Eli^5 se usa para juzgar la significa'
cin de los contrastes. Un contraste individual puede compararse con el margen de error (ME, margin of
error)
M E = 0.025,</
donde los grados de libertad se definen como d = w/3. Para hacer inferencias sobre un grupo de contras
tes, Lenth sugiere usar el margen de error simultneo (SME, simuUaneous margin of error)
S M E = t^ ^ x P S E
donde el punto porcentual de la distribucin r que se usa es y = 1 - (1 + 0.95*''")/2.
Para ilustrar el mtodo de Lenth, considere el experimento 2* del ejemplo 6-2. Los clculos dan como
resultado So = 1-5 x |-2 .6 2 5 1 = 3.9375 y 2.5 x 3.9375 = 9.84375, de donde
P 5 = 1.5

|1.75= 1625

M=2571

2625 = 6.75

S M E = 5.29

2 6 2 5 = 13l70

Considere ahora las estimaciones de los efectos de la tabla 6-12. El criterio SME indicara que los cuatro
efectos ms grandes (en magnitud) son significativos, ya que las estimaciones de sus efectos exceden
SME. El efecto principal de C es significativo de acuerdo con el criterio ME, pero no con respecto al SME.
Sin embargo, puesto que es evidente que la interaccin/IC es importante, probablemente C se incluira
en la lista de efectos significativos. Observe que en este ejemplo el mtodo de Lenth produjo la misma
respuesta que la obtenida anteriormente con el examen de la grfica de probabilidad normal de los
efectos.
Varios autores (ver Hamada y Balakrishnan [52], Loughin [73], Loughin y Noble [74] y Lamtz y Whitcomb [69]) han hecho notar que el mtodo de Lenth falla para controlar los ndices del error tipo I, y que
pueden usarse mtodos de simulacin para calibrar su procedimiento. Lamtz y Whitcomb [69] sugieren
reemplazar los multiplicadores ME y SME con multiplicadores gu stad os de la siguiente manera;
Nmero de contrastes
ME original
ME ajustado
SME original
SME ajustado

7
3.7M
2.295
9.008
4.891

15
2,571
2.140
5.219
4.163

31
2.218
2.082
4.218
4.030

Estos resultados coinciden en gran medida con los de Ye y Hamada [114].


En general, el mtodo de Lenth es un procedimiento ingenioso y til. Sin embargo, recomendamos
utilizarlo como complemento de la grfica de probabilidad normal usual de los efectos, no como su susti
tuto.
Bisgaard [10] ha proporcionado una sutil tcnica grfica, llamada carta de inferencia condicional,
como ayuda para interpretar la grfica de probabilidad normal. La finalidad de esta grfica es ayudar al
experimentador a juzgar los efectos significativos. Esto sera relativamente sencillo si se conociera la des
viacin estndar o, o si pudiera estimarse a partir de los datos. En diseos no repUcados, no se cuenta con
ninguna estimacin interna de o, por lo que la carta de inferencia condicional est diseada para ayudar
al experimentador a evaluar la magnitud de los efectos para un rango de valores de la desviacin estndar.

256

CAPTULO 6

DISEO FACTORIAL ZI*

Bisgaard fundamenta la grfica en el resultado de que el error estndar de un efecto, en un diseo de dos
niveles con N corridas (para un diseo factorial no replicado, N = 2*^), es

2o
Viv
donde o es la desviacin estndar de una observacin individual. Entonces 2 veces el error estndar de
un efecto es
4(7
Una vez que se estiman los efectos, se hace una grfica como la que se muestra en la figura 6*16, con las
estimaciones de los efectos graficadas en el eje vertical, o ejey. En esta figura se han usado las estimacio
nes de los efectos del ejemplo 6-2. El eje horizontal, ox, de la figura 6-16 es la escala de la desviacin es
tndar (a). Las dos rectas estn en
4a
4<7
y y^En el ejemplo tratado aqu, N = 16, por lo que las rectas estn eny = + a y y = -a. Por lo tanto, para cual
quier valor dado de la desviacin estndar a, la distancia entre estas dos rectas puede leerse como un intervalo de confianza de 95% aproximado para los efectos insignificantes.
En la figura 6-16 se observa que s el experimentador piensa que la desviacin estndar est entre 4 y
8, entonces los factores^4, C , D y las nteraccones^C y A D son significativos. Si el experimentador piensa
que la desviacin estndar tiene un valor de hasta 10, el factor C quiz no sea significativo. Es decir, para

Figura 6-16 Carta de inferencia condicional para el


ejemplo 6-2.

6-5 UNA SOLA RPUCA DEL DISEO 2*

^ 1.75------^ 6

257

30

4.09------1------4.53

3.:

4 .S 8 --

i.s
Figura 6-17

r-^.'70

--9 .4 3

2,67
Datos del experimento de perforacin del ejemplo 6-3.

cualquier supuesto dado acerca de la magnitud de a, el experimentador puede construir una cinta de me
dir para juzgar la significacin aproximada de los efectos. La carta tambin puede usarse en sentido in
verso. Por ejemplo, suponga que estuviera en duda si el factor C es significativo o no. Entonces el
experimentador podra preguntar si es razonable esperar que a pudiera ser tan grande como 10 o ms. Si
es improbable que a sea tan grande como 10, entonces puede concluirse que C es significativo.
Se presentan ahora tres ilustrativos ejemplos de diseos factoriales 2* no replicados.

EJEMPLO 6 - 3 ..................................................................................................................................................
'transformacin de datos en un diseo factorial
Daniel [35b] describe un diseo factorial 2* utilizado para estudiar la rapidez de avance de una perforadora
como una funcin de cuatro factores: la carga de la perforadora (A), la rapidez de flujo (B), la velocidad de rota
cin (C) y el tipo de lodo de perforacin usado (D). Los datos del e?q)eTmento se presentan en la figura 6-17.
En la figura 6-18 se muestra la grfica de probabilidad normal de las estimaciones de los efectos de
este experimento. Con base en esta grfica, los factores B, C y D, junto con las interacciones B C y BD,
requieren interpretacin. La figura 6-19 es la grfica de probabilidad normal de los residuales y la fi-

Estimacln del efecto

Figura 6-18

Grfica de probabilidad normal de los efectos del ejemplo 6-3.

258

CAPTULO 6 DISEO FACTORIAL 2

Residuales

Figura 6-19

Grfica de probabilidad normal de los residuales del ejemplo 6-3.

gura 6-20 es la grfica de los residuales contra la velocidad de avance predicha a partir del modelo que
contiene los factores identificados. Hay problemas evidentes con la normalidad y la igualdad de la varianza. Con frecuencia se usa una transformacin de los datos para abordar estos problemas. Puesto que la va
riable de respuesta es una razn de cambio, la transformacin logartmica parece un candidato razonable.

-1

_L

J.

11

14

Velocidad de avance predicha

Figura 6-20 Grfica de los residuales contra la velocidad de avance


predicha en el ejemplo 6-3.

6'5 UNA SOLA RPLICA DEL DISEO 2*

259

Estimacin del efecto

Figura 6-21 Grfica de probabilidad normal de los efectos del ejemplo 6-3 des
pus de la transformacin logartmica.

En la figura 6-21 se presenta la grfica de probabilidad normal de las estimaciones de los efectos des
pus de hacer la transformacin y* = In^;. Observe que al parecer ahora es posible una interpretacin
mucho ms simple, ya que slo los factores B , C y D estn activos. Es decir, expresar los datos en la mtri
ca correcta ha simplificado su estructura hasta el punto de que las dos interacciones han dejado de reque
rirse en el modelo explicatorio.

Residuales

Figura 6-22 Grfica de probabilidad normal de los residuales del ejemplo 6-3
despus de la transformacin logartmica.

260

CAPTULO 6 DISEO FACTORIAL 2^

Velocidad de avance logartmica predicha

Figura 6-23 Grfica de los residuales contra la velocidad predicha


para el ejemplo 6-3 despus de la transformacin logartmica.

En las figuras 6-22 y 6-23 se presentan, respectivamente, una grfica de probabilidad normal de los
residuales y una grfica de los residuales contra la rapidez de avance predicha para el modelo en la escala
logartmica que contiene a S, C y D . Ahora estas grficas son satisfactorias. Se concluye que el modelo
_y* = Iny slo requiere los factores B, C y D para una interpretacin adecuada. En la tabla 6-14 se resume
el anlisis de varianza de este modelo. La suma de cuadrados del modelo es
= 5.345-1-1.339-1-0.431
= 7.115
yR^ =
= 7.115/7.288 = 0.98, por lo que el modelo explica cerca de 98% de la variabilidad de la
rapidez de avance de la perforadora.

EJEMPLO 6 - 4 ....................................... ..........................................................................................................


Efectos de localizacin y dispersin en un diseo factorial no replicado
Se corri un diseo 2* en un proceso de manufactura de paneles laterales y ventanas de un avin comer
cial. Los paneles se hacen en una prensa, y bajo las condiciones actuales es demasiado elevado el nmero
Tabla 6 -1 4

Anlisis de varianza del ejemplo 6-3 despus de la transformacin logartmica

Fuente de
variacin
B (Flujo)
C (Velocidad)
D (Lodo)
Error
Tbtal

Suma de
cuadrados
5.345
1.339
0.431
0.173
7.288

Grados de
libertad
1
1
1
12
15

Cuadrado
medio
5.345
1.339
0.431
0.014

Valor P
F,
381.79 < 0.0001
95.64 < 0.0001
30.79 < 0.0001

6-5 UNA SOLA RPUCA DEL DISEO 2


___________________
Factores

Bajo (-)

A ~ Temperatura (F)
295
B - Tiempo de sujecin (min)
7
C == Flujo de resina
10
^ Tiempo de cierre (s)
15

261

Alto(+)
325
9
20
30

------1S.S

Figura 6*24 Datos del experimento del proceso de los paneles


del ejemplo 6-4.

promedio de defectos por panel en una operacin de prensado. (El promedio actual del proceso es 5.5 de
fectos por panel.) Se investigan cuatro factores utilizando una sola rplica de un diseo 2, en el que cada
rplica corresponde a una sola operacin de prensado. Los factores son la temperatura (A), el tiempo de
sujecin (B), el flujo de resina (C) y el tiempo de cierre en el prensado (D). En la figura 6-24 se muestran
los datos de este experimento.
En la figura 6-25 se muestra la grfica de probabilidad normal de los efectos de los factores. Es evi
dente que los dos efectos ms grandes son ^ = 5.75 y C = -4.25. Ningn efecto de los otros factores pare
ce ser tan grande, y A y C explican cerca de 77% de la variabilidad total, por lo que se concluye que la
temperatura (A) bajay el flujo de resina (C) alto reduciran la incidencia de defectos en los paneles.
El anlisis residual cuidadoso es un aspecto importante de cualquier experimento. La grfica de pro
babilidad normal de los residuales no indic anomalas, pero cuando el experimentador grafic los resi-

Efectos de los factores

Figura 6-25 Grfica de probabilidad normal de los efectos de los factores para
el experimento del proceso de los paneles del ejemplo 6-4.

262

CAPITULO 6

DISEO FACTORIAL

B - Tiempo de sujecin

-B"Figora 6-26 Grfica de los residuales contra el tiempo de suje


cin para el ejemplo 6-4.

duales contra cada uno de los factores^ a D , la grfica de los residuales contra B (tiempo de sujecin)
present el patrn de la figura 6-26. Este factor, que carece de importancia en lo que se refiere al niimero
promedio de defectos por panel, es muy importante en su efecto sobre la variabilidad del proceso, con el
tiempo de sujecin bajo dando como resultado una variabilidad menor en el nmero promedio de defec
tos por panel en una operacin de prensado.
El efecto de dispersin del tiempo de sujecin tambin es muy evidente en la grfica de cabo de la fi
gura 6-27, donde se grafca el nmero promedio de defectos por panel y el rango del nmero de defectos
en cada punto del cubo definido por los factores^, 5 y C. El rango promedio cuando B est en el nivel alto
(la cara posterior del cubo de la figura 6-27) es 7?^+ = 4.75, y cuando B est en el nivel bajo es Rg- = 1.25.
Como resultado de este experimento, el ingeniero decidi operar el proceso con la temperatura baja
y el flujo de resina alto para reducir el nmero promedio de defectos, con el tiempo de sujecin bajo para
reducir la variabilidad en el nmero de defectos por panel, y con el tiempo de cierre en el prensado bajo
(el cual no tuvo ningn efecto ni sobre la localizacin ni sobre la dispersin). El nuevo ajuste de las condi
ciones de operacin produjo un nuevo promedio del proceso de menos de un defecto por panel.
Los residuales de un diseo 2* proporcionan mucha informacin acerca del problema bajo estudio. Pues
to que los residuales pueden considerarse como los valores observados del ruido o error, con frecuencia ofre
cen informacin acerca de la variabilidad del proceso. Puede hacerse el examen sistemtico de los residuales
de un diseo
no replicado para proporcionar informacin acerca de la variabilidad del proceso.

201-

| f { . 4.5

C= Flujo de resina

6.5

5 ------------------- ^ 2 . 2 5 ^ 9
.= 1-5 j T

B - Tiempo de sujecin (min)

'7
______________I
295

325

A = Temperatura (F)

Figura 6-27 Grfica de cubo de la temperatura, el tiempo de sujecin y el flujo de


resina para el ejemplo 6-4.

iSi'O'T'O-iiTii-iOOoOOoONO'il-triiJo d < N c s ddf SCScs cNf OCJ^rnf S


l i l i l
I I I
^

I +

+ I

I +

+ I

+ I

I + + I

I + + I

+ I

I + + I

! +

1 +

1 +

I +

I + + I

1 +

1 +

! +

= 2

IN o

?5 3 ^
d ^ C5

8ri S
2
^ d

+ I

00 Q
T ^
^ ^ O

I +

c<i r~

^ M ci

S ?S
+ + $
<S O

I + + I

I + + I

1 +

vO
_Q

1 +

I +

I + + I

+ I

I +

I +

+ I

+ I

I +

1 +

S ? i?

1 +

I + + I

+ I

+ + I

I + + I

I +

+ + I

I + + I

1 +

I +

u
I

^
Tt
S 00 rJS
1-5 d
es

*0
Q ON
fS 00 m

-5 d

00

c4 d H

5 S
263

264

CAPITULO 6

DISEO FACTORIAL 2>

Considere la grfica de los residuales de la figura 6-26. La desviacin estndar de los ocho residuales
donde B est en el nivel bajo es S(B~) = 0.83, y la desviacin estndar de los ocho residuales donde B est
en el nivel alto es S(B*) 2.72. El estadstico
S \B * )
(6-24)
s ( s - )
tiene una distribucin aproximadamente normal cuando las dos varianzas (^(B*) y ^(B~) son iguales.
Para ilustrar los clculos, el valor de Fg es
"

S \B -)
,A 2 . 7 2 r
(0.83)"
= 2.37

En la tabla 6-15 se presenta el conjunto completo de contrastes para el diseo 2 junto con los resi
duales para cada corrida del experimento del proceso de los paneles del ejemplo 6-4. Cada columna de
esta tabla contiene el mismo nmero de signos positivos y negativos, y es posible calcular la desviacin es
tndar de los residuales de cada grupo de signos en cada columna, por ejemplo, 5(/'^) y 5(i ), i = 1,2,..., 15.
Entonces
; - i 2 .

15

(6-25)

es un estadstico que puede usarse para evaluar la magnitud de los efectos de dispersin del experimento.
Si la varianza de los residuales de las corridas donde el factor i es positivo es igual a la varianza de los resi
duales de las corridas donde el factor i es negativo, entonces F' tiene una distribucin aproximadamente
normal. Los valores de F' se presentan al final de cada columna de la tabla 6-15.
La figura 6-28 es la grfica de probabilidad normal de los efectos de dispersin F ' . Evidentemente, B
es un factor importante en lo que se refiere a la dispersin del proceso. Para un estudio ms amplio de

Figura 6-28 Grfica de probabilidad normal de los efectos de dispersin


F del ejemplo 6-4.

6-5 UNA SOLA RPLICA DEL DISEO 2

.2 6 5

este procedimiento, ver Boxy Meyer [19] y Myersy Montgomery [85a]. Asimismo, para que los residuales
del modelo ofrezcan la informacin apropiada acerca de los efectos de dispersin, es necesario especifi
car correctamente el modelo de localizacin. Referirse al material suplementario del texto de este captu
lo para mayores detalles y un ejemplo.

EJEMPLO 6 - 5 ...................... ..........................................................................................................................


M ediciones duplicadas de la respuesta
Un equipo de ingenieros en una fbrica de semiconductores realizaron un diseo factorial 2^en un horno
de oxidacin vertical. Se apilan cuatro obleas en el hom o, y la variable de respuesta de inters es el es
pesor del xido en las obleas. Los cuatro factores del diseo son la temperatura (A), el tiempo (B), la pre
sin (C) y el flujo de gas (D). El experimento se lleva a cabo cargando cuatro obleas en el horno, ajustando
las variables del proceso en las condiciones de prueba requeridas por el diseo experimental, procesando
las obleas y midiendo despus el espesor del xido en las cuatro obleas. En la tabla 6-16 se presentan el di
seo y las mediciones del espesor resultantes. En esta tabla, las cuatro columnas bajo el encabezado
Espesor contienen las mediciones del espesor del xido de cada oblea individual, y las dos ultimas co
lumnas contienen el promedio muestral y la varianza muestral de las mediciones del espesor en las cuatro
obleas de cada corrida.
La manera apropiada de analizar este experimento es considerar las mediciones del espesor de las
obleas individuales como mediciones duplicadas, y no como rplicas. Si fueran en realidad rplicas,
cada oblea se habra procesado individualmente en una sola corrida del homo. Sin embargo, debido a que
las cuatro obleas se procesaron en conjunto, recibieron los factores de los tratamientos (es decir, los nive
les de las variables del diseo) simultneamente, por lo que hay mucho menos variabilidad en las medicio
nes del espesor de las obleas individuales que la que se habra observado si cada oblea fuera una rplica.
Por lo tanto, el promedio de las mediciones del espesor es la variable de respuesta correcta que deber
considerarse inicialmente.
En la tabla 6-17 se muestran las estimaciones de los efectos de este experimento, utilizando el espesor
del xido promedio)' como la variable de respuesta. Observe que los factoresv4 y B y la interaccinj4B tie
nen efectos grandes que explican en conjunto cerca de 90% de la variabilidad del espesor promedio del

Orden
estndar
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

Orden de
la corrida
10
7
3
9
6
2
5
4
12
16
8
1
14
15
11
13

1
1

1
1

1
1

1
1
1
1

1
1

_1

_1

1
1
1
1
_^1

1
1

1
1

_1
_1

1
1
1
1

_1

1
1
1
1
1
1
1
1
1

378
415
380
450
375
391
384
426
381
416
371
445
377
391
375
430

Espesor
379
376
416
416
382
379
449
446
373
371
390
388
386
385
430
433
375
381
412
420
371
372
443
448
379
377
386
391
376
376
428
430

379
417
383
447
369
391
385
431
383
412
370
448
379
400
377
428

y
378
416
381
448
372
390
385
430
380
415
371
446
378
392
376
429

2
0.67
3.33
3.33
6.67
2
0.67
8.67
12.00
14.67
0.67
6
1.33
34
0.67
1.33

266

CAPTULO 6 DISEO FACTORIAL 2

Tabla 6-17
Trmino del
modelo
A
B
C
D
AB
AC
AD
BC
BD
CD
ABC
ABD
ACD
BCD
ABCD

Estimaciones de los efectos del ejemplo 6-5, la variable de


respuesta es el espesor promedio del xido
Estimacin
del efecto

Suma de
cuadrados

43.125
18.125
-10.375
-1.625
16.875
-10.625
1.125
3.875
-3.875
1.125

7439.06
1314.06
430.562
10.5625
1139.06
451.563
5.0625
60.0625
60.0625
5.0625
0.5625
33.0625
0.0625
1.5625
0.0625

^.375
2.875
-0.125
-0.625
0.125

Contribucin
porcentual
67.9339

12.0001
3.93192
0.0964573
10.402
4.12369
0.046231
0.548494
0.548494
0.046231
0.00513678
0.301929
0.000570753
0.0142688
0.000570753

xido. La figura 6*29 es una grfica de probabilidad normal de los efectos. Al examinar esta representa
cin, se concluira que los factoresv4j 5 y C y las interacciones AB y A C son importantes. En la tabla 6-18
se muestra el anlisis de varianza de este modelo.
El modelo para predecir el espesor promedio del xido es
3 9 9 .1 9 -1 -2 1 .5 6 ;c i -I- 9 .0 6 a :j - 5 . 1 9 a ; 3 + 8 A 4 x , x ^ - 5 . 3 1 x , x ,

El anlisis residual de este modelo es satisfactorio.


Los experimentadores estn interesados en obtener un espesor promedio del xido de 400 , y las es
pecificaciones del producto requieren que el espesor sea de entre 390 y 410 . En la figura 6-30 se presen
tan dos grficas de contorno del espesor promedio, una con el factor C (0 ^:3), la presin, en el nivel bajo
(es decir, % = -1 ) y la otra con C (o ::3) en el nivel alto (es decir, a:3 = -H1), Al examinar estas grficas de
contorno, es evidente que hay muchas combinaciones del tiempo y la temperatura (factores A y B) que
producirn resultados aceptables. Sin embargo, si la presin se mantiene constante en el nivel bajo, la
ventana de operacin se corre hacia el extremo izquierdo, o ms bajo, del eje del tiempo, indicando que
se necesitarn duraciones del ciclo ms cortas para conseguir el espesor del xido deseado.
Es interesante observar los resultados que se hubieran obtenido si las mediciones del espesor del xi
do de las obleas se hubieran considerado incorrectamente como rplicas. En la tabla 6-19 se presenta el
anlisis de varianza del modelo completo basado en tratar el experimento como un diseo factorial 2* con
rplicas. Observe que hay muchos factores significativos en este anlisis, lo cual sugiere un modelo mucho
ms complejo del que se encontr cuando se utiliz el espesor promedio del xido como la respuesta. La
razn de esto es que la estimacin de la varianza del error de la tabla 6-19 es muy pequea (&^ = 6.12). El
cuadrado medio de los residuales de la tabla 6-19 refleja la variabilidad entre las obleas dentro de una co
rrida y la variabihdad entre las corridas. La estimacin del error que se obtiene en la tabla 6-18 es mucho
ms grande,
= 17.61, y es principalmente una medida de la variabihdad entre las corridas. sta es la
mejor estimacin del error que deber usarse para juzgar la significacin de las variables del proceso que
se modifican de una corrida a otra.
Una pregunta lgica que podra plantearse es; qu dao causa identificar demasiados factores como
importantes?, como ciertamente sera el caso en el anhsis incorrecto de la tabla 6-19. La respuesta es que

6-5 UNA SOLA RPUCA DEL DISEO 2

Efecto

Figura 6-29 Grfica de probabilidad normal de los efectos para la respuesta del es
pesor promedio del xido, ejemplo 6-5.
Tabla 6-18

Source
Model

Anlisis de varianja (de Design-Expen) para la respuesta espesor promedio del xido,
ejemplo 6-5

Sum of
Squares

DF

Mean
Square

10774.31

F
Valu

Prob>F

A
B
C
AB
AC
Residual
Cor Total

2154.86

122.35

<0.000

7439.06
1314.06
430.56
1139.06
451.56

1
1
1
1
1

74.-19.06
1314.06
430.56
1139.06
451.56

422.37
74.61
24.45
64.67
25.64

<0.000
<0.000
0.0006
<0.000
0.0005

176.12
10950.44

10
15

17.61

Std. Dev.
Mean
C.V.
PRESS

4.20
399.19
1.05
450.88

Factor

Intercept
>4'Time
&-Temp
C-Pressure

AB
AC

H-Squared
Adj. ff'Squared
Pred. ff-Squared
Adeq. Precisin

0.9839
0.9759
0.9588
27.967

Coafficient
Estmate

DF

Standard
Error

95% Cl
Lew

95% Cl
Hlgh

399.19
21.56
9.06
-5.19
8.44
-5.31

1
1
1
1
1
1

1.05
1.05
1.05
1.05
1.05
1,05

396.85
19.22
6.72
-7.53
6.10
-7.65

401.53
23.90
11.40
-2 .8 5
10.78
-2.97

267

268

CAPTULO 6

DISEO FACTORIAL Z''

Tiempo

to)a:3= -1

Tiempo

(6)i3= +1
Figura 6-30 Grficas de contorno del espesor promedio del xido con
la presin (xj) mantenida constante.

intentar manipular u optimizar los factores que no son importantes sera un desperdicio de recursos, y po
dra resultar en agregar variabilidad innecesaria a otras respuestas de inters.
Cuando se hacen mediciones duplicadas de la respuesta, casi siempre hay informacin til acerca de
algn aspecto de la variabiHdad del proceso contenida en estas observaciones. Por ejemplo, si las medi
ciones duplicadas son pruebas mltiples hechas con un instrumento de medicin en la misma unidad ex-

6-5 UNA SOLA RPLICA DEL DISEO 2*


Ikbla 6-19

Anlisis de varianza (de Design-Expert) de la respuesta individual del espesor del xido de
las obleas

S u m of
Source
Model

43801.75

A
B
C
D
AB
AC
AD
BC
BD
CD
ABO
ABC
ACD
BCD
ABCD

29756.25
5256.25
1722.25
42.25
4556.25
1806.25
20.25
240.25
240.25
20.25
132.25
2.25
0.25
6.25
0.25

Residual
LackofFit
Pur Error

Cor. Total

269

DF
15

294.00
0.000

48

294.00

48

4409B.75

63

Mean
S<|uare

F
Valu

2920.12

476.75

29756.25
5256.25
1722.25
42.25
4556.25
1806.25
20.25
240.25
240.25
20.25
132.25
2.25
0.25
6.25
0.25

4858.16
858.16
281.18
6.90
743.88
294.90
3.31
39.22
39.22
3.31
21.59
0.37
0.041

1.02

0.041

Prob > F

< 0.0001
< 0.0001
< 0.0001
< 0.0001
0.0115

< 0.0001

< 0.0001
0.0753
< 0.0001
< 0.0001
0.0753
< 0.0001
0.5473
0.8407
0.3175
0.8407

6.12

6.13

perimental, entonces las mediciones duplicadas proporcionan cierta informacin acerca de la eficiencia
del instrumento de medicin. Si las mediciones duplicadas se hacen en diferentes lugares dentro de una
unidad experimental, pueden brindar cierta informacin acerca de la uniformidad de la variable de res
puesta en esa unidad. En el ejemplo tratado aqu, ya que se tiene una observacin en cada una de cuatro
unidades experimentales que se han sometido a un procesamiento conjunto, se tiene cierta infonmacin
acerca de la variabilidad dentro de las corridas del proceso. Esta informacin se encuentra contenida en la
varianza de las mediciones del espesor del xido de las cuatro obleas de cada corrida. Sera de inters de
terminar si alguna de las variables del proceso influye en la variabilidad al interior de las corridas.
La figura 6-31 es una grfica de probabilidad normal de las estimaciones de los efectos obtenidas uti
lizando ln(^) como la respuesta. Recuerde que en el captulo 3 se indic que la transformacin logartmi
ca es por lo general apropiada para modelar la variabilidad. No hay ningn efecto individual fuerte, pero
el factor^ y la interaccin BD son los ms grandes. Si se incluyen tambin los efectos principales d e B y D
para obtener un modelo jerrquico, entonces el modelo de ln(s^) es
h ^ ) = 1.08+0.41^1 -

+ 0.20;(4 -

El modelo explica apenas poco menos de la mitad de la variabilidad en la respuesta ln(5^), lo cual desde
luego no es nada espectacular para un modelo emprico, pero con fiecuencia es difcil obtet^r modelos
excepcionalmente buenos de las varianzas.
La figura 6-32 es una grfica de contorno de la varianza predicha (no del logaritmo de la varianza predicha) con la presin a;3en el nivel bajo (recuerde que con esto se minimiza la duracin del ciclo) y el flujc
de gasx4 en el nivel alto. Esta eleccin del flujo de gas produce los valores mnimos de la varianza predicha
en la regin de la grfica de contorno.
En este caso, los experimentadores se enfocaron en seleccionar valores de las variables de diseo que die
ran im espesor medio del xido dentro de las especificaciones del proceso y tan cerca de 400 como fuera po
sible, haciendo al mismo tiempo que la variabilidad dentro de las corridas sea pequea, por ejemplo s 2..

270

CAPTULO 6

DISEO FACTORIAL 2>

Efecto

Figura 6-31 Grfica de probabilidad normal de los efectos utilizando In (s^) como
la respuesta, ejemplo 6-5.
Varianza

Figura 6-32 Grfica de contorno de (variabilidad dentro de las co


rridas) con la presin en el nivel bajo y el flujo de gas en el nivel alto.

6'6 ADICIN DE PUNTOS CENTRALES EN EL DISEO 2

271

IjOO
Figura 6-33 Superposicin del espesor promedio del xido y las res
puestas con la presin en el nivel bajo y el flujo de gas en el nivel alto.

Una manera posible de encontrar un conjunto de condiciones adecuado es superponiendo las grficas de
contorno de las figuras 6-30 y 6-32. La grfica de la superposicin se muestra en la figura 6-33, con las es
pecificaciones del espesor medio del xido y la restriccin < 2 indicadas como contornos. En esta grfi
ca, la presin se mantiene constante en el nivel bajo y el flujo de gas se mantiene constante en el nivel alto.
La regin no sombreada cerca de la parte central izquierda de la grfica identifica una regin factible
para las variables tiempo y temperatura.
Este es un ejemplo simple del uso de las grficas de contorno para estudiar dos respuestas simult
neamente. Este problema se analizar con mayor detalle en el captulo 11.

6-6

A D IC I N DE P U N T O S CENTRALES E N EL DISEO 2*

Una preocupacin potencial en el uso de diseos factoriales de dos niveles es el supuesto de la linpnlidnri
de los efectos de los factores. Desde luego, no es necesaria la linealidad perfecta, y el sistema 2* funciona
r bastante bien incluso cuando el supuesto de linealidad sea vlido slo de manera muy aproximada. D e
hecho, se ha sealado ya que si se agregan los trminos de interaccin a un modelo de los efectos princi
pales o de primer orden, de donde se obtiene
(6-26)
<J

entonces se tiene un modelo con la capacidad de representar cierta curvatura en la funcin de respuesta.
Esta curvatura, desde luego, es resultado del torcimiento del plano inducido por los trminos de interacdxiP^pCj.

272

CAPTULO 6 DISEO FACTORIAL 2k

Habr situaciones en que la curvatura de la funcin de respuesta no est modelada adecuadamente


por la ecuacin 6-26. En tales casos, un modelo lgico por considerar es

j= i

i< J

donde las ^] representan efectos cuadrticos o de segundo orden puros. A la ecuacin 6-27 se le llama mo
delo de superficie de respuesta de segundo orden.
Cuando se realiza un experimento factorial de dos niveles, por lo general se anticipa el ajuste del mo
delo de primer orden de la ecuacin 6-26, pero deber estarse alerta ante la posibilidad de que el modelo
de segundo orden de la ecuacin 6-27 sea en realidad ms apropiado. Existe un mtodo para hacer una r
plica de ciertos puntos de un diseo factorial 2* que ofrecer proteccin contra la curvatura de los efectos
de segundo orden a la vez que permitir una estimacin independiente del error que va a obtenerse. El
mtodo consiste en agregar pontos centrales en el diseo 2*. stos consisten en n rplicas que se corren
en los puntos x = O(i = 1,2,..., k). Una razn importante para agregar rplicas de las corridas en el cen
tro del diseo es que los puntos centrales no afectan las estimaciones usuales de los efectos en un diseo
2*. Cuando se agregan puntos centrales, se supone que los k factores son cuantitativos.
Para ilustrar este enfoque, considere un diseo 2^ con una observacin en cada uno de los puntos fac
toriales (-, - ) , ( + , - ) , ( - , + ) y ( + , + ) , y Wc observaciones en el punto central (0 ,0). En la figura 6-34 se ustra la situacin. Scayp el promedio de las cuatro corridas en los cuatro puntos factoriales y sea ye el
promedio de las c corridas en el punto central. Si la diferencia^;, - y e es pequea, entonces los puntos
centrales caen en el plano (o cerca de l) que pasa por los puntos factoriales, y no hay curvatura cuadrti
ca. Por otra parte, siy^^ ~yc es grande, entonces est presente una curvatura cuadrtica. La suma de cua
drados de la curvatura cuadrtica pura con un solo grado de libertad est dada por

ss.Cuadrtica pura

r t r n c ( y , ~ y c )L
tip+ric

(6_28)

donde, en general, rip es el nmero de puntos del diseo factorial. Esta cantidad puede compararse con el
cuadrado medio del error para probar la curvatura cuadrtica pura. Ms especficamente, cuando se

6-6 ADICIN DE PUNTOS CENTRALES EN EL DISEO 2*

273

agregan puntos en el centro del diseo 2^ con la prueba de la curvatura (utilizando la ecuacin 6-2S) en
realidad se prueban las hiptesis

/=i
Adems, si los puntos factoriales del diseo no tienen rplicas, pueden usarse los nc puntos centrales para
construir una estimacin del error con c - 1 grados de libertad.

EJEMPLO 6 - 6 .......................................................................................................................................... ..
U n ingeniero qumico estudia el rendimiento de un proceso. Hay dos variables de inters, el tiempo de
reaccin y la temperatura de reaccin. Debido a que no se tiene la seguridad sobre el supuesto de linealidad en la regin de exploracin, el ingeniero decide realizar un diseo factorial 2^(con una sola rplica de
cada corrida factorial) aumentando con cinco puntos centrales. El diseo y los datos del rendimiento
se muestran en la figura 6-35.
En la tabla 6-20 se resume el anlisis de varianza de este experimento. El cuadrado medio del error se
calcula a partir de los puntos centrales de la siguiente manera:
S S,
MS E ~
c - 11
(6-29)
Puntos centrales____________

H c- 1
Por lo tanto, por la tabla 6-20,

MS

( y , -40.46)^

i=i

4
0.1720
4
= 0.0430

40.0
160 -

41.5

g
s

I-

40.3
40.5
40.7
40.2
40.6

150 - -1

39.3

40.9

-1

+1

30

35

40

A = Tiempo de reaccin (min)

Figura 6-35 El diseo 2^ con cinco puntos


centrales para el ejemplo 6-6.

274

CAPTULO 6

Fuente de
variacin
A (Tiempo)
B (Tfemperatura)
AB
Cuadrtica pura
Error
Tbtal

DISEO FACTORIAL 2'-

Suma de
cuadrados
2.4025
0.4225
0.0025
0.0027
0.1720
3.0022

Cuadrado
inedio
2.4025
0.4225
0.0025
0.0027
0.0430

Grados de
libertad
1
1
1
4
8

Fo
55.87
9.83
0.06
0.06

Valor P
0.0017
0.0350
0.8185
0.8185

El promedio de los puntos de la parte factorial del diseo e&yp = 40.425, y el promedio de los puntos si
tuados en el centro es ye = 40.46. La diferencian^,-ye = 40.425 - 40.46 = -0.035 parece ser pequea. La
suma de cuadrados de la curvatura cuadrtica pura de la tabla del anlisis de varianza se calcula con la
ecuacin 6-28 de la siguiente manera:
SS Cuadrtica pura

n rric {y ,-y c f
rif + c
_ (4)(5)(-0.035)^
4+5
= 0.0027

El anlisis de varianza indica que ambos factores tienen efectos principales significativos, que no existe
interaccin, y que no hay evidencia de curvatura de segundo orden en la respuesta en la regin de explora
cin. Es decir, la hiptesis nula Hq.
+ ^22 = ^
puede rechazarse.

En el ejemplo 6-6 se lleg a la conclusin de que no haba indicios de efectos cuadrticos; es decir, un
modelo de primer orden
>-= fia +PiX^ + P 2 H

es apropiado (aun cuando probablemente no se necesite el trmino de la interaccin). Habr situaciones


en las que se necesitarn los trminos cuadrticos. Es decir, se tendr que suponer entonces un modelo de
segundo orden tal como
y fio

^1-^1

*^12^1^2

*"^22''-2

Desafortunadamente, los parmetros desconocidos (lasfi) de este modelo no pueden estimarse, ya que
hay seis parmetros por estimar y el diseo 2^ ms los puntos centrales de la figura 6-35 slo tienen cinco
corridas independientes.
Una solucin simple y de gran efectividad de este problema es aumentar el diseo 2^ con cuatro corri
das axiales, como se ilustra en la figura 6-36a. El diseo resuUante, llamado diseo central compuesto,
puede usarse entonces para ajustar el modelo de segundo orden. En la figura 6-366 se muestra un diseo
central compuesto para k = 3 factores. Este diseo tiene 1 4 + ric corridas (generalmente 3 nc ^ 5), y es
un diseo muy eficiente para ajustar el modelo de segundo orden con 10 parmetros en fc = 3 factores.
Los diseos compuestos centrales se usan ampamente para construir modelos de superficie de res
puesta de segundo orden. Estos diseos se estudiarn con mayor detalle en el captulo 11.

6-6 ADICIN DE PUNTOS CENTRALES EN EL DISEO 2*

*2

*3

al Dos factores

6) Tres factores

275

Figura 6-36 Diseos centrales compuestos.

Se concluye esta seccin con algunas sugerencias y observaciones adicionales tiles referentes al uso
de puntos centrales.
1.

2.

3.

4.

5.

Cuando un experimento factorial se lleva a cabo en un proceso en marcha, considere utilizar las
condiciones de operacin actuales (o de receta) como el punto central del diseo. Esto con fre
cuencia le asegura al personal de operacin que al menos una parte de las corridas del experimento
van a realizarse bajo condiciones familiares, y por lo tanto es improbable que los resultados obteni
dos (por lo menos para estas corridas) sean peores que los que se obtienen tpicamente.
Cuando el punto central de un experimento factorial corresponde con las condiciones de opera
cin actuales, el experimentador puede usar las respuestas observadas en el punto central para
proporcionar una verificacin aproximada de si algo inusual ocurri durante el experimento.
Es decir, las respuestas del punto central debern ser muy similares a las respuestas observadas
histricamente en la operacin rutinaria del proceso. Con frecuencia el personal de operacin
llevar una carta de control para monitorear el desempeo del proceso. En ocasiones las res
puestas de los puntos centrales pueden graficarse directamente en la carta de control como una
verificacin de la forma en que estuvo operando el proceso durante el experimento.
Considere correr las rplicas del punto central en orden no aleatorio. Especficamente, debern
correrse uno o dos puntos centrales en o cerca del principio del experimento, uno o dos cerca de
la parte media, y uno o dos cerca del final. Al separar los puntos centrales en el tiempo, el experi
mentador tiene una verificacin aproximada de la estabilidad del proceso durante el experimen
to. Por ejemplo, si ha ocurrido una tendencia en la respuesta mientras se realizaba el
experimento, graficar las respuestas de los puntos centrales contra el tiempo puede poner de ma
nifiesto esta situacin.
En ocasiones los experimentos tienen que realizarse en situaciones en las que la informacin pre
via acerca de la variabilidad del proceso es escasa o nula. En estos casos, correr dos o tres puntos
centrales como las primeras corridas en el experimento puede ser de suma utilidad. Estas corridas
pueden proporcionar una estimacin preliminar de la variabilidad. Si la magnitud de la variabili
dad parece razonable, se contina; por otra parte, si la variabiUdad observada es mayor que la anti
cipada (o que la razonable!), habr que detenerse. Con frecuencia es muy provechoso estudiar la
cuestin de por qu es tan grande la variabihdad antes de proceder con el resto del experimento.
Generalmente, se utilizan puntos centrales cuando todos los factores del diseo son cuantitati
vos. Sin embargo, en ocasiones habr una o ms variables cualitativas o categricas y varias cuan-

276

CAPITULO 6

DISEO FACTORIAL 2

Tipo de
catalizador

Figura 6-37 Un diseo 2 con un factor cualitativo y puntos


centrales.

titativas. Sigue siendo posible emplear los puntos centrales en estos casos. Para ilustrar este
punto, considere un experimento con dos factores cuantitativos, el tiempo y la temperatura, cada
uno con dos niveles, y un solo factor cualitativo, el tipo de catalizador, tambin con dos niveles
(orgnico e inorgnico). En la figura 6-37 se muestra el diseo 2^ para estos factores. Observe
que los puntos centrales se colocan en las caras opuestas del cubo que incluyen los factores cuan
titativos. En otras palabras, los puntos centrales pueden correrse con las combinaciones de los
tratamientos en los niveles alto y bajo de los factores cualitativos, siempre y cuando esos subespacios incluyan nicamente factores cuantitativos.

6-7
6- 1.

PROBLEMAS
Un ingeniero est interesado en los efectos de la velocidad de corte (A), la. geometra de la herramienta (B) y
el ngulo de corte (C) sobre la vida (en horas) de una mquina herramienta. Se eligen dos niveles de cada
factor y se corren tres rpUcas de un diseo factorial 2. Los resultados fueron los siguientes:

+
+
+
-I-.

+
+
+

-H
+
-H
+

Rplica

Combinacin de
tratamientos

II

III

(1)
a
b
ab
c
ac
be
abe

22
32
35
55
44
40
60
39

31
43
34
47
45
37
50
41

25
29
50
46
38
36
54
47

) Estimar los efectos de los factores. Qu efectos parecen ser grandes?


Usar el anlisis de varianza para confirmar las conclusiones del inciso a.
c) Escribir un modelo de regresin para predecir la vida de la herramienta (en horas) con base en los resul
tados de este experimento.
d) Analizar los residuales. Hay algn problema evidente?
e) Con base en el anhsis de las grficas de los efectos principales y las interacciones, cules seran los ni
veles d c A , B y C que se recomendara utilizar?
Considere nuevamente el inciso c del problema 6-1. Utilizar el modelo de regresin para generar las grficas
de la superficie de respuesta y de contorno de la respuesta, la vida de la herramienta. Interpretar estas grfi
cas. Ofrecen alguna idea respecto de las condiciones de operacin deseables para este proceso?
b)

6-2.

6-7 PROBLEMAS

6-3.

6-4.

6-5.

277

Encontrar el error estndar de los efectos de los factores y aproximar los lmites de confianza de 95% para los
efectos de los factores en el problema 6-1. Los resultados de este anlisis concuerdan con las conclusiones
del anlisis de varianza?
Representar los efectos de los factores del problema 6-1 en una grfica relativa a una distribucin t escalada
apropiadamente. En esta representacin grfica se identifican de manera adecuada los factores importan
tes? Comparar las conclusiones de esta grfica con los resultados del anlisis de varianza.
Se usa una mquina para hacer ranuras de localizacin en una tarjeta de circuitos impresos. El nivel de vibra
cin en la superficie de la tarjeta cuando se hacen las ranuras se considera una fuente principal de variacin
dimensional de las ranuras. Se piensa que dos factores influyen en la vibracin: el tamao de las ranuras {A )y
la velocidad de corte (B). Se seleccionan dos tamaos de las ranuras y i de pulgada) y dos velocidades (40 y
90 rpm), y se hacen ranuras en cuatro tarjetas con cada conjunto de condiciones que se muestran abajo. La
variable de respuesta es la vibracin medida como el vector resultante de tres acelermetrcs (x ,y y z ) en cada
tarjeta de prueba.

A
-K

Combinacin d e _________ 5EE------------tratamientos_______ I


II
III
IV

-I-

+
a)

(1)
a

18.2
27.2
b
15.9
ab___________41.0

18.9
24.0
14.5
43.9

12.9
22.4
15.1
36.3

14.4
22.5
14.2
39.9

Analizar los datos de este experimento.

b) Construir una grfica de probabilidad normal de los residuales, y graficar los residuales contra el nivel de
vibracin predicho. Interpretar estas grficas.
Hacer la grfica de la interaccin.^B. Interpretar esta grfica. Qu niveles del tamao de las ranuras y
la velocidad se recomendaran para la operacin rutinaria?
Considere nuevamente el experimento descrito en el problema 6-1. Suponga que el experimentador efectu
nicamente ocho ensayos de la rplica 1. Adems, corri cuatro puntos centrales y obtuvo los siguientes valo
res de la respuesta: 36, 40, 43, 45.
a) Estimar los efectos de los factores. Qu efectos son grandes?
b) Efectuar un anlisis de varianza, incluyendo una verificacin de la curvatura cuadrtica pura. A qu
conclusiones se llega?
c) Escribir un modelo apropiado para predecir la vida de la herramienta, con base en los resultados de este
experimento. Este modelo difiere en alguna forma sustancial del modelo del problema 6-1, inciso c?
d) Analizar los residuales.
e) A qu conclusiones se llegara acerca de las condiciones de operacin apropiadas para est proceso?
Se llev a cabo un experimento para mejorar el rendimiento de un proceso qumico. Se seleccionaron cuatro
factores y se corrieron dos rplicas de un experimento completamente aleatorizado. Los resultados se pre
sentan en la tabla siguiente:

c)
6-6,

6-7.

de tratamientos

RpUca
I
II

(1)
a
b
ab
c
ac
be
abe

90
74
81
83
77
81
88
73

93
78
85
80
78
80
82
70

rom binadn ___


de tratamientos
I
d
ad
bd
abd
cd
acd
bcd
abcd

98
72
87
85
99
79
87
80

II
95
76
83
86
90
75
84
80

278

CAPTULO 6

DISEO FACTORIAL

a)
b)

6-8.

Estimar los efectos de los factores.


Construir la tabla del anlisis de varianza y determinar cules factores son importantes para explicar el
rendimiento.
c) Escribir un modelo de regresin para predecir el rendimiento, suponiendo que los cuatro factores se hi
cieron variar en el rango de -1 a + 1 (en unidades codificadas).
d) Graficar los residuales contra el rendimiento predicho y en una escala de probabilidad normal. El anli
sis residual parece ser satisfactorio?
e) D os interacciones de tres factores, ABC yA B D , aparentemente tienen efectos grandes. Ti-azar una grfi
ca de cubo en los factores A, S y C con los rendimientos promedio indicados en cada vrtice. Repetir lo
anterior utilizando los factores A , B y D . Estas dos grficas ayudan en la interpretacin de los datos?
Dnde se recomendara que se corriera el proceso con respecto a las cuatro variables?
Un bacterilogo est interesado en los efectos de dos medios de cultivo diferentes y dos tiempos diferentes
sobre el crecimiento de un virus particular. Realiza seis rplicas de un diseo 2 \ haciendo las corridas de ma
nera aleatoria. Analizar los datos del crecimiento viral que se presentan enseguida y sacar las conclusiones
apropiadas. Analizar los residuales y comentar la adecuacin del modelo.

Medio de cultivo
Tiempo, h

6-9.

12

21
23
20

22
28
26

25
24
29

26
25
27

18

37
38
35

39
38
36

31
29
30

34
33
35

U n ingeniero industrial empleado por una compaa refresquera est interesado en los efectos de dos dife
rentes tipos de botellas de 32 onzas sobre el tiempo de entrega de cajas de 12 botellas del producto. Los dos
tipos de botellas son de vidrio y de plstico. Se usan dos empleados para realizar una tarea que consiste en
mover 40 cajas del producto 50 pies en una plataforma de carga estndar y acomodarlas en un estante de ven
ta. Se hacen cuatro rplicas de un diseo factorial 2^ y los tiempos observados se enlistan en la siguiente tabla.
Analizar los datos y sacar las conclusiones apropiadas. AnaUzar los residuales y comentar la adecuacin del
modelo.

Empleado
Tipo de botella

6-10.

Vidrio

5.12
4.98

4.89
5.00

6.65
5.49

6.24
5.55

Plstico

4.95
4.27

4.95
4.25

5.28
4.75

4.91
4.71

En el problema 6-9, el ingeniero tambin estuvo interesado en las diferencias en la fatiga potencial que resul
ta de los tipos de botellas. Como una medida de la cantidad de esfuerzo requerido, midi el aumento del rit
mo cardiaco (pulso) inducido por la tarea. Los resultados se presentan a continuacin. Analizar los datos y
sacar conclusiones. Analizar los residuales y comentar la adecuacin del modelo.

6-7 PROBLEMAS

279

Empleado
Tipo de botella

6 - 11 .

6- 12 .

Vidrio

39
58

45
35

20
16

13
11

Plstico

44
42

35
21

13
16

10
15

Calcular los lmites de confianza aproximados para los efectos de los factores del problema 6-10. Los resul
tados de este anlisis concuerdan con el anlisis de varianza realizado en el problema 6-10?
En un artculo qAT& T Technical Journal (vol. 65, pp. 39-50) se describe la aplicacin de diseos factoriales
de dos niveles en la fabricacin de circuitos integrados. Un paso bsico del procesamiento es hacer crecer
una capa epitaxial sobre obleas de silicio pulidas. Las obleas se montan en un susceptor, se colocan en el inte
rior de una campana de cristal y se introducen vapores qumicos. El susceptor se hace girar y se aplica calor
hasta que la capa epitaxial tiene el espesor suficiente. Se corri un experimento utilizando dos factores: rapi
dez de flujo de arsnico (A) y tiempo de deposicin (B). Se corrieron cuatro rplicas y se midi el espesor de
la capa epitaxial (en //m ). Los datos se muestran a continuacin;

Rplica
A

-1-

+
+

-1-

a)
b)
c)

6-13.

6-14.
6-15.

Niveles de factores

11

IV

14.037
13.880
14.821
14.888

16.165
13.860
14.757
14.921

13.972
14.032
14.843
14.415

13.907
13.914
14.878
14.932

B a jo (-)

Alto (-I-)

55%

59%

Corto
(10 min)

Largo
(15 min)

Estimar los efectos de los factores.


Conducir un anlisis de varianza. Qu factores son importantes?
Escribir una ecuacin de regresin que podra usarse para predecir el espesor de la capa epitaxial en la
regin de la velocidad de flujo del arsnico y el tiempo de deposicin utilizado en este experimento.
d) Analizar los residuales. Se observa algn residual que debiera causar preocupacin?
e) Comentar la forma en que se podra resolver el punto atpico potencial encontrado en el inciso d.
Continuacin delproblema 6-12. Usar el modelo de regresin del inciso c del problema 6-12 para generar una
grfica de contorno de la superficie de respuesta para el espesor epitaxial. Suponga que es de importancia
crtica obtener un espesor de la capa de 14.5 //m. Qu ajustes de la velocidad de flujo del arsnico y del tiem
po de deposicin se recomendaran?
Continuacin del problema 6-13. En qu forma cambiara la respuesta dada en el problema 6-13 si la veloci
dad de flujo del arsnico fuera ms difcil de controlar en el proceso que el tiempo de deposicin?
Se utiliza una aleacin de nquel y titanio para fabricar componentes de los motores de turbina de aviones.
La formacin de fisuras es un problema potencialmente serio de las piezas terminadas, ya que pueden provo
car fallas irreversibles. Se realiza una prueba de las piezas para determinar el efecto de cuatro factores sobre
las fisuras. Los cuatro factores son la temperatura de vaciado (^4), el contenido de titanio (B), el mtodo de
tratamiento trmico (C) y la cantidad de refinador de grano usada (D). Se hacen dos rplicas de un diseo 2"
y se mide la longitud de las fisuras (en mm x 10-^) inducidas en un ejemplar de prueba de muestra sometido a
una prueba estndar. Los datos se niuestran en la siguiente tabla:

280

CAPITULO 6 DISEO FACTORIAL

(1)

+
+

a
+
+

b
ab
c
ac
be
abe
d
ad
bd
abd
cd
aed
bed
abcd

+
+
+

+
+

+
+
+

+
+

+
+

+
+

+
+

+
+
+
+

Rplica

Combinacin de
tratamientos

+
+
+
+
+
+
+
+

II
7.037
14.707
11.635
17.273
10.403
4.368
9.360
13.440
8.561
16.867
13.876
19.824
11.846
6.125
11.190
15.653

6.376
15.219
12.089
17.815
10.151
4.098
9.253
12.923
8.951
17.052
13.658
19.639
12.337
5.904
10.935
15.053

a)
b)

6-16.

6-17.

Estimar los efectos de los factores. Qu efectos de los factores parecen ser grandes?
Conducir un anlisis de varianza. Alguno de los factores afecta la formacin de fisuras? Utilizar a =
0.05.
c) Escribir un modelo de regresin que pueda usarse para predecir la longitud de las fisuras como una fun
cin de los efectos principales y las interacciones significativas que se han identificado en el inciso b.
d) Analizar los residuales de este experimento.
e) Hay algn indicio de que alguno de los factores afecte la variabilidad de la formacin de fisuras?
f) Qu recomendaciones se haran respecto de las operaciones del proceso? Utilizar grficas de las inte
racciones y/o de los efectos principales como ayuda para sacar conclusiones.
Continuacin delproblema 6-15. Una de las variables del experimento descrito en el problema 6-15, el mtodo
de tratamiento trmico (C), es una variable categrica. Suponga que los dems factores son continuos.
) Escribir dos modelos de regresin para predecir la longitud de las fisuras, uno para cada nivel de la varia
ble mtodo de tratamiento trmico. Qu diferencias, en caso de haberlas, se observan en estas dos
ecuaciones?
b) Generar las grficas de contorno apropiadas de la superficie de respuesta para los dos modelos de regre
sin del inciso a.
c) Qu conjunto de condiciones se recomendara para los factores^, 5 y i? si se utiliza el mtodo de trata
miento trmico C = -I-?
d) Repetir el inciso e suponiendo que quiere usarse el mtodo de tratamiento trmico C = - .
U n experimentador corre una sola rplica de un diseo 2'*. Se calcularon las siguientes estimaciones de los
efectos:

A = 76.95
B = -67.52
C = -7.84
D = -18.73

a)
b)

AB
AC
AD
BC
BD
CD

= -51.32
= 11.69
=
9.78
= 20.78
= 14.74
=
1.27

ABC
AB D
ACD
BCD
A B CD

=
=
=
=
=

-2.82
-6.50
10.20
-7.98
-6.25

Construir una grfica de probabilidad normal de estos efectos.


Identificar un modelo tentativo, con base en la grfica de los efectos del inciso a.

6-7 PROBLEMAS

6-18.

28 1

En un artculo de Solid State Technology (Diseo ortogonal para optimizacin de procesos y su aplicacin en
el grabado qumico con plasma) se describe la aplicacin de diseos factoriales en el desarrollo de un proce
so de grabado qumico con nitruros en un dispositivo de grabado qumico con plasma para una sola oblea. El
proceso usa Q F j como gas de reaccin. Cuatro factores son de inters: el entrehierro nodo-ctodo (A), la
presin en la cmara del reactor (5), el flujo del gas CjFj (C) y la potencia aplicada al ctodo (D). La respues
ta de inters es la rapidez de grabado para el nitruro de silicio. Se corre una sola rplica de un diseo 2"; los
datos se muestran enseguida:

Nmero de Orden real de


corrida_______la corrida
1

13

2
8
3
12
4
9
5
4
6
15
7
16
8
3
9
1
10
14
11
5
12
10
13
11
14
2
15
7
1 ____________6

Rapidez de grabado

Niveles de los factores


Alto (-H)

D ________ (/min)__________ Bajo (-)

_
-I-

_
+

_
-H

_
+

_
*

+
-I-t-

-I-

-I-

-I-I-

-H

-t'

-I-

-I-

550
669

^ (cm)
0.80
B (mTbrr) 450
C(SC CM ) 125
D (W)
275

1.20
550
200
325

604
650
633
642
601
635
-H
1037
-t749
+
1052
-I868
-I1075
+
860
-H
1063
+ __________729__________________________________

a) Estimar los efectos de los factores. Considere una grfica de probabilidad normal de los efectos de los
factores. Qu efectos parecen ser grandes?
Efectuar un anlisis de varianza para confirmar los resultados obtenidos en el inciso a.
c) Cul es el modelo de regresin que relaciona la rapidez de grabado con las variables significativas del
proceso?
d) Analizar los residuales de este experimento. Comentar la adecuacin del modelo.
e) Si no todos los factores son importantes, hacer la proyeccin del diseo 2^ en un diseo 2* con k < 4 y
conducir el anlisis de varianza.
f) Ttazar grficas para interpretar cualquier interaccin significativa,
g) Graficar los residuales contra el orden real de las corridas. Qu problemas podran ponerse de mani
fiesto en esta grfica?
Connuacin delproblema 6-18. Considere el modelo de regresin obtenido en el inciso c del problema 6-18.
) Construir las grficas de contorno de la rapidez de grabado utilizando este modelo.
b ) Suponga que fuera necesario operar este proceso con una rapidez de 800 /min. Cules seran los ajus
tes de las variables del proceso que se recomendaran?
Considere la rplica nica del diseo 2^ del ejemplo 6-2. Suponga que se decidi arbitrariamente analizar los
datos suponiendo que las interacciones de tres y cuatro factores eran insignificantes. Conducir este anlisis y
comparar los resultados con los que se obtuvieron en el ejemplo. Piensa el lector que es una buena idea su
poner de manera arbitraria que las interacciones son insignificantes incluso cuando sean de orden relativa
mente alto?
Se realiz un experimento en una fbrica de semiconductores en un esfuerzo para incrementar el rendimien
to. Se estudiaron cinco factores, cada uno con dos niveles. Los factores (y los niveles) fueron: j4 = ajuste de
apertura (pequea, grande), B = tiempo de exposicin (20% abajo del nominal, 20% arriba del nominal),
b)

6-19.

6-20.

6-21.

282

CAPTULO 6 DISEO FACTORIAL 2'

C = tiempo de desarrollo (30 s, 45 s), D = tamao de la mscara (pequea, grande) y E - tiempo de grabado
(14.5 min, 15.5 min). Se corri el diseo 2^ no replicado que se muestra a continuacin.
(1)

d = 8
e = 8
ad = 10
ae = 12
i> = 34
fed = 32
fee = 35
ab = 55
abd = 50
abe = 52
c = 16
c d = 18
ce = 15
ac = 2 0
acd = 2 1
ace = 22
be - 40
bcd - 44
bce = 45
abe =60________ abcd = 61______ abce = 65

= 9

de = 6
ade = 1 0
bde = 30
abde = 53
cde = 15
acde 2 0
bcde = 41
abcde^ 63

a)

622.

6-23.

Construir una grfica de probabilidad normal de las estimaciones de los efectos. Qu efectos parecen
ser grandes?
b) Efectuar un anlisis de varianza para confirmar los resultados obtenidos en el inciso a.
c) Escribir el modelo de regresin que relacione el rendimiento con las variables significativas del proceso.
d) Graficar los residuales en papel probabilidad normal. La grfica es satisfactoria?
e) Graficar los residuales contra los rendimientos predichos y contra cada uno de los cinco factores. Co
mentar las grficas.
f) Interpretar cualquier interaccin significativa.
g) Qu recomendaciones se haran respecto de las condiciones de operacin del proceso?
h) Hacer la proyeccin del diseo 2= de este problema en un diseo 2*=en los factores importantes. Esque
matizar el diseo e indicar el promedio y el rango de los rendimientos en cada corrida. Es de ayuda este
esquema para interpretar los resultados de este experimento?
Continuacin deproblema 6-21, Suponga que el experimentador corri cuatro puntos centrales adems de los
32 ensayos del experimento original. Los rendimientos obtenidos en las corridas de los puntos centrales fue
ron 68, 74, 76 y 70.
a) Analizar de nuevo el experimento, incluyendo una prueba para la curvatura cuadrtica pura.
b) Comentar cul sera el siguiente paso.
Se estudiaron cuatro factores, cada uno con dos niveles, en un estudio del rendimiento de un proceso: el
tiempo (A), la concentracin (B), la presin (C) y la temperatura (D). Se corri una sola rplica de un diseo
2"* y los datos obtenidos se muestran en la siguiente tabla:

Nmero de Orden real de


corrida
la corrida
1
2
3
4
5
6
7
8
9

5
9
8
13
3
7
14
1
6

10
11
12
13
14
15
16

11
2
15
4
16
10
12

+
+
+
+
-1-

+
-1+
-H

-1+
-1-h

-1+

-H

-1-

-1-

+
-H

-H
+
+
-1-

H-1+
+

-1-

Rendimiento
(Ibs)
12
18
13
16
17
15

20

15

-H
-1+

10
25
13
24
19

21
17
23

Niveles d los factores


Bajo (-)
^ (h )
B (% )
C (psi)
D (C )

2,5
14
60
225

Alto (+ )
3
18
80
250

6-7 PROBLEMAS

283

a) Construir una grfica de probabilidad norinal de las estimaciones de los efectos. Qu factores parecen
tener efectos grandes?
b) Efectuar un anlisis de varianza utilizando la grfica de probabilidad normal del inciso a como gua para
formar el trmino del error. A qu conclusiones se llega?
c) Escribir un modelo de regresin que relacione el rendimiento con las variables importantes del proceso.
d) Analizar los residuales de este experimento. El anlisis indica algn problema potencial?
e) Es posible plegar este diseo a un diseo 2^con dos rplicas? De ser as, esquematizar el diseo con el
promedio y el rango del rendimiento indicados en cada punto del cubo. Interpretar los resultados.
6-24. Continuacin delproblema 6-23. Usar el modelo de regresin del inciso c del problema 6-23 para generar una
grfica de contomo de la superficie de respuesta del rendimiento. Analizar el valor prctico de esta grfica
de superficie de respuesta.
6-25. El experimento del brownie (pastelito) exquisito. El autor es un ingeniero hecho en la prctica y un firme creyen
te de aprender haciendo las cosas. Durante muchos aos ha impartido el curso de diseo experimental a una
amplia variedad de audiencias y siempre asigna la planeacin, realizacin y anlisis de un experimento real a
los participantes de la clase. Los participantes parecen disfrutar esta experiencia prctica y siempre
aprenden mucho de ella. En este problema se utilizan los resultados de un experimento realizado por Gretchen Krueger en la Universidad Estatal de Arizona.
Existen muchas formas diferentes de hornear brownies. El propsito de este experimento fue determinar
la forma en que el material del molde, la marca de la harina para brownies y el mtodo de batido afectan la
exquisitez de los brownies. Los niveles de los factores fueron:

Factor
A = material del molde
B = mtodo de batido
C = marca de la harina

Bajo (-)
Vidrio
Cuchara
Cara

Alto (-(-)
Aluminio
Batidora
Barata

La variable de respuesta fue la exquisitez, una medida subjetiva derivada de un cuestionario aplicado a los
sujetos que hicieron el muestreo de cada lote de brownies. (Este cuestionario inclua aspectos como el sabor,
la apariencia, la consistencia, el aroma, etc.) Un panel de prueba integrado por ocho personas hizo el mues
treo de cada lote y llen el cuestionario. La matriz del diseo y los datos de la respuesta se presentan a conti
nuacin:

Lote de
brownies
1
2
3
4
5
6
7
8

+
-

-1-1-

+
+

+
-1+
+

1
11
15
9
16
10
12
10
15

2
9
10
12
Y1
11
13
12
12

Resultados del panel de prueba


3
4
5
6
10
10
11
10
16
14
12
9
11
11
11
11
15
12
13
13
15
8
6
8
14
13
9
13
13
10
7
7
15
13
12
12

7
8
6
11
11
9
14
17
9

8
9
15
12
11
14
9
13
14

a) Analizar los datos de este experimento como si se tratara de ocho rplicas de un diseo 2^. Comentar los
resultados.

284

CAPTULO 6 DISEO FACTORIAL 2

b) El anlisis del inciso a es el enfoque correcto? Hay nicamente ocho lotes; se tienen en realidad ocho
rplicas de un diseo factorial 2^?
Analizar el promedio y la desviacin estndar del puntaje de la exquisitez. Comentar los resultados,
Este anlisis es ms apropiado que el del inciso a? Por qu s o no?
Se condujo un experimento en un proceso qumico para producir un polmero. Los cuatro factores estudia
dos fueron la temperatura (A), la concentracin del catalizador (B), el tiempo (C) y la presin (D). Se obser
varon dos respuestas, el peso molecular y la viscosidad. La matriz del diseo y los datos de la respuesta se
presentan a continuacin:

c)
6-26.

Nmero Orden real de


de corrida las corridas A

18
9
13

-1-

-I-

+
+

+
+

+
+
+
+

3
11

9
10
11
12
13
14
15
16
17
18
19
20

14
17
6
7
2
10
4
19
15
20
1
5
16
12

+
+

+
-

+
+
0
0
0
0

+
0
0
0
0

+
+
+
+
0
0
0
0

+
+
+
+
+
+
+
+
0
0
0
0

Niveles de los factores

Peso
molecular

Viscosidad

2400
2410
2315
2510
2615
2625
2400
2750
2400
2390
2300
2520
2625
2630
2500
2710
2515
2500
2400
2475

1400
1500
1520
1630
1380
1525
1500
1620
1400
1525
1500
1500
1420
1490
1500
1600
1500
1460
1525
1500

Bajo (-)
ACC)
B {% )
C (min)
)(psi)

Alto (+ )
100
4
20
60

120
8
30
75

a) Considere nicamente la respuesta del peso molecular. Graficar las estimaciones de los efectos en una
escala de probabilidad normal. Qu efectos parecen ser importantes?

b) Usar un anlisis de varianza para confirmar los resultados del inciso a . Hay algn indicio de curvatura?
c)

6-27.

Escribir un modelo de regresin para predecir el peso molecular como una funcin de las variables im
portantes.
d) Analizar los residuos y comentar la adecuacin del modelo.
e) Repetir los incisos a~d utilizando la respuesta de la viscosidad.
Continuacin del problema 6-26. Utilizar los modelos de regresin del peso molecular y la viscosidad para res
ponder las preguntas siguientes.
) Construir una grfica de contorno de la superficie de respuesta para el peso molecular. En qu direc
cin se ajustaran las variables del proceso a fin de incrementar el peso molecular?
b) Construir una grfica de contorno de la superficie de respuesta para la viscosidad. En qu direccin se
ajustaran las variables del proceso para disminuir la viscosidad?

6-7 PROBLEMAS

6-28.

6-29.

6-30.

c) Qu condiciones de operacin se recomendaran si fuera necesario producir un producto con peso mo


lecular entre 2400 y 2500, y con la viscosidad ms baja posible?
Considere una sola rplica del diseo 2^del ejemplo 6-2. Suponga que se hicieron cinco corridas de puntos en
el centro (0 ,0 ,0 ,0) y que se observaron las respuestas siguientes: 73,75,71,69 y 76. Probar la curvatura en
este experimento. Interpretar los resultados.
Vn valorfallante en un diseofactorial 2*-. No es raro encontrar que falta una de las observaciones de un diseo
2^ debido a un equipo de medicin defectuoso, una prueba fallida, o alguna otra razn. Si el diseo se hace
con n rplicas (n > 1), puede emplearse alguna de las tcnicas estudiadas en el captulo 5. Sin embargo, para
un diseo factorial sin rplicas (n = 1) debe usarse otro mtodo. Un enfoque lgico es estimar el valor faltante con un nmero que haga cero el contraste de la interaccin de orden ms alto. Aplicar esta tcnica al expe
rimento del ejemplo 6-2, suponiendo que falta la corrida ab. Compare los resultados obtenidos con los del
ejemplo 6-2.
Un ingeniero realiz un experimento para estudiar el efecto de cuatro factores sobre la aspereza superficial
de una pieza maquinada. Los factores (y sus niveles) son^ = ngulo de la herramienta (12,15), B = viscosi
dad del uido de corte (300,400), C = velocidad de alimentacin (10,15 pulg/min) yD = enfriador del fluido
de corte usado (no, s). Los datos de este experimento (con los factores codificados en los niveles usuales -1,
-Hl) se muestran a continuacin.

Corrida
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

6-31.

285

C
_

D
_

+
+

-1+

-1-

+
+

+
+
+
+

-1-

+
+

+
-1-1-1-

-1-

+
+

-1-

+
-t-1-1-1+
+

Rugosidad superficial
0.00340
0.00362
0.00301
0.00182
0.00280
0.00290
0.00252
0.00160
0.00336
0.00344
0.00308
0.00184
0.00269
0.00284
0.00253
0.00163

a) Estimar los efectos de los factores. Representar las efectos de los factores en una grfica de probabilidad
normal y seleccionar un modelo tentativo,
b) Ajustar el modelo identificado en el inciso a y analizar los residuales. Hay algn indicio de que el mode
lo no sea adecuado?
c) Repetir el anlisis de los incisos a y b utilizando Ify como la variable de respuesta. Hay algn indicio de
que la transformacin ha sido til?
d) Ajustar un modelo en trminos de las variables codificadas que pueda usarse para predecir la rugosidad
superficial. Convertir esta ecuacin de prediccin en un modelo en las variables naturales.
La resistividad de una oblea de silicio est influida por varios factores. Los resultados de un experimento fac
torial 2* realizado durante un paso crtico del procesamiento se muestran en la tabla siguiente:

286

CAPTULO 6 DISEO FACTORIAL 1'^

Corrida_____ A B
1
2
+
3
-+
4
++
5
_
6
+
7
8
+
9
10
+
11
12
+
13
14
+
15
16
+

C
-

_
_

_
+
+
+
+
+
+

+
+
+
+
_
_
+
+
+
+

D
_
_
_
+
+
+
+
+
+
+
+

Resistividad
1.92
11.28
1.09
5.75
2.13
9.53
1,03
5,35
1.60
11.73
1.16
4.68
2.16
9.11
1.07
5.30

a) Estimar los efectos de los factores. Representar las efectos de los factores en una grfica de probabilidad
normal y seleccionar un modelo tentativo.
b) Ajustar el modelo identificado en el inciso a y analizar los residuales. Hay algn indicio de que el mode
lo no sea adecuado?
c) Repetir el anlisis de los incisos a y b utilizando In (y) como la variable de respuesta. Hay algn indicio
de que la transformacin haya sido til?
d) Ajustar un modelo en trminos de las variables codificadas que pueda usarse para predecir la resistivi
dad.
6-32. Continuacin delprobkma 6-31. Suponga que el experimentador corri tambin cuatro puntos centrales jun
to con las 16 corridas del problema 6-31. Las mediciones de la resistividad en los puntos centrales son: 8.15,
7.63, 8.95 y 6.48. Analizar de nuevo el experimento incorporando los puntos centrales. Qu conclusiones
pueden sacarse ahora?
6-33. Es frecuente usar el modelo de regresin ajustado de un diseo factorial 2' para hacer predicciones en pun
tos de inters del espacio del diseo.
a) Encontrar la varianza de la respuesta predicha ^ en un puntoX],JC2, ...X/, del espacio del diseo. Sugeren
cia: recuerde que las a: estn codificadas, y suponga un diseo 2* con el mismo nmero de rplicas n en
cada punto del diseo, de tal modo que la varianza de un coeficiente de regresin p sea ay(n2^) y que la
covarianza entre cualquier par de coeficientes de regresin sea cero,
b) Usar el resultado del inciso a para encontrar la ecuacin de un intervalo de confianza de 100(1 - a) por
ciento para la verdadera respuesta media en el punto
x^,
x,, del espacio del diseo.
6-34. Modelosjerrquicos. Se ha usado varias veces el principio de jerarqua para seleccionar un modelo; es decir,
se han incluido trminos de orden inferior no significativos en un modelo porque eran factores que estaban
incluidos en trminos de orden superior significativos. Ciertamente, la jerarqua no es un principio absoluto
que deba seguirse en todos los casos. Para ilustrar esto, considere el modelo que result en el problema 6-1,
el cual requiri que se incluyera un efecto principal no significativo para respetar la jerarqua. Utilizar los da
tos del problema 6-1,
a) Ajustar el modelo jerrquico y el modelo no jerrquico.
b) Calcular el estadstico PRESS, la
ajustada y el cuadrado medio del error para ambos modelos,
c) Encontrar un intervalo de confianza de 95 % para la estimacin de la respuesta media en el vrtice de un
cubo (jci = X2 =
= 1). Sugerencia: usar los resultados del problema 6-33.
d) Con base en los anlisis que se han realizado, qu modelo preferira el lector?

Formacin de
bloques y confusin
en el diseo

lA

IN T R O D U C C I N

Hay mltiples situaciones en las que es imposible efectuar todas las corridas de un experimento factorial
2* bajo condiciones homogneas. Por ejemplo, un lote de materia prima podra no ser suficiente para ha
cer todas las corridas requeridas. En otros casos, podra ser conveniente modificar deliberadamente las
condiciones experimentales para asegurar que los tratamientos tengan la misma efectividad (es decir, que
sean robustos) en diversas situaciones que es posible encontrar en la prctica. Por ejemplo, un ingeniero
qumico puede correr un experimento en una planta piloto con varios lotes de materia prima porque sabe
que en el proceso real a gran escala posiblemente se usarn diferentes lotes de materia prima con diversos
grados de calidad.
La tcnica de diseo utilizada en estas situaciones es la formacin de bloques. Este captulo se enfoca
en algunas tcnicas especiales para separar en bloques un diseo factorial 2*.

7-2

FO R M A Q N DE BLOQUES DE U N DISEO FACTORIAL 2^ C O N REPUCAS

Suponga que se han corrido n rplicas del diseo factorial 2*. Esta situacin es idntica a la que se estudi
en el captulo 5, donde se indic cmo correr un diseo factorial general en bloques. Si hay n rpHcas, en
tonces cada conjunto de condiciones no homogneas define un bloque, y cada rplica se corre en uno de
los bloques. Las corridas de cada bloque (o rplica) se haran de manera aleatoria. El anlisis del diseo

Tabla 7-1

Experimento del proceso qufmco en tres bloques________

Ibtales de los bloques

Bloque 1
(1) = 28
a = 36
b = 18
a b = 31
Bi = 113

Bloque 2
(1) = 25
a =32
ft = 19
ab = 30
B2 = 106

Bloque 3
(1) = 27
a = 32
6 = 23
efe = 29
= 111
287

288

CAPTULO 7

Tabla 7-2

FORMACIN DE BLOQUES Y CONFUSIN EN EL DISEO FACTORIAL 2

Anlisis de varianza del experimento del proceso qumico en tres bloques

Fuente de variacin
Bloques
A (concentracin)
B (catalizador)
AB
Error
Tbtal

Suma de
cuadrados
6.50
208.33
75.00
8.33
24.84
323.00

Grados de
libertad
2
1
1

Cuadrado
medio
3.25
208.33
75.00
8.33

50.32
18.12

2.01

0.0004
0.0053
0.2060

4.14

11

es similar al de cualquier experimento factorial separado en bloques; por ejemplo, vase la revisin de la
seccin 5-6.

EJEMPLO 7-1 ............... ...............................................................................................................................


Considere el experimento del proceso qumico que se describi en la seccin 6-2. Suponga que slo pue
den hacerse cuatro ensayos experimentales con un solo lote de materia prima. Por lo tanto, se necesitarn
tres lotes de materia prima para correr las tres rplicas de este diseo. En la tabla 7-1 se muestra el diseo
donde cada lote de materia prima corresponde a un bloque.
En la tabla 7-2 se muestra el anlisis de varianza de este diseo separado en bloques. Todas las sumas
de cuadrados se calculan exactamente igual que en un diseo 2* estndar sin formacin de bloques. La
suma de cuadrados de los bloques se calcula a partir de los totales de los bloques. Sea que
B2 y
re
presenten los totales de los bloques (ver la tabla 7-1). Entonces

yl
12
(113)^ -h(106)^ +(111)^
4
= 6.50

(330)^
12

Hay dos grados de libertad entre los tres bloques. La tabla 7-2 indica que las conclusiones de este anlisis,
si el diseo se hubiera corrido en bloques, son idnticas a las de la seccin 6-2 y que el efecto de los blo
ques es relativamente pequeo.

7-3

C O N FU SI N DEL DISEO FACTORIAL 2^

Hay muchos problemas en los que es imposible realizar una rplica completa de un diseo factorial en un
bloque. La confusin (o mezclado) es una tcnica de diseo mediante la cual un experimento factorial
completo se distribuye en bloques, donde el tamao del bloque es menor que el ntimero de combinacio
nes de los tratamientos de una rplica. La tcnica hace que la informacin acerca de ciertos efectos de los
tratamientos (por lo general las interacciones de orden superior) sea indistinguible de los bloques o est
confundida con los bloques. En este captulo la atencin se centra en los sistemas de confusin (o mezcla
do) para el diseo factorial 2*. Observe que aun cuando los diseos que se presentan son diseos de blo
ques incompletos, ya que cada bloque no contiene todos los tratamientos o las combinaciones de los
tratamientos, la estructura especial del sistema factorial 2* permite un mtodo de anlisis simplificado.
Se considera la construccin y el anlisis del diseo factorial 2* en 2^ bloques incompletos, donde
p < k . Por consiguiente, estos diseos pueden correrse en dos bloques, en cuatro bloques, en ocho blo
ques, etctera.

7-4 CONFUSIN DEL DISEO FACTORIAL 1'' EN DOS BLOQUES

lA

C O N FU SI N DEL D ISEO FACTORIAL

289

EN D O S BLOQUES

Suponga que quiere correrse una sola rplica del diseo 2^. Cada una de las 2^ = 4 combinaciones de los
tratamientos requiere una cantidad de materia prima, por ejemplo, y cada lote de materia prima slo al
canza para probar dos combinaciones de tratamientos. Por lo tanto, se necesitan dos lotes de materia pri
ma. Si los lotes de materia prima se consideran como bloques, entonces deben asignarse a cada bloque
dos de las cuatro combinaciones de tratamientos.
Hn la figura 7-1 se muestra uno de los diseos posibles para este problema. La vista geomtrica, gura 7-la, indica que las combinaciones de tratamientos localizadas en diagonales opuestas se asignan a blo
ques diferentes. Observe, por la figura 7-lft, que el bloque 1 contiene las combinaciones de los
tratamientos (1) y afe y que el bloque 2 contiene a y b . Desde luego, el orden en que se corren las combina
ciones de los tratamientos dentro de un bloque se determina aleatoriamente. Icunbin se decidir aleato
riamente cul de los bloques se correr primero. Suponga que los efectos principales d e A y B se estiman
como si no se hubiera hecho la formacin de bloques. Por las ecuaciones 6-1 y 6-2 se obtiene
A = ^ [a b + a -b ~ il)]
B = ^ [a b + b -a -{)]
Observe que v A m B son afectados por la formacin de bloques, debido a que en cada estimacin hay
una combinacin de un tratamiento positivo y uno negativo de cada bloque. Es decir, cualquier diferencia
entre el bloque 1 y el bloque 2 se cancela.
Considere ahora la interaccin AB
A B -^ \{a b + {l)-a -b ]
Puesto que las dos combinaciones de tratamientos con signo positivo [ab y (1)] estn en el bloque 1 y las
dos con signo negativo {a y b) estn en el bloque 2, el efecto de los bloques y la interaccin^^ son idnti
cos. Es decir, A B est confinndlido (o mezclado) con los bloques.
La razn de esto es evidente en la tabla de signos positivos y negativos del diseo T . Se present origi
nalmente en la tabla 6-2, pero por conveniencia se repite como la tabla 7-3. A partir de esta tabla se observa
que todas las combinaciones de tratamientos que tienen signo positivo para A B se asignan al bloque 1,

- Corrida en el bloque 1
O - Corrida en el bloque 2

A
a) Vista geomtrica
Bloque 1

Bloque 2

(1)

ab

b) Asignacin de las cuatro


corridas en dos bloques

Figura 7-1

Diseo 2^ en dos bloques.

290

CAPTULO 7 FORMACIN DE BLOQUES Y CONFUSIN EN EL DISEO FACTORIAL 2^=

Tabla 7-3

Tabla de signos positivos y negativos para el diseo T?

Combinacin de
tratamientos
_
a
b
ab

____________Efecto factorial___________
/
A
B
AB
+ " ................ :
^
+
+
+
+
_
+
+
+
+

mientras que todas las combinaciones de tratamientos que tienen signo negativo p ara^ S se asignan al
bloque 2, Este enfoque puede usarse para confundir o mezclar cualquier efecto {A, B o AB) con los blo
ques. Por ejemplo, si (1) y b s e hubieran asignado al bloque l y a y ab a \ bloque 2, el efecto principal de A
se habra confundido con los bloques. La prctica usual es confundir la interaccin de orden ms alto con
los bloques.
Este esquema puede usarse para confundir o mezclar cualquier diseo 2* en dos bloques. Como un
segundo ejemplo, considere un diseo 2^ que se corre en dos bloques. Suponga que se quiere confundir la
interaccin de los tres factores ABC con los bloques. Por la formacin de signos positivos y negativos de la
tabla 7-4, las combinaciones de tratamientos que son negativas para ABC se asignan al bloque 1 y las que
son positivas paraABC al bloque 2. El diseo resultante se muestra en la figura 7-2. D e nueva cuenta se
resalta que las combinaciones de tratamientos dentro de un bloque se corren de manera aleatoria.
O tros m todos para construir bloques

Se cuenta con otro mtodo para construir estos diseos. El mtodo utiliza la combinacin lineal
L= a

(^"1)

donde a :, es el nivel del factor i-simo que aparece en una combinacin de tratamientos particular y a es el
exponente que aparece en el factor /-simo para el efecto que va a confundirse. Para el sistema 2*, se tiene
, = Oo 1 yx ~ O(nivel bajo) o a:, = 1 (nivel alto). A la ecuacin 7-1 se le llama la definicin de contrastes.
Las combinaciones de tratamientos que producen el mismo valor de L (mod 2) se colocarn en el mismo
bloque. Puesto que los nicos valores posibles deL (mod 2) son Oy 1, con esto las 2* combinaciones de tra
tamientos se asignarn a exactamente dos bloques.

Tabla 7-4

Tabla de signos positivos y negativos para el diseo V

Combinacin de
tratamientos
(1)
a
b
ab
c
ac
be
abe

I
+
+
+
+
+
+
+
+

+
+

Efecto factorial
AB
C

BC
+
+

ABC

+
+

-1-1-

+
+
+
+

+
+

+
+

AC
+

7-4 CONFUSIN DEL DISEO FACTORIAL 2 EN DOS BLOQUES

Corrida en el bloque 1

Ckirrda en el bloque 2

291

Bloque 1

Bk>que2

(1)

ab

ac

be

abe

b) Asignacin de las ocho


corridas en dos bloques

Figura 7-2 El diseo


dido.

en dos bloques conABC confun

Para ilustrar este enfoque, considere un diseo 2^ con ABC confundido con los bloques. En este caso,
jCj corresponde aA,Xj a5,Arj a Cy i = 2 = <^3 = 1- Por lo tanto, la definicin del contraste correspondien
te a A B C es
L=
+X 2 +A:,
La combinacin de tratamientos (1) se escribe 000 en la notacin (O, 1); por lo tanto,
L = 1(0)-I-1(0)+1(0)= 0 = O (mod 2)
D e manera similar, la combinacin de tratamientos a es 100, obtenindose
L = 1(1) + 1( 0) + 1( 0 ) = 1 = 1 (m o d 2)
Por lo tanto, (1) y a se correran en bloques diferentes. Para el resto de las combinaciones de tratamientos
se tiene
b: L = 1(0) + 1(1)-H (0 ) = 1 = 1 (m o d 2)
ab\ L = l ( l ) - l - l ( l ) + l ( 0) = 2 = 0 (m o d 2)
c: L = 1(0) + 1( 0) + 1(1) = 1 = 1 (m o d 2)
ac: L = l ( l ) + l ( 0) + l ( l ) = 2 = 0 (m o d 2)
be: L = l ( 0 ) + l ( l ) + l ( l ) = 2 = 0 ( m Q d 2 )
abe:

L = l ( l ) + l ( l ) - l - l ( l ) = 3 = 1 (mod 2)

Por lo tanto, (1), ab, ac y be se corren en el bloque 1 y a, fe, c y abe se corren en el bloque 2. Se trata del mis
mo diseo que se ilustr en la figura 7-2, el cual se gener con la tabla de signos positivos y negativos.
Puede usarse otro mtodo para construir estos diseos. Al bloque que contiene la combinacin de
tratamientos (1) se le llama el bloque principal. Las combinaciones de los tratamientos incluidas en este
bloque poseen una til propiedad de la teora de grupos; a saber, forman un grupo con respecto a la multi-

292

CAPTULO 7 FORMACIN DE BLOQUES Y CONFUSIN EN EL DISEO FACTORL^L 2

plicacin mdulo 2. Esto implica que cualquier elemento [con excepcin de (1)] del bloque principal pue
de generarse multiplicando otros dos elementos del bloque principal mdulo 2. Por ejemplo, considere el
bloque principal del diseo con ABC confundido, como se muestra en la figura 7-2. Observe que
ab-ac = a^bc= be
ab-bc = ab^c = ac
ac'bc = abc^ = ab
Las combinaciones de tratamientos del otro bloque (o bloques) pueden generarse multiplicando uno de
los elementos del nuevo bloque por cada uno de los elementos del bloque principal mdulo 2. Para el di
seo 2^ con A B C confundido, puesto que el bloque principal e s { l) ,a b ,a c y be, se sabe que b est en el otro
bloque. Por lo tanto, los elementos de este segundo bloque son
fc-(l)

=b

b -a b = a b ^ = a
b-ac

=abc

b-bc = b^e = c
Estos resultados concuerdan con los que se obtuvieron anteriormente.
Estimacin del error
Cuando el nmero de variables es pequeo, por ejemplo k ~ 2 o 3 , por lo general es necesario hacer rpli
cas del experimento a fin de obtener una estimacin del error. Por ejemplo, suponga que un diseo facto
rial 2^ debe correrse en dos bloques con A B C confundido, y el experimentador decide hacer cuatro
rplicas del diseo. El diseo resultante podra verse como el de la figura 7-3. Observe que ABC est con
fundido en cada rplica.
En la tabla 7-5 se muestra el anlisis de varianza de este diseo. Hay 32 observaciones y 31 grados de
libertad. Adems, puesto que hay ocho bloques, siete grados de libertad deben asociarse con estos blo
ques. En la tabla 7-5 se presenta la descomposicin de esos siete grados de libertad. La suma de cuadra
dos del error se compone en reaUdad de las interacciones de dos factores entre las rplicas, y cada uno de
los efectos (A, B, C, AB, AC, BC). Por lo general es seguro considerar que las interacciones son cero y tra
tar el cuadrado medio resultante como una estimacin del error. Los efectos principales y las interaccio
nes de dos factores se prueban contra el cuadrado medio del error. Cochran y Cox [25b] hacen notar que
el cuadrado medio del bloque o ABC podra compararse con el error del cuadrado medio ABC, que es en
realidad rplicas x bloques. Esta prueba suele tener una sensibilidad muy baja.
Si se cuenta con recursos suficientes para hacer rplicas de un diseo confundido, por lo general es
mejor usar un mtodo ligeramente diferente para disear los bloques en cada rplica. Este enfoque con
siste en confundir un efecto diferente en cada rphca para obtener cierta informacin sobre todos los
Rplica II

Rplica 1

Rplica n i

Rplica IV

Bloque 1

Bloque 2

Bloque 1

Bloque 2

Bloque 1

Bloque 2

Bloque ^

Bloque 2

(1)

abe

(1)

abe

(1)

abe

(1)

abe

ac

ac

ac

ac

ab

ab

ab

ab

be

be

be

he

Figura 7-3

Cuatro rplicas del diseo 2^ con AB C confundido.

7-4 CONFUSIN DEL DISEO FACTORIAL 2 EN DOS BLOQUES

Tabla 7-5

293

Anlisis de vatianza de cuatro rplicas de un


diseo V con ABC confundido

Grados de
Fuente de variacin__________________ libertad
Rplicas
Bloques (ABC)
Error de ABC (rplicas x bloques)
A
B
C
AB
AC
BC
Error (o rplicas x efectos)
Total

3
1
3
1
1
1
1
1
1
18
31

efectos. A este procedimiento se le llama confusin (o mezclado) parcial, y se estudia en la seccin 7-7. Si
k es moderadamente grande, por ejemplo k > A , con frecuencia slo es posible hacer una rplica. El expe
rimentador suele suponer que las interacciones de rdenes superiores son insignificantes y combina sus
sumas de cuadrados como el error. La grfica de probabilidad normal de los efectos de los factores puede
ser muy til a este respecto.

EJEMPLO .........................................................................................................................................................
Considere la situacin descrita en el ejemplo 6-2. Recuerde que se estudian cuatro factoresla tempera
tura (A), la presin (B), la concentracin de formaldehdo (C) y la velocidad de agitacin (D ) en una
planta piloto para determinar su efecto sobre el ndice de filtracin del producto. Se usar este experi
mento para ilustrar las ideas de la formacin de bloques y la confusin en un diseo no replicado. Se in
troducirn dos modificaciones al experimento original. Primera, suponga que no es posible correr las
2* = 16 combinaciones de tratamientos utilizando un solo lote de materia prima. El experimentador
puede correr ocho combinaciones de los tratamientos con un solo lote de material, por lo que un diseo
2* confundido en dos bloques parece apropiado. Es lgico confundir la interaccin de orden ms alto
ABCD con los bloques. La definicin del contraste es
L=

y es sencillo verificar que el diseo es como el que se ilustra en la figura 7-4. D e manera alternativa, puede
examinarse la tabla 6-12 y observar que las combinaciones de los tratamientos que son + en la columna
ABCD se asignan al bloque 1 y que las que son - en la columna ABCD, estn en el bloque 2.
La segunda modificacin que se har es introducir un efecto de los bloques para que pueda demos
trarse la utilidad de la formacin de bloques. Suponga que cuando se seleccionan los dos lotes de materia
prima que se necesitan para correr el experimento, uno de ellos es de calidad mucho ms baja y, como re
sultado, todas las respuestas sern 20 unidades menores en este lote de material que en el otro. El lote de
calidad menor se convierte en el bloque 1 y el lote de buena calidad se convierte en el bloque 2 (no es rele
vante a cul de los dos lotes se le llama bloque 1 o bloque 2). Entonces todas las pruebas del bloque 1 se
realizan primero (las ocho corridas del bloque se hacen, desde luego, de manera aleatoria), pero las res
puestas son 20 unidades ms bajas que las que se habran obtenido si se hubiera usado el material de bue
na calidad. En la figura 7-46 se muestran las respuestas resultantes; observe que stas se han encontrado

294

CAPTULO 7 FORMACIN DE BLOQUES Y CONFUSIN EN EL DISEO FACTORIAL 2


D

= Corridas en el bloque 1
o - Corridas en el bloque 2
a ) Vista geomtrica
Bloque 1

Bloque 2

(1) = 25

0 -7 1

o6 = 45

i = 48

oc = 40

C -6 S

6c-6 0

d-43

a d ^ 80

abe = 65

bd^25

bcd~ 70

c d -5 B

a ed^ S e

a b c d -7 6
b) Asignacin de las 16 corridas
en los dos bloques

Figura 7-4 El diseo 2* en dos bloques para el ejemplo 7-2.

restando el efecto del bloque de las observaciones orignales dadas en el ejemplo 6-2. Es decir, la respues
ta original de la combinacin de tratamientos (1) fue 45, y en la figura 7-46 se consigna como (1) = 25 (=
45 - 20). Las dems respuestas de este bloque se obtienen de manera similar. Despus de que se realizan
las pruebas del bloque 1, se prosigue con las ocho pruebas del bloque 2. No hay ningn problema con la
materia prima de este lote, por lo que las respuestas son exactamente como fueron originalmente en el
ejemplo 6-2.
En la tabla 7-6 se muestran las estimaciones de los efectos para esta versin modificada del ejemplo
6-2. Observe que las estimaciones de los cuatro efectos principales, de las seis interacciones de dos facto
res y de las cuatro interacciones de tres factores son idnticas a las estimaciones de los efectos obtenidas
en el ejemplo 6-2, donde no hubo ningn efecto de bloques. Cuando se construye una grfica de probabili
dad normal de estas estimaciones de los efectos, los factores^, C, Z) y las interacciones^C y A D aparecen
como los efectos importantes, justo como en el experimento original. (El lector deber verificar esto.)
Qu puede decirse del efecto de la interaccin yfiCD? La estimacin de este efecto en el experi
mento original (ejemplo 6-2) a tA B C D = 1.375. En el presente ejemplo, la estimacin del efecto de la in
teraccin ABCD csA B C D = -18.625. Puesto que AfiCZ) est confundido con los bloques, la interaccin
A BCD estima el efecto de la interaccin original (1.375) ms el efecto de bloque (-20), de donde ABCD =
1.375 + (-20) = -18.625. (Puede el lector ver por qu el efecto del bloque es -20?) El efecto del bloque

7-4 CONFUSIN DEL DISEO FACTORIAL 2 EN DOS BLOQUES


Tabla 7-6

295

Estmacones de los efectos para el diseo 2^ separado en bloques del


ejemplo 7-2

Trmino del
modelo

Coeficiente
de regresin
10.81
1.56
4.94
7.31
0.062
-9.06
8.31
1.19
-0.19
-0.56
0.94
2.06
-0.81
-1.31

A
B
C
D
AB
AC
AD
BC
BD
CD
ABC
ABD
ACD
BCD
Bloques (ABCD)

B.stimacin
del efecto
21.625
3.125
9.875
14.625
0.125
-18.125
16.625
2.375
-0.375
-1.125
1.875
4.125
-1.625
-2.625
-18.625

Suma de
cuadrados
1870.5625
39.0625
390.0625
855.5625
0.0625
1314.0625
1105.5625
22.5625
0.5625
5.0625
14.0625
68.0625
10.5625
27.5625
1387.5625

Contribucin
porcentual
26.30
0.55
5.49
12.03
< 0.01
18.48
15.55
0.32
< 0.01
0.07
0.20
0.96
0.15
0.39
19.51

tambin puede calcularse directamente como la diferencia en la respuesta promedio entre los dos blo
ques, o
Efecto del bloque =

,
406

555

8
-1 4 9

8
= -18.625

Desde luego, este efecto es en realidad la estimacin de Bloques + ABCD.


En la tabla 7-7 se resume el anlisis de varianza de este experimento. Los efectos que tienen estima
ciones grandes estn incluidos en el modelo, y la suma de cuadrados de los bloques es

SS

labia 7-7

^ (406)" + (555)'
8

(961)"
16

= 1387.5625

Anlisis de varianza del ejemplo 7-2

Fuente de
variacin
Bloques (ABCD)
A
C
D
AC
AD
Error
Tbtal

Suma de
cuadrados
1387.5625
1870.5625
390.0625
855.5625
1314.0625
1105.5625
187.5625
7111.4375

Grados de
libertad
1
1
1
1
1
1
9
15

Cuadrado
medio
1870.5625
390.0625
855.5625
1314.0625
1105.5625
20.8403

Fo

Valor P

89.76
18.72
41.05
63.05
53.05

< 0.0001
0.0019
0.0001
< 0.0001
< 0.0001

296

CAPTULO 7 FORMACIN DE BLOQUES Y CONFUSIN EN EL DISEO FACTORIAL

Las conclusiones de este experimento coinciden exactamente con las del ejemplo 6-2, donde no estuvo
presente ningn efecto de bloques. Observe que si el experimento no se hubiera corrido en bloques, y si
un efecto de magnitud -2 0 hubiera afectado los 8 primeros ensayos (los cuales se habran seleccionado de
manera aleatoria, ya que los 16 ensayos se habran corrido en orden aleatorio en un diseo sin formacin
de bloques), los resultados pudieron haber sido muy diferentes.

7-5

C O N FU SIO N DEL DISEO FACTORIAL 2^ EN C U A T R O BLOQUES

Es posible construir diseos factoriales 2*" confundidos en cuatro bloques con ' ~ ^ observaciones cada
uno. Estos diseos son particularmente tiles en situaciones en las que el nmero de factores es modera
damente grande, por ejemplo A: > 4, y el tamao de los bloques es relativamente pequeo.
Como un ejemplo, considere el diseo 2^. Si cada bloque incluir nicamente ocho corridas, entonces
debern usarse cuatro bloques. La construccin de este diseo es relativamente directa. Se seleccionan
dos efectos para confundirlos con los bloques, por ejemplo
y 5 C . Estos efectos tienen las dos defi
niciones de contrastes
L^=X^->rX^+X^
Lj = X2 +X3 -\-x
asociadas con ellos. Entonces cada combinacin de tratamientos producir un par particular de valores
deLj (mod 2) yL j (mod 2), es decir, cualquiera de ( 1,^ 2) = (0 ,0), (0 ,1), (1,0) o bien (1,1). Las combina
ciones de tratamientos que producen los mismos valores de (Lj, Lj) se asignan al mismo bloque. En el
ejemplo tratado aqu se encuentra
L, = O, L2 = O

para

(1), ad, be, abcd, abe, ace,'cde, bde

Lj = 1, L2 = O

para

a, d, abe, bed, be, abde, ce, acde

para

b, abd, e, acd, ae, de, abce, bcde

= O, Lj = 1
l^ = , 2 = 1

abcde, ab, bd, ae, cd

Estas combinaciones de tratamientos se asignaran a bloques diferentes. En la figura 7-5 se muestra el di


seo completo.
Con un poco de reflexin, nos damos cuenta de que otro efecto adems deA D E yB C E debe confun
dirse con los bloques. Puesto que hay cuatro bloques con tres grados de libertad entre ellos, y puesto que
A D E y BCE tienen un solo grado de libertad cada una, es evidente la necesidad de confundir un efecto
adicional con un grado de libertad. Este efecto es la interaccin generalizada de A D E y BCE, la cual se

Bloque 1

Bloque 2

i , =0

i, = 1
L , ^0

Bloque 3

Bloque 4

=0
=1

(1)

abe

be

abce

ad

ace

abde

abd

ae

ade bd

be

cde

abe

ce

bcde

bce ac

acd

de

abcd bde

bed acde

e abcde

ab

cd

Figura 7-5 El diseo 2^ en cuatro bloques con ADE,


BCE y A B C D confundidos.

7-6 CONFUSIN DEL DISEO FACTORIAL 2'' EN V BLOQUES

297

define como el producto & ADEy BCE mdulo 2. Por lo tanto, en el ejemplo tratado aqu la interaccin
generalizada (^ E ) (B C E ) = ABCDF^ = ABCD tambin est confundido con los bloques. Es sencillo ve
rificar esto refirindose a la tabla de signos positivos y negativos del diseo 2, como en Davies [36]. La
inspeccin de esta tabla revela que las combinaciones de los tratamientos se asignan a los bloques de la si
guiente manera;
Combinaciones de los
tratamientos en el
Bloque 1
Bloque 2
Bloque 3
Bloque 4

Signo tADE

Signo de BCE

+
-1-

-1+

Signo dtABCD
+

Observe que el producto de los signos de dos efectos cualesquiera de un bloque particular (por ejemplo
A D E y BCE) produce el signo del otro efecto de ese bloque (en este caso, ABCD). Por lo tanto, ADE,
BCE y ABCD estn confundidos con los bloques.
Las propiedades de la teora de grupos del bloque principal mencionadas en la seccin 7-4 siguen
siendo vlidas. Por ejemplo, se observa que el producto de dos combinaciones de tratamientos del bloque
principal produce otro elemento del bloque principal. Es decir,
ad-bc = abcd

abe-bde = ab^de^ = ad

etctera. Para construir otro bloque se selecciona una combinacin de tratamientos que no est en el blo
que principal (por ejemplo b), y b s e multiplica por todas las combinaciones de tratamientos del bloque
principal. Se obtiene as
b -()= b

b -a d = abd

b-bc = b^c = c

b abcd = ab^ cd = acd

etctera, lo que producir las ocho combinaciones de tratamientos del bloque 3. En la prctica, el bloque
principal puede obtenerse a partir de la definicin de contrastes y de la propiedad de la teora de grupos, y
los dems bloques pueden determinarse a partir de estas combinaciones de los tratamientos aplicando el
mtodo que se present anteriormente.
El procedimiento general para construir un diseo 2* confundido en cuatro bloques consiste en elegir
dos efectos para generar los bloques, confundindose automticamente un tercer efecto que es la interac
cin generalizada de las dos primeras. Despus se construye el diseo utilizando las dos definiciones de
contrastes (Li, Lj) y las propiedades de la teora de grupos del bloque principal. Al seleccionar los efectos
que van a confundirse con los bloques, debe tenerse cuidado de obtener un diseo en el que no estn con
fundidos efectos que pueden ser de inters. Por ejemplo, en un diseo 2^ podra elegirse confundir
ABCDE y ABD, con lo cual se confunde automticamente CE, un efecto que es de posible inters. Una
mejor eleccin es confundir A D y S C , con lo cual se confunde a u t o m t i c a m e n t e E s preferible
sacrificar informacin en las interacciones de tres factores A D y BCE en lugar de la interaccin de dos
factores CE.

7-6

C O N FU SI N DEL DISEO FACTORIAL 2> EN 2f BLOQUES

Los mtodos descritos antes pueden extenderse a la construccin de un diseo factorial 2^ confundido (o
mezclado) en 2 bloques (p < k), donde cada bloque contiene exactamente 2** corridas. Se seleccionan^
efectos independientes que van a confundirse, donde por independientes se entiende que ninguno de
los efectos elegidos es la interaccin generalizada de los dems. Los bloques pueden generarse mediante

8 '|>

S '

i'

S 3^ '
'o) 'oqS

g s'

^ o H g s

W'
8 ^'
'^ tS

g 5 j - ! | | g V ! a 88 S
| |^| lg p
^ ' l ^ag

g i

^g I

g S w a

^ ^ y S S ^ S l S S s S l g S ^ S f i S S S S

fe

li) g
Ci

S 'J

SS fe8 I
g' 8

u
u

s3
S'
T
4
S Tf (N 00
ia o^

O va

8
S

O)
05 8 U' bj '^,
^np

(S

00

H t) ^ j ' ^ e S ^ o o N ^ o o
a a
E ^
^
o 22 J=
5
00

S.V
O wT
l-H 0

JS

298

f M
1^

8 ^

&'

fe'

S s

^1
fe' K
w ig
8O)
8'

1^'

g
8'
lT
05

N '
es tn
^>

S <N 't 00

es

-rt-

vo

7-7 CXiNFUSIN PARCIAL

299

el uso de lasp deoiciones de contrastes L^, Lj, ...,Lp asociadas con estos efectos. Asimismo, se confundi
rn otros 2- p - l efectos con los bloques, siendo stos las interacciones generalizadas de los p efectos in
dependientes elegidos iniciaimente. Deber tenerse cuidado al seleccionar los efectos que van a
confundirse para que no se sacrifique informacin sobre los efectos que pueden ser de inters potencial.
El anlisis estadstico de estos diseos es directo. Las sumas de cuadrados de todos los efectos se
calculan como si no se hubiera hecho la formacin de bloques. Despus, la suma de cuadrados de los blo
ques se encuentra sumando las sumas de cuadrados de todos los efectos confundidos con los bloques.
Obviamente, la eleccin de losp efectos usados para generar el bloque es crtica, ya que la estructura
de la confusin (o mezclado) del diseo depende directamente de ellos. En la tabla 7-8 se presenta una
lista de diseos tiles. Para ilustrar el uso de esta tabla, suponga que quiere construirse un diseo 2^ con
fundido en 2^ = 8 bloques con 2^ = 8 corridas cada uno. La tabla 7-8 indica que se clcg\ianABEF, ABCD
y A C E como los/ = 3 efectos independientes para generar los bloques. Los 2'- 77-1 = 2^- 3 - 1 = 4 efec
tos restantes que estn confundidos son las interacciones generalizadas de estos tres; es decir,
(A B EF )(AB C D ) =

CDEF ^ CDEF

{A B E F ){A C E ) = A ^ B C E ^ F = B C F
(A B C D )(A C E ) = A^ BC^ E D = BDE
(A B E F )(A B C D )(A C E ) = A^

DE^ F = ADF

En el problema 7-11 se le pide al lector que genere los ocho bloques de este diseo.

7-7

C O N FU SIO N PARCIAL

En la seccin 7-4 se subray que, a menos que los experimentadores cuenten con una estimacin previa
del error o que estn dispuestos a suponer que ciertas interacciones son insignificantes, deben hacer r
plicas del diseo para obtener una estimacin del error. En la figura 7-3 se muestra un diseo factorial 2^
en dos bloques con A B C confundido, con cuatro rplicas. Por el anlisis de varianza de este diseo, el cual
se presenta en la tabla 7-5, se observa que no puede sacarse informacin acerca de la interaccin A SC de
bido a que ABC est confundido con los bloques en todas las rplicas. Se dice que este diseo est comple
tamente confundido (o mezclado).
Considere la alternativa que se presenta en la figura 7-6. D e nueva cuenta hay cuatro rplicas del di
seo 2^ pero en cada rplica se ha confundido una interaccin diferente. Es decir, ABC est confundido en
la rplica I, AB est confundido en la rplica II, BC est confundido en la rplica III yAC est confundido
en la rplica IV. Como resultado puede obtenerse informacin deABC a partir de los datos de las rplicas
II, III y IV; informacin de AB puede obtenerse de las rplicas I, III y IV; informacin de AC puede obten

Rplica I

Rplica

ABC Confundido

AB Confundido

Rplica m

Rplica IV

BC Confundido

A C Confundido

(1)

(1)

(1)

1|

ab

ac

ab

ac

be

ab

ac

ab

be

abe

abe

be

abe

ac

abe

be

Figura 7-6

Confusin parcial en el diseo 2^.

300

CAPTULO 7 FORMACIN DE BLOQUES Y CONFUSIN EN EL DISEO FACTORIAL 1'

Tabla 7-9

Anlisis de varianza de un diseo T? parcialmente confundido

Grados de
________ Fuente de variacin__________________ libertad
Rplicas
Bloques dentro de rplicas [o ABC (rp. I) + AB (rp. II)
+ BC (rp. III) + AC (rp. IV)]
A
B
C
AB (de las rplicas I, III y IV)
AC (de las rplicas I, II y III)
BC (de las rplicas I, II y IV)
ABC (de las rplicas I, III y IV)
Error

Tbtal
nerse de las rplicas I, II y III; e informacin de BC puede obtenerse de las rplicas I, II y IV. Se dice que
pueden obtenerse tres cuartas partes de la informacin de las interacciones porque no estn confundidas
en slo tres rplicas. Yates [113b] llama a la relacin 3/4 la informacin relativa de los efectos confundi
dos. Se dice que este diseo est parcialmente confundido (o mezclado).
En la tabla 7-9 se muestra el anlisis de varianza de este diseo. Para calcular las sumas de cuadrados
de las interacciones, slo se usan los datos de las rplicas en las que no est confundida una interaccin.
La suma de cuadrados del error consta de las sumas de cuadrados de rplicas x sumas de cuadrados de
efecto principal, ms las sumas de cuadrados de rplicas x sumas de cuadrados de interaccin para cada
rplica en la que esa interaccin no est confundida (por ejemplo, rplicas x A B C para las rplicas II, III
y IV). Adems, hay siete grados de libertad entre los ocho bloques. Es comn hacer la particin de tres
grados de libertad para las rplicas y cuatro grados de libertad para los bloques dentro de las rplicas. La
composicin de la suma de cuadrados de los bloques se muestra en la tabla 7-9 y se sigue directamente de
la eleccin del efecto confundido en cada rplica.

EJEMPLO 7 - 3 .................................................................................................................................................
Un diseo 2 con confusin parcial
Considere el ejemplo 6-1, en el que se realiz un estudio para determinar el efecto del porcentaje de carbonatacin (A), la presin de operacin (B) y la velocidad de lnea (C) sobre la altura de llenado de una
bebida carbonatada. Suponga que cada lote de jarabe alcanza slo para probar cuatro combinaciones de
tratamientos. Por lo tanto, cada rplica del diseo 2^ debe correrse en dos bloques. Se corren dos rplicas,
con A B C confundido en la rplica l y A B confundido en la rplica II. Los datos son los siguientes;

Rplica II
AB confundido

Rplica I
XBC confundido
(1)
ab
ac
be

= -3
= 2
= 2
1
=

(1)
c
ab
abe

= -1
= 0
= 3
= 5

a
b
ac
be

=
=
=

1
0
1
1

7-8 PROBLEMAS
Tabla 7-10

301

Anlisis de varianza del ejemplo 7-3

Suma de
cuadrados
1.00
2.50
36.00
20.25
12.25
0.50
0.25
1.00
0,50
3.75
78.00

Fuente de
variacin
Rplicas
Bloques dentro de las rplicas
A
B
C
AB (slo en la rplica I)
AC
BC
ABC (slo en la rplica II)
Error
Tbtal

Grados de
libertad
1
2
1
1
1
1
1
1
1
5
15

Cuadrado
medio
1.00
1,25
36.00
20.25
17 75
0.50
0.25
1.00
0.50
0.75

Valor P
48.00
27,00
16.33
0,67
0,33
1.33
0.67

0.0001
0.0035
0.0099
0.4503
0.5905
0.3009
0.4503

Las sumas de cuadrados de A, B, C, A C y B C pueden calcularse de la manera usual, utilizando las 16


observaciones. Sin embargo, SSyBc debe encontrarse utilizando nicamente los datos de la rplica II y
SS^B utilizando nicamente los datos de la rplica I de la siguiente manera:

_ [a+b+c+abc-ab-ac-bc-(l)Y
ABCri + 0 + 0 + 5 - 3 - l - l - ( - l ) r

QgQ

( 1)( 8)
_ [(l)+abc-ac+ c-a-b+ ab-bcf
^ "
2*
_ [ - 3 + 6 - 2 + ( - l ) - O - ( - l ) + 2 - 1]^ .. Q

( 1)( 8)
La suma de cuadrados de las rplicas es, en general,

( 6) ^ + ( 10)^

(16)^

16

donde Rf es el total de las observaciones en la rplica /t-sima. La suma de cuadrados de los bloques es la
suma de S S ^ c de la rplica I y 5 5 ^ de la rplica II, o Seioques = 2.50.
En la tabla 7-10 se resume el anlisis de varianza. Los tres efectos principales son importantes.

7-8
7-1.
7-2,
7-3.

PROBLEMAS
Considere el experimento descrito en el problema 6-1, Analizar este experimento suponiendo que cada r
plica representa un bloque de un solo turno de produccin.
Considere el experimento descrito en el problema 6-5, Analizar este experimento suponiendo que cada ima
de las cuatro rplicas representa un bloque.
Considere el experimento de la formacin de fisuras en la aleacin de nquel y titanio descrito en el problema
6-15, Suponga que slo pudieron hacerse 16 corridas en un solo da, por lo que cada rplica se trat como un
bloque. Analizar el experimento y sacar conclusiones.

302

7-4.

7-5.
7-6.
7-7.
7-8.
7-9.
7-10.
7-11.

7-12.
7-13.

7-14.
7-15.
7-16.
7-17.

CAPTULO 7 FORMACIN DE BLOQUES Y CONFUSIN EN EL DISEO FACTORIAL 2^

Considere los datos de la primera rplica del problema 6-1. Suponga que no fue posible correr todas estas ob
servaciones utilizando barras del mismo lote. Establecer un diseo para correr estas observaciones en dos
bloques de cuatro observaciones cada uno con ABC confundido. Analizar los datos.
Considere los datos de la primera rplica del problema 6-7. Construir un diseo con dos bloques de ocho ob
servaciones cada uno con ABCD confundido. Analizar los datos.
Repetir el problema 7-5 suponiendo que se requieren cuatro bloques. Confundir
y ABC (y por consi
guiente CD) con los bloques.
Utilizando los datos del diseo 2 del problema 6-21, construir y analizar un diseo en dos bloques con
ABCDE confundido con los bloques.
Repetir el problema 7-7 suponiendo que se necesitan cuatro bloques. Sugerir un esquema de confusin (o
mezclado) razonable.
Considere los datos del diseo 2 del problema 6-21, Suponga que fue necesario correr este diseo en cuatro
bloques con ACDE y BCD (y por consiguiente ABE) confundidos. Analizar los datos de este diseo.
Disear un experimento para confundir un diseo factorial 2en cuatro bloques. Sugerir un esquema de con
fusin apropiado, diferente del que se ilustr en la tabla 7-8.
Considere el diseo 2en ocho bloques con ocho corridas cada uno con ABCD, ACE yABEF como los efec
tos independientes elegidos para confundirlos con los bloques. Generar el diseo. Encontrar los dems efec
tos confundidos con los bloques.
Considere el diseo 2^ en dos bloques cotAB confundido. Hacer la demostracin algebraica de que 55^ =
S-SBloquMConsidere los datos del ejemplo 7-2. Suponga que todas las observaciones del bloque 2 se incrementan en 20.
Analizar los datos que resultaran. Estimar el efecto de bloque. Puede el lector e}q)licar su magnitud? Los
bloques parecen ser ahora un factor importante? Hay otras estimaciones de los efectos que sufran el impac
to de este cambio hecho en los datos?
Suponga que en el problema 6-1 se confundi ABC en la rplica l,AB en la rplica II y BC en la rplica III.
Calcular las estimaciones de los efectos. Construir la tabla del anlisis de varianza.
Repetir el problema 6-1 suponiendo que ABC se confundi con los bloques en todas las rplicas.
Suponga que en el problema 6-1ABCD se confundi en la rplica I y ABC se confundi en la rplica II. Reali
zar el anlisis estadstico de este diseo.
Construir un diseo 2conABC confundido en las dos primeras rplicas y JSCconfundido en la tercera rpli
ca. Delinear el anlisis de varianza y comentar la informacin obtenida.

Diseos factoriales
fraccionados de dos niveles

Sa

IN T R O D U C C I N

Cuando el nmero de factores de un diseo factorial 2* se incrementa, el nmero de corridas necesarias


para realizar una rplica completa del diseo rebasa con rapidez los recursos de la mayora de los experi
mentadores. Por ejemplo, una rplica completa de un diseo 2* requiere 64 corridas. En este diseo, slo
6 de los 63 grados de libertad corresponden a los efectos principales, y slo 15 a las interacciones de dos
factores. Los 42 grados de libertad restantes se asocian con las interacciones de tres o ms factores.
Si el experimentador puede suponer razonablemente que ciertas interacciones de orden superior son
insignicantes, es posible obtener informacin de los efectos principales y las interacciones de orden infe
rior corriendo nicamente una fraccin del experimento factorial completo. Estos diseos fctoriales
fraccionados se encuentran entre los tipos de diseos de uso ms generalizado en el diseo de productos y
procesos y en el mejoramiento de procesos.
Una de las principales aplicaciones de los diseos factoriales fraccionados es en los experimentos de
tamizado o exploracin. Se trata de experimentos en los que se consideran muchos factores y el objetivo
es identificar aquellos factores (en caso de haberlos) que tienen efectos grandes. Los experimentos de ta
mizado suelen reaUzarse en las etapas iniciales de un proyecto, cuando es posible que muchos de los fac
tores considerados en un principio tengan un efecto reducido o nulo sobre la respuesta. Entonces los
factores que se identifican como importantes se investigan con mayor detalle en experimentos subsecuentes.
El uso exitoso de los diseos factoriales fraccionados se basa en tres ideas clave:
1. El principio de Rectos esparcidos o escasez de efectos. Cuando hay varias variables, es posible que el
sistema o proceso est dominado principalmente por algunos de los efectos principales y las in
teracciones de orden inferior.
2. La propiedad de proyeccin. Los diseos factoriales fraccionados pueden proyectarse en diseos
ms fuertes (ms grandes) en el subconjunto de los factores significativos.
3. Experimentacin secuencial. Es posible combinar las corridas de dos (o ms) diseos factoriales
fraccionados para ensamblar secuencialmente un diseo ms grande para estimar los efectos de
los factores y las interacciones de inters.
303

304

CAPTULOS

DISEOS FACTORIALES FRACCIONADOS DE DOS NIVELES

Este captulo se enfoca en estos principios, los cuales se ilustran con varios ejemplos.

8-2

LA FRACCI N U N M EDIO DEL DISEO 2>

Considere una situacin en la que tres factores, cada uno con dos niveles, son de inters, pero los experi
mentadores no estn en posicin de correr las 2^ = 8 combinaciones de tratamientos. Sin embargo, pue
den llevar a cabo cuatro corridas. Esto sugiere una fraccin un medio de un diseo 2^ Puesto que el
diseo contiene 2^^ = 4 combinaciones de tratamientos, es comn llamar diseo
a una fraccin un
medio del diseo 2^
En la tabla 8-1 se muestra la agrupacin de signos positivos y negativos del diseo 2^ Suponga que se
seleccionan las cuatro combinaciones de tratamientos a, b ,c y abe como la fraccin un medio con la que se
trabajar. Estas corridas se muestran en la parte superior de la tabla 8-1 y en la figura 8-lfl.
Observe que el diseo 2^^ se forma seleccionando slo las combinaciones de tratamientos que tienen
signo positivo en la columna^lfiC. Por lo tanto, zA B C se le llama el generador de esta fraccin particular.
En ocasiones se har referencia a un generador, por ejemplo>45C, como una palabra. Adems, la colum
na identidad / tambin es siempre positiva, por lo que a

J^ABC
se le llama la relacin de definicin del diseo. En general, la relacin de definicin de un diseo factorial
fraccionado ser siempre el conjunto de todas las columnas que son iguales a la columna identidad I .
Las combinaciones de tratamientos del diseo 2^ producen tres grados de libertad que pueden usar
se para estimar los efectos principales. Con referencia a la tabla 8-1, se observa que las combinaciones li
neales de las observaciones usadas para estimar los efectos principales de
5 y C son
= i ( f l - f c - c + afcc)
e g = j(-a + b -c + a b c )
= ^ (-a -b + c + a b c )
Ikmbin es sencillo verificar que las combinaciones lineales de las observaciones usadas para estimar las
interacciones de dos factores son
^Bc = ^ a - b - c + a b c )
Ac = i ( - a + f c - c + a f e c )

Tabla 8-1

Signos positivos y negativos del diseo factorial 2^

Efecto factorial
AB

Combinacin de
tratamientos
a
b
c
abe

-I-

ab
ac
be
(1)___________ _

+
+
+
+

+
+

+
+

-I-

AC

BC

+
+

+
+

-I-

+
-I-

ABC

+
+

8-2 LA FRACCIN UN MEDIO DEL DISEO 2

305

abe

o) La fraccin principal, I - +ABC

be

ob

b) La fraccin alterna, / Figura 8-1


seo 2K

-ABC

Las dos fracciones un medio del di

Por lo t a n t o , 4 = ^Acyfc =
por consiguiente, es imposible diferenciar entre^ y 5C , entre S y
A C y entre C yAB. D e hecho, cuando se estiman/4,5 y C, se estn estimando en realidad A + BC, B + A C
y C + A B . A dos o ms efectos que tienen esta propiedad se les llama alias. En el ejemplo tratado aqu,yl y
B C son alias, B y A C son alias y C yA B son alias. Esto se indica con la notacin ^->A + BC, -*B A C y
4 -> C + AB.
La estructura de los alias para este diseo puede determinarse con facilidad utilizando la relacin de
definicin / = A B C . Al multiplicar cualquier columna (o efecto) por la relacin de definicin se obtienen
los alias de esa columna (o efecto). En el ejemplo tratado aqu se encuentra que el alias de A es
A I = A A B C = A^BC
o, puesto que el cuadrado de cualquier columna es la identidad I,
A = BC
D e manera similar, se encuentra que los alias de 5 y C son
BI=BABC
B=AB^C=AC
CI=CABC
C = A B C ^ = AB
A esta fraccin un medio, con / = +ABC, suele llamrsele la fraccin principal.
Suponga ahora que se eligi la otra fraccin un medio, es decir, las combinaciones de tratamientos de
la tabla 8-1 asociadas con los signos negativos de la columnay4C. Esta fraccin un medio alterna o com

306

CAPTULO 8 DISEOS FACTORIALES FRACCIONADOS DE DOS NIVELES

plementaria (la cual se compone de las corridas (1), ab, ac y be) se ilustra en la figura 8-l>. La relacin de
definicin de este diseo es
I= -A B C
D e la combinacin lineal de las observaciones, por ejemplo i \ , f g y i'c, de la fraccin alterna se obtiene
-> B - A C
e'c ^ C - A B
Por lo tanto, cuando se estiman A, B y C con esta fraccin particular, en realidad se estn estimando
A -B C , B -A C y C-AB.
En la prctica, no importa cul de las fracciones se usa. Ambas fracciones pertenecen a la misma fa
milia; es decir, las dos fi-acciones un medio forman un diseo 2^ completo. Esto puede observarse con fa
cilidad con referencia a los incisos a y fc de la figura 8-1.
Suponga que despus de correr una de las fracciones un medio del diseo 2^, tambin se corri la
otra. Por lo tanto, se cuenta ahora con las ocho corridas asociadas con el diseo 2^ completo. Pueden ob
tenerse entonces las estimaciones sin alias de todos los efectos analizando las ocho corridas como un dise
o 2^ completo en dos bloques de cuatro corridas cada uno. Esto tambin podra hacerse sumando y
restando la combinacin lineal de los efectos de las dos fracciones individuales. Por ejemplo, considere
A-* A + B C y e'^ ^ A - BC. Esto impHca que
\{^ + i\)= ^ {A + B C + A ~ B C )^ A
y que
W

-1 'a ) = \{ A + B C - A + B C ) ^ B C

Por lo tanto, para los tres pares de combinaciones lineales se obtendra lo siguiente:
i
A
B
C

D ei(^, + ;)
A
B
C

BC
AC
AB

Resolucin del diseo


Al diseo 2^^ precedente se le llama diseo de resolucin III. En este diseo, los efectos principales son
ahas de las interacciones de dos factores. U n diseo es de resolucin R cuando ningn efecto del factorp
es alias de otro efecto que contiene menos e R - p factores. Por lo general se emplea un subndice con un
numeral romano para denotar la resolucin del diseo; por lo tanto, la fraccin un medio del diseo 2^
con la relacin de definicin / = A B C (o / = -A B C ) es un diseo
Los diseos de resolucin III, IV y V son particularmente importantes. A continuacin se presentan
las definiciones de estos diseos y un ejemplo de cada uno:
1. Diseos de resolucin III. Se trata de diseos en los que ninguno de los efectos principales es alias
de ningn otro efecto principal, pero los efectos principales son alias de las interacciones de dos
factores, y algunas de las interacciones de dos factores pueden ser alias entre s. El diseo 2^^ de
la tabla 8-1 es un diseo de resolucin III (2^*).
2. Diseos de resolucin IV. Se trata de diseos en los que ninguno de los efectos principales es alias
de ningn otro efecto principal ni de las interacciones de dos factores, pero las interacciones de

8-2 LA FRACCIN UN MEDIO DEL DISEO

2'

307

dos factores son alias entre s. Un diseo 2^' con I = A BC D es un diseo de resolucin IV
3. Diseos de resolucin V Se trata de diseos en los que ninguno de los efectos principales ni de las
interacciones de dos factores son alias de otro efecto principal o interaccin de dos factores, pero
las interacciones de dos factores son alias de las interacciones de tres factores. Un diseo 2^"^ con
I = ABCDE es un diseo de resolucin V (2^).
En general, la resolucin de un diseo factorial fraccionado de dos niveles es igual al menor nmero
de letras en cualquier palabra de la relacin de definicin. Por consiguiente, los diseos precedentes po
dran denominarse diseos de tres, cuatro y cinco letras, respectivamente. Por lo comn, es preferible em
plear diseos fraccionados que tengan la resolucin ms alta posible que sea consistente con el grado de
fraccionamiento requerido. Entre ms alta sea la resolucin, menos restrictivos sern los supuestos que
se requieren respecto de cules de las interacciones son insignificantes para obtener una interpretacin
nica de los datos.
Construccin de fracciones un medio
Una fraccin un medio del diseo 2^ de la resolucin ms alta puede construirse apuntando el diseo b
sico, que consta de las corridas de un diseo factorial 2*' completo, y agregndole despus el factor A:-simo identicando sus niveles positivo y negativo con los signos positivo y negativo de la interaccin^5C
(K ~ 1) del orden ms alto. Por lo tanto, el diseo factorial fraccionado 2^"' se obtiene apuntando el dise
o 2^ completo como diseo bsico e igualando despus el factor C con la interaccin./45. La fraccin al
terna se obtendra igualando el factor C con la interaccin -AB. Este enfoque se ilustra en la tabla 8-2.
Observe que el diseo bsico siempre tiene el nmero correcto de corridas (renglones), pero le falta una
columna. El generador / = A B C K s e resuelve entonces para la columna fallante (X), de tal modo que K
= A B C ( K - 1) define el producto de los signos positivos y negativos que deber usarse en cada rengln
para producir los niveles del factor it-simo.
Observe que podra usarse cualquier efecto de interaccin para generar la columna del factor )t-simo. Sin embargo, al utilizarse cualquier efecto que no seaA SC - (A"-1), no se producir el diseo con la
resolucin ms alta posible.
Otra forma de visualizar la construccin de una fraccin un medio es mediante la particin de las co
rridas en dos bloques con la interaccin de orden ms altoXBC K confundida. Cada bloque es un dise
o factorial fraccionado 2** con la resolucin ms alta.
Proyeccin de iraccioiies en diseos foctoriales
Cualquier diseo factorial fraccionado de resolucin i? contiene diseos factoriales completos (posible
mente diseos factoriales con rplicas) en cualquier subconjunto de i? - 1 factores. ste es un concepto
importante y til. Por ejemplo, si un experimentador tiene varios factores de inters potencial pero piensa
Tabla 8-2

Las dos fracciones un medio del diseo V


Diseo factorial
2^ completo
(diseo
bsico)

2*ni
"*>^T ABC

Corrida

1
2
y
4

_
-

+
-1-

+
+

-1-

2J\ / = -A B C

C=AB

-1-

C = -A B

_
+
+

+
+

CAPTULO 8

308

DISEOS FACTORIALES FRACCIONADOS DE DOS NIVELES

I
1

---------1 -----

z ______ I /
I
------

/
/
J^C

abe

Figura 8-2 Proyeccin de un diseo


2 ^ ' en tres diseos 2^.

que slo i? ~ 1 de ellos tienen efectos importantes, entonces un diseo factorial fraccionado de resolucin
R es la eleccin de diseo apropiada. Si el experimentador est en lo correcto, el diseo factorial fraccio
nado de resolucin R se proyectar en un diseo factorial completo en los /i - 1 factores significativos.
Este proceso se ilustra en la figura 8-2 para el diseo 2^^ , el cual se proyecta en un diseo 2^ en cada subconjunto de dos factores.
Puesto que la mxima resolucin posible de una fraccin un medio del diseo 2*^es i? = k, todos los di
seos 2*^se proyectarn en un factorial completo en (k 1) cualquiera de los k factores originales. Adems,
un diseo 2*^^puede proyectarse en dos rplicas de un factorial completo en cualquier subconjunto d e k - 2
factores, cuatro rplicas de un factorial completo en cualquier subconjunto de A:- 3 factores, etctera.

EJEMPLO ..........................................................................................................................................................
Considere el experimento del ndice de filtracin del ejemplo 6-2. El diseo original, ilustrado en la tabla
6-10, es una sola rplica del diseo 2*. En ese ejemplo se encontr que los efectos principales de A, C y D y
las interacciones y4C y A D eran diferentes de cero. Se retoma ahora este experimento y se simula lo que
habra ocurrido si se hubiera corrido una fraccin un medio del diseo 2* en vez del diseo factorial com
pleto.
Se usar el diseo 2^' con / = ABCD, ya que esta eleccin del generador dar como resultado un di
seo con la resolucin ms alta posible (IV). Para construir el diseo, primero se apunta el diseo bsico,
el cual es un diseo 2 \ como se muestra en las tres primeras columnas de la tabla 8-3, Este diseo bsico
tiene el nmero necesario de corridas (ocho) pero slo tres columnas (factores). Para encontrar los nive
les del cuarto factor, se resuelve / = ABCD paraD, o D = A B C . Por lo tanto, el nivel d eD de cada corrida
Tabla 8-3

El diseo 21,
v con la relacin de definicin I=ABCD
Diseo bsico

Corrida
1
2
3
4
5
6
7
8

+
+

-1+

D=ABC

-1+

-1+
+
+

Combinacin de
tratamientos
(1)
ad
bd
ab
cd
ac
be
abcd

ndice de
filtracin
45
100
45
65
75
60
80
96

8-2 LA FRACCIN UN MEDIO DEL DISEO Z'

309

ftc = 80

Figura 8-3 El diseo 2^ para el experimento del ndice de filtracin del ejemplo 8-1.

es el producto de los signos positivos y negativos de las columnas^, B y C. El proceso se ilustra en la tabla
8-3. Puesto que el g e n e r a d o r e s positivo, este diseo
es la fraccin principal. El diseo se ilus
tra grficamente en la figura 8-3.
Utilizando la relacin de definicin, se observa que cada uno de los efectos principales es alias de una
interaccin de tres factores; es decir,^ =A^BCD = B C D ,B =AB^CD = A C D ,C = A B (? D = A B D y D =
ABCD^ = ABC. Adems, cada interaccin de dos factores es alias de otra interaccin de dos factores.
Estas relaciones de los alias son yl5 = C D ,A C = BD y B C = A D . Los cuatro efectos principales ms los
tres pares de alias de interacciones de dos factores representan los siete grados de libertad del diseo.
En este punto, normalmente se aleatorizaran las ocho corridas y se llevara a cabo el experimento.
Puesto que se ha corrido ya el diseo 2*completo, simplemente se seleccionan los ocho ndices de filtra
cin observados del ejemplo 6-2 que corresponden a las corridas del diseo 2*^\ Estas observaciones se
muestran en la ltima columna de la tabla 8-3, as como en la figura 8-3.
En la tabla 8-4 se muestran las estimaciones de los efectos obtenidas de este diseo 2 j^ \ Para ilustrar
los clculos, la combinacin lineal de las observaciones asociadas con el efecto de A es
i (-4 5 + 1 0 0 - 45-1-65- 75-1-60 - 80-1-96)= 19.00-*mientras que para el efecto A B se obtendra
^ = 1 (4 5 -1 0 0 - 45-H 65-)- 7 5 - 60 - 80-1- 96) = -1 .0 0

-I- C>

Por la inspeccin de la informacin de la tabla 8-4, no es irrazonable concluir que los efectos principales
d e A ,C y D son grandes. Adems, si>1, C y D son los efectos principales importantes, entonces es lgico
concluir que las dos cadenas de alias de interaccionesj4C -I- BD yA D + BC tienen efectos grandes, ya que

Tabla 8>4 Estimaciones de los efectos


y los alias del ejemplo 8-1

Estimacin

=
a

=
=
=
^A B
^ AC
^ AD

=
=
=

19.00
1.50
14.00
16.50
-1.00
-18.50
19.00

Estructura de los alias


^-^A->rBCD
Ig * B+ ACD
tc ^ C + A B D
l ^ D + A B C
t^ -* A B + C D
i

ad

BC

"Los efectos significativos se indican en negritas.

310

CAPTULO 8

DISEOS FACTORIALES FRACCIONADOS DE DOS NIVELES

75

96

Figura 8-4 Proyeccin del diseo


y D para el ejemplo 8-1.

en un diseo 2^ en^4, C

las interacciones^C yA D tambin son significativas. En otras palabras, si^ , C y ) son significativos, en
tonces lo ms posible es que las interacciones significativas sean^C yA D . Se trata de una aplicacin de la
nav^a de Ockham (en honor de Guillermo de Ockham), un principio cientfico que establece que cuan
do uno se confi-onta con varias interpretaciones posibles de un fenmeno, la interpretacin ms simple
suele ser la correcta. Observe que esta interpretacin concuerda con las conclusiones del anlisis del dise
o 2'* completo del ejemplo 6-2.
Puesto que el factor B no es significativo, puede sacarse de consideracin. Por consiguiente, este dise
o 2^^ puede proyectarse en una sola rplica del diseo 2^ en los factores^, C yD , como se muestra en la
figura 8-4. El examen visual de esta grfica de cubo nos hace sentimos ms cmodos con las conclusiones
a las que se lleg antes. Observe que si la temperatura (A) est en el nivel bajo, la concentracin (C) tiene
un efecto positivo grande, mientras que si la temperatura est en el nivel alto, la concentracin tiene un
efecto muy pequeo. Esto se debe probablemente a una interaccin^C. Adems, si la temperatura est
en el nivel bajo, el efecto de la velocidad de agitacin (D) es insignificante, mientras que si la temperatura
est en el nivel alto, la velocidad de agitacin tiene un efecto positivo grande. Esto se debe probablemente
a la interaccin A D que se identific de manera tentativa unos prrafos antes.
Con base en el anhsis anterior, puede obtenerse ahora un modelo para predecir el ndice de filtra
cin en la regin experimental. Este modelo es
y= h
donde

+ ^ 1 3 ^ 3 +^14^1^4

y JC4 son variables codificadas (-1 < x ^ + 1 ) que representan a^, C y ), y las 3son coeficien

tes de regresin que pueden obtenerse a partir de las estimaciones de los efectos como se hizo anterior
mente. Por lo tanto, la ecuacin de prediccin es
y = 70.75+

/'19.00'!
2

fl4.00^
^1 +

^16.50^
^3 +

x ,+

'-18.50]
2

x ,x ,+

f'l9.00\
2

Recuerde que la ordenada al origen /Sq es el promedio de todas las respuestas en las ocho corridas del di
seo. Este modelo es muy similar al que result del diseo factorial 2^ completo del ejemplo 6-2.

8-2 LA FRACCIN UN MEDIO DEL DISEO 2

311

EJEMPLO ..........................................................................................................................................................
Un diseo 2s- usado para mejorar un proceso
Se investigaron cinco factores en un proceso de manufactura de un circuito integrado en un diseo 2^'^
con el objetivo de mejorar el rendimiento del proceso. Los cinco factores fueron^ = ajuste de apertura
(pequea, grande), B = tiempo de exposicin (20% abajo del nominal, 20% arriba del nominal), C =
tiempo de desarrollo (30 s, 45 s), ) = tamao de la mscara (pequea, grande) y E = tiempo de grabado
(14.5 min, 15.5 min). En la tabla 8-5 se muestra la construccin del diseo 2^^ Observe que el diseo se
construy apuntando el diseo bsico que tiene 16 corridas (un diseo 2* en ^ , B, C y D ) , seleccionando
ABCDE como generador, y ajustando despus los niveles del quinto factor E = ABCD. En la figura 8-5 se
presenta una representacin geomtrica del diseo.
La relacin de definicin del diseo es / = ABCDE. Por consiguiente, todos los efectos principales
son alias de una interaccin de cuatro factores (por ejemplo,
BCDE), y cada una de las interac
ciones de dos factores son alias de una interaccin de tres factores (por ejemplo, ^b -*AB + CDE). Por lo
tanto, el diseo es de resolucin V Se esperara que este diseo 2^^ proporcionara excelente informacin
respecto de los efectos principales y las interacciones de dos factores.
La tabla 8-6 contiene las estimaciones de los efectos, las sumas de cuadrados y los coeficientes del
modelo de regresin para los 15 efectos de este experimento. En la figura 8-6 se presenta la grfica de
probabilidad normal de las estimaciones de los efectos de este experimento. Los efectos principales d e ^
5 y C y la interaccinAB son grandes. Recuerde que, debido a los alias, estos efectos son en realidad^! -IBCDE, B +A C D E , C + A B D E yA B -i- CDE. Sin embargo, puesto que parece plausible que las interac
ciones de tres factores y de rdenes superiores sean insignicantes, uno siente seguridad en concluir que
slo A, B, C y A B son los efectos importantes.
En la tabla 8-7 se resume el anlisis de varianza de este experimento. La suma de cuadrados del
m odelo es 5SModeio =
+ SSg + SSc + SS^g = 5747.25, y esto explica ms de 99% de la variabilidad
total del rendimiento. En la figura 8-7 se presenta la grfica de probabilidad normal de los residuales

Corrida
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

A
+
-

+
+
+
+
+
-1+

Diseo bsico
B
C
-

+
+
+
-1+
+
+
-t-

+
+
4+
+
+
-1+

E =A BC D
+

+
+
+
-

+
+
+
+
+
+
-1+

-f+

+
+

Combinacin de
tratamientos
e
a
h
abe
c
ace
bce
abe
d
ade
bde
abd
cde
ac
bcd
abcde

Rendimiento
8
9
34
52
16
22
45
60
6
10
30
50
15
21
44
63

312

CAPTULO 8

DISEOS FACTORIALES FRACCIONADOS DE DOS NIVELES


D

Figura 8-5 El diseo 2^ del ejemplo 8-2.

Tabla 8-6

Efectos, coeficientes de regresin y sumas de cuadrados del ejemplo 8-Z


Nivel -1
Nombre
Variable
A
B
C
D
E

Apertura
Tiempo de desarrollo
Tiempo de ejcposicin
Tkmao de la mscara
Tiempo de grabado

1.000
1.000
1.000
1.000
1.000

Nivel +1

1.000

1.000
1.000
1.000
1.000

Variable

Coeficiente de regresin

Efecto estimado

Suma de cuadrados

Promedio global
A
B
C
D
E
AB
AC
AD
AE
BC
BD
BE
CD
CE
DE

30.3125
5.5625
16.9375
5.4375
-0.4375
0.3125
3.4375
0.1875
0.5625
0.5625
0.3125
-0.0625
-0.0625
0.4375
0.1875
-0.6875

11.1250
33.8750
10.8750
-0.8750
0.6250
6.8750
0.3750
1.1250
1.1250
0.6250
-0.1250
-0.1250
0.8750
0.3750
-1.3750

495.062
4590.062
473.062
3.063
1.563
189.063
0.563
5.063
5.063
1.563
0.063
0.063
3.063
0.563
7.563

Estimaciones de ios efectos

Figura 8-6 Grfica de probabilidad normal de los efectos del ejemplo 8-2.
labia 8-7

Anlisis de varianza del ejemplo 8-2

Fuente de variacin
A (Apertura)
B (Tiempo de exposicin)
C (Tiempo de desarrollo)
AB
Error
Ibtal

Suma de
cuadrados

Grados de
libertad

495.0625
4590.0625
473.0625
189.0625
28.1875
5775.4375

1
1
1
1
11
15

Cuadrado
medio
495.0625
4590.0625
473.0625
189.0625
2.5625

193.20
1791.24
184.61
73.78

Valor P
<0.0001
<0.0001
<0.0001
<0.0001

99

95
90
80
70

50
I

30
20

10

Residuales

Figura 8-7

Grfica de probabilidad normal de los residuales del ejemplo 8-2.

313

314

CAPTULO 8

DISEOS FACTORIALES FRACCIONADOS DE DOS NIVELES

-1

-3

-L
10

20

I
30

_L

_L

40

50

60

Rendimiento predlcho

Figura 8-8 Grfica de los residuales contra el rendimiento predicho


para el ejemplo 8-2.

y la figura 8-8 es una grfica de los residuales contra los valores predichos. Ambas grficas son satis
factorias.
Los tres factoreSv4,5 y C tienen efectos positivos grandes. La interaccin apertura-tiempo de exposi
cin oA B se grafica en la figura 8-9. Esta grfica confirma que el rendimiento es ms alto cuando tanto^
como B estn en el nivel alto.

63

~0B-

6
Bajo

Alto

Figura 8-9 Interacdn apertura-tiempo de expodn del ejemplo 8-2.

8-2 LA FRACCIN UN MEDIO DEL DISEO Z<


44.5

315

61.5

Figura 8-10 Proyeccin del diseo 2^ del


ejemplo 8-2 en dos rplicas de un diseo 2^ en
los factores A, B y C.

El diseo se reducir a dos rplicas de un diseo 2^ en tres cualesquiera de los cinco factores origi
nales. (Observar la figura 8-5 ayuda a visualizar esto.) La figura 8-10 es una grfica de cubo en los factores
A , B y C con los rendimientos promedio superpuestos en los ocho vrtices. Es evidente por la inspeccin
de la grfica de cubo que los rendimientos ms altos se consiguen conv4,5 y C en el nivel alto. Los factores
D y E tienen un efecto pequeo sobre el rendimiento promedio del proceso y pueden ajustarse en los va
lores que optimicen otros objetivos (como el costo).

Secuencias de diseos Wtoriales fraccionados


El uso de los diseos factoriales fraccionados lleva con frecuencia a una gran economa y eficiencia en la
experimentacin, en particular si las corridas pueden hacerse secuencialmente. Por ejemplo, suponga
que se estn investigando k = 4 factores (2* = 16 corridas). Casi siempre es preferible correr un diseo
fraccionado 2^* (ocho corridas), analizar los resultados y despus decidir cul es la mejor serie de corri
das que deber correrse despus. Si es necesario resolver ambigedades, siempre puede correrse la frac
cin alterna y completar el diseo 2*. Cuando se usa este mtodo para completar el diseo, ambas
fracciones un medio representan bloques del diseo completo con las interacciones de orden superior
confundidas con los bloques (en este casoABCD estara confundida). Por lo tanto, la experimentacin secuencial tiene como resultado la prdida de informacin slo en la interaccin de orden ms alto. Su ven
taja es que en muchos casos se saca informacin suficiente de la fraccin un medio para proceder a la
siguiente etapa de la experimentacin, lo cual podra implicar la incorporacin o eliminacin de factores,
el cambio de las respuestas, o la variacin de algunos de los factores en nuevos rangos. Algunas de estas
posibilidades se ilustran grficamente en la figura 8-11.

EJEMPLO 8 * 3 ...................... ..........................................................................................................................


Considere nuevamente el experimento del ejemplo 8-1. Se ha usado un diseo 2 ^ ' y se ha hecho la identi
ficacin tentativa de los tres efectos principales grandes:/!, C y D . Hay dos efectos grandes asociados con
interacciones de dos factores, j4C + BD yA D + BC. En el ejemplo 8-2 se utiliz el hecho de que el efecto
principal de B era insignificante para concluir de manera tentativa que las interacciones importantes eran

316

CAPfaiLO 8

----------1
I
1I
1
-------- ^
\
\

DISEOS FACTORIALES FRACCIONADOS DE DOS NIVELES

---- 1--------- C
1
1 ^
1I
^
-

a) Moverse a una nueva


localizacin para explorar
una tendencia
aparente a la respuesta

b) Agregar otra fraccin


para resolver las
ambigedades de la
fraccin original

Diseo inicial

---- 1
1
1
/

I
/

c) Reescalar algunos factores


porque pueden haberse
hecho variar en los
rangos inapropiados

f ) Hacer un aumerrto para


modelar la curvatura
aparente

7' /

J1

&

r o n t" d ': T e fr o r
porque algunas corridas se

d)Ellm lnaryagr^ar
faMores porque el factor

Wderon incorrectamente

a la%etocidad^deiimm^^^^^
del catalizador es insignificante

Figura 8-11 Posibilidades para el seguimiento de la experimentacin despus de un


experimento factorial fraccionado [adaptado de Box (Sequential Experimentation and
Sequential Assembly of Designs) con permiso del editor].

A C y A D . En ocasiones el experimentador tendr que procesar conocimientos que puedan ayudarle a dis
criminar entre las interacciones que probablemente sean importantes. Sin embargo, siempre es posible
aislar la interaccin significativa corriendo la fraccin alterna, dada por / = -ABCD . Es directa la demos
tracin de que el diseo y las respuestas son los siguientes;

Corrida
1
2
3
4
5
6
7
8

Diseo bsico
B

..

C
_

+
+

+
+

+
+

D = -ABC
+

+
-1+
+
+

+
+
-

Combinacin de
tratamientos
d
a
b
abd
c
ac
bcd
abe

ndice de
ltracin
43
71
48
104
68
86
70
65

8-3 LA FRACCIN UN CUARTO DEL DISEO 2

317

Las combinaciones lineales de las observaciones obtenidas a partir de esta fraccin alterna son
24.25

4.75- > B -A C D
5.75^ C - A B D
=
e'o = 1 1 7 5 ABC
1.25 ^ A B - C D
'ac = -17.75-^ A C - B D
i'An = 14.25 A D - BC
=

Estas estimaciones pueden combinarse con las que se obtuvieron de la fraccin un medio original para
obtener las siguientes estimaciones de los efectos:

A
B
C
D
AB
AC
AD

21.63-/4
3.13- B
9.88 C
14.63-Z )
0.13 -*AB
-18.13
1 6 ,6 3 - ^

-2.63--BCD
-1.63-A C D
4.13 -*ABD
.S8--ABC
-1.13 - CD
-0.38 - BD
2.38- B C

Estas estimaciones concuerdan exactamente con las del anlisis original de los datos como una sola rpli
ca de un diseo factorial 2*, como se consigna en el ejemplo 6-2. Evidentemente, son las nteraccionesv4C
y A D las que son grandes.

Agregar la fraccin alterna a la fraccin principal puede considerarse como un tipo de experimento
de confirmacin, por cuanto proporciona informacin que permitir fortalecer las conclusiones iniciales
acerca de los efectos de la interaccin de dos factores. En la seccin 8-5 se investigarn otros aspectos de
la combinacin de diseos factoriales fraccionados para aislar las interacciones. En ocasiones un experi
mento de confirmacin no es tan elaborado como ste. Por ejemplo, podra usarse la ecuacin del modelo
para predecir la respuesta en un punto de inters dentro del espacio del diseo (no uno de los puntos del
diseo actual), correr despus realmente ese ensayo (quiz varias veces) y usar la comparacin entre la
respuesta predicha y la observada para confirmar los resultados.

8-3

LA FRACCIN U N C U A R TO DEL DISEO 2^

Para un nmero moderadamente grande de factores, con frecuencia son tiles fracciones menores del di
seo 2*. Considere una fraccin un cuarto del diseo 2*. Este diseo contiene 2*"^ corridas y es comn lla
marlo diseo factorial fraccionado 2*~^
El diseo 2*^^puede construirse apuntando primero un diseo bsico compuesto por las corridas aso
ciadas con un diseo factorial completo en ^ - 2 factores y asociando despus las dos columnas adiciona
les con las interacciones elegidas apropiadamente que incluyan los primeros k 2 factores. Por lo tanto,

318

CAPTULOS

DISEOS FACTORIALES FRACCIONADOS DE DOS NIVELES

una fraccin un cuarto del diseo 2* tiene dos generadores. Si P y Q representan los generadores escogi
dos, entonces a / = P e / = 3 se les llama las relaciones generadoras del diseo. Los signos de P y Q (+
o - ) determinan cul de las fracciones un cuarto se produce. Las cuatro fracciones asociadas con la elec
cin de los generadores P y Q pertenecen a la misma familia. La fraccin para la que tanto P como Q
son positivas es la fraccin principal.
La relacin de definicin completa del diseo est compuesta por todas las columnas que son iguales
a la columna identidadI. stas constarn t P ,Q y su interaccin generalizadaPQ\ es decir, la relacin de
definicin e s l = P Q = PQ. A los elementos P ,Q y PQ de la relacin de definicin se les denomina pa
labras. Los alias de cualquier efecto se obtienen mediante la multiplicacin de la columna de ese efecto
por cada palabra de la relacin de definicin. Evidentemente, cada efecto tiene tres alias. El experimenta
dor deber estar atento al elegir los generadores para que los efectos potencialmente importantes no
sean alias entre s.
Como un ejemplo, considere el diseo 2^1 Suponga que se escogen / = A BCE e / = BCDF como los
generadores del diseo. Entonces la interaccin generalizada de los generadores A B C E y BCDF es
ADEF; por lo tanto, la relacin de definicin completa de este diseo es
1 = ABCE = BCDF ^ A D E F
Por consiguiente, se trata de un diseo de resolucin IV Para encontrar los alias de cualquier efecto (por
ejemplo d e^ ), se multiplica ese efecto por cada palabra de la relacin de definicin. Para^, esto produce
A = BCE = ABCDF = DEF
Es sencillo verificar que todos los efectos principales son alias de interacciones de tres y cinco factores,
mientras que las interacciones de dos factores son alias entre s y de interacciones de rdenes superiores.
Por lo tanto, cuando se estim ad, por ejemplo, en realidad se est estim ando^ -I- BCE + DEF + ABCDF.
En la tabla 8-8 se muestra la estructura completa de los alias de este diseo. Si las interacciones de tres
factores y de rdenes superiores son insignificantes, este diseo produce estimaciones claras de los efec
tos principales.
Para construir este diseo se anota primero el diseo bsico, el cual consiste en las 16 corridas para
un diseo completo 2*^ = 2* qtA , B ,C y D . Despus se aaden los dos factores y P, asociando sus nive
les ms y menos con los signos ms y menos de la interaccin ABC y .BCD, respectivamente. Este procedi
miento se muestra en la tabla 8-9.
Otra forma de construir este diseo es deduciendo los cuatro bloques del diseo 2* con ABC E y
BCDF confundidas y eligiendo despus el bloque con las combinaciones de tratamientos que son positi
vas paib^ABCEyBCDF. Se tratara de un diseo factorial fraccionado 2"^con relaciones generadoras / =
ABC E e / = BCDF, y puesto que los dos generadores ABCP y PCDP son positivos, se trata de la fraccin
principal.

Tabla 8-8 Estructura de los alias del diseo 2^ ^


_________con I ^ ABCE = BCDF ^ ADEF__________________
A = BCE = DEF = ABCDF
AB ^ CE = ACDF = BDEF
B = ACE = CDF = ABDEF
AC = BE = ABDF = CDEF
C = ABE = BDF = ACDEF
AD = EF = BCDE = ABCF
D = BCF = AEF = ABCDE
AE = BC = DF =ABCDEF
E = A B C = A D F = BCDEF
AF = DE = BCEF = ABCD
F = BCD = ADE = ABCEF
BD= CF = ACDE = ABEF
ABD = CDE = ACF = BEF
BF = C D = ACEF = ABDE
ACD = BDE * ABE = CEF

8-3 LA FRACCIN UN CUARTO DEL DISEO 2

Tabla 8-9

319

Construccin del diseo 2^^ con los generadores I ABCE t i = BCDF________________________________

Diseo bsico
Corrida__________________ A _______ B
C_______ D _____________ E = A B C ___________________ F = B CD
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

+
_
+
+
+
_
_
+
_

+
+
+
_
_
+
_
+
+
+
_
+
_
+
+______ +

_
_
_
+
+
+
+
_
_
_
+
+
+
+

I
_
_
_
_
_
_
+
+
+
+
+
+
+
+

+
+
+
_
+
_
+
+
_
+

I
+
+
+
+
+
+
_

+
+________________________ +

Hay, desde luego, tres fracciones alternas de este diseo


particular. Se trata de las fracciones
con las relaciones generadorasI = ABC E e l = -BCDF; I = -A B C E e / = BCDF-, e / = -A B C E e / =
-BCDF. Es sencillo construir estas fracciones con el mtodo que se muestra en la tabla 8-9. Por ejemplo,
si quiere encontrarse la fraccin para la que I = ABCE e / = -BCDF, entonces en la ltima columna de la
tabla 8-9 se hace F = -B C D , y la columna de los niveles del feictor F queda como
+ + --------- + + -----+++-! La relacin de definicin completa de esta fraccin alterna es / = A BC E = -B C D F = -ADEF. Ahora
ciertos signos en la estructura de los alias de la tabla 8-9 se han cambiado; por ejemplo, los alias de^4 son
A = BCE = -D E F = -ABCDF. Por lo tanto, la combinacin lineal de las observaciones estima en reali
dad A + BCE - DEF - ABCDF.
Por ltimo, observe que el diseo factorial fraccionado
se proyectar en una sola rplica de un
diseo 2^ en cualquier subconjunto de cuatro factores que no sea una palabra de la relacin de definicin.
Ikmbin se pliega en una fraccin un medio con una rplica de un diseo 2'* en cualquier subconjunto de
cuatro factores que sea una palabra de la relacin de definicin. Por lo tanto, el diseo de la tabla 8-9 se
convierte en dos rpUcas de un diseo 2^^ en los factores ABCE, BCDF y ADEF, porque stas son las pa
labras de la relacin de definicin. Hay otras 12 combinaciones de los seis factores, cx} to.o ABCD,ABCF,
etc., para las que el diseo se proyecta en una sola rplica del diseo 2'*. Este diseo tambin se pliega en
dos rplicas de un diseo 2^ en cualquier subconjunto de tres de los seis factores o en cuatro rplicas de un
diseo 2^ en cualquier subconjunto de dos factores.
En general, cualquier diseo factorial fraccionado 2*"^puede plegarse en un diseo factorial comple
to o bien en un diseo factorial fraccionado en algn subconjunto de r < )t - 2 de los factores originales.
Estos subconjuntos de variables que forman diseos factoriales completos no son palabras de la relacin
de definicin completa.
T E M P L O 8 - 4 ...........................................................................................................................................................
Las piezcis fabricadas en un proceso de moldeo por inyeccin estn presentando una contraccin excesi
va. Esto est ocasionando problemas en las operaciones de ensamblaje que se realizan despus del mol
deo por inyeccin. Un equipo de mejoramiento de calidad ha decidido llevar a cabo un experimento

320

CAPTULOS

DISEOS FACTORIALES FRACCIONADOS DE DOS NIVELES

diseado para estudiar el proceso de moldeo por inyeccin a fin de poder reducir la contraccin. El equi
po decide investigar seis factores la temperatura de moldeo {A), la velocidad del enroscado (B), el
tiempo de retencin (C), la duracin del ciclo (>), el tamao del vaciadero ( ) y la presin de la retencin
(F) con dos niveles cada uno, con el fin de saber cmo se afecta la contraccin debido a cada factor, as
como para obtener informacin preliminar acerca de la forma en que los factores interactan.
El equipo decide usar el diseo factorial fraccionado de 16 corridas con dos niveles de la tabla 8-9. El
diseo se muestra de nuevo en la tabla 8-10, junto con la contraccin observada ( x 10) en la pieza de
prueba producida en cada una de las 16 corridas del diseo. En la tabla 8-11 se muestran las estimaciones
de los efectos, las sumas de cuadrados y los coeficientes de regresin de este experimento.
En la figura 8-12 se presenta la grfica de probabilidad normal de las estimaciones de los efectos de
este experimento. Los nicos efectos grandes so n ^ (temperatura de moldeo), B (velocidad del enrosca
do) y la interaccin AB. A la luz de las relaciones de los alias de la tabla 8-8, parece razonable adoptar es
tas conclusiones de manera tentativa. La grfica de la interaccin A B de la figura 8-13 indica que el
proceso muestra una alta insensibilidad a la temperatura si la velocidad del enroscado est en el nivel
bajo, pero que es muy sensible a la temperatura si la velocidad del enroscado est en el nivel alto. Con la^
velocidad del enroscado en el nivel bajo, el proceso deber producir una contraccin promedio de alrede
dor de 10%, independientemente del nivel de temperatura elegido.
Con base en este anlisis inicial, el equipo decide hacer el ajuste de la temperatura de moldeo y la ve
locidad del enroscado en el nivel bajo. Este conjunto de condiciones reducir la contraccin media de las
piezas en alrededor de 10%. Sin embargo, la variabilidad de la contraccin de una pieza a otra sigue sien
do un problema potencial. D e hecho, la contraccin media puede reducirse adecuadamente mediante las
modificaciones anteriores; sin embargo, la variabilidad de la contraccin de una pieza a otra en una corri
da de produccin podra seguir causando problemas en el ensamblaje. Una manera de abordar esta cues
tin es investigando si alguno de los factores del proceso afecta la variabilidad de la contraccin de las
piezas.
En la figura 8-14 se presenta la grfica de probabilidad normal de los residuales. Esta grfica parece
ser satisfactoria. Se construyeron despus las grficas de los residuales contra cada factor. En la figura

TaMa 8'O

Un diseo 2fv ^para el experimento del moldeo por inyeccin del ejemplo 8-4

Diseo bsico
Corrida
1
2
3
4
5
6
7
8
9
10
11
12
13
14

____

Contraccin
E=ABC

F = BCD

__

__

+
-1-

+
+

+
+
-1-

+ .

-1-

+
-1+
+
+

+
+

-1-

+
-1-

+
+

+
+

15

16

+
+

+
+

+
+
+

+
-1-

+
+
+
+

-H

+
+

observada (X 10)
6
10
32
60
4
15
26
60
8
12
34
60
16

5
37

52

8-3 lA FRACCIN UN CUARTO DEL DISEO 2

321

Tabla 8 '1 1 Efectos, sumas de cuadrados y coeciemes de regresin del ejemplo 8'4

Variable
A
B
C
D
E
F
Variable"
Promedio global
A
B
C
D
E
F
AB + CE
AC + BE
AD+EF
AE-i-BC + DF
AF + DE
BD + CF
BF + CD
ABD
ABF

Nombre
tempeTatura_moldeo
velocidad_enroscado
duracin_retencin
duracin_dclo
tamao_vadadero
presin_retendn
Coefidente de regresin
27.3125
6.9375
17.8125
-0.4375
0.6875
0.1875
0.1875
5.9375
-0.8125
-2.6875
-0.9375
0.3125
-0.0625
-0.0625
0.0625
-2.4375

Nivel -1
-1.000
-1.000
-1.000
-1.000
-1.000
-1.000
Efecto estimado

Slo los efectos principales y las interacciones de dos (actores.

Estimaciones de los efeoos

Figura 8-12

Grfica de probabilidad normal de los efectos del ejemplo 8>4.

13.8750
35.6250
-0.8750
1.3750
0.3750
0.3750
11.8750
-1.6250
-5.3750
-1.8750
0.6250
-0.1250
-0.1250
0.1250
^.8750

Nivel+1
1.000
1.000
1.000
1.000
1.000
1.000
Suma de cuadrados
770.062
5076.562
3.063
7.563
0.563
0.563
564.063
10.562
115.562
14.063
1.563
0.063
0.063
0.063
95.063

322

CAPTULO 8

DISEOS FACTORIALES FRACCIONADOS DE DOS NIVELES

60

B-i

Baja

Alta
Temperatura de moldeo, A

Figura 8-13 Grfica de la interaccin


(temperatura de m ol
deo-velocidad del enroscado) para el ejemplo 8-4.

8-15 se muestra una de estas grficas, la de los residuales contra el factor C (tiempo de retencin). La gr
fica revela que hay una dispersin sensiblemente menor en los residuales con el tiempo de retencin bajo
que con el tiempo de retencin alto. Estos residuales se obtuvieron de la manera usual a partir del modelo
de la contraccin predicha;
= 27.3125+ 6.9375x1 +17.8125i:j + S m i5 x ,x ^

99

95
90
80
70

S
50 X

c
30
20

10
5

Residuales

Figura 8-14

Grfica de probabilidad normal de los residuales del ejemplo 8-4.

8-3 LA FRACCIN UN CUARTO DEL DISEO Zi*

323

Figura 8-15 Residuales contra el tiempo de retencin (C) para el


ejemplo 8-4.

dondeA:i,;c2yj:i*2 son las variables codificadas que corresponden a los factoresv4 y 5 y a la interaccion es.
Entonces los residuales son
e=y-y
El modelo de regresin usado para producir los residuales elimina, en esencia, los efectos de localizacin
d e^ , B yA B de los datos; por lo tanto, los residuales contienen informacin acerca de la variabilidad no
explicada. La figura 8-15 ndica que existe un patrn en la variabilidad y que la variabilidad de la contrac
cin de las piezas puede ser menor cuando el tiempo de retencin est en el nivel bajo (recuerde que en el
captulo 6 se seal que los residuales slo transmiten informacin acerca de los efectos de dispersin
cuando es correcto el modelo de localizacin o la media).
Lo anterior se observa con mayor claridad en el anlisis de los residuales que se presenta en la tabla
8-12. En esta tabla, los residuales se ordenan en los niveles bajo (-) y alto (+ ) de cada factor, y se ha calcu
lado la desviacin estndar de los residuales en los niveles bajo y alto de cada factor. Observe que la des
viacin estndar de los residuales con C en el nivel bajo [5(C^) = 1.63] es considerablemente menor que la
desviacin estndar de los residuales con C en el nivel alto [5(C^) = 5.70].
En el tiltimo rengln de la tabla 8-12 se presenta el estadstico
S \i~ )
Recuerde que si las varianzas de los residuales en los niveles alto ( -I-) y bajo (-) del factor i son iguales, en
tonces este cociente sigue una distribucin aproximadamente normal con media cero, y puede usarse
para evaluar la diferencia en la variabilidad de la respuesta en los dos niveles del factor i. Puesto que el
cociente
es relativamente grande, se concluira que la aparente dispersin o efecto de variabilidad ob
servado en la figura 8-15 es real. Por lo tanto, ajustar el tiempo de retencin en su nivel bajo contribuira a
reducir la variabilidad de una pieza a otra durante una corrida de produccin. En la figura 8-16 se presen-

o o io o o o io o o o v io o o > o Q
inioMOiTiw^Moviu^t^ou^ior^CJ

1 +

r' o^ iM
00
I>
o <N 1-H

oo m in
I

1 +

P 2 In
<ri o

es t-H ON
I

oo
0

r- o lo
't ro o

1 +

S!

K! 3
' t

cri (N o

' ^O

TI

W-

ro c3

1 +

rn -rt

1 +

1 +

O
I

I +

o
+

1 +

NOin

o r- es
^
en o
rH r-l

^
^ On
O Tj - TI
oq

^ TT o

00

00
ja

324

8-3 LA FRACCIN UN CUARTO DEL DISEO 2>

3 25

f"
Figura 8-16

Grfica de probabilidad normal de los efectos de dispersin

del ejemplo 8-4.

ta una grfica de probabilidad normal de los valores f ' de la tabla 8-12; sta tambin indica que el factor
C tiene un efecto de dispersin grande.
En la figura 8-17 se muestran los datos de este experimento proyectados en un cubo en los factoresv4,
B y C .L a contraccin promedio observada y el rango de la contraccin observada se indican en cada vrti
ce del cubo. Por la inspeccin de la figura se observa que correr el proceso con la velocidad del enroscado
(B) en el nivel bajo es la clave para reducir la contraccin promedio de las piezas. SiB est en el nivel bajo,
virtualmente cualquier combinacin de la temperatura (j4) y el tiempo de retencin (C) resultar en valo
res bajos de la contraccin promedio de las piezas. Sin embargo, al examinar los rangos de los valores de
la contraccin en cada vrtice del cubo, es claro de inmediato que ajustar el tiempo de retencin (C) en el
nivel bajo es la nica eleccin razonable si se quiere mantener baja la variabilidad de la contraccin de
una pieza a otra en una corrida de produccin.

1 i-11
y = 60.0
=0

y - 33.0
-2

1
1
11
1
y = 10,0 1
R 12>----------

y ^ l '
=2
\

y -10,0
fl-11
+

y . 11.0
=2

C, tiempo de ratencin

A, temperatura de moldeo^

Figura 8-17 Contraccin promedio y rango de la contraccin en los


factores A , B y C para el ejemplo 8-4,

326
8-4

CAPTULOS

DISEOS FACTORIALES FRACCIONADOS DE DOS NIVELES

EL DISEO FACTORIAL FR ACC IO N AD O

GENERAL

A un diseo factorial fraccionado 2' que contiene 2*"^ corridas se le llama fraccin 1/2^ del diseo 2^ o, de
manera ms simple, diseo factorial fraccionado
En estos diseos deben seleccionarsep generadores
independientes. La relacin de definicin de este diseo se compone de los p generadores elegidos ini
cialmente y sus l ^ - p - l interacciones generalizadas. En la presente seccin se estudia la construccin y el
anlisis de estos diseos.
La estructura de los alias puede encontrarse multiplicando la columna de cada efecto por la relacin
de definicin. Deber prestarse atencin al elegir los generadores para que los efectos de inters poten
cial no sean alias entre s. Cada efecto tiene 2
alias. Para valores moderadamente grandes d e, es co
mn suponer que las interacciones de rdenes superiores (por ejemplo, de tercero y cuarto orden y
superiores) son insignificantes, con lo cual se simplifica en gran medida la estructura de los alias.
Es importante seleccionar los p generadores de un diseo factorial fraccionado 2*"^ de tal modo que
se obtengan las mejores relaciones de los alias posibles. Un criterio razonable es seleccionar los genera
dores para que el diseo 2*^ resultante tenga la resolucin ms alta posible. Para ilustrar, considere el di
seo 2^^ de la tabla 8-9, donde se usaron los generadores E = A B C y F = BCD, con lo cual se produce un
diseo de resolucin IV. ste es el diseo con la resolucin ms alta. Si se hubieran seleccionado E =
A B C y F = A B C D , la relacin de definicin completa hubiera s i d o / = ^ C =A B C D F = D F , y el dise
o habra sido de resolucin III. Se trata, evidentemente, de una eleccin inferior porque sacrifica de ma
nera innecesaria informacin acerca de las interacciones.
En ocasiones la resolucin por s sola no es suficiente para distinguir entre los diseos. Por ejemplo,
considere los tres diseos 2j^^ de la tabla 8-13. Todos estos diseos son de resolucin IV, pero tienen es
tructuras de los alias muy diferentes (se ha supuesto que las interacciones de tres factores y las de rdenes
superiores son insignificantes) con respecto a las interacciones de dos factores. Evidentemente, el diseo
A es el que tiene ms alias y el diseo C el que tiene menos, por lo que el diseo C sera una buena eleccin
para un diseo 2 \^^.
Las tres palabras del diseo ^4 tienen longitud 4; es decir, el patrn de la longitud de las palabras es
{ 4,4, 4} . Para el diseo B es { 4 ,4 , 6 } y para el diseo C es { 4,5, 5} . Observe que la relacin de definicin
del diseo C tiene una sola palabra de cuatro letras, mientras que los dems diseos tienen dos o tres. Por
lo tanto, el diseo C minimiza el nmero de palabras de la relacin de definicin que son de longitud m
nima. A un diseo como ste se le llama diseo de aberracin mnima. Minimizar la aberracin en un di
seo de resolucin i? asegura que el diseo tiene el nmero mnimo de efectos principales que son ahas de

Tabla 8 -1 3

Tres elecciones de generadores para el diseo L - 2

Generadores del diseo y:


F = A B C ,G = B C D
I = AB CF = BCD G = AD FG

Generadores del diseo B:


F =A BC, G ^ADE
I = ABCF = A D E G = BCDEFG

Generadores del diseo C:


F = A B C D ,G = A B D E
I = ABCDF = ABD EG = CEFG

Alias (interacciones de dos factores)

Alias ( in t e r a c ^ n e s ^ dos factores)

AC^BF
A D = FG
AG^DF
BD = CG
B G = CD
AF = B C ^ D G

A C = BF
A D = EG
AE = DG
AF^BC
A G = DE

Alias (interacciones de dos factores)


CE = FG
CF = E G
CG = EF

8-4 EL DISEO FACTORIAL FRACCIONAIX)

GENERAL

327

interacciones de orden i? - 1 , el nmero mnimo de interacciones de dos factores que son alias de interac
ciones de orden R - 2, etctera. Referirse a Fries y Hunter [46] para mayores detalles.
En la tabla 8-14 se presenta una seleccin de diseos factoriales fraccionados 2*^"^para k < 15 factores
y hasta n : 128 corridas. Los generadores sugeridos en esta tabla resultarn en un diseo con la resolu
cin ms alta posible. Son tambin los diseos con aberracin mnima.
Las relaciones de los alias para todos los diseos de la tabla 8-14 para los que < 64 se presentan en
la tabla X ll(a-w ) del apndice. Las relaciones de los alias incluidas en esta tabla se enfocan en los efectos
principales y las interacciones de dos y tres factores. Se da la relacin de definicin completa para cada di
seo. Esta tabla del apndice hace muy sencillo seleccionar un diseo con la resolucin suficiente para
asegurar que cualesquiera interacciones de inters potencial puedan estimarse.

EJEMPLO 8 - 5 ..................................................................................................................................................
Para ilustrar el uso de la tabla 8-14, suponga que se tienen siete factores y que el inters se encuentra en
estimar los siete efectos principales y hacerse una idea aproximada de las interacciones de dos factores.
Estamos dispuestos a suponer que las interacciones de tres factores y de rdenes superiores son insignifi
cantes. Esta informacin sugiere que un diseo de resolucin IV sera apropiado.
La tabla 8-14 muestra que se cuenta con dos fracciones de resolucin IV: la 2
con 32 corridas y la
2jv^ con 16 corridas. La tabla XII del apndice contiene las relaciones de los alias completas para estos
dos diseos. Los alias para el diseo 2]^^ de 16 corridas se encuentran en la tabla XII(i) del apndice.
Observe que los siete efectos prinepales son alias de interacciones de tres factores. Las interacciones
de dos factores son alias en grupos de tres. Por lo tanto, este diseo satisfar los objetivos del problema;
es decir, permitir la estimacin de los efectos principales y dar cierta idea respecto de las interacciones
de dos factores. No es necesario correr el diseo 2 ;^ el cual requerira 32 corridas. La tabla XII(j) del
apndice indica que este diseo permitira la estimacin de los siete efectos principales y que 15 de las 21
interacciones de dos factores tambin podran estimarse de manera nica. (Recuerde que las interaccio
nes de tres factores y de rdenes superiores son insignificantes ) sta es ms de la informacin necesaria
acerca de las interacciones. El diseo completo se muestra en la tabla 8-15. Observe que se construy em
pezando con la corrida 16 del diseo 2* en A , B ,C y D como el diseo bsico y agregando despus las tres
columnas E = A BC, F = BCD y G = A CD . Los generadores son 1 = ABCE, I = BCDF e / = A C D G (tabla
8-14). La relacin de definicin completa e s / = ABCE = BCDF =A D E F = A C D G = BDEG = CEFG =
ABFG.

Anlisis de los diseos factoriales fraccionados


Hay varios programas de computadora que pueden usarse para analizar el diseo factorial fraccionado
2*^. Por ejemplo, el programa Design-Expert ilustrado en el captulo 6 tiene esta capacidad.
El diseo tambin puede analizarse recurriendo a los principios bsicos; el efecto '-simo se estima con
^ _ 2(Contraste,) _ Contraste,.
'~

( N/ 2 )

donde el Contraste, se encuentra utilizando los signos positivos y negativos de la columna i y donde
N = 2*^ es el nmero total de observaciones. El diseo 2*^ slo permite la estimacin de 2*^^- 1 efectos (y
sus alias).

Tabla 8-1 4

Diseos factoriales fraccionados 2*^ seleccionados

Nmero de
factores, k
3
4
5

Fraccin
2 3 -1
24*1

*IV
2 5-1

*v
^ra

2 5 -2

2 -1

V I
,6 -2

6 -3

2 7-1

*VII
2 7 -2

2 7 -3

64
32
16

28-2

64

8 -3

32

8 -4

16

/ j9 - 2

V I
t

9 -3

IV

2 9 -4

^IV

2 9 -5

^III

328

IV

10

32
16

2?--i
^in

iv

Nmero de
corridas
4
8
16
8

o io -a
V

128
64

32

16

128

Generadores
del diseo
C = AB
D = ^C
= ABCD
D = /lS
= AC
F = ABCDE
E=^ABC
F = BCD
D = AB
= AC
F = BC
G = ABCDEF
F = A B C D
G = ABDE
E=ABC
F = BCD
G=ACD
D = AB
E=AC
F = BC
G = ABC
G^ABCD
H = ABEF
ABC
G = ABD
H = BCDE
E = BCD
F = ACD
G = ABC
H = ABD
H = ACDFG
J = BCEFG
G = ABCD
H = ACEF
J = CDEF
F = BCDE
G = ACDE
H = ABDE
/ = ABCE
= ABC
F = BCD
G = ACD
H = ABD
J = ABCD
H = ABCG
J = ACDE
K = ACDF

Tabla 8 -1 4

(continuacin)

Nmero de
factores, k

11

Fraccin_____

2-

Nmero de
Generadores
corridas_______ del diseo
64
G = BCDF
H = ACDF
J = ABDE
K = +ABCE
32
F = ABCD
G = ABCE
H = ABDE
J = ACDE
K = BCDE
16
E = ABC
F = BCD
G = ACD
/ / = ABD
J = ABCD
K = AB
64

32

2-"

16

12

2 -

16

13

2'-

16

G=CD E
H = ABCD
J = ABF
K = BDEF
L = ADEF
F = ABC
G = BCD
H = CDE
J = ACD
K = ADE
L = BDE
= ABC
F = BCD
G = ACD
H = ABD
J = ABCD
K = A B
L = AC
E=ABC
F = +ABD
G = ACD
H = BCD
J = ABCD
K = AB
L = AC
M = AD
E = ABC
F = ABD
G = ACD
H = BCD
J = ABCD
K = AB
329

330

CAPTULO 8

DISEOS FACTORIALES FRACCIONADOS DE DOS NIVELES

Tabla 8-1 4

(continuacin)

Nmero de
factores, k

Fraccin

Nmero de
corridas

Generadores
del diseo
L = A C
M = A D

BC
114-10

14

-^III

16

E=ABC
F = ABD
G = A C D

H = BCD
J = ABCD
K = AB
L = A C
M = A D

715-11

15

^111

16

N = BC
0 = BD
E=ABC
F = ABD
G = A C D

H = BCD
1 = ABCD
K = AB
L = AC
A D

N = BC
0 = BD
P = C D

Tabla 8-15

Un diseo factorial fraccionado 2,\, ^


Diseo bsico

Corrida
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

--

- -

+
+

_
+
+
+
+

- -

+
+

+
+
+
-

--

+
-

+
+

+
+
+
+

E =ABC

F = BCD

G =ACD

+
-h
+
-

+
+
+
+

+
+

--

+
+
+
+
+
+
+
+

+
+

+
+
-

+
+

+
_

8 4 EL DISEO FACTORIAL FRACCIONADO 2*^ GENERAL

331

Proyeccin del diseo factorial fraccionado 2^*'


El diseo 2*"^ se reduce a un factorial completo o bien a un factorial fraccionado en cualquier subconjunto
d e r < k - p de los factores originales. Esos subconjuntos de factores que producen diseos factoriales
fraccionados son subconjuntos que aparecen como palabras en la relacin de denicin completa. Esto
resulta de particular utilidad en los experimentos de tamizado cuando se sospecha desde el principio del
experimento que la mayora de los factores originales tendrn efectos pequeos. El diseo factorial frac
cionado 2*"' puede proyectarse entonces en un factorial completo, por ejemplo, en los factores de mayor
inters. Las conclusiones a que se llegue con diseos de este tipo debern considerarse tentativas y some
terse a anlisis adicional. Por lo general es posible encontrar explicaciones alternativas de los datos que
intervienen en interacciones de rdenes superiores.
Como un ejemplo, considere el diseo 2^^ del ejemplo 8-5. Se trata de un diseo con 16 corridas en
el que intervienen siete factores. Se proyectar en un factorial completo en cuatro cualesquiera de los sie
te factores originales que no sean una palabra de la relacin de definicin. Hay 35 subconjuntos de cuatro
factores, siete de los cuales aparecen en la relacin de definicin completa (ver la tabla 8-15). Por lo tanto,
hay 28 subconjuntos de cuatro factores que formaran diseos 2*. Una combinacin que es obvia al ins
peccionar la tabla 8-15 es A, B, C y D.
Para ilustrar apropiadamente la utilidad de esta proyeccin, suponga que se realiza un experimento
para mejorar la eficiencia de un molino de bolas y los siete factores son los siguientes:
1.
2.
3.
4.
5.
6.
7.

Velocidad del motor


Muesca
Modo de alimentacin
Tkmao de la alimentacin
Tipo de material
ngulo de la criba
Nivel de vibracin de la criba

Se tiene una certeza razonable de que la velocidad del motor, el tamao de la alimentacin y el tipo de
material afectarn la eficiencia y que adems estos factores pueden interactuar. Se sabe menos del papel
de los otros tres factores, pero es probable que sean insignificantes. Una estrategia razonable sera asig
nar la velocidad del motor, el modo de alimentacin, el tamao de la alimentacin y el tipo de material a
las columnas/l, B ,C y D , respectivamente, de la tabla 8-15. La muesca, el ngulo de la criba y el nivel de
vibracin de la criba se asignaran a las columnas E, F y G, respectivamente. Si se est en lo correcto y las
variables menores E ,F y G son insignificantes, quedar un diseo 2* completo en las variables clave del
proceso.
Separacin en bloques de diseos factoriales fraccionados
Ocasionalmente, un diseo factorial fraccionado requiere tantas corridas que no es posible realizarlas to
das bajo condiciones homogneas. En estas situaciones, los diseos factoriales fraccionados pueden con
fundirse o mezclarse en bloques. La tabla XII del apndice contiene los arreglos recomendados para la
separacin en bloques de varios de los diseos factoriales fraccionados de la tabla 8-14. El tamao mni
mo de los bloques para estos diseos es de ocho corridas.
Para ilustrar el procedimiento general, considere el diseo factorial fraccionado 2^^ con la relacin
de definicin / = ABCE = BCDF = ADEF que se muestra en la tabla 8-10. Este diseo fraccionado con
tiene 16 combinaciones de tratamientos. Suponga que quiere correrse este diseo en dos bloques con
ocho combinaciones de tratamientos cada uno. Al seleccionar una interaccin para confundirla con los
bloques, se observa por el examen de la estructura de los alias de la tabla X ll(f) del apndice que hay dos

332
Bloque 1

CAPTULO 8

DISEOS FACTORIALES FRACCIONADOS DE DOS NIVELES

Bloque 2

Figura 8-18
El diseo
en dos bloques con A B D con
fundida.

series de alias que incluyen nicamente interacciones de tres factores. La tabla sugiere seleccionar
(y sus alias) para confundirla con los bloques. Se obtendran as los dos bloques que se muestran en la fi
gura 8-18. Observe que el bloque principal contiene las combinaciones de tratamientos que tienen un n
mero igual de letras en comn con ABD. Son tambin las combinaciones de tratamientos para las que
L =
+ X2 +
= a (mod 2).

E;|EMPL0 .........................................................................................................................................................
Se usa una mquina CNC de cinco ejes para maquinar un propulsor utilizado en un motor de turbina. Los
perfiles de los labes son una caracterstica importante de la calidad. Especficamente, es de inters la
desviacin del perfil del labe del perfil especificado en el plano de ingeniera. Se corre un experimento
para determinar cules son los parmetros de la mquina que afectan la desviacin del perfil. Los ocho
factores seleccionados en el diseo son los siguientes:

Factor
A = desviacin en el eje:c (0.001 pulg)
B desviacin en el eje_y (0.001 pulg)
C = desviacin en el eje z (0.001 pulg)
D fabricante de la herramienta
E = desviacin del eje a (0.001 grados)
F = velocidad del aremetro (%)
G = altura de la plantilla sujetadora (0.001 pulg)
H = velocidad de alimentacin (%)

Nivel bajo (-)


0
0
0
1
0
90
0
90

Nivel alto ( + )
15
15
15
2
30
110
15
110

Se selecciona un labe de prueba en cada pieza para inspeccionarlo. La desviacin del perfil se mMe utili
zando una mquina de medicin coordenada, y la desviacin estndar de la diferencia entre el perfil real y
el perfil especificado se usa como la variable de respuesta.
La mquina tiene cuatro aremetros. Puesto que puede haber diferencias en los aremetros, los in
genieros del proceso piensan que stos debern tratarse como bloques.
Los ingenieros se sienten confiados de que las interacciones de tres o ms factores no son muy impor
tantes, pero estn renuentes a ignorar las interacciones de dos factores. Por la tabla 8-14, inicialmente dos

8-4 EL DISEO FACTORIAL FRACCIONADO 2*^ GENERAL

333

diseos parecen ser apropiados: el diseo 2 ^ con 16 corridas y el diseo 2^^ con 32 corridas. La tabla
XII(I) del apndice indica que si se usa el diseo con 16 corridas, habr un nmero considerable de alias
con interacciones de dos factores. Adems, este diseo no puede correrse en cuatro bloques sin confundir
cuatro interacciones de dos factores con los bloques. Por lo tanto, los experimentadores deciden usar el
diseo 2^^ en cuatro bloques. En este diseo se confunden con los bloques una cadena de alias de in
teracciones de tres factores y una interaccin de dos factores (EH) y sus alias de interacciones de tres fac
tores. La interaccin E H es la interaccin entre la desviacin del eje a y la velocidad de alimentacin, y los
ingenieros consideran que una interaccin entre estas dos variables es altamente improbable.
La tabla 8-16 contiene el diseo y las respuestas resultantes en trminos de desviacin estitdar x 10^
pulg. Puesto que la variable de respuesta es una desviacin estndar, con frecuencia es mejor efectuar el
anlisis despus de una transformacin logartmica. En la tabla 8-17 se muestran las estimaciones de los
efectos. La figura 8-19 es una grfica de probabilidad normal de las estimaciones de los efectos, utilizando
In (desviacin estndar x 10^) como la variable de respuesta. Los nicos efectos grandes sonj4 = desvia
cin del eje;c, B = desviacin del ejey, y la cadena de alias que incluye A D + BG. Ahora bien,j4J es la in-

Tabla 8-16

El diseo 2 en cuatro bloques del ejemplo 8-6

Diseo bsico
Corrida A B C W E
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32

+
+

_
_
_
_

+
+

+
+
-1+

+
+

+
+

+
+
+
+

- +

+
+

_
-

_
_
_
_

+
+
+
+
+
+
+
+

+
+
+
+

_
_

+
+
+
+

+
+
+
+
+
+
+
+

+

+

+
+

+
+

+
+

_
_
_
_

+
+
+
+
+
+
+
+
+
+
+
+
+
+
+

F=ABC G=ABD

_
+
+
+

_
+
+

+
+

H = BCDE
+
+

+
+

+
+

+
+

+
+
+
+

+
+

+
+

+
+

+
+

+
+

+
+
+
+

+
+

+
-1-

Orden real Desviacin estndar


(X 10^ pulg)
Bloque de las corridas
18
2.76
3
2
16
6.18
4
29
2.43
4
4.01
1
1
6
2.48
4
26
5.91
2
14
2.39
3
22
3.35
4.40
1
8
32
4.10
4
15
3.22
2
3
19
3.78
3
24
5.32
2
11
3.87
4
27
3.03
1
3
2.95
2
10
2.64
21
5.50
3
1
7
2.24
4
28
4.28
4
30
2.57
5.37
1
2
3
17
2.11
2
13
4.18
4
3.96
25
1
1
3.27
3
23
3.41
2
12
4.30
2
9
4.44
3
20
3.65
1
5
4.41
4
31
3.40

334

CAPTULO 8

Tabla 8-17

DISEOS FACTORIALES FRACCIONADOS DE DOS NIVELES

Estimaciones de los efectos, coeficientes de regresin y sumas de cuadrados del ejemplo 8-6

Variable
A
B
C
D
E
F
G
H
Variable"
Promedio global
A
B
C
D
E
F
G
H
AB + CF +D O
AC + BF
AD + BG
AE
AF + BC
AG + BD
AH
BE
BH
CD + FG
CE
CG+DF
CH
DE
DH
EF
EG
EH
FH
GH
ABE
ABH
ACD

Nombre
Desviacin del ejex
Desviacin del eje y
Desviacin del ejez
Fabricante de la herramienta
Desviacin del eje a
Velocidad del aremetro
Altura de la plantilla sujetadora
Velocidad de alimentacin
Coeficiente de regresin
1.28007
0.14513
-0.10027
-0.01288
0.05407
-2.531E-04
-0.01936
0.05804
0.00708
-0.00294
-0.03103
-0.18706
0.00402
-0.02251
0.02644
-0.02521
0.04925
0.00654
0.01726
0.01991
-0.00733
0.03040
0.00854
0.00784
-0.00904
-0.02685
-0.01767
-0.01404
0.00245
0.01665
-0.00631
-0.02717

"Slo los efectos principales y las interacciones de dos factores.

Nivel-1
0
0
0
1
0
90
0
90
Efecto estimado
0.29026
-0.20054
-0.02576
0.10813
-5.063E-04
-0.03871
0.11608
0.01417
-0.00588
-0.06206
-0.37412
0.00804
-0.04502
0.05288
-0.05042
0.09851
0.01309
0,03452
0.03982
-0.01467
0.06080
0.01708
0.01569
-0.01808
-0.05371
-0.03534
-0.02808
0.00489
0.03331
-0.01261
-0.05433

Nivel+1
15
15
15
2
30
110
15
110
Suma de cuadrados
0.674020
0.321729
0.005310
0.093540
2.050E-06
0.011988
0.107799
0.001606
2.767E-04
0.030815
1.119705
5.170E-04
0.016214
0.022370
0.020339
0.077627
0.001371
0.009535
0.012685
0.001721
0.029568
0.002334
0.001969
0.002616
0.023078
0.009993
0.006308
1.914E-04
0,008874
0.001273
0.023617

8-4 EL DISEO FACTORIAL FRACCIONADO 2 ^ GENERAL

335

a,"

Estimaciones de los efectos

Figura 8-19 Grca de probabilidad normal de las estimaciones de los efectos


del ejemplo 8-6.

teraccin desviacin del eje jc-fabricante de la herramienta, y BG es la interaccin desviacin del eje
y-altura de la plantilla sujetadora, y como estas dos interacciones son alias es imposible separarlas con
base en los datos del experimento en curso. Puesto que ambas interacciones incluyen un efecto principal
grande, tambin es difcil aplicar cualquier simplificacin lgica obvia en esta situacin. Si se contara
con algn conocimiento de ingeniera o del proceso que arrojara luz sobre la situacin, entonces quiz po
dra hacerse una eleccin entre las dos interacciones; en caso contrario, se necesitarn ms datos para se
parar estos dos efectos (el problema de agregar corridas en un diseo factorial fraccionado para separar
los alias de las interacciones, se estudia en la seccin 8-5 y en el material suplementario de este captulo).
Suponga que el conocimiento del proceso sugiere que posiblemente la interaccin apropiada stdiAD.
La tabla 8-18 es el anlisis de varianza resultante para el modelo con los factores^, B, D yA D (el factor D
se incluy para preservar el principio de jerarqua). Observe que el efecto del bloque es pequeo, lo cual
sugiere que los aremetros de la mquina no son muy diferentes.
La figura 8-20 es una grfica de probabilidad normal de los residuales de este experimento. Esta gr
fica sugiere la presencia de colas ligeramente ms gruesas que las normales, por lo que posiblemente deTabla 8-18

Anlisis de varianza del ejemplo 8-6

Fuente de variacin
A
B
D
AD
Bloques
Error
Tbtal

Suma de
cuadrados
0.6740
0.3217
0.0935
1.1197
0.0201
0.4099
2.6389

Grados de
libertad
1
1
1
1
3
24
31

Cuadrado
medio
0.6740
0.3217
0.0935
1.1197
0.0067
0.0171

Fo
39.42
18.81
5.47
65.48

Valor/
<0.0001
0.0002
0.0280
<0.0001

336

CAPTULOS

DISEOS FACTORIALES FRACCIONADOS DE DOS NIVELES

99

95
90
80
70

t
50 '

I
30
20

10
5

Residuales

Figura 8-20

Grfica de probabilidad normal de los residuales del ejemplo 8-6.

1.826

0.75
Alta

Baja
Desviacin del eje x (A)

Figuro 8-21

Grfica de la interaccin A D para el ejemplo 8-6.

8-5 DISEOS DE RESOLUCIN m


1.247

337

1.273

Figura 8-22 El diseo


del ejemplo 8-6 proyectado en cuatro
rplicas de un diseo 2^ en los factores A, B y D.

ban considerarse otras transformaciones. La grfica de la interaccin


se presenta en la figura 8-21.
Observe que el fabricante de la herramienta (D) y la magnitud de la desviacin del eje jc (A) tienen un im
pacto profundo en la variabilidad, del perfil del labe, de las especificaciones de diseo. Correry4 en el ni
vel bajo (O desviacin) y comprar las herramientas al fabricante 1 produce los mejores resultados. En la
figura 8-22 se muestra la proyeccin de este diseo 2 ^^ en cuatro rplicas de un diseo 2^en los factores
A , B y D . h a mejor combinacin de las condiciones de operacin es^4 en el nivel bajo (O desviacin), B en
el nivel alto (0.015 en desviacin) y > en el nivel bajo (fabricante de herramientas 1).

8-5

DISEO S DE RESOLUCIN III

Como se seal anteriormente, el uso secuencial de los diseos factoriales fraccionados es muy til, lle
vando con frecuencia a una gran economa y eficiencia de la experimentacin. Se ilustran ahora estas
ideas utilizando la clase de los diseos de resolucin IIL
Es posible construir diseos de resolucin III para investigar hasta/; = A ^-1 factores en sloiVcorri
das, donde N es un mltiplo de 4. Con frecuencia estos diseos son tiles en la experimentacin indus
trial. Los diseos en los que N es una potencia de 2 pueden construirse con los mtodos presentados
anteriormente en este captulo, y stos se presentan primero. D e particular importancia son los diseos
que requieren 4 corridas para hasta 3 factores, 8 corridas para hasta 7 factores y 16 corridas para hasta 15
factores. Si fc = TV - 1, se dice que el diseo factorial fraccionado est saturado.
Un diseo para analizar hasta tres factores en cuatro corridas es el diseo 2n7', el cual se present en
la seccin 8-2. Otro diseo factorial fraccionado saturado muy til es el diseo para estudiar siete factores
en ocho corridas, es decir, el diseo 2j'. Este diseo es una fraccin un dieciseisavo del diseo 2. Puede
construirse apuntando primero los niveles positivos y negativos de un diseo 2^ completo en j4, 5 y C
como el diseo bsico, y asociando despus los niveles de cuatro factores adicionales con las interacciones
de los tres factores originales de la siguiente manera: D = AB, E = A C , F = B C y G = ABC. Por lo tanto,
los generadores de este diseo son I = ABD, I = ACE, I = BCF e / = ABCG. El diseo se muestra en la ta
bla 8-19.

338
Tabla 8-19

CAPTULO 8

DISEOS FACTORIALES FRACCIONADOS DE DOS NIVELES

El diseo 2 Jq con los generadores I = ABD, I = ACE, J = BCF e I = ABCG


D iseo bsico

Corrida

1
2
3
4
5

E=AC

+
+
+
+

F = BC

+
+

6
7

D =AB

G=ABC
def

+
+

+
+

+
+
+
+

+
+

afg

beg
abd
cdg

ace
bcf
abcdefg

La relacin de definicin completa de este diseo se obtiene multiplicando entre s los cuatro generadoresyl5A ACE, BCF y A B C G de dos en dos, de tres en tres y los cuatro a la vez, de donde se obtiene
/ = ABD = A C E = BCF = ABCG = BCDE = A CD F = CDG
= A B E F = B E G = A F G = D E F = A D E G = CEFG= BDFG= ABCDEFG
Para encontrar los alias de cualquier efecto, simplemente se multiplica el efecto por cada palabra de la re
lacin de definicin. Por ejemplo, los alias de B son
B = A D = A BC E = C F = A C G = CDE= ABCDF= BCDG= A E F = EG
= A B F G = BDEF = A B D E G = BCEFG= D F G = ACDEFG
Este diseo es una fraccin un dieciseisavo, y como los signos elegidos para los generadores son posi
tivos, se trata de la fraccin principal. Es tambin de resolucin III porque el nmero menor de letras de
cualquier palabra de la definicin de contraste es tres. Cualquiera de los 16 diferentes diseos
de esta
familia podra construirse utilizando los generadores con 1 de los 16 arreglos posibles de los signos en
I = ABD, I = ACE, I = BCF, I = ABCG.
Los siete grados de libertad de este diseo pueden usarse para estimar los siete efectos principales.
Cada uno de estos efectos tiene 15 alias; sin embargo, si se supone que las interacciones de tres o ms fac
tores son insignificantes, se consigue entonces una simplificacin considerable en la estructura de los alias.
Estableciendo este supuesto, cada una de las combinaciones lineales asociadas con los siete efectos
principales de este diseo es en realidad una estimacin del efecto principal y las tres interacciones de dos
factores:
t ,^ A + B D + C E + F G
tg ^ B + A D + C F + E G
t

-*C + A E + B F + D G

D + A B + C G + EF

(8-1)

-* E + A C + B G + DF
(. p -* F + B C + A G + DE
(. Q

G+CD+BE+AF

Estos alias se encuentran en la tabla X ll(h ) del apndice, ignorando las interacciones de tres factores y de
rdenes superiores.

8-5 DISEOS DE RESOLUCIN III

339

El diseo saturado 2 '^ de la tabla 8-19 puede usarse para obtener diseos de resolucin III para es
tudiar menos de siete factores en ocho corridas. Por ejemplo, para generar un diseo para seis factores en
ocho corridas, simplemente se ehmina cualquiera de las columnas de la tabla 8-19, digamos la G. Se obtie
ne as el diseo que se muestra en la tabla 8-20,
Es sencillo verificar que este diseo es tambin de resolucin III; de hecho es un diseo
^, o una
fraccin un octavo, del diseo 2, La relacin de definicin del diseo 2^^ ^ es igual a la relacin de defini
cin del diseo 2^^* original, con las palabras que incluyen la letra G eliminadas. Por lo tanto, la relacin
de definicin del nuevo diseo es
I = ABD = A CE = BCF = BCDE = ACDF = ABEF = DEF
En general, cuando se eliminan d factores para producir un nuevo diseo, la nueva relacin de definicin
se obtiene de las palabras de la relacin de definicin original que no contienen ninguna de las letras eli
minadas. Cuando se construyen diseos con este mtodo, deber prestarse atencin para obtener el me
jor arreglo posible. Si se ehminan las columnas B ,D , F y G de la tabla 8-19, se obtiene un diseo para tres
factores en ocho corridas, no obstante que las combinaciones de tratamientos corresponden a dos rpli
cas de un diseo 2^. Probablemente el experimentador preferira correr un diseo 2^ completo en ^ , C y E .
Ikmbin es posible obtener un diseo de resolucin III para estudiar hasta 15 factores en 16 corridas.
Este diseo 2i saturado puede generarse apuntando primero las 16 combinaciones de tratamientos
asociadas con un diseo 2' e n ^ ,5 , C y De, igualando despus 11 nuevos factores con las interacciones de
dos, tres y cuatro factores de los cuatro factores originales. En este diseo, cada uno de los 15 efectos prin
cipales es alias de siete interacciones de dos factores. Puede usarse un procedimiento similar para el dise
o 2^'^, lo cual permite el estudio de hasta 31 factores en 32 corridas.

Ensamblaje secuencial de fracciones para separar efectos


Mediante la combinacin de diseos factoriales fraccionados en los que se han intercambiado ciertos sig
nos, es posible aislar de manera sistemtica los efectos de inters potencial. A este tipo de experimento
secuencial se le llama doblez o plegado (fod over) del diseo original. La estructura de los alias de cual
quier fraccin con los signos de uno o ms de los factores invertidos se obtiene haciendo el cambio de sig
no apropiado en los factores de la estructura de los ahas de la fraccin original.

i
Corrida
1
2
3
4
5
6
7
8

Diseo bsico
A
B
C

D ^AB
+

E =AC
-1-

+
+

+
+

-1-

-H

+
+

-1+

F = BC
+
+
-

-H

-H
-1-

def

be
abd
cd
ace
bcf
abcdef

340

CAPTULO 8

DISEOS FACTORIALES FRACCIONADOS DE DOS NIVELES

Considere el diseo
de la tabla 8-19. Suponga que junto con esta fraccin principal se corre tam
bin un segundo diseo fraccionado con los signos invertidos en la columna del factor D. Es decir, la co
lumna de D de la segunda fraccin es
- + + -I-I
Los efectos que pueden estimarse a partir de la primera fraccin se muestran en la ecuacin 8-1, y a partir
de la segunda fraccin se obtiene
i'^ ^ A -B D + C E + F G
'b ^ B - A D + C F + E G
'c ^ C + A E + B F - D G
es decir,

t , ^ D -A B -C G -E F
-^ -D + A B + C G + E F
i'g ^ E + A C + B G - D F
^ F + B C + A G -D E
'^ ^ G -C D + B E + A F

suponiendo que no son significativas las interacciones de tres factores y de rdenes superiores. Ahora
bien, a partir de las dos combinaciones lineales de los efectos j( + \) y ^( - ') se obtiene
i
A
B
C
D
E
F
G

De
A + C E + FG
B + CF + EG
C+AE+BF
D
E+AC+BG
F+BC+AG
G + BE+AF

BD
AD
DG
AB + CG +EF
DF
DE
CD

Por lo tanto, se ha aislado el efecto principal de ) y todas sus interacciones de dos factores. En gene
ral, si a un diseo fraccionado de resolucin III o mayor se le agrega una fraccin adicional con los signos
de un joZo/flcror invertidos, entonces el diseo combinado producir las estimaciones del efecto principal
de ese factor y sus interacciones de dos factores.
Suponga ahora que a un diseo fraccionado de resolucin III se le agrega una segunda fraccin en la
que los signos de todos los factores estn invertidos. Este tipo de doblez (llamado en ocasiones doblez com
pleto o reflexin) rompe los vnculos de alias entre los efectos principales y las interacciones de dos facto
res. Es decir, puede usarse el diseo combinado para estimar todos los efectos principales quitados de
todas las interacciones de dos factores. En el siguiente ejemplo se ilustra la tcnica,

E JE M P L O S -?.................................................................................................................................................
Un analista de desempeo humano conduce un experimento para estudiar el tiempo de enfoque del ojo y
ha construido un aparato en el que pueden controlarse varios factores durante la prueba. Los factores
que considera importantes inicialmente son la agudeza o claridad visual (A), la distancia del objetivo al
ojo (5), la forma del objetivo (C), el nivel de iluminacin (D), el tamao del objetivo ( ), la densidad del
objetivo {F) y el sujeto (G). Se consideran dos niveles de cada factor. El analista sospecha que slo algu
nos de estos siete factores son de importancia principal y que pueden omitirse las interacciones de rde-

8-5 DISEOS DE RESOLUCIN III


Diseo

Tabla 8^21

341

para el experimento del tiempo de enfoque del ojo

D iseo bsico

Corrida
1
2

3
4
5

E =AC
+

B
+

G =ABC

+
+

+
+

+
+
-

-H

6
7

F = BC

+
+

+
+

-1-

Tiempo
def
ak
beg
abd
cdg
ace
bcf
abcdefg

85.5
75.1
93.2
145.4
83.7
77.6
95.0
141.8

nes superiores entre los factores. Con base en este supuesto, el analista decide correr un experimento de
tamizado para identificar los factores ms importantes para despus enfocar el estudio en los mismos.
Para explorar estos siete factores, el experimentador corre las combinaciones de tratamientos del diseo
2 ^5^ de la tabla 8-19 de manera aleatoria, obteniendo los tiempos de enfoque en milisegundos, como se
muestra en la tabla 8-21.
A partir de estos datos pueden estimarse siete efectos principales y sus alias. Por la ecuacin 8-1 se
observa que los efectos y sus alias son
^ =

20.6 ^ A + B D + C E + F G

b=

3 S .3 8 - * B + A D + C F + E G

c = -0 .2 8 ^ C + A E + B F + D G
e^=

28.8S ^ D + A B + C G + E F

= -0 .2 8 - * E + A C + B G + D F
-0 .6 Z ^ F + B C + A G + D E
, = - Z 4 3 ^ G + C D + B E + AF
Por ejemplo.

= i(-85.5-(-75,l- 9a2+145.4- 83,7-1-77.6- 95.0-1-141.8)= 20.63


Los tres efectos ms grandes son
ig y ). La interpretacin ms simple de los datos es que los efectos
principales d e ^ , B y D son todos significativos. Sin embargo, esta interpretacin no es nica, ya que otra
conclusin lgica seraque/l,jB y la interaccin AB, o q u i z y la interaccin BD, o tal vezj4,D y la in
teraccin A D son los verdaderos efectos.
Observe queABD es una palabra en la relacin de definicin de este diseo. Por lo tanto, este diseo
2^^^no se proyecta en un factorial 2^ enABD; en cambio, se proyecta en dos rplicas de un diseo 2^~\
como se ilustra en la figura 8-23. Puesto que el diseo 2^' es de resolucin 111,^4 ser alias de BD, B ser
alias de AD y D ser alias &AB, por lo que no es posible separar las interacciones de los efectos principa
les. En este caso, quiz el analista haya tenido mala suerte. Si hubiera asignado el nivel de iluminacin a C
en lugar de aD , el diseo se habra proyectado en un diseo 2^completo, y la interpretacin podra haber
sido ms sencilla.
Para separar los efectos principales y las interacciones de dos factores, se corre una segunda fraccin
con todos los signos invertidos. Este doblez del diseo se muestra en la tabla 8-22, junto con las respuestas
observadas. Note que cuando se hace el doblez de un diseo de resolucin III de esta manera, de hecho se

342

CAPITULO 8 DISEOS FACTORIALES FRACCIONADOS DE DOS NIVELES

A
Figura 8-23 El diseo 2^* proyectado en
dos rplicas de un diseo 2 ^ ' 6 n A ,B y D .

cambian los signos de los generadores que tienen un nmero impar de letras. Los efectos estimados por
esta fraccin son
'^ = - 17.68 - * A - B D - C E - FG
e'g=

37.73 ^ B - A D - C F - E G

i'c= - 3 .3 3 ^ C - A E - B F ~ D G
l ^ =

29M ^ D - A B - C G - E F

l '^ =

Q .5 3 -^ E -A C -B G -D F
1.63 ^ F - B C - A G - D E

'q =

2.68- * G ~ C D - b e - A F

Al combinar esta segunda fraccin con la original se obtienen las siguientes estimaciones de los efectos:
i

De i

A
B
C
D
E
F

A =

1.48
B = 38.05
C =: -1.80
D =: 29.38
E = 0.13
F =
0.50
G =: 0.13

Tabla 8-22

U n doblez del diseo 2

BD + CE + F G = 19.15
+ CF + E G = 0.33
+ BF + D G ^ 1.53
+ C G + E F ^ -0.50
+ B G + D F = -0.40
BC + A G + DE =-1.53
CD + B E + A F = -2.55

AD
AE
AB
AC

^ en el experim ento del tiem po de enfoque del ojo

Diseo bsico
Corrida
1
2
3
4
5
6
7
8

D = -A B

E = -A C

+
-

+
+
-

+
+

+
+

+
-

+
+
-

+
+
-

+
+
+
+
-

F = -B C
+
+
+
+
-

G =ABC
+
-

+
+
+
-

abcg
bcde
acdf
cefg
abef
bdfy

adeg
(1)

Tiempo
91.3
136.7
82.4
73.4
94.1
143.8
8 7 .3
7 1 .9

8'5 DISEOS DE RESOLUCIN III

343

Los dos efectos ms grandes son B y D . Adems, el tercer efecto ms grande es BD + CE + FG, por lo
que parece razonable atribuir esto a la interaccin BD. El analista us los dos factores, distancia (B) y ni
vel de iluminacin (D), en experimentos subsecuentes con los dems factores^, C , E y F e n ajustes estn
dar, y verific los resultados obtenidos aqu. Decidi usar los sujetos como bloques en estos nuevos
experimentos en lugar de ignorar el efecto potencial del sujeto debido a que fue necesario utilizar varios
sujetos diferentes para completar el experimento.

La relacin de definicin para un diseo de doblez


La combinacin de diseos factoriales fraccionados por medio de un doblez, como la que se hizo en el
ejemplo 8-7, es una tcnica muy til. Con frecuencia es de inters conocer la relacin de definicin del di
seo combinado. Puede determinarse con facilidad. Cada fraccin separada tendr L + U palabras usa
das como generadores: L palabras con el mismo signo y U palabras con signos diferentes. En el diseo
combinado se usarnL + U - 1 palabras como generadores. stas sern lasL palabras con el mismo signo
y las 7 - 1 palabras que constan de productos pares independientes de las palabras que tienen signos dife
rentes. (Los productos pares son las palabras tomadas de dos en dos, de cuatro en cuatro, etctera.)
Para ilustrar este procedimiento, considere el diseo del ejemplo 8-7. Para la primera fraccin, los ge
neradores son
I=A B D ,

I=A C E ,

I=B C F

I=A B C G

y para la segunda fraccin son


I = -A B D ,

I = ~ACE,

I = -B C F

I=A B C G

Observe que en la segunda fraccin se han intercambiado los signos de los generadores con un nmero
impar de letras. Asimismo, observe que L-I-7=1- I-3 = 4.E1 diseo combinado tendr/ = A B C G (la pa
labra con el mismo signo) como generador y dos palabras que son productos pares independientes de las
palabras con signos diferentes. Por ejemplo, tm eseI = ABD e l = ACE; entoncesI = (ABD){ACE) =
BCDE es un generador del diseo combinado. Asimismo, tmese I = A B D e / = BCF\ entonces
/ = {ABD){BCF) = A CD F es un generador del diseo combinado. La relacin de definicin completa
para el diseo combinado es
I = A B C G = BCDE = ACDF = A D E G = BDFG = ABEF = CEFG
Diseos de Plackett'Burman
Estos diseos, atribuidos a Plackett y Burraan, son diseos factoriales fraccionados de dos niveles para es
tudiar k = N ~ \ variables en N corridas, donde N es un mltiplo de 4. Si ATes una potencia de 2, estos dise
os son idnticos a los que se presentaron anteriormente en esta seccin. Sin embargo, para N = 12,20,
24,28 y 36, los diseos de Plackett-Burman en ocasiones son de inters. Puesto que estos diseos no pue
den representarse como cubos, en ocasiones se les llama diseos no geomtricos.
En la mitad superior de la tabla 8-23 se presentan los renglones de signos positivos y negativos que se
usan para construir los diseos de Plackett-Burman para = 12,20,24 y 36, mientras que en la mitad in
ferior de la tabla se presentan los bloques de signos positivos y negativos para construir el diseilo para iV =
28. Los diseos para N = 12, 20, 24 y 36 se obtienen escribiendo el rengln apropiado de la tabla 8-23
como una columna (o rengln). Entonces se genera una segunda columna (o rengln) a partir de la pri
mera moviendo los elementos de la columna (o rengln) hacia abajo (o hacia la derecha) una posicin y
colocando el ltimo elemento en la primera posicin. Una tercera columna (o rengln) se produce a par
tir de la segunda de manera similar, y el proceso se contina hasta que se genera la columna (o rengln) k.

344

CAPTULOS

DISEOS FACTORIALES FRACCIONADOS DE DOS NIVELES

Tabla 8-23 Signos positivos y negativos para los diseos de Plackett-Burman


k = l , N = 12 + + - + + + ------ + A: =19, = 20 + + - - + + + + - + - + -------- + + ^ =23, N = 24 + + + + + - + - + + - - + + - - + - + -------k ^ 35, N = 3 6 - + - + + + -------- + + + + + - + + + - - + ----------- + - + - + + - - + -

fc=27,AT = 28
+ - + + + + ------ -------------------------- + ------- + +
+ + - + + + ------ ------------------------- + + - - + - - + + + + + ------ -------------------------+ -------+ + ------ + - + + + +
+ - + ------- +
------ + + - + + +
+ --------- + +
-------- + + + + +
- + - + ------- + + + + ------ + - +
+ --+ -+ + + + ------ + + + + --------- +
+ + + -------- + +
- + +~+~^

+ + -+ -+ + -+
-+ ++ + -+ + +-+-+ + -+ +
+ -+++-+-+
++ --+ +++ -+ ++-+ -++
+ -++-+ +++ + -+ + --+ +
_++_+++_+

Despus se agrega un rengln de signos negativos, completndose as el diseo. Para AT= 28, los tres blo
ques X, Y y Z se, apuntan en el orden
X Y Z
Z X Y
Y Z X
y se agrega un rengln de signos negativos a estos 27 renglones. El diseo para TV = 12 corridas y fc = 11
factores se muestra en la tabla 8-24.
Los diseos no geomtricos de Plackett-Burman paraiV = 12,20,24,28 y 36 tienen estructuras de los
alias muy intrincadas. Por ejemplo, en el diseo de 12 corridas, todos los efectos principales son alias par
dales de cada una de las interacciones de dos factores en los que no estn incluidos. Por ejemplo, la in
teraccin A B es alias de los nueve efectos principales C, D,
K. Adems, cada uno de los efectos
principales son alias parciales de 45 interacciones de dos factores. En diseos ms grandes, la situacin es
todava ms compleja. Se recomienda al experimentador usar estos diseos con mucho cuidado.

Tabla 8-24 Diseo de Plackett-Burman para N = 12, fc = 11


Corrida
A
B
C
D
E

1
+
+
+
+
+
2
3
+
+
+
4
+
+
+
5
+
+
+
+
6
+
+
+
+
+
+
+
7
+
+
+
8
+
+
9
+
+
10
+
11
12
-

F
-

H
+
+

/
+
+
+

+
+

+
+
+
+
-

+
+
-

+
+
+

+
+

+
+
+
-

G
+

+
+
+
-

+
+
+

K
+
-

+
+
+
-

8-5 DISEOS DE RESOLUCIN III

345

o) Proyeccin en tres factores

6) Proyeccin en cuatro factores

Figura 8-24 Proyeccin del diseo de Plackett-Burman de 12 corridas


en diseos de tres y cuatro factores.

Las propiedades proyectivas de los diseos no geomtricos de Plackett-Burman no son avasalladora


mente atractivas. Por ejemplo, considere el diseo de 12 corridas de la tabla 8-24. Este diseo se proyecta
r en tres rplicas de un diseo 2^ completo en dos cualesquiera de los 11 factores originales. Sin embargo,
en tres factores, el diseo proyectado es un diseo 2^completo ms un factorial fraccionado 2
(ver la fi
gura 8-24fl). Por lo tanto, el diseo de Plackett-Burman de resolucin III tiene proyectividad 3, lo cual sig
nifica que se plegar en un diseo factorial completo en cualquier subconjunto de tres factores. El diseo
2^^ slo tiene proyectividad 2. Las proyecciones de cuatro dimensiones se muestran en la figura 8-24fe.
Observe que estas proyecciones de tres y cuatro factores no son diseos balanceados.

BJEMPLO 8 - 8 .................................................................................................................................................
Se ilustrarn algunas de las dificultades potenciales asociadas con los diseos de Plackett-Burman utili
zando el diseo de 11 variables con 12 corridas y un conjunto de datos simulados. Se supondr que el pro
ceso tiene tres efectos principales significativos (A, B, D ) y dos interacciones significativas de dos factores
(AB y A D ). El modelo es
V= 200-I-&i:i -hIOaj -I-12x ^

+ 9 a:iA:4 -i-e

donde cada;t es una variable codificada definida en el intervalo -1 , -1-1 y e es un trmino NID(0, 9) del
error aleatorio. Por lo tanto, tres de los A: = 11 factores son grandes, y hay dos interacciones grandes; la si
tuacin no est fuera de razn.
En la tabla 8-25 se presenta el diseo de Plackett-Burman con 12 corridas y las respuestas simuladas.
Este diseo luce diferente al diseo de 12 corridas de la tabla 8-24 porque se construy utilizando el ren-

346

CAPTULO 8

Tabla 8-25

DISEOS FACTORIALES FRACCIONADOS DE DOS NIVELES

Diseo de Plackett-Burman para el ejemplo 8-8

Corrida

1
2

3
4
5

B
+
+

+
+
+

+
+

+
+
+
+

+
+
+
+

8
9

10
11

+
+
+
+

+
+
+

+
+
+
+
+

Respuesta

+
+
+
+

+
+
+
+

+
+

+
+

+
+

+
+
+
+
+

+
+
+

+
+
+

+
+

+
+

12

231
207
230
217
175
176
183
185
181

220
229
168

gln de signos para /r = 11, = 12 de la tabla 8-23 como rengln. En la tabla 8-26 se muestran las estima
ciones de los efectos. Observe que hay siete efectos grandes:^, B, C, D, E, J y K ( y , dpsde luego, sus alias).
No es evidente de inmediato que algunos de estos efectos podran ser interacciones. Parte de esta ambi
gedad podra resolverse haciendo el doblez del diseo. Con esto por lo general se resolvern los efectos
principales, pero con frecuencia sigue dejando al experimentador con la incertidumbre acerca de los efec
tos de las interacciones.

La dificultad para interpretar un diseo de Plackett-Burman, ilustrada en el ejemplo anterior, ocurre


con mucha frecuencia en la prctica. Si la eleccin est entre un diseo geomtrico 2ii" con 16 corridas o
un diseo de Plackett-Burman con 12 corridas que quiz tenga que doblarse (para lo cual se requeriran
24 corridas), el diseo geomtrico puede resultar una mejor eleccin. Para mayores detalles ver Montgomery, Borror y Stanley [81]. Bajo ciertas condiciones, los alias de un diseo no geomtrico de Plac-

Tabla 8-26

Estimaciones de los efectos, coeficientes de regresin y sumas de cuadrados del ejemplo 8-8

Variable"
Promedio global
A
B
C
D
E
F
G
H
J
K
L

Coeciente de regresin
200.167
6.333
6.667
6.833
17.000
6.833
0.500
-1.167
1.500
-6.333
-5.833
-0.167

Efecto estimado

Suma de cuadrados

12.667
13.333
12.667
34.000
13.667
1.000
-7 333
3.000
-12.667
-11.667
-0.333

481.333
533.333
560.333
3468.000
560.333
3.000
16.333
27.000
481.333
408.333
0.333

Tbdos los efectos principales son alias parciales de 45 interacciones de dos factores.

8-6 DISEOS DE RESOLUCIN IV Y V

347

kett-Burman pueden desenredarse utilizando tcnicas de construccin de modelos de regresin. Esto se


analiza en Hamada y Wu [53].

8-6

DISEO S DE RESOLUCION IV Y V

Un diseo factorial fraccionado 2*"' es de resolucin IV si los efectos principales estn separados de las
interacciones de dos factores y algunas interacciones de dos factores son alias entre s. Por lo tanto, si se
suprimen las interacciones de tres factores y de rdenes superiores, los efectos principales pueden esti
marse directamente en un diseo 2i^. Un ejemplo es el diseo 2^^ de la tabla 8-10. Adems, las dos
fracciones combinadas del diseo
del ejemplo 8-7 producen un diseo
Cualquier diseo 2 ^ ' debe incluir al menos 2k corridas. A los diseos de resolucin IV que contie
nen exactamente 2k corridas se les llama diseos mnimos. Los diseos de resolucin IV pueden obte
nerse a partir de diseos de resolucin III por el proceso de doblado. Recuerde que para hacer el doblez
de un diseo
, simplemente se agrega a la fraccin original una segunda fraccin con todos los sig
nos invertidos. Entonces los signos positivos en la columna identidad I de la primera fraccin podran
intercambiarse en la segunda fraccin, y el factor (k + l)-sim o podra asociarse con esta columna. El
resultado es un diseo factorial fraccionado 2^^'"^. El proceso se muestra en la tabla 8-27 para el diseo
2 ^ \ Es sencillo verificar que el diseo resultante es un diseo 2j^ con la relacin de definicin
I = ABCD.
lkmbin es posible hacer el doblez de diseos de resolucin IV para separar las interacciones de dos
factores que son alias entre s. Montgomeiy y Runger [83c] hacen notar que un experimentador puede te
ner varios objetivos al hacer el doblez de un diseo de resolucin IV, como 1) romper tantas cadenas de
alias de interacciones de dos factores como sea posible, 2) romper las interacciones de dos factores en una
cadena de alias especfica, o 3) romper las interacciones de dos factores que incluyen un factor especfico.
Una manera de hacer el doblez de un diseo de resolucin IV es corriendo una segunda fraccin en la que
se invierte el signo de todos los generadores del diseo que tienen un nmero impar de letras. Para ilus
trar, considere el diseo 2^;;^ usado en el experimento del moldeo por inyeccin del ejemplo 8-4. Los ge
neradores del diseo de la tabla 8-10 son I = ABC E e / = BCDF, La segunda fraccin usara los

Tabla 8-27

Diseo 2 ^ ' obtenido por doblez_______

I___________A____________ B_____________C
Diseo
orginal con J = ABC
+
+
+
+
+
+
+
+
+
+
Segundo diseo 2^' con los signos intercambiados
+
+
+
+
+
+

348

CAPTULO 8 DISEOS FACTORIALES FRACCIONADOS DE DOS NIVELES

generadores I = -ABCE e / = -BCDF, y el generador nico para el diseo combinado sera / = ADEF.
Por lo tanto, el diseo combinado sigue siendo un diseo factorial fraccionado de resolucin IV. Sin em
bargo, las relaciones de los alias sern mucho ms sencillas que en el diseo 2%^ original. D e hecho, las
nicas interacciones de dos factores que tendrn alias sonAD = EF, A E = DF y A F = DE. Todas las de
ms interacciones de dos factores pueden estimarse a partir del diseo combinado.
Como otro ejemplo, considere el diseo 2^^ con 32 corridas. La tabla 8-14 indica que el mejor con
junto de generadores para este diseo e s / = ABCF, I = ABD G e l = BCDEH. En la tab laX ll(m ) del
apndice se muestran los alias para este diseo. Observe que hay seis pares de interacciones de dos facto
res y un grupo de tres interacciones de dos factores que son alias. Si se hace el doblez de este diseo, la se
gunda fraccin tendra los generadores I = -ABCF, I = -A B D G e / = BCDEH. El diseo combinado tiene
los generadores I = CDFG e / = BCDEH, y la relacin de definicin completa es

1 = CDFG= BCDEH = BEFGH

El diseo combinado es de resolucin IV, pero las nicas interacciones de dos factores que siguen tenien
do alias son CD = FG, CF = D G y CG = DF. Se trata de una simplificacin considerable de los ahas de la
fraccin original.
Observe que cuando se empieza con un diseo de resolucin III, el procedimiento de doblez garanti
za que el diseo combinado ser de resolucin IV, con lo cual se asegura que todos los efectos principales
pueden separarse de sus alias en interacciones de dos factores. Cuando se hace el doblez de un diseo de
resolucin IV, no necesariamente se separarn todas las interacciones de dos factores. D e hecho, si la
fraccin original tiene una estructura de los alias con ms de dos interacciones de dos factores en cual
quier cadena de alias, el doblez no separar completamente todas las interacciones de dos factores.
Ambos ejemplos anteriores, el 2;^ y el 2*^ ^, tienen al menos una de tales cadenas de alias de interaccio
nes de dos factores. Montgomery y Runger [83c] dan una tabla de diseos hechos doblez recomendados
para fracciones de resolucin IV con 6 ^
< 10 factores.
Los diseos de resolucin V son factoriales fraccionados en los que los efectos principales y las in
teracciones de dos factores no tienen como ahas otros efectos principales u otras interacciones de dos fac
tores. Estos diseos son muy poderosos, permitiendo la estimacin nica de todos los efectos principales
y las interacciones de dos factores, siempre que todas las interacciones de tres factores y de rdenes supe
riores sean insignificantes. La palabra ms pequea de la relacin de definicin de tal diseo debe tener
cinco letras. El diseo 2^"^con la relacin de definicin / - A B C D E es de resolucin V. Otro ejemplo es el
diseo 2
con las relaciones de definicin I = A B C D G e 7 = ABEFH. Ejemplos adicionales de estos di
seos se presentan en Box y Hunter [17c].
Debido a que los diseos estndar de resolucin V son diseos grandes cuando el nmero de factores
es moderadamente grande, existe cierto inters prctico en los diseos factoriales fraccionados irregula
res de resolucin V. Se cuenta con diseos tiles para 4 < k < 9 factores. El diseo de 24 corridas para
k = 5 factores se muestra en la tabla 8-28, Puesto que se trata de un diseo de resolucin V, es posible esti
mar los cinco efectos principales y las 10 interacciones de dos factores, suponiendo que las interacciones
de tres factores y rdenes superiores son insignificantes. El diseo para k = 4 factores tiene 12 corridas y
se comenta en el problema 8-22. Para = 6,7 y 8, estos diseos tienen 48 corridas, y el diseo de nueve
factores tiene 96 corridas. El paquete de software Design-Expert contiene todos estos diseos.
Por ltimo, cabe sealar que un doblez completo de un diseo de resolucin IV o V suele ser innece
sario. En general, slo hay una o dos (o muy pocas) interacciones con alias que son de inters potencial.
Los ahas de estas interacciones pueden por lo general separarse agregando un nmero pequeo de corr-

8-7 RESUMEN

349

Tabla 8-28 La fraccin irregular de


resolucin V para cinco factores
en 24 corridas
A
~~B
C
D
E
_

+
-

+
+

+
+
+
+

+
+
+

+
+
+

+
+
+
+
+

+
+
+
+

+
+
+

+
+
+

+
+
+
+
+
+

+
+
+
+
+
+
+
+
+
+
+
+

+
+

+
+
+

+
-

das a la fraccin original. Esta tcnica se denomina en ocasiones doblez parcial. Para formarse una idea
de cmo se hace esto, referirse al ejemplo 10-5 y al material suplementario del texto de este captulo.

8-7

RESUMEN

En este captulo se introdujo el diseo factorial fraccionado 2*"'. Se ha hecho hincapi en el uso de estos
diseos en experimentos de tamizado para identificar de manera rpida y ecaz el subconjunto de facto
res que estn activos, as como para proporcionar cierta informacin sobre las interacciones. La propie
dad de proyeccin de estos diseos hace posible en muchos casos examinar los factores activos con mayor
detalle. El ensamblaje secuencial de estos diseos por medio de un doblez es una manera muy eficaz de
obtener informacin adicional acerca de las interacciones que pueden identificarse como de posible im
portancia en un experimento inicial.
En la prctica, los diseos factoriales fraccionados 2*^ con = 4 , 8 , 1 6 y 32 corridas son muy tiles.
En la tabla 8-29 se resumen estos diseos, identificando cuntos factores pueden usarse con cada diseo
para obtener diferentes tipos de experimentos de tamizado. Por ejemplo, el diseo de 16 corridas es un
factorial completo para 4 factores, una fraccin un medio para 5 factores, una fraccin de resolucin IV
para 6 u 8 factores y una fraccin de resolucin III para 9 a 15 factores. Tbdos estos diseos pueden cons
truirse utilizando los mtodos explicados en este captulo, y muchas de sus estructuras de los alias se
muestran en la tabla XII del apndice.

350

CAPTULO 8

DISEOS FACTORIALES FRACCIONADOS DE DOS NIVELES

Tabla 8-29

Diseos factoriales y factoriales fraccionados tiles del


sistema 2H>. Los nmeros en las celdas son el nmero
de factores del experimento
Nmero de corridas

8-8
8-1.

8-2.
8-3.
8-4.

8-5.

8-6.

PROBLEMAS

Tipo de diseo

16

32

Factorial completo
Fraccin un medio
Fraccin de resolucin IV
Fraccin de resolucin III

2
3

3
4
4
5-7

4
5
6-8
9-15

5
6
7-16
17-31

-------------- --------------------------------------------------------------------------------------

Suponga que en el experimento del desarrollo del proceso qumico descrito en el problema 6-7 slo pudo co
rrerse una fraccin un medio del diseo 2^. Construir el diseo y llevar a cabo el anlisis estadstico utilizando
los datos de la rplica I.
Suponga que en el problema 6-15 slo pudo correrse una fraccin un medio del diseo 2"^. Construir el diseo
y llevar a cabo el anlisis utilizando los datos de la rplica I.
Considere el experimento del grabado con plasma del problema 6-18. Suponga que slo pudo correrse una
fraccin un medio del diseo. Establecer el diseo y analizar los datos.
En el problema 6-21 se describe el estudio para mejorar un proceso durante la manufactura de un circuito in
tegrado. Suponga que slo pudieron hacerse ocho corridas de este proceso. Establecer un diseo 2-^ apro
piado y encontrar la estructura de los alias. Utilizar las observaciones apropiadas del problema 6-21 como las
observaciones de este diseo y estimar los efectos de los factores. Qu conclusiones pueden sacarse?
Continuacin del problema 8-4. Suponga que ha hecho las ocho corridas del diseo 2^-^ del problema 8-4.
Qu corridas adicionales se necesitaran para identificar los efectos de los factores que son de inters?
Cules son las relaciones de los alias en el diseo combinado?
R.D. Snee (Experimentacin con un nmero grande de variables, en Experiments in Industry: Design,
Anafysis and Interpretation ofResults, de R.D. Snee, L.B. Har y J.B. Ti-out, editores, ASQC) describe un ex
perimento en el que se us un diseo
con I = AB CD E para investigar los efectos de cinco factores sobre
el color de un producto qumico. Los factores son.4 = solvente/reactivo, B = catalizador/reactivo, C = tem
peratura, D = pureza del reactivo y E = pH del reactivo. Los resultados obtenidos fueron los siguientes:
e = -0 .6 3
a=

2.51

b = -2 .6 8

8-7.

bde = 3.45

abe =

1.66

abd = 5.68

c=

2.06

cde = S 2 1

ace =

1.22

acd = 4.38

bce = -2 .0 9

bcd = 4.30

1.93

abcde = 4.05

abe =
a)
b)

d = 6.79
ade = 5.47

Construir una grfica de probabilidad normal de los efectos. Qu efectos parecen estar activos?
Calcular los residuales. Construir una grfica de probabilidad normal de los residuales y graficar los resi
duales contra los valores ajustados. Comentar las grficas.
c) Si algunos de los factores son insignificantes, plegar el diseo 2-* a un diseo factorial completo en los
factores activos. Comentar el diseo resultante e interpretar los resultados.
En un artculo de J.J. Pignatiello, Jr. y J.S. Ramberg deU oum al ofQuality Technology (vol. 17, pp. 198-206) se
describe el uso de un diseo factorial fraccionado con rplicas para investigar el efecto de cinco factores so
bre la altura libre de los resortes de hojas utilizados en una aplicacin automotriz. Los factores son^4 = tem-

8-8 PROBLEMAS

351

peratura del homo, B = tiempo de calentamiento, C = tiempo de transferencia, D = tiempo de retencin y


E = temperatura del aceite de templado. Los datos se presentan a continuacin:
D

B
+
+

+
+

+
+

+
+

+
+
+
+

+
+

+
+

f
+

+
+
+
+
+

+
+

8- 8 .

7.78
8.15
7.50
7.59
7.54
7.69
7.56
7.56
7.50
7.88
7.50
7.63
7.32
7.56
7.18
7.81

+
+

+
+

Altura libre
7.78
8.18
7.56
7.56
8.00
8.09
7.52
7.81
7.25
7.88
7.56
7.75
7.44
7.69
7.18
7.50

7.81
7.88
7.50
7.75
7.88
8.06
7.44
7.69
7,12
7.44
7.50
7.56
7.44
7.62
7.25
7.59

Escribir la estructura de los alias de este diseo. Qu resolucin tiene este diseo?
Analizar
los datos. Qu factores influyen en la altura libre promedio?
b)
Calcular
el
rango y la desviacin estndar de la altura libre para cada corrida. Hay algn indicio de que
c)
cualquiera de estos factores afecta la variabilidad de la altura lbre?
d) Analizar los residuales de este experimento y comentar los resultados.
) Este diseo es el mejor posible para cinco factores en 16 corridas? Especficamente, es posible encon
trar un diseo fraccionado para cinco factores en 16 corridas con una resolucin ms alta que la de este
diseo?
En un artculo de Industrial and Engineering Chemistfy (Informacin adicional acerca de la planeacin de
experimentos para aumentar la eficiencia de la investigacin) se utiliza un diseo 2*-*para investigar el efec
to de^4 = temperatura de condensacin, B = cantidad del material 1, C = volumen del solvente, D = tiempo
de condensacin y E = cantidad del material 2 sobre el rendimiento, Ixjs resultados obtenidos son los si
guientes:
e=23,2
ab =15.5
a)
b)
c)
d)

fld=16.9
be =16.2

cd = 23.8
ace =23.4

bde =16.8
abcde =18.1

Verificar que los generadores que se utilizaron en el diseo fueron / = ACE e / = BDE.
Apuntar la relacin de definicin completa y los alias de este diseo,
Estimar los efectos principales,
Elaborar la tabla del anlisis de varianza. Verificar que las interacciones.^^ yAD estn disponibles para
usarlas como error.
e) Graficar los residuales contra los valores ajustados. Construir tambin la grfica de probabilidad normal
de los residuales. Comentar los resultados.
8-9. Considere el experimento con el resorte de hojas del problema 8-7. Suponga que el factor (temperatura del
aceite de templado) es muy difcil de controlar durante la manufactura, Cul sera el ajuste de los factores
A, B, Cy > para reducir la variabihdad de la altura libre tanto como sea posible, independientemente de la
temperatura del aceite de templado usada?
8'10. Construirun diseo 2-^seleccionando dos interacciones de dos factores como los generadores independien
tes, Apuntar la estructura de los ahas completa de este diseo. Delinear la tabla del anlisis de varianza.
Cul es la resolucin de este diseo?

352

8-11.

8-12.
8-13.
8-14.
8-15.
8-16.
8-17.
8-18.
8-19.

8-20.

8-21.

8-22.

8-23.

CAPTULOS

DISEOS FACTORIALES FRACCIONADOS DE DOS NIVELES

Considere el diseo 2 del problema 6-21, Suponga que slo pudo correrse una fraccin un medio. Adems
se requirieron dos das para hacer las 16 observaciones, y fue necesario confundir el diseo
en dos blo
ques. Construir el diseo y analizar los datos.
Analizar los datos del problema 6-23 como s provinieran de un diseo 2jv' con I = ABCD. Proyectar el dise
o en un factorial completo en el subconjunto de los cuatro factores originales que parecen ser significativos.
Repetir el problema 8-12 utilizando I = -ABCD. El uso de la fraccin alterna modifica la interpretacin de
los datos?
Proyectar el diseo 2 del ejemplo 8-1 en dos rplicas de un diseo 2^ en los factores j4 y B. Analizar los da
tos y sacar conclusiones.
Construir un diseo 2^^- Determinar los efectos que pueden estimarse si se corre una segunda fraccin de
este diseo con todos los signos invertidos.
Considere el diseo 2^^ del problema 8-15. Determinar los efectos que pueden estimarse si se corre una se
gunda fraccin de este diseo con los signos del factor A invertidos.
Hacer el doblez del diseo 2^^ de la tabla 8-19 para producir un diseo de ocho factores. Verificar que el di
seo resultante sea 2^''. Se trata de un diseo mnimo?
Hacer el doblez de un diseo 2fj^ para producir un diseo de seis factores. Verificar que el diseo resultante
sea 2%^. Comparar este diseo con el diseo 2^^ de la tabla 8-10.
Un ingeniero industrial realiza un experimento utiUzando un modelo de simulacin Montecarlo de un siste
ma de inventario. Las variables independientes de su modelo son la cantidad del pedido (A), el punto de un
nuevo pedido (B), el costo de organizacin (C), el costo del refrendo de pedidos (D) y la tarifa de transporta
cin (E). La variable de respuesta es el costo anual promedio. Para ahorrar tiempo de computadora, el inge
niero decide investigar estos factores utilizando un diseo 2^^ con I = ABD e / = BCE. Los resultados que
obtiene son de = 95, ae = 134, b = 158, abd = 190, cd = 92, ac = 187, bce = 155 y abcde 185.
a) Verificar que las combinaciones de tratamientos dadas sean correctas. Estimar los efectos suponiendo
que las interacciones de tres factores y de rdenes superiores son insignificantes.
b) Suponga que se agrega una segunda fraccin a la primera, por ejemplo, ade = 136, e = 93, ab = 187, bd =
153, acd = 139, c = 99, abce = 19ly bcde = 150. Cmo se obtuvo esta segunda fraccin? Incorporar es
tos datos a la fraccin original y estimar los efectos.
c) Suponga que se corri la fraccinate = 189, ce = 96, bcd = 154, acde = 135, abe = 193, bde - 152, ad =
137 y (1) = 98. Cmo se obtuvo esta fraccin? Incorporar estos datos en la fraccin original y estimar
los efectos.
Construir un diseo 25-i. Indicar cmo puede correrse el diseo en dos bloques de ocho observaciones cada
uno. Alguno de los efectos principales o de las interacciones de dos factores estn confundidos con los blo
ques?
Construir un diseo 2-^. Indicar cmo puede correrse el diseo en cuatro bloques de ocho observaciones
cada uno. Alguno de los efectos principales o de las interacciones de dos factores estn confundidos con los
bloques?
lecciones irregulares del diseo 2* (John [6Id]). Considere un diseo 2'^. Tienen que estimarse los cuatro efec
tos principales y las seis interacciones de dos factores, pero no puede correrse el factorial 2'*completo. El ta
mao del bloque ms grande posible contiene 2 corridas. Estas 12 corridas pueden obtenerse de las cuatro
rplicas un cuarto definidas por / = AB = ACD = BCD omitiendo la fraccin principal. Indicar cmo
pueden combinarse las tres fracciones 2"^^restantes para estimar los efectos requeridos, suponiendo que las
interacciones de tres factores y de rdenes superiores son insignificantes. Este diseo podra considerarse
como una fraccin fres cuartos.
Los nodos de carbono utilizados en un proceso de fundicin se fabrican en un horno anular. Se corre un ex
perimento en el horno para determinar cules son los factores que influyen en el peso del material de empa
que que se adhiere a los nodos despus de la coccin. Seis variables son de inters, cada una con dos niveles:
A = relacin paso/finos (0.45,0.55), 5 = tipo de material de empaque (1,2), C = temperatura del material de
empaque (ambiente, 325C), D = localizacin de la chimenea (adentro, afuera), E = temperatura del foso
(ambiente, 195C) y F = tiempo de retraso antes del empaque (cero, 24 horas). Se corre un diseo 2^^ y se

8-8 PROBLEMAS

8-24.

353

obtienen tres rplicas en cada uno de los puntos del diseo. El peso del material de empaque adherido a los
nodos se mide en gramos. Los datos en el orden de las corridas son los siguientes: abd = (984, 826, 936);
abcdef = (1275, 976,1457); be = (1217,1201, 890); af = (1474,1164,1541); def = (1320,1156, 913); cd =
(765,705,821); ace = (1338,1254,1294) y )c/= (1325,1299,1253). Se desea minimizar la cantidad de mate
rial de empaque adherido.
a) Verificar que las ocho corridas correspondan a un diseo 2%^. Cul es la estructura de los alias?
b) Usar el peso promedio como respuesta. Qu factores parecen tener influencia?
c) Usar el rango de los pesos como respuesta. Qu factores parecen tener influencia?
d) Qu recomendaciones podran hacerse a los ingenieros del proceso?
Se corri un experimento de 16 corridas en una planta de manufactura de semiconductores para estudiar los
efectos de seis factores sobre la curvatura o combadura de los dispositivos del sustrato producidos. Las seis
variables y sus niveles se presentan a continuacin;

Corrida
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

Ibmperatura de
laminacin
CQ
55
75
55
75
55
75
55
75
55
75
55
75
55
75
55
75

Tiempo de
laminacin
(s)
10
10
25
25
10
10
25
25
10
10
25
25
10
10
25
25

Presin de
laminacin
(tn)
5
5
5
5
10
10
10
10
5
5
5
5
10
10
10
10

Ifemperatura
de coccin
(C)
1580
1580
1580
1580
1580
1580
1580
1580
1620
1620
1620
1620
1620
1620
1620
1620

Duracin
del ciclo de
coccin
(h)
17.5
29
29
17.5
29
17.5
17.5
29
17.5
29
29
17.5
29
17.5
17.5
29

Punto de
roco de
la coccin
(C)
20
26
20
26
26
20
26
20
26
20
26
20
20
26
20
26

Se hicieron cuatro rplicas de cada corrida, y se hizo una medicin de la combadura del sustrato. Los datos se
presentan enseguida:

Corrida
1
2
3
4
5
6
7
8
9
10

Combadura por rplica (pulg/pulg)


1
2
3
4
0.0167
0.0128
0.0149
0.0185
0.0044
0.0062
0.0066
0.0020
0.0041
0.0043
0.0042
0.0050
0.0073
0.0081
0.0039
0.0030
0.0089
0.0047
0.0047
0.0040
0.0147
0.0296
0.0219
0.0258
0.0121
0.0090
0.0092
0.0086
0.0255
0.0250
0.0226
0.0169
0.0077
0.0069
0.0032
0.0023
0.0060
0.0045
0.0078
0.0158

Tbtal
(10^ pulg/pulg)
629
192
176
223
223
920
389
900
201
341

Media
(10-^ pulg/pulg)
157.25
48.00
44.00
55.75
55.75
230.00
97.25
225.00
50.25
85.25

Desviacin
estndar
24.418
20.976
4.083
25.025
22.410
63.639
16.029
39.42
26.725
50.341

CAPTULO 8 DISEOS FACTORIALES FRACCIONADOS DE DOS NIVELES

354

Combadura por rplica (pulg/pulg)


Corrida
11

12

13
14
15
16
a)
b)
c)
d)

0.0043
0.0186
0.0110

0.0065
0.0155
0.0093

0.0027
0.0137
0.0086
0.0109
0.0158
0.0124

0.0028
0.0158
0.0101

0.0126
0.0145
0.0110

0.0028
0.0159
0.0158
0.0071
0.0145
0.0133

Tbtal
(1(H pulg/pulg)
126
640
455
371
603
460

Media
(1(H pulg/pulg)
31.50
160.00
113.75
92.75
150.75
115.00

Desviacin.
estndar
7.681
20.083
31.12
29.51
6.75
17.45

Qu tipo de diseo utilizaron los experimentadores?


Cules son las relaciones de los alias en este diseo?
Alguna de las variables del proceso afecta la combadura promedio?
Alguna de las variables del proceso afecta la variabilidad de las mediciones de la combadura?

Tabla 8-30 Datos para el problema 8'25


_____________________________________ ________
Espesor del recubrimiento protector
A
B
C
D
E
F
Centro Der. Prom. Rango
Corrida Volumen Lote Tiempo, s Velocidad Aceleracin Cubierta Izq.
Sin
4531 4531 4515 4525.7 16
14
7350
5
5
Lote 2
1
36
Sin
4446 4464 4428 4446
6
7350
5
2
5
Lote 1
4452
4490
4452
4464.7
38
5
Sin
6
6650
Lote 1
3
3
4308
4317.3
20
Sin
4316
4328
14
7350
20
3
Lote 2
4
4295
4289
4297
18
Sin
4307
14
7350
5
3
Lote 1
5
4492
4495
4485.7
25
Sin
4470
6
6650
20
6
5
Lote 1
5
Con
4496 4502 4482 4493.3 20
6
7350
Lote 1
7
3
4542 4547 4538 4542.3
9
20
Sin
14
6650
8
5
Lote 2
4625.7
30
4621
4643
4613
5
Sin
14
6650
Lote 1
9
5
25
4653 4670 4645 4656
5
Con
14
6650
Lote 1
10
3
4478.7
16
4480
4486
4470
20
Con
14
6650
Lote 2
11
3
4223.7
16
4221
4233
4217
20
Sin
6
7350
12
3
Lote 1
4626.7
22
4620
4641
4619
5
Con
6
6650
Lote 1
13
5
25
4455 4480 4466 4467
20
Con
6
6650
Lote 1
14
3
4243
4262
45
Con
4255
4288
14
7350
20
5
Lote 2
15
4515.7
44
4490
4534
4523
5
Con
6
7350
Lote
2
16
5
4540
4535
37
Con
4514
4551
14
7350
5
3
Lote
2
17
4494
4503
4496
4497.7
9
Sin
14
6650
20
3
Lote
1
18
13
4293
4306
4302
4300.3
20
Sin
6
7350
Lote
2
5
19
4534 4545 4512 4530.3 33
5
Sin
Lote 2
6
7350
20
3
24
4460 4457 4436 4451
20
Con
Lote 1
14
6650
21
5
4650 4688 4656 4664.7 38
5
Con
Lote 2
6
6650
22
3
14
4231 4244 4230 4235
20
Sin
Lote 1
14
7350
23
5
4225 4228 4208 4220.3 20
20
Con
6
7350
24
3
Lote 2
Con
4381 4391 4376 4382.7 15
5
Lote 1
14
7350
25
5
Sin
4533 4521 4511 4521.7 22
20
Lote 2
6
6650
26
3
Con
4194 4230 4172 4198.7 58
14
7350
20
3
Lote 1
27
Sin
4666 4695 4672 4677.7 29
6
6650
5
5
Lote 2
28
Con
4180 4213 4197 4196.7 33
7350
20
5
Lote 1
6
29
4465 4496 4463 4474.7 33
20
Con
Lote 2
6
6650
30
5
Con
4653 4685 4665 4667.7 32
14
6650
5
5
Lote
2
31
Sin
4683 4712 4677 4690.7, 35
14
6650
5
3
Lote
2
32

8-8 PROBLEMAS

8-25.

355

e) Si es importante reducir la combadura tanto como sea posible, qu recomendaciones se haran?


Se usa un revestimiento por centrifugado para aplicar un recubrimiento fotoprotector en una oblea de silicio
natural. Esta operacin suele hacerse en las fases iniciales del proceso de fabricacin de semiconductores, y
el espesor promedio del recubrimiento protector y la variabilidad del espesor del mismo tienen un impacto
importante en los pasos subsecuentes de manufactura. Seis variables se usan en el experimento. Las varia
bles y sus niveles alto y bajo se presentan a continuacin:

Factor
Velocidad de centrifugado final
ndice de aceleracin
Volumen de recubrimiento protector aplicado
Tiempo del centrifugado
Variacin del lote del recubrimiento protector
Presin de descarga

Nivel bajo
7350 rpm
5
3 cc
14 s
Lote 1
Sin cubierta

Nivel alto
6650 rpm
20

5 cc
6s
Lote 2
Con cubierta

El experimentador decide usar un diseo


y hacer tres lecturas del espesor del recubrimiento protector en
cada oblea de prueba. Los datos se muestran en la tabla 8-30.
a) Verificar que se trata de un diseo 2^'. Discutir las relaciones de los alias de este diseo.
b) Qu factores parecen afectar el espesor promedio del recubrimiento protector?
c) Considerando que el volumen del recubrimiento protector aplicado tiene un efecto reducido sobre el es
pesor promedio, tiene esto alguna implicacin prctica importante para los ingenieros del proceso?
d) Proyectar este diseo en un diseo menor que incluya nicamente los factores significativos. Presentar
los resultados grficamente. Ayuda esto en la interpretacin?
e) Usar el rango del espesor del recubrimiento protector como variable de respuesta. Hay algn indicio de
que alguno de estos factores afecte la variabilidad del espesor del recubrimiento protector?
f) Dnde se recomendara que corrieran el proceso los ingenieros?
8-26, Harry y Judy Peterson-Nedry (dos amigos del autor) son propietarios de un viedo y una fbrica vim'cola en
Newberg, Oregon, Cultivan varias variedades de uvas y fabrican vino. Harry y Judy han usado diseos facto
riales para el desarrollo de procesos y productos en el segmento de fabricacin vincola de su negocio. Este
problema describe el experimento realizado para su Pinot Noir 1985. Originalmente se estudiaron ocho va
riables, las cuales se muestran en este experimento:

Variable
A = Clon de Pinot Noir
B Tipo de roble
C = Edad de la barrica
D = Levadura/contacto con la piel
E = Vapores
F = Tostado de las barricas
G = Racimos completos
H = Tbmperatura de fermentacin

Nivel bajo (-)


Pommard
Allier
Vieja
Champagne
Ninguno
Ligero
Ninguno
Baja (75F mx.)

Nivel alto ( - I - )
Wadenswil
Honris
Nueva
Montrachet
Tbdos
Medio
10%
Alta (92F mx.)

Harry y Judy decidieron usar un diseo 2^'* con 16 corridas. El vino fue catado por un panel de expertos el 8
de marzo de 1986. Cada experto calific las 16 muestras de vino catadas, siendo la calificacin 1 la mejor. El
diseo y los resultados del panel de catadores se muestra en la tabla 8-31.
a) Cules son las relaciones de los aUas en el diseo seleccionado por Harry y Judy?
b) Usar las calificaciones promedio (y) como variable de respuesta. Analizar los datos y sacar conclusiones.
Se encontrar til examinar una grfica de probabilidad normal de las estimaciones de los efectos.

pi-Hpf^' !ff^cSoqcaqoi3Nr^cS'OOT-H
ncnHTH^^-oc5r4cn^c^T-5TtT-H

co

v500' )(NOOO srNOoqoqvqTt<N\sC


1 l>^ aof^ONCv^uSiAMr^ooHoHo^H

pq r > c T \ i n c ^ o ^ < ^ ' t c ^ ^ o o ' ^ i o ^ ^ f r )


9Pt
s s
ex

O ' ! t ^ 0 N 0 0 ^ v ^ v ^ < r ) l > r S ^ ^csvJc<^

m T ^ o ^ - ^ /^'*o^o^r)T^oolocs^^o^cN

1
i z
fe
u
c ^ O ' t O N o o ' O ' O i o ^ r ^ t n c ^ c N ^ i n ^

i + + l

e;

I + + I + I

I+

I + + I + I

I + + I

1+

I + I + + I H - I

1+

I+ + I - I - I + I + I

1+1

-D
. ca x> tti
c

I I+ + + +I

I + + I

I I 1+

T3

O
s 1

I I I I I I I I +

+ + + + + +

I I I I+ + + +I

I I I+ + + +

oq

I I + + 1

I + + I

( + + I

1+

1 + I + I + I + I + I + I + I

ra
T3

356

8'8 PROBLEMAS

357

c) Usar la desviacin estndar de las calificaciones (o alguna transformacin apropiada tal como log s)
como variable de respuesta. Qu conclusiones pueden sacarse acerca de los efectos de las ocho varia
bles sobre la variabilidad de la calidad del vino?
d) Despus de mirar los resultados, Harry y Judy coincidieron en que uno de los miembros del panel
(DCM) saba ms de cerveza que de vino, por lo que decidieron eliminar su calificacin. Qu efecto
tendra esto en los resultados y las conclusiones de los incisos y e ?
e) Suponga que justo antes de empezar el experimento, Harry y Judy se enteraron de que las ocho nuevas
barricas que ordenaron de Francia para usarlas en el experimento no llegaran a tiempo, y que las 16 co
rridas tendran que hacerse con las barricas viejas. Si Harry y Judy simplemente eliminan la columna C
de su diseo, qu ocurre con las relaciones de los ahas? Es necesario que empiecen de nuevo y cons
truyan otro diseo?
f) Harry y Judy saben por experiencia que es improbable que algunas de las combinaciones de tratamientos
produzcan buenos resultados. Por ejemplo, la corrida con las ocho variables en el nivel alto generalmen
te resulta en un vino con una calificacin baja. Esto se confirm el 8 de marzo de 1986 en la prueba del
vino. Quieren establecer un nuevo diseo para su Pinot Noir 1986 utilizando estas mismas ocho varia
bles, pero no quieren correr el experimento con los ocho factores en el nivel alto. Qu diseo sugerira
el lector?
8-27. En un artculo de Quality Engineering (Una aplicacin de los diseos experimentales factoriales fracciona
dos, vol. 1, pp. 19-23) M.B. Kilgo describe un experimento para determinar el efecto de la presin del CQ^
(4), la temperatura del CQ^ (B), la humedad del cacahuate (C), la velocidad de flujo del CQj (>) y el tamao
de las partculas de cacahuate (E) sobre el rendimiento total del aceite por lote de cacahuates (y). Los niveles
que us para estos factores son los siguientes:

Nivel
codificado
-1
1

A,
presin
(bar)
415
550

B,
temperatura
(C)
25
95

c,
humedad
(% por peso)
5
15

E,
tamao de las
partculas (mm)
1.28
4.05

D,
flujo
(litros/min)
40
60

Kilgo realiz el experimento factorial fraccionado con 16 corridas que se muestra a continuacin.

A
415
550
415
550
415
550
415
550
415
550
415
550
415
550
415
550

B
25
25
95
95
25
25
95
95
25
25
95
95
25
25
95
95

C
5
5
5
5
15
15
15
15
5
5
5
5
15
15
15
15

D
40
40
40
40
40
40
40
40
60
60
60
60
60
60
60
60

E
1.28
4.05
4.05
1.28
4.05
1.28
1.28
4.05
4.05
1.28
1.28
4.05
1.28
4.05
4.05
1.28

y
63
21
36
99
24
66
71
54
23
74
80
33
63
21
44
96

358

8-28.

CAPTULOS

DISEOS FACTORIALES FRACCIONADOS DE DOS NIVELES

a) Qu tipo de diseo se ha utilizado? Identificar la relacin de definicin y las relaciones de los alias.
b) Estimar los efectos de los factores y usar una grfica de probabilidad normal para hacer la identificacin
tentativa de los factores importantes.
c) Efectuar el anlisis estadstico apropiado para probar las hiptesis de que los factores identificados en el
inciso b anterior tienen un efecto significativo sobre el rendimiento del aceite de cacahuate.
d) Ajustar un modelo que pueda usarse para predecir el rendimiento del aceite de cacahuate en trminos
de los factores que se han identificado como importantes.
e) Analizar los residuales de este experimento y comentar la adecuacin del modelo.
Los ingenieros de la planta Essex Aluminum de Ford Motor Company llevaron a cabo un experimento facto
rial fraccionado en 10 factores con 16 corridas para el vaciado en arena de tubos mltiples para motor, el cual
se describe en el artculo Estudio del proceso de vaciado evaporativo para mltiples de admisin de 3.0 li
tros Poor SandfiU, de D. Becknell (Fourth Symposium on Taguchi Methods, American Supplier Institute,
Dearborn, MI, pp. 120-130). El objetivo fue determinar cules de los 10 factores tienen un efecto sobre la
proporcin de vaciados defectuosos. El diseo y la proporcin resultante de vaciados no defectuosos p que
se observaron en cada corrida se presentan enseguida. Se trata de una fraccin de resolucin III con genera
dores E - CD, F = BD, G = BC, H =AC, J = AB y K = ABC. Suponga que el nmero de vaciados hechos en
cada corrida del diseo es 1000.

Corrida
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

A
+
+
+
+
+
+
+
+

B
-

+
+
+
+
+
+
-

-1-t-

C
D
- -H
-1+
+
+
-

-1-t-H
+

+
+
+
+

-1+

+
+
+
+

+
-H
-1-1-

-
+
+
+
+

*
-

-1-1-1+

G
+
-1-

-1-1-1-1+
+

H
J
+ +
-1+
-1+
+
-H

+
+
+
+

+
+
+
-

-H
-t-1
-1-

+
+
-

+
+

P
0.958
1.000
0.977
0.775
0.958
0.958
0.813
0.906
0.679
0.781
1.000
0.896
0.958
0.818
0.841

arcsen/^

0.955

1.357

1.364
1.571
1.419
1.077
1.364
1.364
1.124
1.259
0.969
1.081
1.571
1.241
1.364
1.130
1.161

Modificacin
deF&T
1.363
1.555
1.417
1.076
1.363
1.363
1.123
1.259
0.968
1.083
1.556
1.242
1.363
1.130
1.160
1.356

a) Encontrar la relacin de definicin y las relaciones de los alias de este diseo.


b) Estimar los efectos de los factores y usar una grfica de probabilidad normal para hacer la identificacin
tentativa de los factores importantes.
c) Ajustar el modelo apropiado utihzando los factores identificados en el inciso b anterior.
d) Graficar los residuales de este modelo contra la proporcin predicha de vaciados no defectuosos. Cons
truir tambin una grfica de probabilidad normal de los residuales. Comentar la adecuacin de estas gr
ficas.
e) El lector habr notado en el inciso d un indicio de que la varianza de la respuesta no es constante (consi
derando que la respuesta es una proporcin, esto debera haberse anticipado). La tabla anterior tambin
muestra una transformacin de p, arcsen de la raz cuadrada de p, que es de uso generalizado como
transformacin para estabilizar la varianza de los datos de la proporcin (referirse a la discusin de las
transformaciones para estabilizar la varianza del captulo 3). Repetir los incisos aald anteriores utilizan

8-8 PROBLEMAS

f)

do la respuesta transformada y comentar los resultados. Especficamente, son mejores ahora las grfi
cas de los residuales?
Hay una modificacin de la transformacin arcsen de la raz cuadrada, propuesta por Freeman y lkey
(Transformaciones relacionadas con ngulos y la raz cuadrada,
of Mathematical Statistics, vol.
21, pp. 607-611) que mejora su desempeo en las colas. La modcacin de F&T es:

[arcsen

8-29.

359

/( + ! ) + aicson^ (np - l- l) /( + l)] /2

Resolver de nuevo los incisos a al d utilizando esta transformacin y comentar los resultados. (Para una
interesante discusin y anlisis de este experimento, referirse a Anlisis de experimentos factoriales con
defectos o partes defectuosas como respuesta, de S. Bisgaard y H.T FuUer, Quality Engineering, vol. 7,
pp. 429-443.)
Un experimento factorial fraccionado en nueve factores y 16 corridas fue conducido por el departamento
Chrysler Motors Engineering y se describe en el artculo Mejoramiento del proceso compuesto de moldeo
de planchas, de P.I. Hsieh y D.E. Goodwin (Founh Symposium on Taguchi Methods, American Supplier
Institute, Dearbom, MI, pp. 13-21). El objetivo era reducir el nmero de defectos en el acabado de rejillas de
planchas moldeadas de recuadros abiertos. El diseo y el nmero resultante de defectos, c, observados en
cada corrida se muestran a continuacin. Se trata de una fraccin de resolucin III con generadores = BD,
F = BCD, G = A Q H = ACD y J = AB.

Modificacin
de F&T

Corrida

V?

56

7.48

7.52

17

4.12

4.18

-1-

+
-

-1-

1.41

1.57

+
-

+
+

-1-

2.00

2.12

+
-

-1-

1.73

1.87

2.00

2.12

+
-

-1-

+
-

-I-

50

7.07

7.12

-1-

-1-

1.41

1.57

9
10

+
+

+
+

-1-

1.00

1.21

-t-

-1-

0
3

0.00
1.73

0.50
1.87

-1-

+
+

-1-1-

3.46

3.54

-t-1-

+
+

12

-1-

+
+

1.73

1.87

-1-

4
0
0

2.00

2.12

0.00
0.00

0.50
0.50

3
4

11
12
13
14
15

16

-1+
-1-

+
-1-

+
+
+

-1+
-1-

a) Encontrar la relacin de definicin y las relaciones de los alias de este diseo.


b) Estimar los efectos de los factores y usar una grfica de probabilidad normal para hacer la identificacin
tentativa de los factores importantes.
c) Ajustar un modelo apropiado utilizando los factores identificados en el inciso b anterior.
d) Graficar los residuales de este modelo contra el nmero predicho de defectos. Asimismo, construir una
grfica de probabilidad normal de los residuales. Comentar la adecuacin de estas grficas.

360

CAPITULO 8 DISEOS FACTORIALES FRACCIONADOS DE DOS NIVELES

e) El lector habr notado en el inciso d un indicio de que la varianza de la respuesta no es constante (consi
derando que la respuesta es un conteo, esto debera haberse anticipado). La tabla anterior tambin in
cluye una transformacin de c, la raz cuadrada, que es una transformacin para estabilizar la varianza de
uso generalizado con datos de conteos (referirse a la exposicin de las transformaciones para estabilizar
la varianza del captulo 3). Repetir los incisos a al d utilizando la respuesta transformada y comentar los
resultados. Especficamente, han mejorado ahora las grficas de los residuales?
f) Hay una modificacin de la transformacin de la raz cuadrada, propuesta por Freeman y Tukey
(Transformaciones relacionadas con ngulos y raz cuadrada, j4nnaZ of Mathematical Statistics, vol.
21, pp. 607-611) que mejora su desempeo. La modificacin de F&T de la transformacin de la raz
cuadrada es:
[V^ + V( ^ ] / 2

8-30.

Resolver de nuevo los incisos a al d utilizando esta transformacin y comentar los resultados. (Para una
interesante discusin y anlisis de este experimento, referirse a AnUsis de experimentos factoriales con
defectos o partes defectuosas como respuesta, de S. Bisgaard y H.T Fuller, Quaty Engineering, vol. 7,
pp. 429-443.)
Se corre un experimento en una fbrica de semiconductores para investigar el efecto de seis factores sobre la
amplificacin del transistor. El diseo seleccionado es el
que se muestra a continuacin:

Orden
Orden de
estndar las corridas
1
2
2
8
5
3
4
9
5
3
6
14
7
11
8
10
15
9
10
13
11
1
12
6
12
13
14
4
15
7
16
16

a)
b)
c)
d)
8-31.

A
+
+

-1
-l-1-1+
+

B C D E F Amplificacin
1455
- - - + -1511
-1- - - + +
1487
+
1596
-t-
- -1- - -1- +
1430
- -1- - - +
1481
-1- -1- - - 1458
+ -1- - -H 1549
- - -1- - -11454

-f- -1- -11517


+
-1- . -1- 1487
+
1596
- -1- -1- -1- 1446

-1- -1- - 1473


+ + + - -11461
+ -t- -1- + +
1563

Usar una grfica normal de los efectos para identificar los factores significativos.
Conducir las pruebas estadsticas apropiadas para el modelo identificado en el inciso a.
Analizar los residuales y comentar los resultados.
Es posible encontrar un conjunto de condiciones de operacin que prodiKca una amplificacin de 1500
25?
El tratamiento trmico es de uso comn para carbonizar piezas metlicas, como engranes. El espesor de la
capa carbonizada es una variable de salida crtica de este proceso, y suele medirse realizando un anlisis de
carbono del paso del engrane (la cara superior del diente del engrane). Se estudiaron seis factores en un dise
o 2v^:^ = temperatura del horno, B = duracin del ciclo, C = concentracin de carbono, D = duracin del

8-8 PROBLEMAS

361

ciclo de carbonizacin, E - concentracin de carbono del ciclo difuso y f = duracin del ciclo difuso. El ex
perimento se presenta a continuacin:

Orden
estndar
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

Orden de
las corridas
5
7
8
2
10
12
16
1
6
9
14
13
11
3
15
4

- + - +
+ +
- -I_
- +
+*+
- + - +
+ +
- + - +
+ +

Paso
74
190
133
127
115
101
54
144
121
188
135
170
126
175
126
193

- - - - + - + +
- - +
+ - + +
+ - - +
+ - + ^ - 1- + - +
+ + +
- + + - + - + + + + + - + + - +
+ + + +

a) Estimar los efectos de los factores y representarlos en una grfica de probabilidad normal. Seleccionar
un modelo tentativo.
b) Efectuar las pruebas estadsticas apropiadas en el modelo.
c) Analizar los residuales y comentar la adecuacin del modelo.
d) Interpretar los resultados de este experimento. Suponer que es deseable un espesor de la capa de entre
140 y 160.
8-32. Se estudian cinco factores en el diseo factorial fraccionado irregular de resolucin V mostrado enseguida;

Orden Orden de
Indar las corridas
1
1
10
2
5
3
4
4
15
5
19
6
16
7
8
7
8
9
3
10
11
13
11
12
12
13
14
20
9
15

+
'+

-t-

+
+
+

+
+
+

+
+

+
+
+

+
+
+
+
+
+

+
+
+

+
+
+

y
16.33
18.43
27.07
16.95
14.58
19.12
18.96
23.56
29.15
15.74
20.73
21.52
15.58
21.03
26.78

362

CAPTULO 8

DISEOS FACTORIALES FRACCIONADOS DE DOS NIVELES

Orden Orden de
estndar las corridas
16
22
17
21
18
6
19
23
20
18
21
24
22
17
23
2
24
14

A
+
+
+
+
-

B
+
+
+
+
+

C
+
+
+
+
+
+

+
+
+
+
+
+

E
+
+
+
+
+
+
+
+
+

y
13.39
18.63
19.01
17.96
20.49
29.31
17.62
16.03
21.42

a) Analizar los datos de este experimento, Qu factores influyen en la respuesta y")


b) Analizar los residuales. Comentar la adecuacin del modelo.

Diseos factoriales y
factoriales fraccionados
con tres niveles y con
niveles mixtos

Las series con dos niveles de los diseos factoriales y factoriales fraccionados que se comentaron en los
captulos 6,7 y 8 son de uso generalizado en la investigacin y el desarrollo industrial. Hay algunas exten
siones y variantes de estos diseos que en ocasiones son tiles, como los diseos para los casos en que to
dos los factores estn presentes con tres niveles. Estos diseos 3* se analizan en este captulo. Se
consideran tambin los casos en que algunos de los factores tienen dos niveles y otros factores tienen ya
sea tres o cuatro niveles.

9-1
9-1.1

DISEO FACTORIAL 3^
Notacin y motivacin del diseo 3*

Se estudia ahora el diseo factorial 3*"; es decir, un arreglo factorial de k factores que tienen tres niveles
cada uno. Se usarn letras maysculas para denotar los factores y las interacciones. Se har referencia a
los tres niveles de los factores como bajo, intermedio y alto. Hay varias notaciones diferentes que se usan
para representar estos niveles de los factores; una posibilidad es representar los niveles de los factores
con los dgitos O (bajo), 1 (intermedio) y 2 (alto). Cada combinacin de tratamientos del diseo 3* se de
notar por k dgitos, donde el primer dgito indica el nivel del factor^, el segundo dgito indica el nivel del
factor 5,..., y el dgito fc-simo indica el nivel del factorC. Por ejemplo, en un diseo 3^, 00 dentala com
binacin de tratamientos correspondiente ^ A y B ambos en el nivel bajo, y 01 denota la combinacin de
tratamientos correspondiente a A en el nivel bajo y 5 en el nivel intermedio. En las figuras 9-1 y 9-2 se
muestra la representacin geomtrica de los diseos 3^y 3^, respectivamente, utilizando esta notacin.
Este sistema de notacin pudo haberse usado en los diseos 2* presentados anteriormente, utilizando
Oy 1 en lugar del 1 negativo y el 1 positivo, respectivamente. En el diseo 2* se prefiri la notacin 1 por
que facihta la vista geomtrica del diseo y porque puede aplicarse directamente al modelado de regre
sin, la separacin en bloques y la construccin de factoriales fraccionados.
En el sistema de los diseos 3*", cuando los factores son cuantitativos, es comn denotar los niveles
bajo, intermedio y alto con - 1 , 0 y -I-1, respectivamente. Con esto se facilita el ajuste de un modelo de re363

364

CAPTULO 9

DISEOS FACTORIALES Y FACTORIALES FRACCIONADOS CON TRES NIVELES

02

12

22

01

11

21

00

10

20

Factor A

Figura 9-1 Combinaciones de tratamientos en un


diseo 3==.

gresin que relaciona la respuesta con los niveles de los factores. Por ejemplo, considere el diseo 3^ de la
figura 9-1, y sea que jcj represente al factor^ y que jcz represente al factor 5 . U n modelo de regresin que
relaciona la respuesta y con
y X2 que se basa en este diseo es
(9-1)
Observe que la adicin de un tercer nivel de los factores permite que la relacin entre la respuesta y los
factores del diseo se modele como un modelo cuadrtico.
El diseo S'' es ciertamente una eleccin posible para un experimentador que se preocupa por la cur
vatura en la funcin de respuesta. Sin embargo, es necesario tomar en consideracin dos puntos:
1. El diseo 3*"no es la forma ms eficiente de modelar una relacin cuadrtica; los diseos de su
perficie de respuesta que se exponen en el captulo 11 son alternativas superiores.

Factor A

Figura 9-2 Combinaciones de tratamientos en un diseo 3^.

9-1 DISEO FACTORIAL SI

2.

365

El diseo 2* aumentado con los puntos centrales, como se analiz en el captulo 6, es una forma
excelente de obtener una indicacin de la curvatura. Permite conservar reducido el tamao y la
complejidad del diseo y al mismo tiempo permite obtener cierta proteccin contra la curvatura.
Entonces, si la curvatura es importante, el diseo de dos niveles puede aumentarse con corridas
axiales para obtener un diseo central compuesto, como se ilustra en la figura 6-36. Esta estrate
gia secuencial de experimentacin es ms eficiente, por mucho, que correr un diseo factorial 3*
con factores cuantitativos.

9 '1.2

El diseo 3^

El diseo ms simple del sistema 3^ es el diseo 3^, el cual tiene dos factores, cada uno con tres niveles. Las
combinaciones de tratamientos de este diseo se mostraron en la figura 9-1. Puesto que estn presentes
3^ = 9 combinaciones de tratamientos, hay ocho grados de libertad entre estas combinaciones de trata
mientos. Los efectos principales d e^ y B tienen dos grados de libertad cada uno, y la interaccinj45 tiene
cuatro grados de libertad. Si hay n rplicas, habr 3^ - 1 grados de libertad totales y 3^(n - 1 ) grados de li
bertad del error.
Las sumas de cuadrados de .,4, B y A B pueden calcularse mediante los mtodos usuales para los dise
os factoriales analizados en el captulo 5. Cada efecto principal puede representarse con un componente
lineal y uno cuadrtico, cada uno con un solo grado de libertad, como se observa en la ecuacin 9-L Desde
luego, esto slo tiene sentido si el factor es cuantitativo.
La particin de la interaccin de dos factores
puede hacerse de dos maneras. El primer mtodo
consiste en subdividir A S en los cuatro componentes con un solo grado de libertad que corresponden a
AB X
X
Xz.
XQpuede hacerse ajustando los t r m
i n o s ^niXiX2 y
^U22p^i^2 >respectivamente, como se indic en el ejemplo 5-5. Para los datos de la vida de la herramienta
de ese ejemplo se obtiene SS^bl
x q ~ 42.67,
= 2.67y
^^ = 8.00. Puesto que
se trata de una particin ortogonal de A S , observe que 5 5 ^ =
+
+
^
= 6L34.
El segundo mtodo se basa en los cuadrados latinos ortogonales. Considere los totales de las combi
naciones de los tratamientos para los datos del ejemplo 5-5. Estos totales se muestran en la figura 9-3
como los nmeros encerrados en crculos dentro de los cuadrados. Los dos factoresj4 y B corresponden a
los renglones y las columnas, respectivamente, de un cuadrado latino 3 x 3. En la figura 9-3 se muestran
dos cuadrados latinos 3 x 3 particulares, superpuestos en los totales de las celdas.
Estos dos cuadrados latinos son ortogonales; es decir, si uno de los cuadrados se superpone en el otro,
cada letra del primer cuadrado aparecer exactamente una vez con cada letra del segundo cuadrado. Los
totales de las letras en el cuadrado a son Q = 18, i = -2 y 5 = 8, y la suma de cuadrados entre estos totales

Factor B
1

0
0

ll

a)

Factor B
1

, .
. , ,
. ,
61

Figura 9-3 Ibtales de las combinaciones de los tratamientos del ejemplo 5-5
con dos cuadrados latinos superpuestos.

366

CAPTULO 9

DISEOS FACTORIALES Y FACTORL^ES FRACCIONADOS CON TRES NIVELES

es [18^ + ( - 2 f + 8^]/(3)(2) - [24V(9)(2)] = 33.34, con dos grados de libertad. D e manera similar, los tota
les de las letras en el cuadrado b son Q = 0,i? = 6 y 5 = 18,yla suma de cuadrados entre estos totales es [0^
+ 6^ + 18^]/(3)(2) - [247(9)(2)] = 28.00, con dos grados de libertad. Observe que la suma de estos dos
componentes es
33.34+ 28.00= 6 1 .3 4 - 5 5 ^
con 2 + 2 = 4 grados de libertad.
En general, a la suma de cuadrados calculada con el cuadrado a se le llama el componeiite.i4 de la interaccn, y a la suma de cuadrados calculada con el cuadrado b se le llama el co m p o n en tes^ de la inte
raccin. Cada uno de los componentes
y AB^ tiene dos grados de libertad. Se usa esta terminologa
porque si los niveles (0, 1, 2) de ^4 y se denotan por;Ci y^j, respectivamente, entonces se encuentra que
las letras ocupan celdas de acuerdo con el siguiente patrn:

Cuadrado a
<2:

Cuadrado b

+ JTj = O(mod 3)

Q\

+ 2 x ^ - 0 (mod 3)

R\x-^ + x ^ = l (m o d 3)

S\ x, + 2x^ = 1 (m o d 3)

S: x + x2 = 2 (mod 3)

R: x + 2x^ = 2 (mod 3)

Por ejemplo, en el cuadrado b se observa que la celda de en medio corresponde


= \ y x 2 = V, por lo
tanto, + 2x2 = 1 + (2)(1) = 3 = 0 (mod 3), y Q ocupara la celda de en medio. Cuando se consideran ex
presiones de la forma^^5, se establece la convencin de que el nico exponente permitido en la primera
letra es 1. Si el exponente de la primera letra no es 1, la expresin completa se eleva al cuadrado y los ex
ponentes se reducen al mdulo 3. Por ejemplo, A^B es lo mismo que AB^ porque
B = {A^ B f = A^

= AB^

Los c o m p o n e n t e s y A B ^ de la interaccinj45 no tienen significado real y por lo general no se in


cluyen en la tabla del anlisis de varianza. Sin embargo, esta particin en gran medida arbitraria de la
interaccinylS en dos componentes ortogonales con dos grados de libertad es muy xitil para construir di
seos ms complicados. Adems, no hay relacin entre los componentes
y A B ^ de la interaccin y las
sumas de cuadrados de AB^^ ^ A B ^ g, A B q ^ i , y A B q ^ q.
Los componentesAB yAB^ de la interaccin pueden calcularse de otra manera. Considere los totales
de las combinaciones de los tratamientos en cualquiera de los cuadrados de la figura 9-3. Si se hace la
suma de los datos en las diagonales hacia abajo de izquierda a derecha, se obtienen los totales -3 + 4 - 1 =
O, 3 + 10 - 1 = 6 y 5 + 11 + 2 = 18. La suma de cuadrados entre estos totales es 28.00 ( ^ ^ ) . En forma si
milar, los totales de la diagonal hacia abajo de derecha a izquierda son 5 + 4-1 = 8, -3 + 2-1 = -2 y -3 +
11 + 10 = 18. La suma de cuadrados entre estos totales es 33.34 (AB). Yates llam a estos componentes
de la interaccin los componentes / y / de la interaccin, respectivamente. Se usarn aqu indistintamente
las dos notaciones; es decir,
I{A B )=A B ^
J(A B )= A B

9-1 DISEO FACTORIAL SI-

9 -1 .3

367

El d ise o 3^

Suponga ahora que hay tres factores (A ,B y C ) bajo estudio, y que cada factor tiene tres niveles dispuestos
en un experimento factorial. Se trata de un diseo factorial 3^, y la disposicin experimental y la notacin
de las combinaciones de los tratamientos se presentaron anteriormente en la figura 9-2. Las 27 combina
ciones de tratamientos tienen 26 grados de libertad. Cada efecto principal tiene 2 grados de libertad, cada
interaccin de dos factores tiene 4 grados de libertad y la interaccin de tres factores tiene 8 grados de li
bertad. Si se hacen n rplicas, hay 3^ - 1 grados de libertad totales y 3^( - 1 ) grados de libertad del error.
Las sumas de cuadrados pueden calcularse utilizando los mtodos estndares para los diseos facto
riales. Adems, si los factores son cuantitativos, es posible hacer la particin de los efectos principales en
un componente lineal y uno cuadrtico, cada uno con un solo grado de libertad. Las interacciones de dos
factores pueden descomponerse en efectos lineal x lineal, lineal X cuadrtico, cuadrtico X lineal y cua
drtico X cuadrtico. Por ltimo, puede hacerse la particin de la interaccin de tres factores
en
ocho componentes con un solo grado de libertad que corresponden a lineal x lineal x lineal, lineal x li
neal X cuadrtico, etctera. Esta descomposicin de la interaccin de tres factores no es por lo general de
gran utilidad.
Tmbin es posible hacer la particin de las interacciones de dos factores en sus componentes / y /.
stos se designaran AB, AB^, AC, A ( y , BC y B O , y cada componente tendra dos grados de libertad.
Como en el diseo 3^, estos componentes no tienen significacin fsica.
Es posible hacer la particin de la interaccin de tres factoresv4BC en cuatro componentes ortogona
les con dos grados de libertad, a los que suele denominarse los componentes W ,X , Y y Z t \ a . interaccin.
Tkmbin se hace referencia a ellos como los componentes
AB^C,
y A B C de la interaccin
ABC, respectivamente. Las dos notaciones se usan indistintamente; es decir,
W {A B C )= A B ^ C ^
X {A B C )= A B ^ C
Y {A B C ) = A B C ^
Z { A B C ) = ABC
Observe que ninguna de las primeras letras puede tener un exponente diferente de 1. Al igual que los
componentes / y / , los componentes W,X, Y y Z no tienen ninguna interpretacin prctica. Sin embargo,
son tiles para construir diseos ms complejos.

EJEMPLO 9 - 1 ..................................................................................................................................................
Se usa una mquina para llenar contenedores metlicos de 5 galones con jarabe para una bebida gaseosa.
La variable de inters es la cantidad de jarabe perdida debido al espumeo. Se piensa que tres factores in
fluyen en el espumeo; el diseo de la boquilla (A), la velocidad del llenado (B) y la presin de operacin
(C). Se seleccionan tres boquillas, tres velocidades de llenado y tres presiones, y se corren dos rplicas de
un experimento factorial 3^. En la tabla 9-1 se muestran los datos codificados.
El anlisis de varianza de los datos de la prdida de jarabe se muestra en la tabla 9-2; Las sumas de
cuadrados se calcularon con los mtodos usuales. Se observa que la velocidad de llenado y la presin de
operacin son estadsticamente significativas. Las tres interacciones de dos factores tambin son signifi
cativas. En la figura 9-4 se analizan grficamente las interacciones de dos factores. El nivel intermedio de
la velocidad produce el mejor desempeo, mientras que las boquillas tipo 2 y 3, y la presin baja (10 psi) o
bien alta (20 psi) parecen ser las ms efectivas para reducir la prdida de jarabe.

368

CAPTULO 9

DISEOS FACTORIALES Y FACTORIALES FRACCIONADOS CON TRES NIVELES

Tipo de boquilla (A)


2
Velocidad (en rpm) (B)
100 120 140
20
17 -65
4
24 -58
110
55 -55
44
120 -44
-23 -64 -20
-5
-62 -31

1
Presin (en psi) (C)
10
15
20

100
-35
-25
110
75
4
5

120
-45
-60
-10
30
^0
-30

140
-M)
15
80
54
31
36

3
100
-39
-35
90
113
-30
-55

120
-55
-67
-28
-26
-61
-52

140
15
-30
110
135
54
4

El ejemplo 9-1 ilustra una situacin en la que el diseo de tres niveles suele encontrar cierta aplica
cin; uno o ms de los factores es cualitativo, asumiendo desde luego tres niveles, y los dems factores son
cuantitativos. En este ejemplo, suponga que slo hay tres diseos de la boquilla que son de inters. Se tra
ta evidentemente, entonces, de un factor cualitativo que requiere tres niveles. La velocidad de llenado y la
presin de operacin son factores cuantitativos. Por lo tanto, podra ajustarse un modelo cuadrtico
como el de la ecuacin 9-1 en los dos factores, velocidad y presin, con cada nivel del factor boquilla.
En la tabla 9-3 se muestran estos modelos de regresin cuadrticos. Lasy3 de estos modelos se estima
ron usando un programa de computadora de regresin lineal estndar. (En el captulo 10 se analizar con
mayor detalle la regresin de mnimos cuadrados.) En estos modelos, las variables y Xj estn codificadas
en los niveles - 1, 0, -1-1, como se estudi anteriormente, y se supusieron los siguientes niveles naturales
para la presin y la velocidad:

Nivel codificado

Velocidad (rpm)

Presin (psi)

-1
O

100

10

- 1-1

120

15

140

20

En la tabla 9-3 se presentan estos modelos tanto en trminos de estas variables codificadas como en tr
minos de los niveles naturales de la velocidad y la presin.

labia 9-2

Anlisis de varianza de los datos de la prdida de jarabe

Fuente de
variacin
A, boquilla
B, velocidad
C,Jpresin
r
AB
AC
BC
ABC
Error
Tbtal

Suma de
cuadrados
993.77
61,190.33
69,105.33
6,300.90
7,513.90
12,854.34
4,628.76
11,515.50
174,102.83

Grados de
libertad
2
2
2
4
4
4
8
27
53

Cuadrado
medio
496.89
30,595.17
34,552.67
1,575.22
1,878.47
3,213.58
578.60
426.50

Po
1.17
71.74
81.01
3.69
4.40
7.53
1.36

Valor P
0.3256
< 0.0001
< 0.0001
0.0383
0.0222
0.0025
0.2737

9-1 DISEO FACTORIAL 3

400

400

B -1 4 0

200

369

C-15

200

B = 100

-200

^ ^ C = 20

!-200

'' '''N c-io

B = 120
-400

-400

2
3
Tipo de boquilla (A)

J______ L

a)

2
3
Tipo de boquilla (A)
61

Velocidad en rpm ()
c)

Figura 9-4 Interacciones de dos factores del ejemplo 9-1.

Tabla 9-3

Modelos de regresin para el ejemplo 9-1

Tipo de boquilla
1

= velocidad {S),X2 = Presin (P) en unidades codificadas


S = 22.1 -1- Iftt, + 16.3j:j + 51Jx^ + 2.9x,x^
j) =1217.3-31.2565-H86.017P-I-0.129175^ -2.8733/"-h 0.02875SP
j) = 25.6-22.8Xi -12.3xj-H4.1;i;,^ -56.9xj^ -0.7x,xj

j) = 180.1 -9.47SS-H 66J5P+ a035S' - 2.2767/"-0.0075Sf


9 = 15.1 + 20.3X, -1- 5.9xj -t- 75.8x1"- 94.9xj" + 10.5x,xj

9 = 194ai -4a0585-l-102.48/-Hai8958S" -3.7967/" + 0.105SP

370

CAPTULO 9 DISEOS FACTORIALES Y FACTORIALES FRACCIONADOS CON TRES NIVELES

En la figura 9-5 se muestran las grficas de contorno de las superficies de respuesta de la prdida de
jarabe constante, como una fiincin de la velocidad y la presin para cada tipo de boquilla. Estas grficas
revelan informacin de considerable utilidad acerca del desempeo de este sistema de llenado. Puesto
que el objetivo es minimizar la prdida de jarabe, se preferira la boquilla tipo 3, ya que los contornos ob
servados ms pequeos (-60) slo aparecen en esta grfica. Debern usarse la velocidad de llenado cerca
del nivel intermedio de 120 rpm y el nivel de presin ya sea bajo o alto.
Cuando se construyen grficas de contorno para un experimento que tiene una mezcla de factores
cuantitativos y cualitativos, no es raro encontrar que las formas de las superficies de respuesta de los fac
tores cuantitativos son muy diferentes en cada nivel de los factores cualitativos. Esto puede observarse en
cierta medida en la figura 9-5, donde la forma de la superficie para la boquilla tipo 2 es considerablemente
alargada en comparacin con las superficies de las boquillas tipo 1 y 3, Cuando esto ocurre, implica que
las condiciones de operacin ptimas (y otras conclusiones importantes) en trminos de los factores
cuantitativos son muy diferentes en cada nivel de los factores cualitativos.
Es sencillo mostrar la particin numrica de la interaccin^BC en sus cuatro componentes ortogo
nales con dos grados de libertad utilizando los datos del ejemplo 9-1. El procedimiento general ha sido
descrito por Cochran y Cox [26] y Davies [36]. Primero se seleccionan dos cualesquiera de los tres facto
res, por e j e m p l o y se calculan los totales / y / de la interaccin.^45 en cada nivel del tercer factor C.
Estos clculos se presentan a continuacin:

A
c

10

100
120
140

15

20

Tbtales

3,

-60
-105
-25

41
-123
24

-7 4
-122
-15

-198
-106
-155

-222
-79
-158

100
120
140

185
20
134

175
-99
154

203
-54
245

331
255
377

238
440
285

100
120
140

9
-70
67

-28
-126
-51

-85
-113
58

-59
-74
-206

-144
^0
-155

Despus, los totales I{AB) yJ(AB) se arreglan en una tabla de dos vas con el factor C, y se calculan los to
tales de las diagonales / y / de esta nueva disposicin:

Tbtales
C
10
15
20

I(AB)
-198
331
-59

-106
255
-74

-155
377
-206

Totales

-149
212
102

41
19
105

10
15
20

J(AJB)
-222
238
-144

-79
440
-40

-158
285
-155

63
62
40

138
4
23

Los totales de las diagonales/y/calculados arriba son en realidad los totales que representan las cantida
des/[/(A B ) X C] =A B^C,J[H AB) X C] =AB^C,I[J{AB) X C] = A B C y J { J ( A B ) x C] = ^ B C , o l o s
componentes W ,X ,Y y Z &ABC. Las sumas de cuadrados se encuentran de la manera usual; es decir,

9-1 DISEO FACTORIAL 31*

Velocidad
al Boquilla tipo 1

Velocidad
6) Boquilla tipo 2

100.0

106.7

113.3

120.0 126.7
Velocidad

133.3

140.0

e) Boquilla tipo 3

Figura 9-5 Contomos de la prdida de jarabe constante


(unidades: cc - 70) como una funcin de la velocidad y la
presin para las boquillas tipo 1, 2 y 3, ejemplo 9-1.

371

372

CAPTULO 9

DISEOS FACTORIALES Y FACTORIALES FRACCIONADOS CON TRES NIVELES


I [ I { A B ) y .C ] = A B ^ C ^ = W { A B C )

(-149)" +(212)^ +(102)^

(165)^

18
J [ I { A B ) x C ] = A B ^ C = X (A B C )
^ (41)^+(19)^+(105)^
18
I [ J ( A B ) x C ] = ABC^ = Y{A B C )
(63)^+(62)^+(40)"
18
J[J(A B ) X C] = A B C = Z (A B C )
(138)"+(4)"+(23)"
18

54

= 3804.11

(165)" ^
54
(165)"

54
(165)"
54

Aun cuando se trata de una particin ortogonal de


se seala de nuevo que no se acostumbra pre
sentarla en la tabla del anlisis de varianza. En secciones subsecuentes se analiza la necesidad ocasional
de calcular uno o ms de estos componentes.

9-1.4

El diseo general 3'

Los conceptos utilizados en los diseos 3^ y 3^ pueden extenderse de inmediato al caso de k factores, cada
uno con tres niveles, es decir, a un diseo factorial 3*^. Se emplea la notacin digital usual para las combi
naciones de tratamientos, por lo que 0120 representa una combinacin de tratamientos en un diseo 3"
co n ^ y D en los niveles bajos, B en el nivel intermedio y C en el nivel alto. Hay 3* combinaciones de trata
mientos, con 3*"-1 grados de libertad entre ellas. Estas combinaciones de tratamientos permiten deter
minar las sumas de cuadrados de k efectos principales, cada uno con dos grados de libertad; ( j )
interacciones de dos factores, cada una con cuatro grados de libertad;...; y una interaccin de k factores
con 2* grados de libertad. En general, una interaccin de h factores tiene 2* grados de libertad. Si se ha
cen n rplicas, hay 3* - 1 grados de libertad totales y 3(n - 1) grados de libertad del error.
Las sumas de cuadrados de los efectos y las interacciones se calculan con los mtodos usuales para los
diseos factoriales. D e manera tpica, no se hace ninguna descomposicin adicional de las interacciones
de tres factores y de rdenes superiores. Sin embargo, cualquier interaccin de h factores tiene 2''^com
ponentes ortogonales con dos grados de libertad. Por ejemplo, la interaccin de cuatro factores
tiene 2'^^ = 8 componentes ortogonales con dos grados de libertad, denotados por ABCD^, A B 0 D ,
AB^CD,ABCD,ABC^D^,AB^C^D,AB^CD^ y AB^C^D^. Al escribirse estos componentes, observe que el
nico exponente permitido en la primera letra es 1. Si el exponente de la primera letra no es 1, entonces la
expresin completa debe elevarse al cuadrado y los exponentes deben reducirse al mdulo 3. Para ilustrar
lo anterior, considere
A ^ B C D = { A ^ B C D f = A^B^C^D^ =AB^C^D^
Estos componentes de la interaccin no tienen ninguna interpretacin fsica, pero son tiles para cons
truir diseos ms complejos.
El tamao del diseo se incrementa rpidamente con k. Por ejemplo, un diseo 3^ tiene 27 combina
ciones de tratamientos por rplica, un diseo 3'*tiene 81, un diseo 3^ tiene 243, etctera. Por lo tanto, con
frecuencia slo se considera una sola rplica del diseo 3*, y las interacciones de rdenes superiores se
combinan para proporcionar una estimacin del error. Como una ilustracin, si las interacciones de tres

9-2 CONFUSIN EN EL DISEO FACTORIAL 3'

373

factores y de rdenes superiores son insignificantes, entonces una sola rplica del diseo 3^ proporciona 8
grados de libertad del error, y una sola rplica del diseo 3 proporciona 48 grados de libertad del error.
Estos diseos siguen siendo grandes para 3 y, por consiguiente, son de escasa utilidad.

9-2

C O N FU SI N EN EL DISEO FACTORIAL 3>

Incluso cuando se considera una sola rplica del diseo 3*, sta requiere tantas corridas que es improba
ble que puedan hacerse las 3* corridas bajo condiciones uniformes. Por lo tanto, con frecuencia es necesa
rio hacer la confusin (o mezclado) en bloques. El diseo 3^ puede confundirse en y bloques
incompletos, dondep < k. Por lo tanto, estos diseos pueden confundirse en tres bloques, nueve bloques,
etctera.

9'2.1

El diseo factorial 3* en tres bloques

Suponga que se quiere confundir el diseo 3* en tres bloques incompletos. Estos tres bloques tienen dos
grados de libertad entre ellos; por lo tanto, debe haber dos grados de libertad confundidos con los blo
ques. Recuerde que en la serie factorial 3*^cada efecto principal tiene dos grados de libertad. Adems,
cada interaccin de dos factores tiene cuatro grados de libertad y puede descomponerse en dos compo
nentes de la interaccin (por ejemplo, AB yAB^), cada uno con dos grados de libertad; cada interaccin
de tres factores tiene ocho grados de libertad y puede descomponerse en cuatro componentes de la in
teraccin (por ejemplo, ABC, ABC^,AB^C y AB^C% cada uno con dos grados de libertad; y as sucesiva
mente. Por lo tanto, es conveniente confundir un componente de interaccin con los bloques.
El procedimiento general consiste en construir una definicin de contrastes
L=

+02^2 + +a:^x^

(9-2)

donde a representa el exponente del factor /-simo en el efecto que va a confundirse y x es el nivel del fac
tor -simo en una combinacin de tratamientos particular. Para la serie 3* se tiene ; = 0 , 1 o 2, donde la
primera a diferente de cero es la unidad, y x = O (nivel bajo), 1 (nivel intermedio) o 2 (nivel aho). Las
combinaciones de tratamientos del diseo 3^ se asignan a los bloques con base en el valor de L (mod 3).
Puesto que L (mod 3) slo puede asumir los valores 0 ,1 o 2, tres bloques estn definidos de manera nica.
Las combinaciones de tratamientos que satisfacen L = O (mod 3) constituyen el bloque principal. Este
bloque incluir siempre la combinacin de tratamientos 00 ...0 .
Por ejemplo, suponga que quiere construirse un diseo factorial 3^ en tres bloques. Cualquiera de los
componentes de la interaccinv4B, AB o A B \ puede confundirse con los bloques. Al elegir arbitrariamen
te A B \ se obtiene la definicin de contrastes
L = x^+2 x 2
El valor de L (mod 3) de cada combinacin de tratamientos puede encontrarse de la siguiente manera:
00:
01:
02:
10:

L = l ( 0 ) + 2 ( 0 ) = 0 = 0 ( m o d 3 ) 11: L = 1 (1)+ 2(1)=


L = l ( 0 ) + 2 ( l ) = 2 = 2 ( m o d 3 ) 21: L = 1( 2) + 2 ( 1 ) =
L = l ( 0 ) + 2 ( 2 ) = 4 = 1 (m od3) 12: L = 1(1) + 2( 2) =
L = l ( l ) + 2( 0) = 1 = 1 (m od3) 22: L = l ( 2) + 2( 2) =
20: L = l ( 2 ) + 2 ( 0 ) = 2 = 2 ( m o d 3 )

En la figura 9-6 se muestran los bloques.

3=
4=
5=
6=

O(mod 3)
1 (m o d 3)
2 (mod 3)
O(mod 3)

374

CAPTULO 9

DISEOS FACTORIALES Y FACTOIUALES FRACCIONADOS CON TRES NIVELES

Bloque 1

Bloque 2

Bloque 3

00
11
22

10
21
02

01
12
20

a) Asignacin de las conibinaciones


de tratamiento a los bloques

02

12

22

01

11

21

---------------

00

-------------- <

10

X
O

- Bloque 1
O - Bloque 2
d ^ Bloque 3

20

_L

2
FactorA

6) Vista geomtrica

Figura 9-6
fundida.

El diseo 3^ en tres bloques conAB^ con

Los elementos del bloque principal forman un grupo con respecto a la adicin mdulo 3. Con refe
rencia a la figura 9-6, se observa que 11 -i-11 = 2 2 y l l -h 22 = 00. Las combinaciones de tratamientos de
los otros dos bloques pueden generarse sumando, en mdulo 3, cualquier elemento del nuevo bloque con
los elementos del bloque principal. Por lo tanto, para el bloque 2 se usa 10 para obtener
10+ 0 0 = 1 0

10+11 = 21

10+ 2 2 = 0 2

01+11 = 12 y

01+ 2 2 = 2 0

Para generar el bloque 3, al utilizar 01, se encuentra


01 + 0 0 = 0 1

EJEMPLO ..........................................................................................................................................................
El anlisis estadstico del diseo 3^ confundido en tres bloques se ilustra empleando los datos siguientes,
los cuales provienen de la rplica nica del diseo 3^ que se muestra en la figura 9-6.

TbtaJes de los bloques =

Bloque 1
00= 4
11 = - 4
22= 0

Bloque 2
10 = - 2
21 = 1
02= 8

Bloque 3
01 = 5
12 = - 5
20= 0

Al aplicar los mtodos convencionales para el anlisis de factoriales, se encuentra que


SSb = 0.22.

= 131.56 y

9-2 CONFUSIN EN EL DISEO FACTORIAL 3


l b U 9 -4

375

Anlisis de varianza de los datos del


ejemplo 9-2

Fuente de
variacin
Bloques (AB^)
A
B
AB
Tbtal

Grados de
libertad

Suma de
cuadrados

2
2
2
2
8

10.89
131.56
0.22
2.89
145.56

Se encuentra tambin que

Sin embargo, 55Bioques es exactamente igual al componente


vaciones se escriben de la siguiente manera:

Factor

0
1
2

0
4
-2
0

de la interaccin. Para ver esto, las obser

Factor B
1
5
-A
1

2
8
-5
0

Recuerde, por la seccin 9-1.2, que el componente I oAB^ de la interaccin^^ puede encontrarse calcu
lando la suma de cuadrados entre los totales de la diagonal de izquierda a derecha de la representacin
anterior. Se obtiene as
,,( 0 ) ! ( 0 ) L t < Z ) l _ (2 1 ,1 0 .8 9
3
9
valor que es idntico a 55Bio<,ue5El anlisis de varianza se presenta en la tabla 9-4. Puesto que hay una sola rplica, no puede hacerse
una prueba formal. No es una buena idea utilizar el componente A S de la interaccin como una estima
cin del error.
Se considera ahora un diseo un poco ms complicado; un diseo factorial 3^ confundido en tres blo
ques con nueve corridas cada uno. El c o m p o n e n t e d e la interaccin de tres factores se confundir
con los bloques. La definicin de contrastes es
L = JCj +2x^ +2x
Es sencillo verificar que las combinaciones de tratamientos 000, 012 y 101 se encuentran en el bloque
principal. Las corridas restantes del bloque principal se generan de la siguiente manera:
(1) 000

(4) 101 +101 = 202

(7) 101 -f- 021 = 122

(2) 012 (5) 012-1-012 = 021

( 8) 012 + 202 = 211

(3) 101

(9) 021 + 202= 220

( 6) 101+ 012= 110

376

CAPTULO 9

DISEOS FACTORIALES Y FACTORLALES FRACCIONADOS CON TRES NIVELES

Para encontrar las corridas de otro bloque se observa que la combinacin de tratamientos 200 no est en
el bloque principal. Por lo tanto, los elementos del bloque 2 son
( 1) 200+ 000=200

(4) 200 + 202= 102

(7) 2 0 0 + 122= 022

( 2) 200+ 012=212

(5) 200+021 = 221

( 8) 200+211 = 111

(3) 200+101 = 001

( 6) 200+ 110=010

(9) 2 0 0 + 220= 120

Observe que todas estas corridas satisfacen^ = 2 (mod 3). El ltimo bloque se encuentra observando que
100 no pertenece al bloque 1 ni al bloque 2. Al usar 100 como arriba, se obtiene
( 1) 100 + 000=100

(4) 100 + 202 = 002

(7) 100+ 122= 222

( 2 ) 100+ 012=112

(5) 100+021 = 121

( 8) 100+211 = 011

(3) 100+101 = 201

( 6) 100 + 110= 210

(9) 100 + 2 2 0 = 0 2 0

Los bloques se ilustran en la figura 9-7.


Bloque 1

Bloque 2

Bloque 3

000
012
101
202
021
110
122
211
220

200
212
001
102
221
010
022
111
120

100
112
201
002
121
210
222
011
020

a) Asignacin de jas combinaciones de


tratamientos a los bloques

0112
002

222

122

022

= Bloque 1
o = Bloque 2
a - Bloque 3

202

102*
021

011
^
001

*121
0111

101
201

oio/^

120

020
110

^*^10

100

200

_ J __

_ | __

Factor A

b) Vista geomtrica
Figura 9-1

221

El diseo 3^ en tres bloques con AB^C^ confundida.

220

9-2 CONFUSIN EN EL DISEO FACTORIAL 3'

Tabla 9-5

377

Anlisis de varianza de un diseo 3^


con AB^C^ confundida

Fuente de variacin

Grados de
libertad
2
2
2
2
4
4
4

Bloques
A
B
C
AB
AC
BC

Error {ABC +AB^C +ABC^)

26

Total

En la tabla 9-5 se presenta el anlisis de varianza de este diseo. Al utilizar este esquema de confusin
(o mezclado), se cuenta con informacin acerca de todos los efectos principales y las interacciones de dos
factores. Los componentes restantes de la interaccin de tres factores (ABC,AB^C yABC^) se combinan
como una estimacin del error. La suma de cuadrados de esos tres componentes podra obtenerse por
sustraccin. En general, para el diseo 3* en tres bloques se seleccionara siempre un componente de la
intraccin de orden ms alto para confundirlo con los bloques. Los dems componentes de esta interac
cin que no estn confundidos pueden obtenerse calculando la interaccin de k factores de la manera
usual y restando de esta cantidad la suma de cuadrados de los bloques.

9-2.2

El diseo factorial 3* en nueve bloques

En algunas situaciones experimentales puede ser necesario confundir el diseo 3'' en nueve bloques. Por
lo tanto, ocho grados de libertad se confundirn con los bloques. Para construir estos diseos se eligen dos
componentes de interaccin y, como resultado, dos ms se confundirn automticamente, produciendo
los ocho grados de libertad requeridos. Estos dos son las interacciones generalizadas de los dos efectos
elegidos originalmente. En el sistema 3*, las interacciones generalizadas de dos efectos (es decir, -Py S ) se
definen como PQ y PQ^ (o P^Q).
Los dos componentes de interaccin elegidos inicialmente producen doi definiciones de contrastes
L^ = a^x^+a^x^+
Lj

+a^x^ = u
+P^Xi^ = /i (m od3)

u = 0 ,l,2
h = O, 1, 2

donde {a,} y
son los exponentes de la primera y la segunda interacciones generalizadas, respectiva
mente, con la convencin de que las primeras ay^j diferentes de cero son la unidad. Las definiciones de
contrastes de la ecuacin 9-3 implican nueve ecuaciones simultneas especificadas por el par de valores
paraLi y L2. Las combinaciones de tratamientos que tienen el mismo par de valores para (Lj, 2) se asig
nan al mismo bloque.
El bloque principal consta de las combinaciones de tratamientos que satisfacen Li = L i = O (mod 3).
Los elementos de este bloque forman un grupo con respecto a la adicin mdulo 3; por lo tanto, el esque
ma presentado en la seccin 9-2.1 puede usarse para generar los bloques.

378

CAPTULO 9 DISEOS FACTORIALES Y FACTORL^LES FRACCIONADOS CON TRES NIVELES

Como un ejemplo, considere el diseo factorial 3^ confundido en nueve bloques con nueve corridas
cada uno. Suponga que se elige confundir A B C y AB^D^. Sus interacciones generalizadas
{A B C ){A B ^ D ^ )= A^B^CD^ = { A ^ B ^ C D ^ y = A C ^ D
( A B C ) { A B ^ D ^ f = A^B^CD^ = B^ CD = {B^ C D f = BC^
tambin estn confundidas con los bloques. Las definiciones de contrastes de A B C y AB^D^ son
Ly=x^ +;c2 +^3

(9-4)

Lj ~ x^+2x^+2x^
Los nueve bloques pueden construirse utilizando las definiciones de contrastes (ecuacin 9-4) y la propie
dad de la teora de grupos del bloque principal. El diseo se muestra en la figura 9-8.
Para el diseo ^ en nueve bloques habr cuatro componentes de interaccin confundidos. Los dems
componentes de estas interacciones que no estn confundidos pueden determinarse restando la suma de
cuadrados del componente confundido de la suma de cuadrados de la interaccin completa. El mtodo
descrito en la seccin 9-1.3 puede ser til para calcular los componentes de interaccin.

9-2.3

El diseo factorial 3* en 3< bloques

El diseo factorial 3*^puede confundirse en V bloques con 3^^ observaciones cada uno, donde p < k . B \
procedimiento consiste en seleccionar p efectos independientes que habrn de confundirse con los blo
ques. Como resultado, exactamente otros ( y - I p - l)/2 efectos se confunden de manera automtica.
Estos efectos son las interacciones generalizadas de los efectos elegidos originalmente.
Como una ilustracin, considere un diseo 3'' que va a confundirse en 27 bloques. Puesto quep = 3,se
seleccionaran tres componentes de interaccin independientes y se confundiran automticamente otros
[3^ - 2(3) - 1]/2 = 10. Suponga que se eligen^JSC^DG, BCE^F^G y BDEFG. A partir de estos efectos pue-

Bloque 1 Bloque 2

Bloque 3

Bloque 4

Bloque 5

Bloque 6

Bloque?

Bloque 8

Bloque 9

0000

0001

2000

0200

0020

OCIO

1000

0100

0002

0122

0120

2122

0022

0112

0102

1122

0222

0121

0211

0212

2211

0111

0201

0221

1211

0011

0210

1021

1022

0021

0221

1011

1001

2021

1121

1020

1120

2110

1210

1112

1110

1111

0110

1010

1100

1202

1200

0202

1102

1222

1212

2202

1002

1201

2012

2010

1012

2212

2002

2022

0012

2112

2011

2101

2012

1101

2001

2121

2111

0101

2201

2100

2220

2221

1220

2120

2210

2200

0220

2020

2222

- (0.0)

(0,1)

(2,2)

(2,0)

(2,1)

(1,2)

(1,1)

(1,0)

(0,2)

Figura 9-8

El diseo S'' en nueve bloques con A B C , AB^D^, A O D y BOD ^ confundidas.

9-3 RPLICAS FRACCIONADAS DEL DISEO FACTOIUAL 3^

379

den construirse tres definiciones de contrastes, y los 27 bloques pueden generarse con los mtodos descri
tos anteriormente. Los otros 10 efectos confundidos con los bloques son
(^ 5 C ' > G )(5 C 'F 'G )= AB^DE^F^G^
(ABC^DG)(BCE^F^G)^ =

DE^

= ACDEF

(ABC^DG)(BDEFG)=AB^C^D^EFG^
(ABC^ DG){BDEFG)^ = AB^

F^ G^ = AC^E^F^

{BCE^F''G){BDEFG)= B^CDE^F^G^ = BC^D^G


(BCE^F^G)(BDEFG)^ =B^CD^E^F*G^ = CD^EF
{ABC^DG)(BCE''F''G)(BDEFG)= AB^

E^ F^ G^ = AD^

(ABC^DG)^{BCE^F''G)(BDEFG)= A^B*C^D^G* = AB^Ct^


{ABC^DG){BCE^ F^ G f{B D E F G ) = ABCD^ E^ F^ G
(ABC^DG){BCE^F^G)(BDEFG)^ = ABC^

E* F* G " = ABEFG

Se trata de un diseo enorme que requiere 3^ = 2187 observaciones dispuestas en 27 bloques con 81 ob
servaciones cada uno.

9-3

RPLICAS FRACC IO N AD AS DEL DISEO FACTORIAL 3>

El concepto de rplica fraccionada puede extenderse a los diseos factoriales 3*. Debido a que una rplica
completa del diseo 3* puede requerir un nmero bastante grande de corridas incluso para valores mode
rados de k, las rplicas fraccionadas de estos diseos son de inters. Sin embargo, como se ver ms ade
lante, algunos de estos diseos tienen estructuras de alias complicadas.

9'3.1

La fraccin un tercio del diseo factorial 3'

La fraccin ms grande del diseo 3*"es la fraccin un tercio que contiene 3*' corridas. Por consiguiente,
se hace referencia a l como el diseo factorial fraccionado 3*" ^ Para construir un diseo factorial fraccio
nado 3*' se selecciona un componente de interaccin con dos grados de libertad (generalmente, la in
teraccin de orden ms alto) y se hace la particin del diseo 3* completo en tres bloques. Cada uno de los
tres bloques resultantes es un diseo fraccionado 3*' y puede seleccionarse cualquiera de los bloques
para usarlo. Si
C A"* es el componente de interaccin utilizado para definir los bloques, enton
ces a / = AB"^
K " se le llama la relacin de definicin del diseo factorial fraccionado. Cada efec
to principal o componente de interaccin estimado a partir del diseo 3*' tiene dos alias, los cuales
pueden encontrarse multiplicando el efecto tanto por I como por P mdulo 3.
Como un ejemplo, considere una fraccin un tercio del diseo 3^. Puede seleccionarse cualquiera de
los componentes de la interaccinABC para construir el diseo, es t t,A B C ,A B ^ C ,A B O oAB^O. Por
lo tanto, hay en realidad 12 fracciones un tercio diferentes del diseo 3^ definidas por
+a^X 2 + 3a;3 = u (mod 3)
donde o: = l o 2 y M = 0, l o 2 . Suponga que se selecciona el componente deAB^C^. Cada fraccin del dise
o 3^^ resultante contendr exactamente 3^ = 9 combinaciones de tratamientos que deben satisfacer
x i + 2 x ^ -I-2 JC3 = u (m o d 3)

380

CAPITULO 9 DISEOS FACTORIALES Y FACTORLALES FRACCIONADOS CON TRES NIVELES

donde m = 0 , 1 o 2. Es sencillo verificar que las tres fracciones un tercio son las que se muestran en la figu
ra 9-9.
Si se corre cualquiera de los diseos 3^^ de la figura 9-9, la estructura de los alias resultante es
A = A {A B ^ C ^ )=

= A BC

A = A { A B ^ C ^ Y = A ^ B ^ C ^ = B C
B = B { A B ^ C ^ ) ^ AB^C^ = AC^
B = B { A B ^ C ^ y = A^B^C^ = ABC^
C = C { A B ^ C ^ )= A B ^ C ^ = A B ^
C = C (A B ^ C ^ y = A^B^C' = AB^C
A B = A B (A B ^ C ^ )= A^B^C^ = A C
A B = A B (A B ^ C ^ y = A^B'C^ = BC^
Por consiguiente, los cuatro efectos que en realidad se estiman a partir de los ocho grados de libertad
del diseo so n ^ + B C + ABC, B + AC^ + ABC^, C + AB^ + AB^C y A B + A C + BC^. Este diseo slo
tendra valor prctico si todas las interacciones fueran pequeas en comparacin con los efectos principa
les. Puesto que los efectos principales son alias de las interacciones de dos factores, se trata de un diseo
de resolucin m . Observe lo complejas que son las relaciones de los alias en este diseo. Cada efecto
principal es alias de un componente de interaccin. Si, por ejemplo, la interaccin de dos factores B C es
grande, esto distorsionar potencialmente la estimacin del efecto principal de ^ y har que sea muy
complicada la interpretacin del efecto de A S + A C + BC^. Es muy difcil ver cmo este diseo podra ser
de utilidad, a menos que se suponga que todas las interacciones son insignificantes.
Diseo 1
u=0

Diseo 1
u -1

Diseo 1
u -2

000
012
101
202
021
110
122
211
220

100
112
201
002
121
210
222
011
020

200
212
001
102
221
010
022
111
120

a) Combinaciones de tratamientos

/ I
>
I
-------- ----------

>-

1 *
J------r

u=1

u*2

6) Vista geomtrica

Figura 9-9

Las tres fracciones un tercio del diseo 3 con la relacin de denicin I = ABK^.

9-3 RPUCAS FRACCIONADAS DEL DISEO FACTORIAL 3

381

Antes de dejar el diseo 37*, observe que para el diseo con m = O(ver la figura 9-9), si se hace q ue^
denote el rengln y fi la columna, entonces el diseo puede escribirse como

000 012 021


101 110 122
202

211

220

que es un cuadrado latino 3 x 3. El supuesto de las interacciones insignificantes requerido para la inter
pretacin nica del diseo 3j,7 tiene su paralelo en el diseo del cuadrado latino. Sin embargo, los dos di
seos surgen por motivos diferentes, uno como consecuencia de la rplica fraccionada y el otro de las
restricciones sobre la aleatorizacin. Por la tabla 4-13 se observa que slo hay 3 x 3 cuadrados latinos y
que cada uno corresponde a uno de los doce diferentes diseos factoriales fraccionados 3^^
Las combinaciones de tratamientos en un diseo 3*"^ con la relacin de definicin
I = AB''^ C '
pueden construirse utilizando un mtodo similar al que se emple en la serie 2*"'.
Primero se escriben las 3*"' corridas para un diseo factorial de tres niveles completo en A:- 1 factores, con
la notacin comn 0 , 1,2. ste es el diseo bsico en la terminologa del captulo 8. Despus se introduce
el factor it-simo igualando sus niveles con el componente apropiado de la interaccin de orden ms
alto, por ejemplo A B ^C^ { K -iy " -', mediante la relacin
+

(9-5)

donde = (3-a*)a, (mod 3) para 1 < i < ) t - 1. Se obtiene as un diseo con la resolucin ms alta posible.
Como una ilustracin, se usa este mtodo para generar el diseo 3j^^ con la relacin de definicin
/ = AB^CD que se muestra en la tabla 9-6. Es sencillo verificar que los tres primeros dgitos de cada com
binacin de tratamientos de esta tabla son las 27 corridas de un diseo 3^ completo. Se trata del diseo b
sico. l?araAB^CD se tiene i = aj = 04 = 1 y 2 = 2. Esto implica que^i = (3 - l)a i (mod 3) = (3 - 1)(1) =
2,/S2 = (3 - l)c2 (mod 3) = (3 - 1)(2) = 4 = 1 (mod 3) y^Sj = (3 - l ) a , (mod 3) = (3 - 1)(1) = 2. Por lo tan
to, la ecuacin 9-5 queda como
= 2 x^ + x ^ + 2 x 3

(9-6)

Los niveles del cuarto factor satisfacen la ecuacin 9-6. Por ejemplo, se tiene 2(0) 1(0) -t- 2(0) = 0 ,2(0)
+ 1(1) + 2(0) = 1, 2(1) + 1(1) -I- 2(0) = 3 = 0, etctera.
El diseo
resiUtante tiene 26 grados de libertad que pueden usarse para calcular las sumas de
cuadrados de los 13 efectos principales y los com ponentes de las interacciones (y sus alias). Los alias

Tabla 9-6
0000
0101
1100
1002
0202
1201
2001
2102
2200

Un diseo 3)^' con


I = AB^CD
0012
0110
0211
1011
1112
1210
2010
2111
2212

???1
0021
0122
0220
1020
1121
1222
2022
2120

382

CAPTULO 9

DISEOS FACTORIALES Y FACTORIALES FRACCIONADOS CON TRES NIVELES

de cualquier efecto se encuentran de la manera usual; por ejemplo, los alias d e ^ son j4 (AS^CZ)) =
ABC?D^ yA(AB^CDy = BC^D^. Puede verificarse que los cuatro efectos principales estn separados de
cualquier componente de interacciones de dos factores, pero que algunos componentes de interacciones
de dos factores son alias entre s. Una vez ms se observa la complejidad de la estructura de los alias. Si
cualquiera de las interacciones de dos factores es grande, probablemente ser muy difcil aislarla con este
diseo.
El anlisis estadstico de un diseo 3*^se lleva a cabo con los procedimientos usuales del anlisis de
varianza para experimentos factoriales. Las sumas de cuadrados de los componentes de interacciones
pueden calcularse como en la seccin 9-1. Cuando interprete los resultados, recuerde que los componen
tes de las interacciones no tienen ninguna interpretacin prctica.

9-3.2

Otros diseos factoriales fraccionados 3*-'

Para moderar los valores grandes de k, es deseable un fraccionamiento todava mayor del diseo 3*. En
general, puede construirse una fraccin ( j f del diseo 3*^parap < k , donde la fraccin contiene 3*^"^corri
das. A este diseo se le llama el diseo factorial fraccionado 3*^^. Por lo tanto, un diseo 3*^es una frac
cin un noveno, un diseo 3*^ es una fraccin un veintisieteavo, etctera.
El procedimiento para construir un diseo factorial fraccionado 3*^ consiste en seleccionar^ compo
nentes de interacciones y usar estos efectos para hacer la particin de las 3*^combinaciones de tratamien
tos en y bloques. Entonces cada bloque es un diseo factorial fraccionado 3*^^. La relacin de definicin I
de cualquier fraccin consta de losp efectos elegidos inicialmente y sus (3' - ^ - 1)/2 interacciones gene
ralizadas. El alias de cualquier efecto principal o componente de interaccin se obtiene con la multiplica
cin mdulo 3 del efecto por I e
Las corridas que definen un diseo factorial fraccionado 3*^^ tambin pueden generarse anotando
primero las combinaciones de tratamientos de un diseo factorial 3*^^ completo e introduciendo despus
los p factores adicionales igualndolos con los componentes de las interacciones, como se hizo en la sec
cin 9-3.1.
El procedimiento se ilustrar construyendo un diseo 3''"^ es decir, una fraccin un noveno del dise
o 3*. SeanAB^C y BCD los dos componentes de interacciones elegidos para construir el diseo. Sus in
teracciones generalizadas son (AB^C)(BCD) = AC^D y (AB^C)(BCDf = ABD^. Por lo tanto, la relacin
de definicin de este diseo es / = At^C = BCD = AC^D = ABD^, y el diseo es de resolucin III. Las
nueve combinaciones de tratamientos del diseo se encuentran apuntando un diseo 3^ en los factores^
y B, y agregando despus dos nuevos factores haciendo
= 2x^
= 2jCj + 2 x ^

Tabla 9-7 Un diseo 3n7^


con! =AB^C
_________e I=BCP_______
0000
Oni
0222
1021
1102
1210
2012
2120
2201

9'4 DISEOS FACTORIALES CON NIVELES MIXTOS

Tabla 9-8 Estructura de los alias del diseo


Efecto
I
ABCD ACD^

383

de la tabla 9-7__________________________________________________

Alias
P

ABC^

AB^D

BC^

AB^C^^

BD^

AC

BC^t^ ABC^D AB^D^

ABC

CD

AB^C^D

AD^

AB^C^

BC^D AD

ABCD^

AB^

BD

ACD

ABC^D^

AB^CD BCt^ AC^D^

AB

AB^CD^

BC

AC^

ABD

Esto es equivalente a ussiAB^CyBCD para hacer la particin del diseo 3 completo en nueve bloques y
luego seleccionar uno de estos bloques como la fraccin deseada. El diseo completo se muestra en la ta
bla 9-7.
Este diseo tiene ocho grados de libertad que pueden usarse para estimar cuatro efectos principa
les y sus aUas. Los alias de cualquier efecto pueden encontrarse multiplicando el efecto mdulo 3 por
AB^C, BCD,AC^D,ABD^ y sus cuadrados. En la tabla 9-8 se presenta la estructura de los alias completa
del diseo.
Por la estructura de los alias se observa que este diseo slo es til en ausencia de interacciones. Ade
ms, sj4 denota los renglones y las columnas, entonces al examinar la tabla 9-7 se observa que el diseo
3, ^ tambin es un cuadrado grecolatino.
El escrito de Connor y Zelen [28] contiene una extensa seleccin de diseos para 4 < A: 10. Este escri
to se elabor para la National Bureau of Standards y es la tabla ms completa disponible de los planes S*"'.
En esta seccin se ha hecho notar en varias ocasiones la complejidad de las relaciones de los alias de
los diseos factoriales fraccionados 3*'^. En general, si k es moderadamente grande, por ejemplo /: > 4 o
5, el tamao del diseo 3^ llevar a muchos experimentadores a considerar fracciones bastante pequeas.
Desafortunadamente, estos diseos tienen relaciones de alias que incluyen alias parciales de componen
tes de interacciones con dos grados de libertad. Esto, a su vez, resulta en un diseo cuya interpretacin
ser difcil, si no imposible, si las interacciones no son insignificantes. Adems, no hay esquemas de au
mento simples (como el doblez) que puedan usarse para combinar dos o ms fracciones a fin de aislar las
interacciones significativas. El uso del diseo 3* suele sugerirse cuando hay curvatura presente. Sin em
bargo, hay alternativas ms eficientes (ver el captulo 11). Por estas razones, se puede concluir que los di
seos factoriales fraccionados 3*' son soluciones que causan problemas; no son, en general, buenos
diseos.

9-4

DISEO S FACTORIALES C O N NIVELES M IXTOS

Se han resaltado los diseos factoriales y factoriales fraccionados en los que todos los factores tienen el
mismo nmero de niveles. El sistema con dos niveles revisado en los captulos 6,7 y 8 es de particular utili
dad. El sistema de tres niveles presentado en este captulo es de utihdad mucho menor debido a que los
diseos son relativamente grandes incluso para un nmero modesto de factores, y la mayora de las frac
ciones pequeas tienen relaciones de alias complejas que requeriran supuestos muy restrictivos respecto
de las interacciones para ser tiles.
Estamos convencidos de que los diseos factoriales y factoriales fraccionados de dos niveles debern
ser la piedra angular de la experimentacin industrial para el desarrollo de productos y procesos, detec
cin de defectos y mejoramiento. Sin embargo, existen situaciones en las que es necesario incluir un fac
tor (o cilgunos factores) que tiene ms de dos niveles. Esto suele ocurrir cuando hay factores tanto
cuantitativos como cualitativos en el experimento, y el factor cualitativo tiene (por ejemplo) tres niveles.

CAPTULO 9

384

DISEOS FACTORIALES Y FACTORIALES FRACCIONADOS CON TRES NIVELES

Tabla 9-9

Uso de factores con dos niveles para formar


un factor con tres niveles

Factores con dos niveles


B

Factores con tres niveles

X2
+
+

Si todos los factores son cuantitativos, entonces debern usarse diseos de dos niveles con puntos centra
les. En esta seccin se indica cmo pueden incorporarse factores con tres y cuatro niveles en un diseo 2'.

9-4.1

Factores con dos y tres niveles

Los diseos en los que algunos factores tienen dos niveles y otros tres niveles pueden derivarse de la tabla
de signos positivos y negativos del diseo 2* usual. El procedimiento general se ilustra mejor con un ejem
plo. Suponga que se tienen dos variables, donde tiene dos niveles y X tres. Considere la tabla de signos
positivos y negativos del diseo 2^ usual con ocho corridas. Los signos de las columnas B y C tienen el pa
trn que se muestra en el lado izquierdo de la tabla 9-9. Sea que los niveles d e ^ estn representados por
x^,xi yx^. En el lado derecho de la tabla 9-9 se muestra cmo se combinan los patrones de los signos de 5 y
C para formar los niveles del factor con tres niveles.
Entonces el factor^ tiene dos grados de libertad, y si el factor es cuantitativo, es posible hacer su par
ticin en un componente lineal y uno cuadrtico, con cada componente teniendo un grado de libertad. En
la tabla 9-10 se muestra un diseo 2^ con las columnas rotuladas para indicar los efectos reales que esti
man, d o n d e yXQ denotan los efectos lineal y cuadrtico, respectivamente, d e X Observe que el efecto
lineal d s X es la suma de las estimaciones de los dos efectos calculadas a partir de las columnas asociadas
generalmente con 5 y C, y que el efecto d e^ slo puede calcularse a partir de las corridas dondeX est en
el nivel bajo o bien en el alto, es decir, las corridas 1,2, 7 y 8. D e manera similar, el efecto ^4 x X i es la
suma de los dos efectos que se habran calculado a partir de las columnas rotuladas generalmente
y

Tabla 9-10

Corrida
1
2
3
4
5
6
7
8

Un factor con dos niveles y un factor con tres niveles en un diseo 2^

A
A

Xl

AxX^

AB
+

AC
+

A
BC
+
-1-

ABC
-

+
-1-

+
+
-1+

+
+

-1-

+
+

-1+

Xq

+
+

Combinaciones de
tratamientos reales
A
X
Bajo
Bajo
Alto
Bajo
Intermedio
Bajo
Intermedio
Alto
Bajo
Intermedio
Alto
Intermedio
Bajo
Alto
Alto
Alto

M DISEOS FACTORIALES CON NIVELES MIXTOS

Tabb 9-11

385

Anlisis de varianza del diseo de la tabla 9-10___________

Fuente de
variacin

Suma de Grados de Cuadrado


cuadrados libertad
medio

A
X {X l + X q)
A X ( A x X ^ + A x X q)
Error (a partir de las corridas 3 y 5
y de las corridas 4 y 6)
'Ibtal

SSx
SSax
SS^

i
2
2
2

SSj

MSb
MSax
MSg

AC. Adems, observe que las corridas 3 y 5 son rplicas. Por lo tanto, puede hacerse una estimacin del
error con un grado de libertad del error utilizando estas dos corridas. D e manera similar, las corridas 4 y 6
son rplicas, y esto llevara a una segunda estimacin del error con un grado de libertad. La varianza pro
medio de estos dos pares de corridas podra usarse como cuadrado medio del error con dos grados de li
bertad. En la tabla 9-11 se resume el anlisis de varianza completo.
Si se est dispuesto a suponer que las interacciones de dos factores y de rdenes superiores son insig
nificantes, el diseo de la tabla 9-10 puede convertirse en una fraccin de resolucin III con hasta cuatro
factores con dos niveles y un solo factor con tres niveles. Esto se conseguira asociando los factores de dos
niveles con las columnas^, A B ,^ C y ABC. La colum na5C no puede usarse para un factor de dos niveles
porque contiene el efecto cuadrtico del factor X de tres niveles.
Puede aplicarse el mismo procedimiento en los diseos 2* de 16,32 y 64 corridas. Para 16 corridas es
posible construir factoriales fraccionados de resolucin V con dos factores de dos niveles y con dos o tres
factores de tres niveles. Tkmbin puede obtenerse una fraccin con 16 corridas de resolucin V con 3 fac
tores de dos niveles y un factor de tres niveles. Si se incluyen cuatro factores de dos niveles y un solo factor
de tres niveles en 16 corridas, el diseo ser de resolucin III. Los diseos de 32 y 64 corridas permiten
arreglos similares. Para un estudio adicional de algunos de estos diseos, ver Addleman [Ib].

9 '4.2

Factores con dos y cuatro niveles

Es muy sencillo incorporar un factor con cuatro niveles en un diseo 2'. El procedimiento para hacerlo
implica el uso de dos factores con dos niveles para representar el factor con cuatro niveles. Por ejemplo,
suponga q ue^ es un factor de cuatro niveles con los niveles aj,
Considere dos columnas de la ta
bla usual de signos positivos y negativos, por ejemplo las columnas P y Q .^ X patrn de los signos de estas
dos columnas se muestra en el lado izquierdo de la tabla 9-12. El lado derecho de esta tabla muestra cmo
estos cuatro patrones de signos corresponderan con los cuatro niveles del factor^. Los efectos represen-

labia 9-12

Corrida
1
2
3
4

El factor A con cuatro niveles expresado como dos


factores con dos niveles

Factores con dos niveles Factores con cuatro niveles


P
A
Q

+
+

1
2
3
4

1 I + I + + I

1 +

+ 1

1 + 1

1 +

I + + I + I

1 +

r<

OQ

l + l + l + l + i + i + i + i

386

9-3 PROBLEMAS

387

tados por las columnas P y Q y l a interaccin PQ son mutuamente ortogonales y corresponden al efecto de
A con tres grados de libertad.
Para ilustrar esta idea con mayor detalle, suponga que se tiene un factor de cuatro niveles y dos facto
res de dos niveles y que es necesario estimar todos los efectos principales y las interacciones en las que in
tervienen estos factores. Esto puede hacerse con un diseo de 16 corridas. En la tabla 9-13 se presenta la
tabla usual de signos positivos y negativos del diseo 2* con 16 corridas, donde las columnas^l y S se usan
para formar el factor de cuatro niveles, por ejemploX, con los nivelesjc^, j:2, JC3yJC4. Se calcularan las sumas
de cuadrados de cada columnav4,B, ...,ABCD exactamente igual que en el sistema 2* usual. Despus las
sumas de cuadrados de todos los factoresjT, C ,D y sus interacciones se forman de la manera siguiente:
= SS^ +SS + S S ^

(3 grados de libertad)

SS^ = SS(.

(1 grado de libertad)

55^ = SSj,

(1 grado de libertad)

SScD = SScD

(1 grado de libertad)
+S^Bc + S S ^ c

(3 grados de libertad)

S S ^ = S S ^ +SSso + S S ^ ^

(3 grados de libertad)

SS^CD = SS^CD + SS,CD + SS^CD (3 grados de libertad)


A este diseo podra llamrsele 4 x 2^. Si uno est dispuesto a ignorar las interacciones de dos factores,
pueden asociarse hasta nueve factores adicionales de dos niveles con la columna de la interaccin de dos
factores (excepto^ 5 ), la columna de la interaccin de tres factores y la columna de la interaccin de cua
tro factores.

9-5
9-1.

PROBLEMAS
Se estudian los efectos de la fuerza del revelador (A) y el tiempo de revelado (B) sobre la densidad de la pel
cula de placa fotogrfica. Se usan tres fuerzas y tres tiempos, y se corren cuatro rplicas de un experimento
factorial 3^. Los datos de este experimento se presentan a continuacin. Analizar los datos utilizando los m
todos estndares para experimentos factoriales.
Tiempo de revelado (minutos)
Fuerza del revelador
1
2
3

9-2.
9-3.

10
0
5
4
7
7
8

14
2
4
6
5
10
7

1
4
6
7
10
8

18
3
2
8
7
10
7

2
4
9
8
12
9

5
6
10
5
10
8

Calcular los componentes / y / de la interaccin de dos factores del problema 9-1.


Se llev a cabo un experimento para estudiar el efecto de tres tipos diferentes de botellas de 32 onzas (A) y
tres tipos diferentes de aparadores de venta (B) anaqueles permanentes lisos, aparadores al final del pasi
llo con anaqueles enrejados y refrigeradores para refrescos sobre el tiempo que toma acomodar diez cajas
de 12 botellas en los aparadores. Se usaron tres empleados (factor C) en el experimento, y se corrieron dos
rplicas de un diseo factorial 3^. Los datos del tiempo observado se muestran en la tabla siguiente. Analizar
los datos y sacar conclusiones.

388

CAPTULO 9

DISEOS FACTORIALES Y FACTORIALES FRACCIONADOS CON TRES NIVELES

Tipo de
botella
Permanente
Plstico
3.45
Vidrio de 28 mm
4.07
Vidrio de 38 mm
4.20
Plstico
4.80
Vidrio de 28 mm
4.52
Vidrio de 38 mm
4.96
Plstico
4.08
Vidrio de 28 mm
4.30
Vidrio de 38 mm
4.17

Empleado
1

9-4,

Un investigador mdico estudia el efecto de la lidocana sobre el nivel de enzimas en el msculo cardiaco de
perros beagle. En el experimento se usan tres marcas comerciales de lidocana (A), tres dosis (B) y tres perros
(C), y se corren dos rplicas de un diseo factorial 3. Los niveles de enzimas observados se presentan a conti
nuacin. Analizar los datos de este experimento.

Marca de
lidocana
1

9-5.
9-6.

Rplica I
Rplica II
Final del
Final del
pasillo Refrigerador Permanente pasillo Refrigerador
4.14
5.80
3.36
4.19
5.23
4.38
5.48
3.52
4.26
4.85
4,26
5.67
3.68
4.37
5.58
5.22
6.21
4.40
4.70
5.88
5.15
6.25
4.44
4.65
6.20
5.17
6.03
4.39
4.75
6.38
3.94
5.14
3,65
4.08
4.49
4,53
4.99
4.04
4.08
4.59
4.86
4.85
3.88
4.48
4.90

Fuerza de
la dosis
1
2
3
1
2
3
1
2
3

1
96
94
101
85
95
108
84
95
105

Rplica I

Rplica II

Perro
2

Perro
2

84
99
106
84
98
114
83
97
100

3
85
98
98
86
97
109
81
93
106

1
84
95
105
80
93
no
83
92
102

85
97
104
82
99
102
80
96
111

3
86
90
103
84
95
100
79
93
108

Calcular los componentes I y J de las interacciones de dos factores del ejemplo 10-1.
Se realiza un experimento en un proceso qumico utilizando un diseo factorial 3^. Los factores del diseo
son la temperatura y la presin, y la variable de respuesta es el rendimiento. Los datos que resultan de este
experimento se presentan a continuacin:

Ifemperatura, C
80
90
100

100
47.58, 48.77
51.86, 82.43
71.18, 92.77

Presin, psig
120
64.97, 69.22
88.47, 84.23
96.57, 88,72

140
80.92, 72.60
93.95, 88.54
76.58, 83.04

a) Analizar los datos de este experimento conduciendo un anlisis de varianza. Qu conclusiones pueden
sacarse?
b) Analizar grficamente los residuales. Hay algtin motivo de preocupacin respecto de los supuestos sub
yacentes o de la adecuacin del modelo?

9-5 PROBLEMAS

389

c) Verificar que si se hace que los niveles bajo, intermedio y alto de ambos factores de este diseo asuman
los niveles - 1,0 y + 1, entonces un ajuste de mnimos cuadrados de un modelo de segundo orden del ren
dimiento es
>= 86.81 +10.4;ci + 8.42a;, - l . l l x l - 7.86a:,' - l.(>9x,x^
d) Confirmar que e) modelo del inciso c puede escribirse en trminos de las variables naturales la tempe
ratura (7^ y la presin (P) como
5>=-1335.63+18.56r-l-8.59P-0.072r" -0.0196/" ' -0.0384T P

9-1.

9-8.
9-9.

9-10.
9-11.
9-12.
9-13.
9-14.
9-15.
9-16.
9-17.
9-18,
9-19.
9-20.

9-21.

9-22.

) Construir una grfica de contorno del rendimiento como una funcin de la presin y la temperatura.
Con base en el examen de esta grfica, dnde se recomendara operar este proceso?
a) Confundir un diseo 3 en tres bloques utilizando el componentej4BC^ de la interaccin de tres factores.
Comparar los resultados obtenidos con el diseo de la figura 9-7.
b) Confundir un diseo 3^ en tres bloques utilizando el componente
de la interaccin de tres factores.
Comparar los resultados con el diseo de la figura 9-7.
c) Confundir un diseo 3^ en tres bloques utilizando el componentej4BC de la interaccin de tres factores.
Comparar los resultados obtenidos con el diseo de la figura 9-7.
d) Despus de observar los diseos de los incisos a, b y c y la figura 9-7, qu conclusiones pueden sacarse?
Confundir un diseo 3* en tres bloques utilizando el componentej4B^Ci) de la interaccin de cuatro factores.
Considere los datos de la primera rplica del problema 9-3. Suponiendo que no fue posible hacer las 27 ob
servaciones el mismo da, establecer un diseo para conducir el experimento en tres das conAB^C confundi
da con los bloques. Analizar los datos.
Delinear la tabla del anlisis de varianza del diseo 3'*en nueve bloques. Se trata de un diseo prctico?
Considere los datos del problema 9-3. Sj45C est confundida en la rpUca I y ABO- est confundida en la r
plica II, realizar el anlisis de varianza.
Considere los datos de la rplica I del problema 9-3. Suponga que slo se corre una fraccin un tercio de este
diseo con I = ABC. Construir el diseo, determinar la estructura de los alias y analizar los datos.
Por el examen de la figura 9-9, qu tipo de diseo quedara si despus de completar las nueve primeras co
rridas pudiera ehminarse uno de los tres factores?
Construir un diseo 3j^ con / = ABCD. Escribir la estructura de los alias de este diseo.
Verificar que el diseo del problema 9-14 es un diseo de resolucin IV.
Construir un diseo 3^-^con/ ABC e / = CDE. Escribir la estructura de los alias de este diseo. Cul es la
resolucin de este diseo?
Construir un diseo 3- y verificar que es un diseo de resolucin III.
Construir un diseo 4 x 2 ^ confundido en dos bloques con 16 observaciones cada uno. Delinear el anlisis de
varianza de este diseo.
Delinear la tabla del anlisis de varianza de un diseo factorial 2^3^. Comentar la manera en que este diseo
puede confundirse en bloques.
Empezando con un diseo 2* de 16 corridas, indicar cmo pueden incorporarse dos factores de tres niveles
en este experimento. Cuntos factores de dos niveles pueden incluirse si se quiere cierta informacin sobre
las interacciones de dos factores?
Empezando con un diseo 2'* de 16 corridas, indicar cmo pueden incorporarse un factor con tres niveles y
tres factores con dos niveles, de tal modo que siga siendo posible la estimacin de las interacciones de dos
factores.
En el problema 8-26 el lector conoci a Harry y Judy Peterson-Nedry, dos amigos del autor que son propieta
rios de un viedo y una fbrica vincola en Newberg, Oregon. En ese problema se describi la aplicacin de
diseos factoriales fraccionados de dos niveles en su producto Pinot Noir 1985. En 1987 quisieron conducir
otro experimento Pinot Noir. Las variables de este experimento fueron

390

CAPTULO 9

DISEOS FACTORIALES Y FACTORL^LES FRACCIONADOS CON TRES NIVELES

Variable
Niveles
Clon de Pinot Noir
Wadenswil, Pommard
T ^ao de la uva
Pequeo, grande
Ifemperatura de fermentacin 80F, 85F, 90/80-F, 90"?
Uva completa
Ninguno, 10%
Tiempo de maceracin
10 das, 21 das
Tipo de levadura
Assmanhau, Champagne
Tipo de roble
H-ongais, AUier

Harry y Judy decidieron usar un diseo factorial fraccionado de dos niveles con 16 corridas, tratando los cua*
tro niveles de la temperatura de fermentacin como dos variables de dos niveles. Como en el problema 8-26,
utilizaron las calificaciones de un panel de catadores como variable de respuesta. El diseo y las calificacio
nes promedio resultantes se presentan enseguida:
Corrida Clon
1
2
-13
4
+
5
6
-17
8
+
9
10
+
11
12
-t13
14
+
15
16
+

9-23.

Ikmao
de la uva
-1+
+
+
-1+
-

-1-1-,

Tfcmperatura de
Uva
Tiempo de
fermentacin completa maceracin
-1+
+
+
+
+
-1
+
+
-1+
+
-1+
-1-1+
-1-1-H

-t-1
-1+
-1
+
+
+
+
H-1-

Tipo de
levadura

Tipo de
roble

-1+
-1

+
-1-

+
+

-t+

-1-

+
+

Califcacin
promedio
4
10
6
9

11
1
15
5
12
2
16
3

-1-

14
7
13

a) Describir los alias de este diseo.


b) Analizar los datos y sacar conclusiones.
c) Qu comparaciones pueden hacerse entre este experimento y el experimento del Pinot Noir 1985 del
problema 8-26?
En un artculo de W.D. Baten publicado en el volumen de 1956 de Industrial Quality Control se describe un
experimento para estudiar el efecto de tres factores sobre la longitud de unas barras de acero. Cada barra se
someti a uno de dos procesos de tratamiento trmico y se cort en una de cuatro mquinas en una de tres
horas durante el da (8 a.m., 11 a.m, o 3 p.m.). Los datos de la longitud codificada son los siguientes:
Hora del
da

11
8 a.m.

Mquina

Proceso de
tratamiento trmico

1
6
1
4
0

2
9
3
6
1

7
5
6
3

3
9
5
5
4

1
0
-1
0

4
2
4
0
1

6
7
4
5

6
3
5
4

9-5 PROBLEMAS

Hora del
da

Proceso de
tratamiento trmico

-------------------------- Mquina
1
2
6
1

11 a.m.

3 p.m.

391

3
1

8
4

7
8

2
1

7
11

9
6

3
1
1 - 2

6
1

4
2
0
3 - 1 1

9
6

4
3

5
9
6
3

10
6

11
-1
2
4
6
1
7 0
-2
0 4 - 4

10
4
4
7

5
8
3
O

4
6
0
7

8
10

a) Analizar los datos de este experimento suponiendo que las cuatro observaciones de cada celda son rpli
cas.
b) Analizar los residuales de este experimento. Existe algn indicio de que hay un punto atpico en una de
las celdas? Si se encuentra un punto atpico, eliminarlo y repetir el anlisis del inciso a. A qu conclusio
nes se llega?
c) Suponga que las observaciones de las celdas son las longitudes (codificadas) de barras que se procesaron
conjuntamente en el tratamiento trmico y despus se cortaron secuencialmente (es decir, en orden) en
las cuatro mquinas. Analizar los datos y determinar los efectos de los tres factores sobre la longitud pro
medio.
d) Calcular la varianza logartmica de las observaciones de cada celda. Analizar esta respuesta. Qu con
clusiones pueden sacarse?
e) Suponga que la hora en que se corta una barra en realidad no puede controlarse durante la produccin
rutinaria. Analizar la longitud promedio y la varianza logantmica de la longitud de cada una de las 12 ba
rras cortadas en cada combinacin mquina/proceso de tratamiento trmico, Qu conclusiones pueden
sacarse?

Ajuste de
modelos de
regresin

10-1

IN T R O D U C C I N

En muchos problemas hay dos o ms variables relacionadas, y el inters se centra en modelar y explorar
esta relacin. Por ejemplo, en un proceso qumico el rendimiento del producto est relacionado con la
temperatura de operacin. Quiz el ingeniero qumico quiera construir un modelo que relacione el rendi
miento con la temperatura para usarlo despus como herramienta de prediccin o bien de optimizacin o
control del proceso.
En general, suponga que hay una sola variable dependiente o de respuesta y que depende de k varia
bles independientes o regresores, por ejemplo, a:i,Xj,
La relacin que existe entre estas variables se
caracteriza por un modelo matemtico llamado modelo de regresin. Dicho modelo se ajusta a un con
junto de datos mustrales. En ocasiones el experimentador conoce la forma exacta de la verdadera rela
cin funcional entrey y
por ejemploy = (>(x-^,x2,
Sin embargo, en la mayora dlos casos
no se conoce la verdadera relacin funcional, y el experimentador elige una funcin apropiada para apro
ximar (p. Los modelos polinomiales de orden inferior son de uso generalizado como funciones de aproxi
macin.
Existe una fuerte relacin recproca entre el diseo de experimentos y el anlisis de regresin. A lo
largo de este libro se ha destacado la importancia de expresar cuantitativamente los resultados de un ex
perimento, en trminos del modelo emprico, a fin de facilitar su comprensin, interpretacin e implementacin. Los modelos de regresin constituyen la base para conseguirlo. Se ha presentado en mltiples
ocasiones el modelo de regresin que representaba los resultados de un experimento. En este captulo se
presentan algunos aspectos del ajuste de estos modelos. Presentaciones ms completas de la regresin se
encuentran en Montgomery y Peck [82] y Myers [84].
Los mtodos de regresin se utilizan con frecuencia para analizar datos de experimentos no planea
dos, como podra ser el caso de la observacin de fenmenos no controlados o de registros histricos. Los
mtodos de regresin tambin son muy tiles en experimentos diseados cuando algo sali mal. En
este captulo se ilustran algunas de estas situaciones.
392

10-2 MODELOS DE REGRESIN UNEAL

10-2

393

MODELOS DE REGRESIN LINEAL

La atencin se centrar en el ajuste de modelos de regresin lineal. Para ilustrar, suponga que quiere de
sarrollarse un modelo emprico que relacione la viscosidad de un polmero con la temperatura y la veloci
dad de alimentacin del catalizador. Un modelo que podra describir esta relacin es
+

(10-1)

donde y representa la viscosidad, jc, la temperatura y Xj la velocidad de alimentacin del catalizador. Se


trata de un modelo de regresin lineal mltiple con dos variables independientes. Es comn llamar a las
variables independientes variables predictoras o regresores (variables de regresin). Se utiliza el trmi
no lineal porque la ecuacin 10-1 es una funcin lineal de los parmetros desconocidos /3o, y ^ 2- El mo
delo describe un plano en el espacio bidimensionalA:i,A:2. El parmetro/3q define la interseccin del plano
con el eje de las ordenadas. En ocasiones y ^2 se denominan los coeficientes de regresin parcial, porque
mide el cambio esperado en y para cada cambio unitario dcA^i cuando jcj se mantiene constante, y 32
mide el cambio esperado en y para cada cambio unitario de
cuando
se mantiene constante.
En general, la variable de respuesta y puede relacionarse con k regresores. Al modelo
3^=/?o+/5 i^i +^2^2 + - - + ^ A +

(10-2)

se le llama modelo de regresin lineal mltiple con k regresores. A los parmetros


= 0 , 1,..., k se les lla
ma los coeficientes de regresin. Este modelo describe un hiperplano en el espacio de k dimensiones de los
regresores {xy}. El parmetro representa el cambio esperado en la respuesta y para un cambio unitario
en Xj cuando las variables independientes restantes x (i ^ j) se mantienen constantes.
Con frecuencia los modelos cuya apariencia es ms compleja que la ecuacin 10-2 pueden tambin
analizarse mediante tcnicas de regresin lineal mltiple. Por ejemplo, considere la incorporacin de un
trmino de interaccin en el modelo de primer orden en dos variables, por ejemplo

y = Po +^
Si se hace x = x ^ 2 y

^3

1^1

+P 12X1 X2 +e

(10-3)

entonces la ecuacin 10-3 puede escribirse como

y=

(10-4)

que es un modelo de regresin lineal mltiple estndar con tres regresores. Recuerde que en algunos
ejemplos de los captulos 6,7 y 8 se presentaron varios modelos empricos similares a las ecuaciones 10-2 y
10-4 para expresar cuantitativamente los resultados de un diseo factorial de dos niveles. Como otro
ejemplo, considere el modelo de superficie de respuesta de segundo orden en dos variables:
y=
Si se hace:c3 = x^,x^ = x l,x ^ = x ^ 2,^z =
y=

+ ^ 2^ 2 "*"^11^1
= ^ 22 yPs =

^ 22^2

(10-5)

entonces esta expresin queda como

+ ^ 2^2 "^^3^3 *^4^4 "*"^5^5

(10-6)

que es un modelo de regresin lineal. Este modelo se ha visto tambin en ejemplos anteriores de este li
bro. En general, cualquier modelo de regresin que es lineal en los parmetros (los valores y3) es un mode
lo de regresin lineal, independientemente de la forma de la superficie de respuesta que genera.
En este captulo se resumirn los mtodos para estimar los parmetros de los modelos de regresin li
neal mltiple. A este procedimiento suele llamrsele el ajuste del modelo. Se analizarn tambin los m
todos para probar hiptesis y para construir intervalos de confianza para estos modelos, as como para

394

CAPTULO 10 AJUSTE DE MODELOS DE REGRESIN

verificar la adecuacin del ajuste del modelo. La atencin se centra en los aspectos del anlisis de regre
sin que son tiles en los experimentos diseados. Para presentaciones ms completas de la regresin, re
ferirse a Montgomery y Peck [82] y Myers [84].

10-3

ESTIM ACIN DE LOS PARM ETROS EN MODELOS


DE REGRESIN LINEAL

El mtodo de mnimos cuadrados se usa de manera tpica para estimar los coeficientes de regresin de un
modelo de regresin lineal mltiple. Suponga que se cuenta con/i > k observaciones de la variable de res
puesta, por ejemplo,y 1,^2, ,yn- Junto con cada respuesta observada}^, se tendr una observacin de cada
uno de los regresores, y sea que a:,j denote la observacin o nivel -simo de la variable Jty. Los datos apare
cern como en la tabla 10-1. Se supone que el trmino del error e del modelo tiene E{e) = Oy V { e ) = ( / y
que las {,} son variables aleatorias no correlacionadas.
La ecuacin del modelo (ecuacin 10-2) puede escribirse en trminos de las observaciones de la tabla
10-1 como
*
~ ^0

(10-7)
Pj^ij "*"^

i 1, 2,

j=i
El mtodo de mnimos cuadrados consiste en elegir las/3 de la ecuacin 10-7 de tal modo que la suma de
cuadrados de los errores, e , se minimice. La funcin de mnimos cuadrados es
n
= l

ni

( 10-8)

= 2

j=i

La funcin L debe rninimizarse con respecto a /9q,


ejemplo
deben satisfacer

Los estimadores de mnimos cuadrados, por

dL
=-2 2

= 0

(10-9a)

y = l, 2,..., A:

(10-9b)

;=1

dL

JC,.,. = 0
M-

..
Tabla 10-1

Datos de una regresin lineal mltiple

X2

3'
^11
^21
yn

X22

^2k

10-3 ESTIMACIN DE LOS PARMETROS EN MODELOS DE REGRESIN UNEAL

395

Al simplificar la ecuacin 10-9, se obtiene


n

1=1

2
is l

S
(=1

i- l
rt

1=1

-i

ni

i= i

= i

'* ^ 2 2
1=1

1=1

3-,

(1 0 -1 0 )

i l *^2 2
1=1

/-I

1=1

Estas ecuaciones se denominan ecuaciones normales de mnimos cuadrados. Observe que hayp = k - l
ecuaciones normales, una para cada uno de los coeficientes de regresin desconocidos. La solucin de las
ecuaciones normales sern los estimadores de mnimos cuadrados de los coeficientes de regresin
^0

PkEs ms sencillo resolver las ecuaciones normales si se expresan en la notacin matricial. A continua
cin se presenta el desarrollo matricial de las ecuaciones normales que es anlogo al desarrollo de la
ecuacin 10-10. El modelo en trminos de las observaciones, ecuacin 10-7, puede escribirse en notacin
matricial como
y = X ^ -H e

donde
> i'

x=

y=
yn.

1 :c11 ^12
1

Xn2

Cl'
P=

)8i

e=

A .

En general, y es un vector (n x 1) de las observaciones, X es una matriz (w x p ) de los niveles de las varia
bles independientes,^ es un vector (p x 1) de los coeficientes de regresin, y e es un vector ( x 1) de los
errores aleatorios.
Quiere encontrarse el vector de los estimadores de mnimos cuadrados, ^ que minimice
/I

e ? = 'e = ( y - x ^ ) ' ( y - x / J )
Observe que L puede expresarse como
L = y y ~ 0 X ' y - y ' ^ + f i ' X ' l S 0

( 10- 11)

= y'y-2fi'X 'y+ fi'X 'lfi


ya que/?'X'y es una matriz (1 x 1), o un escalar, y su transpuesta (fiX'y)' = y'Xfi es el mismo escalar. Los
estimadores de mnimos cuadrados deben satisfacer

396

CAPTULO 10 AJUSTE DE MODELOS DE REGRESIN

dL

= - 2 X ' y + 2 X '1 0 = O

cuya simplificacin es

X'-}0=X'y

(10-12)

La ecuacin 10-12 es la forma matricial de las ecuaciones normales de mnimos cuadrados. Es idntica a
la ecuacin 10-10. Para resolver las ecuaciones normales, ambos miembros de la ecuacin 10-12 se multi
plican por la inversa de X'X. Por lo tanto, el estimador de mnimos cuadrados de es
^=(X'X)->X'y
(10-13)
Es sencillo ver que la forma matricial de las ecuaciones normales es idntica a la forma escalar. Al de
sarrollar en detalle la ecuacin 10-12, se obtiene
n

n
A l
n
i
'
Xn
i =l
/-I

=1 ^

i
i=l
n

1=1

4 I

XaX2

i =l

S
i=L

4
i =l

1
= l
n

A .

_=i

Si se efecta la multiplicacin matricial indicada, se obtendr la forma escalar de las ecuaciones normales
(es decir, la ecuacin 10-10). En esta forma es sencillo ver que X'X es una matriz simtrica ( p x p ) y que
X'y es un vector columna (p X 1). Observe la estructura especial de la matriz X'X. Los elementos de la
diagonal de X'X son las sumas de cuadrados de los elementos de las columnas de X, y los elementos que
no estn en la diagonal son las sumas de los productos cruzados de los elementos de las columnas de X.
Adems, observe que los elementos de X'y son las sumas de los productos cruzados de las columnas de Xy
las observaciones {y,}.
El modelo de regresin ajustado es
y=X^
(10-14)
En notacin escalar, el modelo ajustado es
i = ,2 ,...,n
i= l

La diferencia entre la observacin real y, y el valor ajustado correspondiente


e. = y. - y .. El vector (n x 1) de los residuales se denota por
e = y - y

es el residual, es decir,
(10-15)

Estimacin de
Por lo general tambin es necesario estimar
Para desarrollar un estimador de este parmetro, conside
re la suma de cuadrados de los residuales, por ejemplo

-1
n
=l
= e^e

10-3 ESTIMACIN DE LOS PARMETROS EN MODELOS DE REGRESIN LINEAL

Al sustituir e = y - y = y -

397

se tiene
S S ,= {y -^ iy -K ^

= y'y-P X'y-y'Jfi+p'X'10
= y'y-2fi'X'y+p'X10
Puesto que X'X^= X'y, esta ltima ecuacin queda como
S S ^ = y ' y - f i 'X ' y

(10-16)

A la ecuacin 10-16 se le llama la suma de cuadrados residual o del error, y tiene n - p grados de libertad
asociados con ella. Puede demostrarse que
E (S S ,) = a \ n - p )
por lo que un estimador insesgado de ( / est dado por
2

SS,
= n -p

(10-17)

Propiedades de los estimadores


El mtodo de mnimos cuadrados produce un estimador insesgado del parmetro del modelo de regre
sin lineal. Esto puede demostrarse fcilmente tomando el valor esperado de de la siguiente manera:
E ( 0 ) = [(X 'X )- X'y]
= [(X 'X )-( V + ) ]
= [(X 'X )-^X 'I^4<X 'X )- X'e]
=0
ya que E( e) = O y (X'X)"'X'X = I. Por lo tanto, fi es un estimador insesgado de p.
La propiedad de la varianza de

se expresa en la matriz de covarianza:

CxMfi) ^

e{[P

- ( ^ ) ] [ 3 - (^ )]'}

(10-18)

que es una matriz simtrica cuyo elemento t-simo de la diagonal principal es la varianza del coeficiente
de regresin individual
cuyo elemento (y)-simo es la covarianza entre
y
La matriz de cova
rianza de P es
C m (p ) = a \ X ' X ) - ^

(10-19)

T E M PL O 10-1 .............................................................................................................................................
En la tabla 10-2 se muestran 16 observaciones de la viscosidad de un polmero (y) y dos variables del pro
ceso: la temperatura de reaccin (xj) y la velocidad de alimentacin del catalizador (r^). Se ajustar el mo
delo de regresin lineal mltiple
y=

398

CAPTULO 10 AJUSTE DE MODELOS DE REGRESIN

10-2

Datos de la viscosidad del ejemplo 10-1 (viscosidad en


centistokes @ 100C)

Velocidad de alimentacin
del catalizador (x^, Ib/h) Viscosidad
2256
8
2340
9
10
2426
2293
12
11
2330
2368
8
2250
8
10
2409
2364
12
2379
11
2440
13
11
2364
8
2404
12
2317
9
2309
12
2328

Tfcmperatura
Observacin
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

80
93
100
82
90
99
81
96
94
93
97
95
100
85
86
87

a estos datos. La matriz X y el vector y son

'1 80 8 '
1 93 9
1 100 10
1 82 12
1 90 11
1 99 8
1 81 8
1 96 10
X=
1 94 12
1 93 11
1 97 13
1 95 11
1 100 8
1 85 12
1 86 9
1 87 12

"2256 '
2340
2426
2293
2330
2368
2250
2409
y = 2364
2379
2440
2364
2404
2317
2309
2328

La matriz X'X es

80 93
8 9

87
12

1
XX =

1
1

80
93

8
9

87 12

10-3 ESTIMACIN DE LOS PARMETROS EN MODELOS DE REGRESIN LINEAL

16
1458
164

399

1458
164
133^560 14,946
14,946 1,726

y el vector X'y es
1

X'y= 80 93
8 9

87
12

2256
2340
2328

37,577'
3^429,550
385^562
La estimacin de mnimos cuadrados de p es
^ = (X 'X )-X'y

14.176004 -0.129746
-0.223453
-0.129746
1.429184x10 ^ -4.763947x10 ^
-0.223453 -4.763947x10,-5
2222381x10 - 2

37,577
3^429,550
385^562

1566.07777
7.62129
8.58485

El ajuste de mnimos cuadrados, con los coeficientes de regresin expresados con dos cifras decimales, es
Tabla 10-3 Valores predichos, residuales y otros diagnsticos del ejemplo 10-1
Observacin
Valor predicho Residual
i
yi
hu
.c,
1
2256
2244.5
11.5
0.350
2
2340
2352.1
-12.1
0.102
3
2426
2414.1
11.9
0.177
4
2293
2294.0
-1.0
0.251
5
2346.4
2330
-16.4
0.077
6
2368
2389.3
-21.3
0.265
7
2250
2252.1
-2.1
0.319
8
2409
2383.6
25.4
0.098
9
2364
2385.5
-21.5
0.142
10
2379
2369.3
9.7
0.080
11
2440
2416.9
23.1
0.278
12
2364
2384.5
-20.5
0.0%
13
2404
2396.9
7.1
0.289
14
2317
2316.9
0,1
0.185
15
2309
2298.8
10.2
0.134
16
2328
2332.1
-4.1
0.156

Residual
studentizado
0.87
-0.78
0.80
-0.07
-1.05
-1.52
-0.15
1.64
-1.42
0.62
1.66
-1.32
0.52
0.01
0.67
-0.28

A
0.137
0.023
0.046
0.001
0.030
0.277
0.004
0.097
0.111
0.011
0.354
0.062
0.036
0.000
0.023
0.005

^-student
0.87
-0.77
0.79
-0.07
-1.05
-1.61
-0.15
1.76
-1.48
0.60
1.80
-1.36
0.50
<0.01
0.66
-0.27

402

CAPTULO 10 AJUSTE DE MODELOS DE REGRESIN

labia 10-4

Salida de Minitab para el modelo de regresin de la viscosidad, ejemplo 10-1

Anlisis de regresin

The r e g r e s s i o n e q u a t l o n i s
V i s c o s i t y = 1 5 6 6 + 7 . 6 2 Temp + 8 . 5 8

Analysis

of

P
0.000
0.000
0.004
= 91. 6%

Variance
F
82.50

ns
22079
268

SS
44157
3479
47636

t>F
2
13
15

Source
Regression
R e s i d u a l Error
Total

Seq SS
40841
3316

DF
1
1

Source
Temp
Fe e d Rat

R-Sq(adj)

R- Sq = 92. 7%

S = 16.36

T
25.43
12.32
3.52

StDev
61 . 5 9
0.618A
2.439

Co e f
1566.08
7.6213
8.585

Predictor
Constant
Temp
Fe e d Rat

Fee d R a t e

57

Variables codificadas

VarlabIsE del procesa


Corrida Tamparatura ('C) Presin (pslgl
1
2
4
5
6
7
B
9
10
11
12

40

120
160
120
160
120
160
120
160
140
140
140
140

40
eo
80
40
40
SO
80
60
60
60
60
Tsmpeiatura -1 4 0

^ ------------- i

Figura 10-5

------

n0nuiniiiiiu/
y

Concentracin (g/l)
15
15
15
15
30
30
30
30
22.5
22.B
22.6

-1
1
-1
1
-1
1
-1
1
0
0
0

22.5

Pn3in-60
20

-1

-1

-1
1
1
-1
-1
1

-1
-1
-1
1
1
1

1
0
0
0
0

1
0
0
0

Concentracin-225
I
7.5

Diseo experimental del ejemplo 10-2.

32
46
57
65
36
48
67
68
50
44
53
56

P
0.000

10-3 ESTIMACIN DE LOS PARMETROS EN MODELOS DE REGRESIN LINEAL

403

Ajuste de modelos de regresin en experimentos diseados


Se ha usado con frecuencia un modelo de regresin para presentar los resultados de un experimento dise
ado en una forma cuantitativa. Se ofrece ahora un ejemplo completo donde se indica cmo se hace esto.
Se presentan enseguida otros tres ejemplos breves que ilustran otras aplicaciones tiles del anlisis de re
gresin en los experimentos diseados.

EJEMPLO 1 0 - 2 ................. .............................................................................................................................


Anlisis de regresin de un diseo factorial 2^
Un ingeniero qumico est investigando el rendimiento de un proceso. Tires de las variables del proceso
son de inters: la temperatura, la presin y la concentracin del catalizador. Cada variable puede correrse
en un nivel bajo y uno alto, y el ingeniero decide correr un diseo 2^ con cuatro puntos centrales. En la fi
gura 10-5 se muestra el diseo y los rendimientos resultantes, donde se presentan tanto los niveles natura
les del diseo como la notacin de variables codificadas + 1 ,-1 que se utiliza normalmente en los diseos
factoriales 2^ para representar los niveles de los factores.
Suponga que el ingeniero decide ajustar un modelo que slo incluye los efectos principales, por ejemplo
y=
Para este modelo, la matriz X y el vector y son

"1
1
1
1
1
1
X=
1
1
1
1
1
1

-1
-1
1
1
-1
1
1
1
0
0
0
0

-1
1
-1
1
-1
1
1
1
0
0
0
0

32
46
57
65
36
48
y= 57
68
50
44
53
56

-1'
-1
-1
-1
1
1
1
1
0
0
0
0

Es sencillo demostrar que


12 0 0 0"
0 8 0 0
XX =
0 0 8 0
0 0 0 8

612
45
X y = 85
9

Puesto que X'X es diagonal, el inverso que se requiere tambin es diagonal, y las estimaciones de mnimos
cuadrados de los coeficientes de regresin son
^=(X'X)-^X'y =

1/12

1 /8

O
O

0' '612'

O
O
0 1 /8
O
O
0 1 /8

45
85
9

El modelo de regresin ajustado es


y = 51.000 + 5.625;ci +lQ.e25x^ +\125x^

51.000'
5.625
10.625
1.125

404

CAPTULO 10 AJUSTE DE MODELOS DE REGRESIN

Como se ha hecho uso de ellos en muchas ocasiones, los coeficientes de regresin guardan una estre
cha relacin con las estimaciones de los efectos que se obtendran por el anlisis usual de un diseo 2^. Por
ejemplo, el efecto de la temperatura es (referirse a la figura 10-5)
r = -y ,.-y ,= 56.75-45.50
= 11.25
Observe que el coeficiente de regresin de

es

(11.25)/2 -5 .6 2 5
Es decir, el coeficiente de regresin es exactamente la mitad de la estimacin usual del efecto. Esto siem
pre se cumplir para un diseo 2*^. Como se seal antes, en los captulos 6 al 8 se emple este resultado
para producir modelos de regresin, valores ajustados y residuales en varios experimentos de dos niveles.
Este ejemplo demuestra que las estimaciones de los efectos de un diseo 2* son estimaciones de mnimos
cuadrados.

En el ejemplo 10-2 es sencillo obtener la matriz inversa porque X'X es diagonal. Intuitivamente, esto
parece ofrecer ventajas, no slo porque los clculos se simplifican sino tambin porque los estimadores de
todos los coeficientes de regresin no estn correlacionados, es decir, Cav0i, ^) = 0. Si los niveles de las
variables x pueden elegirse antes de recabar los datos, quiz sea deseable disear el experimento de tal
modo que resulte una X'X diagonal.
En la prctica puede ser relativamente sencillo conseguir esto. Se sabe que los elementos de X'X que
estn fuera de la diagonal son las sumas de los productos cruzados de las columnas en X. Por lo tanto, es
necesario hacer que el producto interior de las columnas de X sean iguales a cero; es decir, estas columnas
deben ser ortogonales. A los diseos experimentales que poseen esta propiedad para ajustar un modelo
de regresin se les llama diseos ortogonales. En general, el diseo factorial 2* es un diseo ortogonal
para ajustar el modelo de regresin lineal mltiple.
Los mtodos de regresin son en extremo tiles cuando algo sale mal en un experimento diseado.
Esto se ilustra en los dos ejemplos siguientes.

EJEMPLO 1 0 - 3 ...............................................................................................................................................
Un diseo factorial 2^ con una observacin fallante
Considere el diseo factorial 2^ con cuatro puntos centrales del ejemplo 10-2. Suponga que cuando se rea
liz este experimento, falt la corrida con todas las variables en el nivel alto (la corrida 8 de la figura 10-5).
Esto puede ocurrir por varias razones; el sistema de medicin puede producir una lectura incorrecta, la
combinacin de los niveles de los factores quiz no sea la apropiada, la unidad experimental puede estar
daada, etctera.
Se ajustar el modelo de los efectos principales
y=
utilizando las 11 observaciones restantes. La matriz X y el vector y son

10-3 ESTIMACIN DE LOS PARMETROS EN MODELOS DE REGRESIN LINEAL

'1
1
1
1
1
1
X=
1
1
1
1
1

1
1
1
1
1
1
-1
0
0
0
0

1
-1
1
1
1
-1
1
0
0
0
0

-1'
-1
-1
1
1
1
1
0
0
0
0

405

' 32
46
57
65
36
y= 48
57
50
44
53
56

Para estimar los parmetros del modelo se forman


11

-1

-1 7 -1
X'X=
-1
-1
-1
-1

_1

_1

7
-1

-1
-1 X y =
7

544
-2 3
17
-5 9

y entonces

^ = (X 'X )-'X 'y


9.61538X10-" 1.92307X10'"
_ 1.92307x10-" 0.15385
1.92307x10" 2.88462x10''
1.92307x10" 2.88462x10'"

1.92307X10"
2.88462x10"
0.15385
2.88462x10-"

1.92307x10"
2.88462x10"
2.88462X10"
0.15385

'544'
-23
17
-59

'51.251
5.75
10.75
1.25
Por lo tanto, el modelo ajustado es
y = 5.25+5J5x^ +10.75^:^ +1.25jc3
Compare este modelo con el que se obtuvo en el ejemplo 10-2, donde se usaron las 12 observaciones. Los
coeficientes de regresin son muy similares. Debido a la estrecha relacin entre los coeficientes de regre
sin y los efectos de los factores, las conclusiones no sufriran una alteracin sustancial por la observacin
faltante. Sin embargo, observe que las estimaciones de los efectos han dejado de ser ortogonales, ya que
(X'X) y su inversa ya no son diagonales.

EJEMPLO 1 0 - 4 ...............................................................................................................................................
Niveles imprecisos de los factores del diseo
Cuando se corre un experimento diseado, en ocasiones es difcil alcanzar y mantener los niveles preci
sos de los factores requeridos por el diseo. Las discrepancias pequeas no son importantes, pero las
grandes son motivo de preocupacin potencial. Los mtodos de regresin son tiles en el anlisis de un

406

CAPTULO 10 AJUSTE DE MODELOS DE REGRESIN

Tabla 10'5

Corrida
1

2
3
4
5
6
7
8

9
10
11
12

Diseo experimental del ejemplo 10-4

Variables del proceso


Ifemperatura
Presin
Concentracin
(X )
(psig)
(g/l)
125
41
14
158
40
15
121
82
15
160
80
15
118
39
33
163
40
30
122
80
30
165
83
30
140
60
22.5
140
60
22.5
140
60
22.5
140
60
22.5

Variables codificadas
Rendimiento
y

-0.75
0.90
-0.95
1
-1.10
1.15
-0.90
1.25
0
0
0
0

-0.95
-1
1.1
1
-1.05
-1
1
1.15
0
0
0
0

-1.133
1
-1
-1
1.14
1
1
1
0
0
0
0

32
46
57
65
36
48
57
68
50
44
53
56

experimento diseado cuando el experimentador no ha podido obtener los niveles requeridos de los
factores.
Para ilustrar, el experimento de la tabla 10-5 presenta una variacin del diseo 2^ del ejemplo 10-2,
donde muchas de las combinaciones de prueba no son exactamente las que se especifican en el diseo.
Las dificultades parecen haber ocurrido sobre todo con la variable temperatura.
Se ajustar el modelo de los efectos principales
y Pf

+^2^2

La matriz X y el vector y son


1
1
1
1
1
1
X=
1
1
1
1
1
1

-0.75
0.90
-0.95
1
-1.10
1.15
-0.90
1.25
0
0
0
0

-0.95
-1
1.1
1
-1.05
-1
1
1.15
0
0
0
0

-1.133
1
1
1.4
1
1
1
0
0
0
0

'32
46
57
65
36
48
y = 57
68
50
44
53
56

Para estimar los parmetros del modelo se necesitan


ri2
0.60
XX =
0.25
0.2670

0.60
0.25
8.18
0.31
0.31
8.5375
-0.1403 -0.3437

0.2670'
-0.1403
-0.3437
9.2437

_
XVL,
y=

[612
]
77.55
161.50
19.144

10-3 ESTIMACIN DE LOS PARMETROS EN MODELOS DE REGRESIN LINEAL

407

Entonces
^ = (X 'X )-'X 'y
' & 37447xl0^
-6.09871 X10^
-2 .3 3 5 4 2 x 1 0 ^
-2 .5 9 8 3 3 x 1 0

-6.09871x10
0.12289
-4 .2 0 7 6 6 x 1 0 '
1.88490x10

-2 .3 3 5 4 2 x 1 0 ^
-4 .2 0 7 6 6 x 1 0 ^
0.11753
4.37851x10^

-2.59833x10^
1.88490x10^
4.37851x10
0.10845

'612
77.55
161.50
19.144

50.36496'
5.41932
10.16672
. 1.07653
El modelo de regresin ajustado, con los coeficientes reportados con dos cifras decimales, es
y =

50.36+2jCj +10.17a:2 +1.0&C,

AI comparar este resultado con el modelo original del ejemplo 10-2, donde los niveles de los factores fue
ron exactamente los que se especificaron en el diseo, se observa muy poca diferencia. La interpretacin
prctica de los resultados de este experimento no sufrira alteraciones sustanciales por la incapacidad del
experimentador para alcanzar exactamente los niveles deseados de los factores.

EJEMPLO 1 0 - 5 .................................. ............................................................................................................


Separacin de alias de interacciones en un diseo factorial fhiccionado
En el captulo 8 se seal la posibilidad de separar los alias de las interacciones de un diseo factorial
fraccionado mediante el proceso llamado doblez o plegado. Para un diseo de resolucin III, un plegado
completo se construye corriendo una segunda fraccin en la que los signos estn invertidos respecto de
los signos de la fraccin original. Entonces el diseo combinado puede usarse para separar los alias de to
dos los efectos principales de las interacciones de dos factores.
Una dificultad con el plegado es que requiere un segundo grupo de corridas de tamao idntico al del
diseo original. Por lo general es posible separar los alias de ciertas interacciones de inters aumentando
el diseo original con un nmero de corridas menor que las que se requieren en un plegado completo. Los
mtodos de regresin son una forma fcil de formular este problema y de ver cmo puede resolverse.
Para ilustrar, suponga que se ha corrido un diseo 2 . En la tabla 8-3 se muestra la fraccin princi
pal de este diseo, en la que / = ABCD. Suponga que despus de que se observaron los datos de los ocho
primeros ensayos, los efectos ms grandes fueron^, B, C, D (se ignoran las interacciones de tres factores
que son alias de estos efectos principales), y la cadena de a lia s e s + CD. Las otras dos cadenas de aUas
pueden ignorarse, pero es claro que A S o CD o ambas interacciones de dos factores son grandes. Para di
lucidar cules son las interacciones importantes podra, desde luego, correrse la fraccin alterna, para lo
cual se requeriran otros ocho ensayos. Entonces las 16 corridas podran usarse para estimar los efectos
principales y las interacciones de dos factores.
Es posible separar los alias &AB y CD en un nmero de ensayos adicionales menor que ocho. Supon
ga que quiere ajustarse el modelo

y ^0 "*"^1^1

^34^3^4 ^

408

CAPTULO 10 AJUSTE DE MODELOS DE REGRESIN

dondeA:i, x2,x3yx4 son las variables codificadas que representan ? iA ,B ,C jD . Utilizando el diseo de la ta
bla 8-3, la matriz X de este modelo es
X2

X3

JC4

-3*4

X=

donde se han anotado las variables arriba de las columnas a fin de facilitar la comprensin. Observe que la
rninmna
es idntica a la colum nax3j:4 (como se anticipaba, ya q&AB 0 x ^ 2 es alias de CD o
lo cual implica una dependencia lineal en las columnas de X. Por lo tanto, no pueden estimarse tanto ^12
comoy334 en el modelo. Sin embargo, suponga que se agrega la corrida nicajci = -1 , jcj =
= 1
=
1 de la fraccin alterna a las ocho corridas originales. Entonces la matriz X del modelo queda como

X=

Observe que ahora las columnas ji:ia:2y ;tjx:4ya no son idnticas, y el modelo puede ajustarse incluyendo a
las dos interaccionesXit2 (AB) yx^^ (CD). Las magnitudes de los coeficientes de regresin brindarn in
formacin respecto a cules son las interacciones importantes.
Aun cuando al agregar una sola corrida se separarn los alias de las interaccionesv4B y CD, este enfo
que tiene una desventaja. Suponga que existe un efecto de tiempo (o un efecto de bloque) entre las ocho
primeras corridas y la ltima corrida que se agreg arriba. Al agregarse una columna a la matriz X para los
bloques, se obtiene lo siguiente:
Xi

X=

X2

JC4

a3x:4 bloques

10-4 PRUEBA DE HIPTESIS EN LA REGRESIN MLTIPLE

409

Se ha supuesto que el factor del bloque estaba en el nivel bajo o


durante las ocho primeras corridas, y
en el nivel alto o + durante la novena corrida. Es sencillo ver que la suma de los productos cruzados de
cada columna con la columna del bloque no es cero, lo cual significa que los bloques han dejado de ser or
togonales para los tratamientos, o que el efecto del bloque afecta ahora a las estimaciones de los coefi
cientes de regresin del modelo. Para conseguir la ortogonalidad de los bloques, debe agregarse un
nmero par de corridas. Por ejemplo, con las cuatro corridas

1
-1
1

-1
-1
1
1

-1
-1
1
1

1
-1
1
-1

se separarn los alias de A 8 de CD y permitirn que los bloques sean ortogonales (esto puede verse desa
rrollando la matriz X como se hizo anteriormente).
En general, suele ser directo el examen de la matriz X del modelo reducido que se obtiene de un dise
o factorial fraccionado, as como la determinacin de cules son las corridas que habrn de aumentarse
en el diseo original para separar los alias de las interacciones de inters potencial. Adems, el impacto de
las estrategias especficas para aumentar el diseo puede evaluarse utilizando los resultados generales
de los modelos de regresin que se presentan ms adelante en este captulo. Se cuenta tambin con mto
dos basados en computadora para construir diseos que pueden ser tiles en el aumento del diseo para
separar los ahas de los efectos. Estos diseos generados por computadora se revisarn en el captulo si
guiente.

10-4

PR U EBA DE HIPOTESIS EN LA REGRESION MULTIPLE

En los problemas de regresin lineal mltiple, ciertas pruebas de hiptesis acerca de los parmetros del
modelo son una ayuda para medir la utidad del modelo. En esta seccin se describen varios procedi
mientos de prueba de hiptesis importantes. Estos procedimientos requieren que los errores del mode
lo sigan una distribucin normal e independiente con media cero y varianza 6^, lo cual se abrevia
~ NID(0, a^). Como resultado de este supuesto, las observaciones y, tienen una distribucin normal e in
dependiente con media /3o -iy varianza tr^.

10'4.1

Prueba de significacin de la regresin

La prueba de significacin de la regresin es un procedimiento para determinar si existe una relacin li


neal entre la variable de respuestay y un subconjunto de los regresores jcj, jcj,
Las hiptesis apropia
das son
^0-^1 = ^2 = = P k = 0
. P j ^ 0
para al menos una j

(10-20)

El rechazo deH^ de la ecuacin 10-20 implica que al menos uno de los regresoresA:i,JC2,
contribuye de
manera significativa al modelo. El procedimiento de prueba incluye un anlisis de varianza en el que se

410

CAPTULO 10 AJUSTE DE MODELOS DE REGRESIN

hace la particin de la suma de cuadrados total SSj- en una suma de cuadrados debida al modelo (o a la re
gresin) y una suma de cuadrados debida a los residuales (o al error), es decir,
SSj = SS^+SS^

(10-21)

Ahora bien, si la hiptesis nulaio:;^! = jSa = =


= Oes verdadera, entonces SS^/a^ se distribuye como
x l , donde el nmero de grados de libertad para^^ es igual al nmero de regresores del modelo. Asimis
mo, puede demostrarse que SSe/o^se distribuye como xl-k-i Y Q^e 55^ y 55 son independientes. El pro
cedimiento de prueba para
= = Pk = ^ consiste en calcular
r

S S J {n -k -\)

MS,
MS^

y en rechazar / qsF qexcede a f


D e manera alternativa, podra usarse el enfoque del valorPpara
la prueba de hiptesis y, por lo tanto, rechazar H qsi el valor P del estadstico Fqes menor que a. Por lo ge
neral la prueba se resume en una tabla del anlisis de varianza como la tabla 10-6.
Es sencillo encontrar una frmula para calcular SSj^. En la ecuacin 10-16 se estableci una frmula
para calcular SS^; es decir,
S S ,= y 'y -P 'X 'y
Ahora bien, puesto que SS^ =
reescribirse como

y i f / = y y
n

I n, la ecuacin anterior puede

\2

\-i
n

SS^ = 55^ - 55^


Por lo tanto, la suma de cuadrados de regresin es

5 5 ^ = ^ 'X 'y -

\i= l

(10-23)

mientras la suma de cuadrados del error es


(10-24)

S S . ^ y ' y - P ' X y

Tabla 10-6

Anlisis de varianza de la significacin de la regresin en una regresin mltiple


Suma de cuadrados

Grados de libertad

Cuadrado medio

'o

Regresin

SS^

M5;,

MSJMS e

Error o residual

SS^

n-k-

MS e

Total

SSr

n-1

Fuente de variacin

10'4 PRUEBA DE HIPTESIS EN LA REGRESIN MLTIPLE

411

y la suma de cuadrados total es


n

(10-25)

Estos clculos casi siempre se realizan con software de regresin. Por ejemplo, en la tabla 10-4 se
muestra una parte de la salida de Minitab para el modelo de regresin de la viscosidad del ejemplo 10-1.
La seccin superior de esta presentacin es el anlisis de varianza del modelo. La prueba de significacin
de la regresin en este ejemplo incluye las hiptesis
O

para al menos unaj

El valor P de la tabla 10-4 para el estadstico F (ecuacin 10-22) es muy pequeo, por lo que se concluira
que al menos una de las dos variables la temperatura (jCi) y la velocidad de alimentacin (Jtz) tiene un
coeficiente de regresin diferente de cero.
En la tabla 10-4 se presenta tambin el coeficiente de determinacin mltiple R \ donde
R ^ = ^ = l - ^
SSj.
SSj.

(10-26)
^

Como en los experimentos diseados, es una medida de la cantidad de reduccin en la variabilidad de^
que se obtiene al utilizar las variables de regresin j ci . xj , j c* en el modelo. Sin embargo, como se seal
antes, un valor grande de ^ no implica necesariamente que el modelo de regresin sea adecuado. Siem
pre que se agregue una variable al modelo, ^ se incrementar, independientemente de que la variable
adicional sea estadsticamente significativa o no. Por lo tanto, es posible que los modelos que tienen valo
res grandes de
produzcan predicciones pobres de nuevas observaciones o estimaciones pobres de la
respuesta media.
Puesto que
siempre se incrementa cuando se agregan trminos al modelo, algunos constructores
de modelos de regresin prefieren usar el estadstico
gu stad a definido como

5S^/(-l)

(10-27)

En general, el estadstico
ajustada no siempre se incrementar cuando se agreguen variables al mode
lo. D e hecho, si se agregan trminos innecesarios, el valor de
se decrementar con frecuencia.
Por ejemplo, considere el modelo de regresin de la viscosidad. La ^ ajustada para el modelo se
muestra en la tabla 10-4. Se calcula como
p2

_ -I _

^ajustada

n -
[n -p )
(15\

(1 -0 .9 2 6 9 7 )
U 3;
= 0.915735
=

que est muy cerca de la


ordinaria. Cuando la diferencia entre R^ y
considerable, existe un
buen riesgo de que se hayan incluido en el modelo trminos no significativos.

412

10-4.2

CAPTULO 10 AJUSTE DE MODELOS DE REGRESIN

Pruebas de los coeficientes de regresin individuales


y de grupos de coeficientes

Muchas veces el inters se centra en probar hiptesis sobre los coeficientes de regresin individuales.
Estas pruebas seran tiles para determinar el valor de cada uno de los regresores del modelo de regre
sin. Por ejemplo, el modelo podra ser ms eficaz con la inclusin de variables adicionales o quiz con la
eliminacin de una o ms de las variables que estn ya en el modelo.
Agregar una variable al modelo de regresin ocasiona siempre que la suma de cuadrados de regre
sin se incremente y que la suma de cuadrados del error se decremente. Es necesario decidir si el incre
mento de la suma de cuadrados de regresin es suficiente para garantizar el uso de la variable adicional
en el modelo. Adems, agregar una variable no importante al modelo en realidad puede incrementar el
cuadrado medio del error, reducindose as la utilidad del modelo.
Las hiptesis para probar la significacin de cualquier coeficiente de regresin individual, por ejem
plo fip son

= Ono se rechaza, entonces esto indica queA:^ puede eliminarse del modelo. El estadstico de prue
ba para esta hiptesis es

donde Cjj es el elemento de la diagonal de (X'X)' correspondiente a . La hiptesis nulai/o:y3y = Ose re*
chaza si | /q I >
Observe que se trata en realidad de una prueba parcial o marginal, ya que el coefi
ciente de regresin
depende de todos los dems regresores x (i ^ j) que estn en el modelo.
Al denominador de la ecuacin 10-28,
se le llama con frecuencia error estndar (se) del coe
ficiente de regresin Pj. Es decir,
se (l.)= ,d % :

(10-29)

Por lo tanto, una manera equivalente de escribir el estadstico de prueba de la ecuacin 10-28 es
^
se(p j)

(10-30)

La mayora de los programas de computadora de regresin proporcionan la prueba f para cada par
metro del modelo. Por ejemplo, considere la tabla 10-4, la cual contiene la sahda de Minitab para el ejem
plo 10-1. En la seccin superior de esta tabla se da la estimacin de mnimos cuadrados de cada
parmetro, el error estndar, el estadstico r y el valor F correspondiente. Se concluira que ambas varia
bles, la temperatura y la velocidad de alimentacin, contribuyen de manera significativa en el modelo.
Tmbin puede examinarse directamente la contribucin de una variable particular, por ejemplo jc,-, a
la suma de cuadrados de regresin, dado que otrasx, variables (t ^ j) estn incluidas en el modelo. El pro
cedimiento para hacer esto es la prueba general de la significacin de la regresin o, como se denomina
con frecuencia, el mtodo de suma de cuadrados extra. Este procedimiento tambin puede usarse para
investigar la contribucin de un subconjunto de los regresores al modelo. Considere el modelo de regre
sin con k regresores:

10-4 PRUEBA DE HIPTESIS EN LA REGRESIN MLTIPLE

413

donde y es (w x 1), X es ( x p),fi c s ( p x l) ,e es (n x 1) yp = A: + 1. Querra determinarse si el subconjunto de regresores a:i,


(r < k) contribuye significativamente al modelo de regresin. Sea que se
haga la particin del vector de los coeficientes de regresin de la siguiente manera:
P=
donde

es (r x 1) y

\P2.

es [(p - r) x 1]. Quieren probarse las hiptesis


= 0

(10-31)

El modelo puede escribirse como


y = l0 + e = X A + X j,+ e

(10-32)

donde Xj representa las columnas de X asociadas con ^ , y X2 representa las columnas de X asociadas
con ^ 2.
Para el modelo completo (incluyendo tanto a ^ i como a ^ 2)
P~
y* Adems, la
suma de cuadrados de regresin para todas las variables incluyendo la ordenada al origen es
SSg(P) = 0'X'y

( p grados de hbertad)

n -p
ASS(fi) se le llama la suma de cuadrados de regresin debida afi. Para encontrar la contribucin de los
trminos en/Sj a la regresin, se ajusta el modelo suponiendo que la hiptesis nula Ho fii = Oes verdadera.
El modelo reducido se encuentra a partir de la ecuacin 10-32 con
= 0:
y= X A + e
El estimador de mnimos cuadrados de ^ 2
(^ 2 ) =
La suma de cuadrados de regresin debida a

(10-33)

= (X'2X2)'^X'2y, y
(P -

grados de libertad)

dado que

^2

(10-34)

est ya en el modelo es

SS^ (/8J /S2) = 5 5 , ( ^ ) - 55^ { P , )

(10-35)

Esta suma de cuadrados tiene r grados de libertad. Es la suma de cuadrados extra debida a^i. Observe
que
I/J2) es el incremento en la suma de cuadrados de regresin debido a la inclusin de las varia
bles Xi, X2,
X, en el modelo.
Ahora bien,
I/J2) es independiente de MS^, y la hiptesis nula^i = Opuede probarse con el es
tadstico
(10-36,
MS e
Si F q >
se rechaza//(,, y se concluye que al menos uno de los parmetros en^j es diferente de cero
y, por consiguiente, al menos una de las variablesjCi, j2j ,^r en Xj contribuye significativamente al modelo
de regresin. Algunos autores llaman a la prueba de la ecuacin 10-36 la prueba F parcial.

414

CAPTULO 10 AJUSTE DE MODELOS DE REGRESIN

La prueba 7^parcial es muy til. Puede usarse para medir la contribucin dejc, como si fuera la ltima
variable que se agreg al modelo, calculando

ste es el incremento en la suma de cuadrados de regresin debido a que se agrega^r^ a un modelo que ya
contiene axj, ...,xj_i,x + 1,
Observe que la p ru eb a p a rcia l de una sola variable ;c, es equivalente a la
prueba t de la ecuacin 10-28. Sin embargo, la prueba F parcial es un procedimiento ms general por
cuanto puede medir el efecto de conjuntos de variables.

EJEMPLO 1 0 - 6 ...............................................................................................................................................
Considere los datos de la viscosidad del ejemplo 10-1. Suponga que se quiere investigar la contribucin de
la variableA:2 (velocidad de alimentacin) al modelo. Es decir, las hiptesis que quieren probarse son

Esto requerir la suma de cuadrados extra debida a

M = S S M ,

P ,)

Entonces, por la tabla 10-4, donde se prob la significacin de la regresin, se tiene

a la que se llam en la tabla la suma de cuadrados del modelo. Esta suma de cuadrados tiene dos grados
de lilertad.
El modelo reducido es
El ajuste de mnimos cuadrados de este modelo es

j>= 1652.3955-1-7.6397;ci
y la suma de cuadrados de regresin para este modelo (con un grado de libertad) es
5 5 ( ^ il/3 o ) = 40,840.8

Observe que
|/3o) se muestra en la parte inferior de la salida de Minitab de la tabla 10-4 bajo el en
cabezado Seq SS. Por lo tanto,
55^ (y32li8o.y3J= 44,157.1-40,840.8
= 3316.3
con 2 - 1 = 1 grado de libertad. Este es el incremento en la suma de cuadrados de regresin que resulta de
agregar jcj a un modelo que contena ya ax,, y se muestra en la parte inferior de la salida de Minitab en la
tabla 10-4. Para probar
= O, por el estadstico de prueba se obtiene

,)/l
------------------------

3316.3/1
1 5 ^

Observe que en el denominador de Fg se usa


del modelo completo (tabla 10-4). Entonces, puesto que
^ 0.05,1.13 = 1*67) se rechazarai/o:y32 = Oy se concluira quej2 (velocidad de alimentacin) contribuye signi
ficativamente al modelo.

10-5 INTERVALOS DE CONFIANZA EN REGRESIONES MLTIPLES

415

Debido a que esta prueba F parcial incluye un solo regresor, es equivalente a la prueba t porque el
cuadrado de una variable aleatoria t con v grados de libertad es una variable aleatoria F con 1 y v grados
de libertad. Para ver esto, observe, por la tabla 10-4, que el estadstico t para/o;/32 = Odio como resultado
t , = 3.5203 y que t i = (3.5203)"* = 12.3925 = F^.

10^5

INTERVALOS DE C O N H A N Z A EN REGRESIONES MLTIPLES

Con frecuencia es necesario construir estimaciones de intervalos de confianza para los coeficientes de re
gresin {Pj} y para otras cantidades de inters del modelo de regresin. El desarrollo de un procedimien
to para obtener estos intervalos de confianza requiere suponer que los errores {e} tienen una
distribucin normal e independiente con media cero y varianza a^, el mismo supuesto que se estableci en
la seccin sobre la prueba de hiptesis de la seccin 10-4.
10-5.1

Intervalos de confianza para los coeficientes de regresin individuales

Puesto que el estimador de mnimos cuadrados^es una combinacin lineal de las observaciones, se sigue
que ^ tiene una distribucin normal con vector medio p y matriz de covarianza <r^(X'X)Entonces cada
uno de los estadsticos

.....

se distribuye como t con n - p grados de libertad, donde Cj es el elemento (y)-simo de la matriz (X'X)*S y
a ^ es la estimacin de la varianza del error, obtenida con la ecuacin 10-17. Por lo tanto, un intervalo de
confianza de lOO(l-a) por ciento para el coeficiente de regresin
j = O, 1, ..., k, es
Pj - K,2.n-p

^ y?; ^

(10-38)

Observe que este intervalo de confianza tambin podra escribirse como


h - K a ,n - ,s e 0 j

yaquese(i3^) = ^ a ' Q .

EJEMPLO .........................................................................................................................................................
Se construir un intervalo de confianza de 95% para el parmetro /?i del ejemplo 10-1. Ahora bien,
7.62129, y puesto que

= 267.604 y C = 1.429184 x 10-^ se encuentra que


^ 1 ~ ^0.025,13

^1 1 ^ 1 ^ ^ 1 +^0.02S.13

7.62129- Z16V(267.604)(1.429184xl0-^) <


7.62129-(-2.16V(267.604)(1.429184xl0"^)
7.62129- 2.16(0.6184) s 7.62129-hZ16(0.6184)
y el intervalo de confianza de 95% para /?i es

6.2855S/8, 8.9570

416

CAPTULO 10

10-5.2

AJUSTE DE MODELOS DE REGRESIN

Intervalo de confianza para la respuesta media

Tambin puede obtenerse un intervalo de confianza para la respuesta media en un punto particular, por
ejemplo,
x^. Se define primero el vector
^ 1
-'"01

La respuesta media en este punto es

La respuesta media estimada en este punto es


=

(10-39

Este estimador es insesgado, ya que [K * o )]=

varianza de y(xo) es

n K ^ )] = a ^ x ;(X 'X r x

(10-40)

Por lo tanto, un intervalo de confianza de 100(1 - a) por ciento para la respuesta media en el punto j:oi,jco2)
Xok es

________ _
%'^s)'^^all,n-p4^ Xo ( X^)

(10-41)
K

10-6

xo) + w

.V ^ ' * ( x 'x )'^ x7

PREDICCIN DE N U EV A S OBSERVACIONES DE LA RESPUESTA

Es posible usar un modelo de regresin para predecir observaciones futuras de la respuesta^ que corres
ponden avalores particulares de los regresores, por ejemploj^oi, JCo2>
Si x o = [1,a:oi,:ico2!
enton
ces una estimacin puntual de la observacin futura^o en el puntoXoi,ao2, sc calcula con la ecuacin
10-39:
Kxo) = < ^
Un intervalo de prediccin de 100(l-a:) por ciento para esta observacin futura es
K ^o)" Kn,n-p

(1 +

(X 'x)"x ) < ^0

(10-42)

Cuando se predicen nuevas observaciones y se estima la respuesta media en un punto dadoXqi, jo2j
>
Xf^, es necesario tener cuidado para no hacer una extrapolacin fuera de la regin que contiene las obser
vaciones originales. Es muy posible que un modelo que se ajuste bien en la regin de los datos originales
deje de hacerlo fuera de esa regin.

10-7

DIA G N STICO S DEL MODELO DE REGRESIN

Como se destac en los experimentos diseados, la verificacin de la adecuacin del modelo es una parte
importante en el procedimiento del anlisis de datos. Es de igual importancia en la construccin de mo
delos de regresin y, como se ilustr en el ejemplo 10-1, en un modelo de regresin debern examinarse

10-7 DIAGNSTICOS DEL MODELO DE REGRESIN

417

siempre las grficas de los residuales que se usaron en los experimentos diseados. En general, siempre
es necesario: 1) examinar el modelo ajustado para asegurarse de que proporciona una aproximacin ade
cuada del verdadero sistema y 2) verificar que no se infringe ninguno de los supuestos de la regresin de
mnimos cuadrados. El modelo de regresin probablemente producir resultados pobres o equivocados a
menos que sea un ajuste adecuado.
Adems de las grficas de los residuales, existen otros diagnsticos del modelo que con frecuencia
son tiles en la regresin. En esta seccin se presenta un breve resumen de estos procedimientos. Para
anlisis ms completos, ver Montgomery y Peck [82] y Myers [84].

1 0 '7 .l

Residuales escalados y PRESS

Residuales estandarizados y studentizados

Muchos constructores de modelos prefieren trabajar con residuales escalados en lugar de los residuales
de mnimos cuadrados ordinarios. Estos residuales escalados transmiten con frecuencia ms informacin
que los residuales ordinarios.
Un tipo de residual escalado es el residual estandarizado:
i = l,2 ,...,n

(10-43)

donde por lo general se usa d =


en los clculos. Estos residuales estandarizados tienen media cero
y varianza aproximadamente unitaria; por consiguiente, son muy tiles para buscar puntos atpleos. La
mayora de los residuales estandarizados debern localizarse en el intervalo -3 < d, < 3, y cualquier ob
servacin con un residual estandarizado que est fuera de este intervalo es potencialmente inusual con
respecto a su respuesta observada. Estos puntos atpicos debern examinarse con atencin, ya que pue
den representar algo tan simple como un error al registrar los datos o algo que sea motivo de mayor preo
cupacin, como una regin del espacio del regresor, donde el modelo ajustado es una aproximacin
pobre de la verdadera superficie de respuesta.
El proceso de estandarizacin de la ecuacin 10-43 escala los residuales al dividirlos por su desvia
cin estndar promedio aproximada. En algunos conjuntos de datos, los residuales pueden tener desvia
ciones estndar que difieren considerablemente. A continuacin se presenta una escalacin que toma en
consideracin esta situacin.
El vector de los valores ajustados y que corresponden a los valores observados y es
y=x^
= X (X 'X ) - X 'y

(10-44)

= Hy

A la matriz x
H = X (X 'X )"'X ' se le llama generalmente la matriz gorro porque mapea el vector de
los valores observados en un vector de los valores ajustados. La matriz gorro y sus propiedades desempe
an un papel central en el anlisis de regresin.
Los residuales del modelo ajustado pueden escribirse convenientemente en la notacin matricial
como
e = y -y
y resulta que la matriz de covarianza de los residuales es
C ov(e) = 7 ^ ( I - H )

(1 0 -4 5 )

La matriz I - H no es por lo general diagonal, por lo que los residuales tienen varianzas diferentes y estn
correlacionados.

418

CAPTULO 10 AJUSTE DE MODELOS DE REGRESIN

Por lo tanto, la varianza del residual i-simo es


F(e,.)=a^(l-/i,)

(10-46)

donde /t es el elemento i-simo de la diagonal de H, Puesto que O ^


^ 1, al utilizar el cuadrado medio
residual M5 para estimar la varianza de los residuales en realidad se est sobreestimando V(e). Adems,
puesto que ha es una medida de localizacin del punto /-simo en el espacio x, la varianza de e, depende de
dnde est el puntos:,. En general, los residuales situados cerca del centro del espacioa tienen varianzas
ms grandes que los residuales situados en lugares ms apartados. Las violaciones de los supuestos del
modelo son ms probables en los puntos remotos, y estas violaciones pueden ser difciles de detectar por
la inspeccin de e (o d) porque sus residuales sern por lo general ms pequeos.
Se recomienda tomar en consideracin esta desigualdad de la varianza cuando se escalen los residua
les. Se sugiere grafiear los residuales studentizados:
r, =

, ,

i=

(10-47)

con
= MS^ en lugar de e (o d). Los residuales studentizados tienen varianza constante F(r,) = 1 inde
pendientemente de la localizacin de x, cuando la forma del modelo es correcta. En muchas situaciones la
varianza de los residuales se estabiliza, en particular para conjuntos de datos grandes. En estos casos pue
de haber poca diferencia entre los residuales estandarizados y los studentizados. Por lo tanto, los residua
les estandarizados y studentizados transmiten con frecuencia informacin equivalente. Sin embargo, ya
que cualquier punto con un residual grande y una h grande tiene una influencia potencialmente conside
rable sobre el ajuste de mnimos cuadrados, suele recomendarse el examen de los residuales studentiza
dos. En la tabla 10-3 se presentan las diagonales gorro /i, y los residuales studentizados para el modelo de
regresin de la viscosidad del ejemplo 10-1.
Residuales PRESS
La suma de cuadrados del error de prediccin (PRESS, del ingls Predietion Error Sum of Squares) pro
porciona una til esealacin de los residuales. Para calcular la PRESS se selecciona una observacin, por
ejemplo la L Se ajusta el modelo de regresin a las w - 1 observaciones restantes y se usa esta ecuacin
para predecir la observacin que se apart y,. Al denotar este valor predicho
puede encontrarse el
error de prediccin del punto / como
= >>, = 5>() Al error de prediccin suele llamrsele el residual
PRESS -simo. Este procedimiento se repite para cada observacin i = 1,2,..., n, producindose un con
junto de n residuales PRESS
Entonces el estadstico PRESS se define como la suma de
cuadrados de los n residuales PRESS como en

PRESS = X 4 ) =
ic o l'
/=1
=1
Por lo tanto, la PRESS utiliza cada subeonjunto posible de n - 1 observaciones como un conjunto de datos
de estimacin, y se utiliza una observacin a la vez para formar un conjunto de datos de prediccin.
Tnir.ia1mp.nte, parecera que para calcular la PRESS es necesario ajustar n regresiones diferentes. Sin
embargo, la PRESS puede calcularse a partir de los resultados de un solo ajuste de mnimos cuadrados a
las n observaciones totales. Resulta que el residual PRESS i-simo es

Por lo tanto, ya que la PRESS es tan slo la suma de cuadrados de los residuales PRESS, una frmula de
clculo simple es

PRESS = 2
1=1

l-h ,j

(1 0 -5 0 )

10-7 DIAGNSTICOS DEL MODELO DE REGRESIN

419

Por la ecuacin 10-49 es sencillo ver que el residual PRESS es slo el residual ordinario ponderado de
acuerdo con los elementos de la diagonal de la matriz gorro /i. Los puntos de los datos para los que /i es
grande tendrn residuales PRESS grandes. Estas observaciones sern por lo general puntos de alta in
fluencia. En general, una diferencia grande entre el residual ordinario y los residuales PRESS indicar un
punto donde el modelo se ajusta bien a los datos, pero un modelo construido sin dicho punto producir
predicciones pobres. En la siguiente seccin se estudiarn otras medidas de influencia.
Por ltimo, cabe sealar que la PRESS puede usarse para calcular una.R^ aproximada de prediccin,
por ejemplo
(10-51)
^y
Este estadstico ofrece cierto indicio de la capacidad predictiva del modelo de regresin. Para el modelo
de regresin de la viscosidad del ejemplo 10-1, los residuales PRESS pueden calcularse utilizando los re
siduales ordinarios y el valor de h encontrado en la tabla 10-3. El valor correspondiente del estadstico
PRESS es PRESS = 5207.7. Entonces
d2
_1 _ ^PRESS
5207.7
^ 47,635.9
= 0.8907
Por lo tanto, podra esperarse que este modelo explique cerca de 89% de la variabilidad al predecir
nuevas observaciones, en comparacin con el aproximadamente 93% de la variabilidad en los datos origi
nales que explica el ajuste de mnimos cuadrados. La capacidad predictiva global del modelo basado en
este criterio parece ser muy satisfactoria.
R-student

Es comn considerar al residual studentizado r, comentado antes como el diagnstico de un punto atpico. Se acostumbra usar MS^ como una estimacin de en el clculo de r. Se hace referencia a este enfo
que como la escalacin interna del residual, ya que MS^ es una estimacin de generada internamente
que se obtiene del ajuste del modelo a las n observaciones. Otro enfoque sera usar una estimacin de
basada en un conjunto de datos en el que se elimina la observacin i-sima. La estimacin de as obteni
da se denota por
. Puede demostrarse que
_ in ~ p )M S ,-e f/(l-h ,)

(10-52)

La estimacin de de la ecuacin 10-52 se usa en lugar de MS e para producir un residual studentizado


externamente, al que es comn llamar 7?-student, dado por

En muchas situaciones habr una ligera diferencia entre t y el residual studentizado r,. Sin embargo,
si la observacin z-sima es influyente, entonces
puede diferir significativamente de MS e, y por lo tan
to la ^-student ser ms sensible a este pxmto. Adems, bajo los supuestos usuales, tiene una distribu
cin
Por lo tanto, la.R-student ofrece un procedimiento ms formal para detectar puntos atpleos a
travs de la prueba de hiptesis. En la tabla 10-3 se muestran los valores de la /?-student para el modelo de
regresin de la viscosidad del ejemplo 10-1. Ninguno de esos valores es inusualmente grande.

420
1 0 -7 .2

CAPTULO 10 AJUSTE DE MODELOS DE REGRESIN

D ia g n stico s de in flu en cia

En ocasiones se encuentra que un subconjunto pequeo de los datos ejerce una influencia desproporcio
nada sobre el modelo de regresin ajustado. Es decir, las estimaciones o predicciones de los parmetros
pueden depender ms del subconjunto influyente que de la mayora de los datos. Sera conveniente loca
lizar estos puntos influyentes y valorar su impacto en el modelo. Si estos puntos influyentes son valores
malos, debern eliminarse. Por otra parte, quiz no haya nada malo con estos puntos. Pero si controlan
propiedades clave del modelo, sera deseable saberlo, ya que podra afectar el uso del modelo. En esta
seccin se describen e ilustran algunas medidas tiles de influencia.
P untos de accin de palanca

La localizacin de los puntos en el espacios es importante para detefminar las propiedades del modelo. En
particular, las observaciones apartadas tienen potencialmente acciones o brazos de palanca desproporcio
nados sobre las estimaciones de los parmetros, los valores predichos y los estadsticos de resumen usuales.
La matriz gorro H = X(X'X)^X' es muy til para identificar las observaciones influyentes. Como ya
, se seal, H determina las varianzas y covarianzas de y y e, ya que V(y) =
y K(e) = a^(\ - H). Los ele
mentos hj de H pueden interpretarse como la cantidad de accin de palanca ejercida pory^ sobre %. Por lo
tanto, la inspeccin de los elementos de H puede revelar puntos que son potencialmente influyentes en
virtud de su localizacin en el espacio x. La atencin suele centrarse en los elementos de la diagonal /z.
Puesto que
h = rango(H) = rango(X) = p, el tamao promedio de los elementos de la diagonal de la
matriz H es pin. Como gua aproximada, entonces, si un elemento de la diagonal es mayor que 'pin, la
observacin i es un punto con accin de palanca alta. Para aplicar lo anterior al modelo de la viscosidad
del ejemplo 10-1, observe que Tpjn = 2(3)/16 = 0.375. En la tabla 10-3 se dan las diagonales gorro para
el modelo de primer orden; puesto que ninguna de las excede 0.375, se concluira que no hay puntos de
accin de palanca en estos datos.
Influencia sobre los coeficientes de regresin

Las diagonales gorro identificarn los puntos potencialmente influyentes debido a su localizacin en el
espacio X. Es deseable considerar la localizacin del punto y la variable de respuesta cuando se mide la in
fluencia. Cook [32a, b] ha sugerido el uso de una medida del cuadrado de la distancia entre la estima
cin de mnimos cuadrados basada en todos los n puntos y la estimacin obtenida al eliminar el punto i,
por ejemplo
Esta medida de la distancia puede expresarse como

(10-54,

pMS^

Un valor de referencia razonable paraZ?, es la unidad. Es decir, en general las observaciones para las que
D > 1 se consideran influyentes.
El estadstico D se calcula en realidad a partir de
, = 1 ,2 ......
P

(10-55)

P (1-^)

Observe que, aparte de la constantep , D es el producto del cuadrado del residual studentizado /-simo y
/i/(l-ft). Puede demostrarse que este cociente es la distancia del vector x, al centroide de los datos res
tantes. Por lo tanto, D est compuesto por un componente que refleja la medida en que el modelo ajusta

10-8 PRUEBA DE FALTA DE AJUSTE

421

la observacin /-sima}', y un componente que mide qu tan alejado est ese punto del resto de los datos.
Cualquiera de los componentes (o ambos) puede contribuir a un valor grande de D.
En la tabla 10-3 se muestran los valores de Z) para el ajuste del modelo de regresin a los datos de la
viscosidad del ejemplo 10-1. Ninguno de estos valores de D, excede 1, por lo que no hay evidencia slida
de observaciones influyentes en estos datos.

10-8

PR UEBA DE FALTA DE AJUSTE

En la seccin 6-6 se indic cmo agregar puntos centrales a un diseo factorial T le permite al experimen
tador obtener una estimacin del error experimental puro. Esto permite hacer la particin de la suma de
cuadrados de los residuales SS^ en dos componentes; es decir,
SS^ = SSp^ + SS^Qp
donde SSp^ es la suma de cuadrados debida al error puro y SS^^of
suma de cuadrados debida a la falta
de ajuste.
Puede presentarse un desarrollo general de esta particin en el contexto de un modelo de regresin.
Suponga que se tienen n observaciones de la respuesta en el nivel i-simo de los regresores x i = 1,2,...,
m. Sea quey,y denota la observaciny-sima de la respuesta en x i = 1,2,
y; = 1 , 2 , Hayn
n observaciones en total. El residual (t))-simo puede escribirse como
y - 9, = {yi - r, ) + ( x - X )

(10-56)

donde y, es el promedio de las n observaciones en x,. Al elevar al cuadrado ambos miembros de la ecua
cin 10-56 y hacer la operacin suma sobre i y j se obtiene
S

(n-y.)+

i =l

1= 1 J= 1

(10-57)

i=l

El primer miembro de la ecuacin 10-57 es la suma de cuadrados de los residuales ordinaria. Los dos
componentes del segundo miembro miden el error puro y la falta de ajuste. Se observa que la suma de
cuadrados del error puro
55,, = 2 ^

(10-58)

i=l

se obtiene calculando la suma de cuadrados corregida de las observaciones repetidas en cada nivel de x y
haciendo despus la agrupacin en los m niveles de x. Si se satisface el supuesto de la varianza constante,
sta es una medida independiente del modelo del error puro, ya que para calcular SSp^ slo se usa la varia
bilidad de las y en cada nivel x,. Puesto que hay n - l grados de libertad del error puro en cada nivel x el
nmero total de grados de hbertad asociados con la suma de cuadrados del error puro es
m

2 { n - \ ) = n -m
=1

(10-59)

La suma de cuadrados de la falta de ajuste


=

(1 0 -6 0 )

422

CAPTULO 10 AJUSTE DE MODELOS DE REGRESIN

es una suma ponderada de los cuadrados de las desviaciones entre la respuesta media y, en cada nivel x, y
el valor ajustado correspondiente. Si los valores ajustados estn cerca de las respuestas promedio}', co
rrespondientes, entonces hay un fuerte indicio de que la funcin de regresin es lineal. Si las y se desvan
mucho de lasy entonces es probable que la funcin de regresin no sea lineal. Hay m - p grados de bertad asociados con
porque hay m niveles de x, y se pierden p grados de libertad porque deben esti
marse p parmetros para el modelo. En lo que a los clculos se refiere, por lo general SS[^op se obtiene
restando SSp^ de SS;.
El estadstico de prueba para la faha de ajuste es
_ S S ^ ,/(m -p )

El valor esperado de MSps es a^, y el valor esperado de

es

n,
m -2

(10-62)

Si la verdadera funcin de regresin es lineal, entonces E (y ) =


^Y si segundo trmino de la
ecuacin 10-62 es cero, dando como resultado E(MS lof) =
Sin embargo, si la verdadera funcin de re
gresin no es lineal, entonces E(y)y^
y EMS^of) >
Adems, si la verdadera funcin de
regresin es lineal, entonces el estadstico f osigue la d i s t r i b u c i n P o r lo tanto, para probar la falta
de ajuste, se calculara el estadstico de prubalo y se concluira que la funcin de regresin no es lineal si
*0 > Fa , m -p,n'-m '
Es sencillo incorporar este procedimiento de prueba en el anlisis de varianza. Si se concluye que la
funcin de regresin no es lineal, entonces el modelo tentativo habr de abandonarse y debern hacerse
intentos para encontrar una ecuacin ms apropiada. D e manera alternativa, si Fg no excede
no
existe evidencia shda de falta de ajuste y MSp^ y MS^qf se combinan con frecuencia para estimar a^. El
ejemplo 6-6 es una ilustracin muy completa de este procedimiento, donde las rplicas de las corridas son
puntos centrales de un diseo factorial 2^.

10-9

PROBLEMAS

10-1. La resistencia a la tensin de un producto de papel se relaciona con la cantidad de madera dura en la pulpa.
Se producen 10 muestras en la planta piloto y los datos obtenidos se presentan en la siguiente tabla.
Resistencia
160
171
175
182
184

Porcentaje de madera dura


10
15
15
20
20

Resistencia
181
188
193
195
200

Porcentaje de madera dura


20
25
25
28
30

) Ajustar un modelo de regresin lineal que relacione la resistencia con el porcentaje de madera dura.
b) Probar el modelo del inciso a para la significacin de la regresin.
c) Encontrar un intervalo de confianza de 95% para el parmetro /Sj,
10-2. En una planta se destila aire lquido para producir oxgeno, nitrgeno y argn. Se piensa que el porcentaje de
impurezas en el oxgeno se relaciona linealmente con la cantidad de impurezas en el aire, medida por el

10-9 PROBLEMAS

423

comeo de contaminacin en partes por milln (ppm). Una muestra de los datos de operacin de la planta
se presenta a continuacin:
Pureza (%)

93.3

Conteo de contaminacin (ppm)

1.10

93.1
0.99

10-3.
10-4.
10-5.
10- 6.

92.0
1.45

93.2

92.9

0.83

1.22

92.4
1.36
92.2
1.47

91.7
1.59
91.3
1.81

94.0
1.08
90.1
2.03

94.6
0.75
91.6
1.75

93.6
1.20
91.9
1.68

fl) Ajustar un modelo de regresin lineal a los datos.


b) Probar la significacin de la regresin.
c) Encontrar un intervalo de confianza de 95% para /?i.
Graficar los residuales del problema 10-1 y comentar la adecuacin del modelo.
Graficar los residuales del problema 10-2 y comentar la adecuacin del modelo.
Utilizando los resultados del problema 10-1, probar el modelo de regresin para la falta de ajuste.
Se realiz un estudio sobre el desgastede un cojinete y su relacin conjcj = viscosidad del aceite yx 2 = car
ga. Se obtuvieron los siguientes datos:

y
193
230
172
91
113
125

-1^1
1.6
15.5
22.0
43.0
33.0
40.0

851
816
1058
1201
1357
1115

a) Ajustar un modelo de regresin lineal mltiple a los datos.


b) Probar la significacin de la regresin.
c) Calcular el estadstico t para cada parmetro del modelo. Qu conclusiones pueden sacarse?
10-7. Se piensa que la potencia al freno desarrollada por el motor de un automvil en un dinammetro es una fun
cin de la rapidez del motor en revoluciones por minuto (rpm), el octanaje del combustible y la compresin
del motor. Se llev a cabo un experimento en el laboratorio y los datos colectados fueron:

Potencia al freno
225
212
229
222
219
278
246
237
233
224
223
230

rpm
2000
1800
2400
1900
1600
2500
3000
3200
2800
3400
1800
2500

Octanaje
90
94
88
91
86
96
94
90
88
86
90
89

Compresin
100
95
110
96
100
110
98
100
105
97
100
104

424

CAPTULO 10 AJUSTE DE MODELOS DE REGRESIN

a) Ajustar un modelo de regresin mltiple a estos datos.


b) Probar la significacin de la regresin. Qu conclusiones pueden sacarse?
c) Con base en las pruebas t, son necesarios los tres regresores en el modelo?
10-8. Analizar los residuales del modelo de regresin del problema 10-7. Comentar la adecuacin del modelo.
10-9. El rendimiento de un proceso qumico se relaciona con la concentracin del reactivo y la temperatura de
operacin. Se realiza un experimento con los siguientes resultados;

Rendimiento

Concentracin

Tfemperatura

81
89
83
91
79
87
84
90

1.00
1.00
2.00
2.00
1.00
1.00
2.00
2.00

150
180
150
180
150
180
150
180

d)

Suponga que quiere ajustarse un modelo de los efectos principales a estos datos. Establecer la matriz
X'X utilizando los datos exactamente como aparecen en la tabla.
V) La matriz que se obtuvo en el inciso a es diagonal? Comentar la respuesta.
c) Suponga que el modelo se escribe en trminos de las variables codificadas usuales

Concentracin - 1 .5

Temperatura -1 6 5

0.5

15

Establecer la matriz X'X para el modelo en trminos de estas variables codificadas. Esta matriz es dia
d)

gonal? Comentar la respuesta.


Definir un nuevo conjunto de variables codificadas

Concentracin - 1 . 0
1,0

Temperatura - 1 5 0
30

Establecer la matriz X'X para el modelo en trminos de este conjunto de variables codificadas. Esta
matriz es diagonal? Comentar la respuesta.
e) Resumir lo que se haya aprendido acerca de la codificacin de variables con este problema.
10-10. Considere el experimento factorial 2^ del ejemplo 6-2. Suponga que falta la ltima observacin. Volver a ana
lizar los datos y sacar conclusiones. Cmo se comparan estas conclusiones con las del ejemplo original?
10-11. Considere el experimento factorial 2'* del ejemplo 6-2. Suponga que faltan las dos ltimas observaciones.
Volver a analizar los datos y sacar conclusiones. Cul es el resultado de la comparacin de estas conclusio
nes con las del ejemplo original?
10-12. Dados los datos siguientes, ajustar el modelo de regresin polinomial de segundo orden

10-9 PROBLEMAS

425

^2

26
24
175
160
163
55
62
100
26
30
70
71

1.0
1.0
1.5
1.5
1.5
0.5
1.5
0.5
1.0
0.5
1.0
1.5

1.0
1.0
4,0
4.0
4.0
2.0
2.0
3.0
1.5
1.5
2.5
2.5

Despus de que se haya ajustado el modelo, probar la significacin de la regresin.


10-13. a) Considere el modelo de regresin cuadrtico del problema 10-12. Calcular los estadsticos de cada uno
de los parmetros del modelo y comentar las conclusiones a que se llega a partir de estas cantidades.
b) Usar el mtodo de la suma de cuadrados extra para evaluar el valor de los trminos cuadrticos
y
Xt>[2 del modelo.
10-14. Relacin entre el anlisis de varianza y el anlisis de regresin. Cualquier modelo del anlisis de vari anza puede
expresarse en trminos del modelo lineal general y =
-I- e, donde la matriz X se compone de ceros y unos.
Demostrar que el modelo con un solo factory ^ f + r + e,y, i - 1 ,2 ,3 ,j = 1, 2 , 3, 4 puede escribirse en la for
ma del modelo lineal general. Despus
a) Escribir las ecuaciones normales (X X )^ = X y y compararlas con las ecuaciones normales que se encon
b)
c)

traron en el captulo 3 para este modelo.


Encontrar el rango de X'X. Es posible obtener (X'X)-'?
Suponga que se elimina la primera ecuacin normal y se agrega la restriccin
ni, = 0. Tiene solu
cin el sistema de ecuaciones resultante? D e ser as, encontrarla. Hallar la suma de cuadrados de regre
sin fiT y y compararla con la suma de cuadrados de los tratamientos del modelo con un solo factor.

10-15. Suponga que se est haciendo el ajuste de una lnea recta y se desea hacer la varianza de tan pequea como
sea posible. Al trabajar con la restriccin de un nmero par de puntos experimentales, dnde debern colo
carse estos puntos para minimizar K(^j)? (Nota: usar el diseo que se pide en este ejercicio con sumo cuida
do, ya que, aun cuando minimiza
tiene propiedades indeseables; ver, por ejemplo, Myers y
Montgomery [85a]. nicamente si se tiene u n a ^ a /i seguridad de que la verdadera relacin funcional es li
neal deber considerarse el uso de este diseo.)
10-16. Mnimos cuadrados ponderados. Suponga que se est ajustando la lnea recta =^ +
+ e, pero la varianza
de las y depende ahora del nivel de x; es decir.

w..

donde las w son constantes desconocidas, llamadas con frecuencia ponderaciones. Demostrar que si se eli
gen las estimaciones de los coeficientes de regresin para rrnimizar la suma de cuadrados de los errores
ponderados dada por '^w.(y -

- p^x f , las ecuaciones normales de mnimos cuadrados resultantes son


n

1=1
n

i=l
n

426

CAPTULO 10

AJUSTE DE MODELOS DE REGRESIN

10-17. Considere el diseo


analizado en el ejemplo 10-5.
a) Suponga que se opta por aumentar el diseo con la corrida nica seleccionada en ese ejemplo. Encontrar
las varianzas y las covarianzas de los coeficientes de regresin del modelo (ignorando los bloques):
y fio

*'^2^2 +^3^3

b) Hay otras corridas de la fraccin alterna que separaran los alias AB de CDl
c) Suponga que el diseo se aumenta con las cuatro corridas sugeridas en el ejemplo 10-5. Encontrar las va
rianzas y las covarianzas de los coeficientes de regresin (ignorando los bloques) para el modelo del
inciso a.
d) Considerando los incisos a y c, qu estrategia de aumento se preferira y por qu?
10-18. Considere un diseo
Suponga que despus de correr el experimento, los efectos observados ms gran
des son^ + BD, B + A D y D + AB. Quiere aumentarse el diseo original con un grupo de cuatro corridas
para separar los alias de estos efectos,
a) Cules son las cuatro corridas que se haran?
b) Encontrar las varianzas y las covarianzas de los coeficientes de regresin del modelo
^0

*^2^2 +^4^4 "*"^12^1^2 '*^14'^1^4

+ /324^2^4 +
c) Es posible separar los alias de estos efectos con menos de cuatro corridas adicionales?

Mtodos de superficies
de respuesta y otros
enfoques para la
optimizacin de
procesos

1M

IN T R O D U C C I N A LA M ET O D O U X SA DE SUPERHCIES DE RESPUESTA

La metodologa de superficies de respuesta, o MSR, es una coleccin de tcnicas matemticas y estadsticas tiles en el modelado y el anlisis de problemas en los que una respuesta de inters recibe la influencia
de diversas variables y donde el objetivo es optimizar esta respuesta. Por ejemplo, suponga que un inge
niero qumico quiere encontrar los niveles de temperatura (xj) y presin (X2) que maximicen el rendimien
to (y) de un proceso. El rendimiento del proceso es una funcin de los niveles de la temperatura y la
presin, por ejemplo,
y = / ( x Xj ) +
donde e representa el ruido o error observado en la respuesta _y. Si la respuesta esperada se denota por
E(y) = /(xi, X2) = r, entonces a la superficie representada por
r j= f( X i, JCj)
se le llama superficie de respuesta.
Por lo general la superficie de respuesta se representa grficamente como en la figura 11-1, donde r
se grafica contra los niveles de.i y x 2- Se han visto ya grficas de superficie de respuesta como sta, parti
cularmente en los captulos sobre diseos factoriales. Para ayudar a visualizar la forma de una superficie
de respuesta, con frecuencia se grafican los contornos de la superficie de respuesta, como se muestra en
la figura 11-2. En la grfica de contorno se trazan las lneas de respuesta constante en el plan0 Xi,X2. Cada
contorno corresponde a una altura particular de la superficie de respuesta. Tkmbin se ha visto antes
la utilidad de las grficas de contorno.
En la mayora de los problemas MSR, la forma de la relacin entre la respuesta y las variables inde
pendientes es desconocida. Por lo tanto, el primer paso de la MSR es encontrar una aproximacin ade
cuada de la verdadera relacin funcional entre y y el conjunto de variables independientes. Por lo general
se emplea un polinomio de orden inferior en alguna regin de las variables independientes. Si la respues
ta est bien modelada por una funcin lineal de las variables independientes, entonces la funcin de apro
ximacin es el modelo de primer orden

( 11-1)
427

428

CAPTULO 11 MTODOS DE SUPERFICIES DE RESPUESTA

- Temperatura (C)

20

*2 = Presin (psi)

Figura l-1 Superficie de respuesta tridimensional donde se indica el rendi


miento esperado (r) como una funcin de la temperatura (xj) y la presin (x^).

jt, = Temperatura fC)

Figura 11-2

20

*2 = Pfei<5n (psi)

Grfica de contorno de una superficie de respuesta.

11-1 INTRODUCCIN A LA METODOLOGA DE SUPERFICIES DE RESPUESTA

429

Si hay curvatura en el sistema, entonces debe usarse un polinomio de orden superior, tal como el modelo
de segundo orden
(=1

1=1

i<j

En casi todos los problemas MSR se usa uno de estos modelos, o ambos. Desde luego, es probable que un mo
delo polinomial sea una aproximacin razonable de la verdadera relacin funcional en el espacio completo de
las variables independientes, pero para una regin relativamente pequea suelen funcionar bastante bien.
El mtodo de mnimos cuadrados, estudiado en el captulo 10, se usa para estimar los parmetros de
los polinomios de aproximacin. Despus se realiza el anlisis de la superficie de respuesta utilizando la
superficie ajustada. Si la superficie ajustada es una aproximacin adecuada de la verdadera funcin de la
respuesta, entonces el anlisis de la superficie ajustada ser un equivalente aproximado del anlisis del
sistema real. Los parmetros del modelo pueden estimarse de manera ms eficiente cuando se emplean
los diseos experimentales apropiados para recolectar los datos. Los diseos para ajustar superficies de
respuesta se denominan diseos de superficie de respuesta. Estos diseos se revisan en la seccin 11-4.
La MSR es un procedimiento secuencal. Muchas veces, cuando se est en un punto de la superficie
de respuesta que est apartado del ptimo, como en el caso de las condiciones de operacin actuales de la
figura 11-3, el sistema presenta una curvatura moderada y el modelo de primer orden ser apropiado. El
objetivo en este caso es llevar al experimentador de manera rpida y eficiente por la trayectoria del mejo
ramiento hasta la vecindad general del ptimo. Una vez que se ha encontrado la regin del ptimo, puede
emplearse un modelo ms elaborado, como el de segundo orden, y llevarse a cabo un anlisis para locali
zar el ptimo. En la figura 11-3 se puede ver que el anlisis de una superficie de respuesta puede conside
rarse como el ascenso a una colina, donde la cima de sta representa el punto de la respuesta mxima.
Si el verdadero ptimo es un punto de respuesta mnima, entonces la situacin puede considerarse como
el descenso a un valle.
El objetivo ltimo de la MSR es determinar las condiciones de operacin ptimas del sistema o de
terminar una regin del espacio de los factores en la que se satisfagan los requerimientos de operacin.

430

CAPTULO 11

MTODOS DE SUPERFICIES DE RESPUESTA

Anlisis ms detallados de la MSR se encuentran en Myers y Montgomery [85a], Khur y Cornell [67] y
Box y Draper [16b],

11-2

M TODO DEL ASCENSO MS PR O N U N C IA D O

Frecuentemente la estimacin inicial de las condiciones de operacin ptimas del sistema estarn lejos
del ptimo real. En tales circunstancias, el objetivo del experimentador es pasar con rapidez a la vecindad
general del ptimo. Para ello desea usarse mi procedimiento experimental econmico y eficiente. Cuan
do se est muy lejos del ptimo, por lo general se supone que un modelo de primer orden es una aproxi
macin adecuada de la verdadera superficie en una regin pequea de las x.
El mtodo del ascenso ms pronunciado es un procedimiento para moverse secuencialmente sobre la
trayectoria del ascenso ms pronunciado, es decir, en la direccin del incremento mximo de la respuesta.
Desde luego, si lo que se pretende es una minimizacin, entonces esta tcnica se llama mtodo del descen
so ms pronunciado. El modelo ajustado de primer orden es
9 = K + 'Z
/=1

(11-3)

y la superficie de respuesta de primer orden, es decir, los contornos de es una serie de lneas paralelas
como las que se muestran en la figura 11-4. La direccin del ascenso ms pronunciado es aquella en la que
p se incrementa con mayor rapidez. Esta direccin es paralela a la normal de la superficie de respuesta
ajustada. Por lo general se toma como la trayectoria del ascenso ms pronunciado a la recta que pasa por
el centro de la regin de inters y que es normal a la superficie ajustada. Por lo tanto, ios pasos sobre la

Figura 11-4 Superficie de respuesta de primer orden y trayecto'


ra del ascenso ms pronunciado.

11-2 MTODO DEL ASCENSO MS PRONUNCIADO

431

trayectoria son proporcionales a los coeficientes de regresin {3.}. El tamao real del paso lo determina
el experimentador con base en el conocimiento del proceso o de otras consideraciones prcticas.
Se conducen experimentos sobre la trayectoria del ascenso ms pronunciado hasta que deja de obser
varse un incremento adicional en la respuesta. Entonces puede ajustarse un nuevo modelo de primer or
den, determinarse una nueva trayectoria del ascenso ms pronunciado y el procedimiento contina. En
ltima instancia, el experimentador llegar a la vecindad del ptimo. En general, la falta de ajuste del mo
delo de primer orden indica que se ha llegado a ella. En este momento se realizan experimentos adiciona
les para obtener una estimacin ms precisa del ptimo.

T E M PL O 1 1 - 1 ....................................................................................................................................... ..
Un ingeniero qumico est interesado en determinar las condiciones de operacin que maximizan el ren
dimiento de un proceso. Dos variables controlables influyen en el rendimiento del proceso: el tiempo de
reaccin y la temperatura de reaccin. El ingeniero opera actualmente el proceso con un tiempo de reac
cin de 35 minutos y una temperatura de 155F, que dan como resultado rendimientos de cerca de 40%.
Puesto que es improbable que esta regin contenga el ptimo, el ingeniero ajusta un modelo de primer
orden y aplica el mtodo del ascenso ms pronunciado.
El ingeniero decide que la regin de exploracin para ajustar el modelo de primer orden deber ser
(30,40) minutos de tiempo de reaccin y (150,160)E Para simplificar los clculos, las variables indepen
dientes se codificarn en el intervalo usual (-1 ,1 ). Por lo tanto, si denota la variable natural tiempo y
la variable natural temperatura, entonces las variables codificadas son

El diseo experimental se muestra en la tabla 11-1. Observe que el diseo usado para recabar estos datos
es un factorial 2^ aumentado con cinco puntos centrales. Las rplicas del centro se usan para estimar el
error experimental y permitir la verificacin de la adecuacin del modelo de primer orden. Adems, el di
seo est centrado alrededor de las condiciones de operacin actuales del proceso.
Es posible ajustar un modelo de primer orden a estos datos por el procedimiento de mnimos cuadra
dos. Aplicando los mtodos para diseos de dos niveles se obtiene el siguiente modelo en las variables co
dificadas:
p = 40.44-t-0.775;ci +0.325x.

labia 1 l ' l

Variables
naturales
1.
30
30
40
40
35
35
35
35
35

Datos del proceso para ajustar el modelo de


primer orden

Variables
codificadas

2
150
160
150
160
155
155
155
155
155

Respuesta

y
-1
-1

1
1
0
0
0
0
0

-1
1
-1
1
0
0
0
0
0

39.3
40.0
40.9
41.5
40.3
40.5
40.7
40.2
40.6

432

CAPTULO 11

MTODOS DE SUPERFICIES DE RESPUESTA

Antes de explorar a lo largo de la trayectoria del ascenso ms pronunciado, deber investigarse la


adecuacin del modelo de primer orden. El diseo 'con puntos centrales permite al experimentador
1. Obtener una estimacin del error.
2. Verificar las interacciones (o trminos de productos cruzados) del modelo.
3. Verificar los efectos cuadrticos (curvatura).
Las rplicas del centro pueden usarse para calcular una estimacin del error de la siguiente manera:
,
^

(40.3)^ +(40.5)" +(40.7)" +(40.2)" +(40.6)" -(202.3)" /5


^
^
^
"
= 0.0430

En el modelo de primer orden se supone que las variablesxi


tienen un efecto aditivo sobre la respues
ta. La interaccin entre las variables se representara por el coeficiente ^,2 del trmino de un producto
cruzado xix:2sumado al modelo. La estimacin de mnimos cuadrados de este coeficiente es simplemente
la mitad del efecto de la interaccin que se calcula como en un diseo factorial 2" ordinario, o
^12 = T [(1X 39.3)+ (l X 4 1 .5 )+ (-1 X 4 0 .0 ) + ( - l X 40.9)]

= i(-0.1)
= -0.025
La suma de cuadrados de la interaccin con un solo grado de libertad es
55 Interaccin

= 0.0025
Al comparar 55i,agc6n con " se obtiene el estadstico para la falta de ajuste
p _ '^'^Intctaecin
0.0025
0.0430
= 0.058
que es pequeo, lo cual indica que la interaccin es insignificante.
Otra verificacin de la adecuacin del modelo de lnea recta se obtiene aplicando la verificacin del
efecto de curvatura cuadrtica pura de la seccin 6-6. Recuerde que sta consiste en comparar la respues
ta promedio en los cuatro puntos de la porcin factorial del diseo, por ejemplo
= 40.425, con la res
puesta promedio en el centro del diseo, por ejemplo
= 40.46. Si existe curvatura cuadrtica en la
verdadera funcin de la respuesta, e n t o n c e s - y e es una medida de esta curvatura. Si
y ^22 son los coe
ficientes de los trminos cuadrticos puros x y , entoncesy^ - y e es una estimacin de
+ Piz- En el
ejemplo tratado aqu, una estimacin del trmino cuadrtico puro es
Pn '*^22 ~ yp ~ y c
= 40.425- 40.46
= -0 .0 3 5

433

11-2 MTODO DEL ASCENSO MS PRONUNCIADO


Tabla 11-2

Anlisis de varianza del modelo de primer orden

Fuente de variacin

Suma de
cuadrados

Grados de
libertad

Cuadrado
medio

Modelo
Residual
(Interaccin)
(Cuadrtico puro)
(Error puro)
Tbtal

2.8250
0.1772
(0.0025)
(0.0027)
(0.1720)
3.0022

2
6

1.4125
1
1
4

0.0025
0.0027
0.0430

F,
47.83

Valor/

0.058
0.063

0.8215
0.8142

0.0002

La suma de cuadrados con un solo grado de libertad asociada con la hiptesis nula,

+ P22 = 0>

55 Cuadrtica pura
(4)(5)(-0.035)^
4+5
= 0.0027
donde n^yric son el nmero de puntos de la porcin factorial y el nmero de puntos centrales, respectiva
mente. Puesto que
F

Cuadrtica pura

0.0027
~ 0.0430
= 0.063
es pequeo, no hay indicios de un efecto cuadrtico puro.
En la tabla 11*2 se resume el anhsis de varianza de este modelo. Las verificaciones de la interaccin
y la curvatura no son significativas, mientras que la prueba F de la regresin global es significativa. Ade
ms, el error estndar de
y
es
0.0430

Ambos coeficientes de regresin

y ^2

= 0.10

grandes en comparacin con sus errores estndar. En este

punto no hay razn para cuestionar la adecuacin del modelo de primer orden.
Para apartarse del centro del diseo el punto
= O, X2 = 0) sobre la trayectoria del ascenso ms
pronunciado, se hara un movimiento de 0.775 unidades en la direccin ati por cada 0.325 unidades en la
direccin jcj. Por lo tanto, la trayectoria del ascenso ms pronunciado pasa por el punto (i = 0,^:2 = 0) y
tiene pendiente 0.325/0.775. El ingeniero decide usar 5 minutos de tiempo de reaccin como tamao bsi
co del paso. A l utilizar la relacin entre yAii, se observa que 5 minutos de tiempo de reaccin es equiva
lente a un paso en la variable codificada
de Arj = 1. Por lo tanto, los pasos sobre la trayectoria del
ascenso ms pronunciado son A^i = 1.0000 y
= (0.325/0.775) Axjj = 0.42.
El ingeniero calcula puntos sobre esta trayectoria y observa los rendimientos en los mismos hasta que
se nota un decremento en la respuesta. En la tabla 11-3 se muestran los resultados tanto en variables codi
ficadas como naturales. Aun cuando la manipulacin matemtica de las variables codificadas es ms sen
cilla, deben usarse las variables naturales cuando se corre el proceso. En la figura 11-5 se grafica el

CAPTULO 11 METODOS DE SUPERFICIES DE RESPUESTA

434
Tabla 11-3

Experimento del ascenso ms pronunciado para el ejemplo 11-1

Variables codificadas
Pasos
O

Origen
A

1.00

Origen + A

1.00

Origen +
Origen +
Origen +
Origen +
Origen +
Origen +
Origen +
Origen +
Origen +
Origen +
Origen +

2.00
3.00
4.00
5.00

2A
3A
4A
5A
6A
7A
8A
9A
lOA
llA
12A

6.00

7.00
8.00
9.00
10.00
11.00
12.00

O
0.42
0.42
0.84
1.26
1.68
2.10

2.52
2.94
3.36
3.78
4.20
4.62
5.04

Variables naturales
1
35
5
40
45
50
55
60
65
70
75
80
85
90
95

I2
155
2
157
159
161
163
165
167
169
171
173
175
179
181

41.0
42.9
47.1
49.7
53.8
59.9
65.0
70.4
77.6
80.3
76.2
75.1

rendimiento en cada paso de la trayectoria del ascenso ms pronunciado. Se observan incrementos de la


respuesta hasta el dcimo paso; sin embargo, todos los pasos despus de este punto resultan en un decre
mento del rendimiento. Por lo tanto, deber ajustarse otro modelo de primer orden en la vecindad gene
ral del punto ( li = 8 5 , = 175).
Se ajusta un nuevo modelo de primer orden alrededor del punto (^1 = 85, ^2 = 175). La regin de ex
ploracin para
es [80, 90] y para I 2
[170, 180]. Por lo tanto, las variables codificadas son
^1-85
X, =

Figura 11-5 Rendimiento contra pasos sobre la trayectoria


del ascenso ms pronunciado para el ejemplo 11-1.

11-2 MTODO DEL ASCENSO MS PRONUNCIADO

435

Tabla 11-4 Datos para el segundo modelo de primer


orden
Variables
naturales

Variables
codificadas

Respuesta

y
80
80
90
90
85
85
85
85
85

170
180
170
180
175
175
175
175
175

-1
1
-1
1
0
0
0
0
0

-1
1
1
0
0
0
0
0

76.5
77.0
78.0
79.5
79.9
80.3
80.0
79.7
79.8

D e nueva cuenta se usa un diseo 2^ con cinco puntos centrales. El diseo experimental se muestra en la
tabla 11-4.
El ajuste del modelo de primer orden a las variables codificadas de la tabla 11-4 es
j)= 78.97+I.OOa:,+0.50JC,
En la tabla 11-5 se presenta el anlisis de varianza de este modelo, incluyendo las verificaciones de la
interaccin y del trmino cuadrtico puro. Las verificaciones de la interaccin y del trmino cuadrtico
puro implican que el modelo de primer orden no es una aproximacin adecuada. Esta curvatura en la ver
dadera superficie puede indicar que el experimentador se encuentra cerca del ptimo. En este punto es
necesario hacer anlisis adicionales para localizar el ptimo con mayor precisin.

Por el ejemplo 11-1 se obser/a que la trayectoria del ascenso ms pronunciado es proporcional a los sig
nos y magnitudes de los coeficientes de regresin del modelo ajustado de primer orden

i=sl

Es sencillo dar un algoritmo general para determinar las coordenadas de un punto sobre la trayectoria del
ascenso ms pronunciado. Suponga que el punto jc, = jcj = ... = = Oes la base o punto origen. Entonces
1. Se elige el tamao del paso en una de las variables del proceso, por ejemplo hx. En general, se se
leccionara la variable de la que se tenga mayor informacin, o se seleccionara la variable que
tiene el coeficiente de regresin absoluto | \ ms grande.
Tabla 11-5

Anlisis de vatiania del segundo modelo de primer orden

Fuente de variacin

Suma de
cuadrados

Grados de
libertad

Regresin
Residual
(Interaccin)
(Cuadrtico puro)
(Error puro)
Tbtal

5.00
11,1200
(0.2500)
(10.6580)
(0,2120)
16.1200

2
6
1
1
4
8

Cuadrado
medio

0.2500
10.6580
0.0530

Valor/*

4.72
201.09

0.0955
0.0001

436

CAPTULO 11 MTODOS DE SUPERFICIES DE RESPUESTA

2. El tamao del paso de las otras variables es


Ax. = ^ ^

i = l, 2,

k;

i^ j

3. Se convierten las Ak de variables codificadas a variables naturales.


Para ilustrar, considere la trayectoria del ascenso ms pronunciado calculada en el ejemplo H-1.
Puesto quex^ tiene el coeficiente de regresin ms grande, se selecciona el tiempo de reaccin como la va
riable del paso 1 del procedimiento anterior. Cinco minutos de tiempo de reaccin es el tamao del paso
(con base en el conocimiento del proceso). En trminos de las variables codificadas, ste es Ax-^ = 1.0. Por
lo tanto, por el lincamiento 2, el tamao del paso de la temperatura es

f t /A .

(0.775/1.0)

Para convertir los tamaos de los pasos codificados (Ax- = 1.0 y A^2 = 0.42) a las unidades naturales de
tiempo y temperatura, se usan las relaciones

que dan como resultado


= Ax:i(5) = 1.0(5) = 5 min

(5) = 0.42(5) = 2 F

11-3

ANLISIS DE U N A SUPERFICIE DE RESPUESTA DE SEG U NDO O RDEN

Cuando el experimentador se encuentra relativamente cerca del ptimo, por lo general se requiere un
modelo que incorpore la curvatura para aproximar la respuesta. En la mayora de los casos, el modelo de
segundo orden

= 1

i<j

es adecuado. En esta seccin se indicar cmo usar este modelo ajustado para encontrar el conjunto pti
mo de condiciones de operacin para las a:, as como para caracterizar la naturaleza de la superficie de res
puesta.

11'3.1

Localizacin del punto estacionario

Suponga que quieren encontrarse los niveles tx^,x 2,


que optimizan la respuesta predicha. Este pun
to, en caso de existir, ser el conjunto de las x^, Xj,
para las que las derivadas parciales3y/ dx^ =
^ylQx^ = =d^ldx^ = O.A este punto, por ejemploA:i_JC2_
se le llama punto estacionario. El pun
to estacionario podra representar 1) un punto de respuesta mxima, 2) un punto de respuesta mnima, o
3) un punto silla. Estas tres posibilidades se ilustran en las figuras 11-6 a 11-8.
Las grficas de contorno desempean un papel muy importante en el estudio de las superficies de
respuesta. Mediante la generacin de grficas de contorno utilizando software de computadora para el

11-3 ANLISIS DE UNA SUPERFICIE DE RESPUESTA DE SEGUNDO ORDEN

-O.BO

-0.50

-1.00 *-1.00
a) Superficie de respuesta

b) Grfica de contorno

Figura 11-6

Superficie de respuesta y grfica de contorno que ilustran una superficie con un mximo.

437

438

CAPTULO 11

MTODOS DE SUPERFICIES DE RESPUESTA

1.00

-0 .5 0

-0 .5 0

-1.00 *-1,00
a) Superficie de respuesta

6) Grfica de contorno

Figura 11-7

Superficie de respuesta y grfica de contorno que ilustran una superficie con un mnimo.

11-3 ANLISIS DE UNA SUPERFICIE DE RESPUESTA DE SEGUNDO ORDEN

1.00

-1.00 *-1,00
al Superficie de respuesta

b) Grfica de contorno

Figura 11-8 Superficie de respuesta y grfica de contorno que ilustran una superficie con un punto silla (o rainimax).

439

440

CAPTULO 11 MTODOS DE SUPERFICIES DE RESPUESTA

anlisis de superficie de respuesta, el experimentador puede por lo general caracterizar la forma de la su


perficie y localizar el ptimo con una precisin razonable.
Es posible obtener una solucin matemtica general para la localizacin del punto estacionario. Al
escribir el modelo de segundo orden en notacin matricial, se tiene
><=

+x'b + x'Bx

donde

-j
^ii>

'K
x=

b= h

%> P ik ! ^
^22 J >

B=

simtrica

Es decir, b es un vector (k x 1) de los coeficientes de regresin de primer orden y B es una matriz sim
trica (k X k) cuyos elem entos de la diagonal principal son los coeficientes cuadrticos;>Mraj (^ ) y cu
yos elem en to s que estn fuera de la diagonal son la mitad de los co eficien tes cuadrticos mixtos
(Pi , i ^ ;) La derivada de con respecto a los elementos del vector x igualada con O es
= b- i - 2Bx=0

(11-6)

dx

El punto estacionario es la solucin de la ecuacin 11-6, o


x . = - B 'b

(11-7)

Adems, al sustituir la ecuacin 11-7 en la 11-5, la respuesta predicha en el punto estacionario puede en
contrarse como

11-3.2

Caracterizacin de la superficie de respuesta

Una vez que se ha encontrado el punto estacionario, generalmente es necesario caracterizar la superficie
de respuesta en la vecindad inmediata de este punto. Por caracterizar se entiende determinar si el punto
estacionario es el punto de una respuesta mxima, mnima o un punto silla, Por lo general tambin se de
sea estudiar la sensibilidad relativa de la respuesta a las variables x^, jcj,
x^.
Como ya se seal, la forma ms directa de hacer esto es examinando una grfica de contorno del
modelo ajustado. Si slo hay dos o tres variables en el proceso (lasx), la construccin e interpretacin de
esta grfica de contorno es relativamente sencilla. Sin embargo, incluso cuando hay un nmero relativa
mente reducido de variables, un anlisis ms formal, llamado anlisis cannico, puede ser til.
Es conveniente transformar primero el modelo en un nuevo sistema de coordenadas con el origen en
el punto estacionario x, y despus hacer la rotacin de los ejes de este sistema hasta que sean paralelos a
los ejes principales de la superficie de respuesta ajustada. Esta transformacin se ilustra en la figura 11-9.
Puede demostrarse que se obtiene as el modelo ajustado
(11-9)
donde las {w,} son las variables independientes transformadas y las {A,} son constantes. A la ecuacin
11-9 se le llama la forma cannica del modelo. Adems, las
son slo eigenvalores o races caracters
ticas de la matriz B.

11-3 ANLISIS DE UNA SUPERFICIE DE RESPUESTA DE SEGUNDO ORDEN

441

*2

*1,0
Figura 11-9
orden.

J1

Forma cannica del modelo de segundo

La naturaleza de la superficie de respuesta puede determinarse a partir del punto estacionario y de


los signos y magnitudes de las {A,}. Primero suponga que el punto estacionario est dentro de la regin de
exploracin para ajustar el modelo de segundo orden. Si todas las U} son positivas, x, es un punto de res
puesta mnima; si todas las U} son negativas, x, es un punto de respuesta mxima; y si las {A,} tienen sig
nos diferentes, x* es un punto silla. Adems, la superficie presenta una inclinacin mayor en la direccin
Wi para la que | A. | es el mximo. Por ejemplo, la figura 11-9 describe un sistema para el que x, es un mxi
mo (Al y Aj son negativas) con lAJ > lAj].

EJEMPLO 1 1 - 2 ............................................................... ...............................................................................


Se continuar el anlisis del proceso qumico del ejemplo 11-1. No es posible ajustar un modelo de segun
do orden en las variables jci y jcj utilizando el diseo de la tabla 11-4. El experimentador decide aumentar
este diseo con puntos suficientes para ajustar un modelo de segundo orden.' Obtiene cuatro observacio
nes en
= 0,X2 = 1.414)y(jc, = 1.414,:C2 = 0)-El experimento completo se muestra en la ta b la ll-6 ,y
el diseo se ilustra en la figura 11-10. A este diseo se le llama diseo central compuesto (o DCC), el cual
se estudiar con mayor detalle en la seccin 11-4.2. En esta segunda fase del estudio, dos respuestas adi
cionales fueron de inters, la viscosidad y el peso molecular del producto. Las respuestas tambin se
muestran en la tabla 11-6.
La atencin se centrar en el ajuste de un modelo cuadrtico para la respuesta rendimiento (las
otras respuestas se analizarn en la seccin 11-3.4). Por lo general se utiliza software de computadora
para ajustar una superficie de respuesta y construir las grficas de contorno. La tabla 11-7 contiene la sali
da de Design-Expert. Al examinar la tabla se observa que este paquete de software calcula primero las su
mas de cuadrados extra o secuenciales de los trminos lineales, cuadrticos y cbicos del modelo (hay un
mensaje de advertencia referente a los alias del modelo cbico, ya que el DCC no contiene corridas sufi
cientes para apoyar un modelo cbico completo). Con base en el valor P pequeo de los trminos cuadr-

El ingeniero corri las cuatro observaciones adicionales aproximadamente en el mismo periodo en que corri las nueve observacio
nes originales. Si hubiera transcurrido un lapso grande entre las dos series de corridas, habria sido necesaria la separacin en bloques.
La separacin en bloques en los diseos de superficie de respuesta se revisa en la seccin 11-4.3.

442
Tabla 11-6

CAPTULO 11

MTODOS DE SUPERFICIES DE RESPUESTA

Diseo central compuesto para el ejmplo 11-2

Respuestas
Variables naturales

80
80
90
90
85
85
85
85
85
92.07
77.93
85
85

170
180
170
180
175
175
175
175
175
175
175
182.07
167.93

Variables codificadas

-1
-1
1
1
0
0
0
0
0
1.414
-1.414
0
0

X2

yi

'2

(rendimiento)

(viscosidad)

(peso molecular)

-1
1
-1
1
0
0
0
0
0
0
0
1.414
-1.414

76.5
77.0
78.0
79.5
79.9
8.3
80.0
79.7
79.8
78.4
75.6
78.5
77.0

62
60
66
59
72
69
68
70
71
68
71
58
57

2940
3470
3680
3890
3480
3200
3410
3290
3500
3360
3020
3630
3150

ticos, se decide ajustar un modelo de segundo orden a la respuesta rendimiento. La salida de


computadora muestra el modelo final en trminos tanto de las variables codificadas como de los niveles
naturales o reales de los factores.
En la figura 11-11 se muestra la grfica de la superficie de respuesta tridimensional y la grfica de
contorno para la respuesta rendimiento en trminos de las variables del proceso tiempo y temperatura.
Es relativamente sencillo ver por el examen de estas figuras que el ptimo se encuentra muy cerca de
175Fy 85 minutos de tiempo de reaccin y que la respuesta est en un mximo en este punto. Por el exa
men de la grfica de contorno se observa que el proceso puede ser ligeramente ms sensible a los cambios
en el tiempo de reaccin que a los cambios en la temperatura.

*2

11-i ANLISIS DE UNA SUPERFICIE DE RESPUESTA DE SEGUNDO ORDEN

Tabla 11-7

Salida de computadora de Design-Expen para ajustar un modelo a la respuesta


rendimiento del ejemplo 11-2
___________

Response:
**WARNING: The Cubic Model is Aliased!***
Sequential Model Sum of Squares
Sum of
DF
Source
Squares
80062.16
10.04
0.25
17.95
2.042E-003
0.49
80090.90

Mean
Linear
2FI
Quadratic
Cubic
Residual
Total

1
2
1
2
2
5
13

Mean
Square
80062.16
5.02
0.25
8.98
1.021E-003
0.099
6160.84

F
Valu

Prob > F

2.69
0.12
126.88
0.010

0.1166
0.7350
<0.0001
0.9897

Suggested
Aliased

Suma de cuadrados del modelo secuenciat' : se selecciona el polinomio de orden ms alto


cuando los trminos adicionales son significativos.

Lack of Fit Tests


Sum of
Squares

Source
Linear
2FI
Quadratic
Cubic
Pur Error

DF

Mean
Square

F
Valu

Prob > F

6
5
3
1
4

3.08
3.65
0.094
0.28
0.053

58.14
68.82
1.78
5.31

0.0008
0.0006
0.2897
0.0826

18.49
18.24
0.28
0.28
0.21

Suggested
Aliased

"Pruebas de falta de ajuste": se quiere que el rhodelo seleccionado no tenga falta de ajuste
significativa.

Model Summarv Statistics


Std.
Source Dev. R'Squared
1.37
1.43
0.27
0.31

Linear
2FI
Quadratic
Cubic

0.3494
0.3581
0.9828
0.9828

Adjusted
R-Squared

Predicted
R-Squared

PRESS

0.2193
0.1441
0.9705
0.9588

-0.0435
-0.2730
0.9184
0.3622

29.99
36.59
2.35
18.33

Suggested
Aliased

"Estadsticos de resumen del modelo" : se enfocan en el modelo que minimiza TRESS" o, de


manera equivalente, que maximiza la "R CUADRADA DE PREDICCION".

Response: yleld
ANOVA for Response Surface Quadratic Model
Analysis of variance table [Partlal sum of squares]
Mean
Sum of
DF
Square
Squares
Source
Model
A
B

AB
Residual
Lack o f Fit
Pur Error
Cor Total
Std. Dev.
Mean
C.V.
PRESS

28.25
7.92
2.12
13.18
6.97
0.25
0.50
0.28
0.21
28.74
0.27
78.48
0.34
2.35

5
1
1
1
1
1
7
3
4
12

5.65
7.92
2.12
13.18
6.97
0.25
0.071
0.094
0.053

R'Squared
Adj R-Squared
Pred R-Squared
Adeq Precisin

F
Valu

Prob > F

79.85
111.93
30.01
186.22
98.56
3.53

<0.0001
<0.0001
0.0009
<0.0001
<0.0001
0.1022

1.78

0.2897

0.9828
0.9705
0.9184
23.018

443

444

CAPITULO 11 METODOS DE SUPERFICIES DE RESPUESTA

Tabla 11-7

Factor

(concmuacin)

Coefficient
Estmate

DF

Standard
Error

95% Cl
Low

95% Cl
High

VIF

79.94
0.99
0.52
-1 .3 8
-1 .0 0
0.25

1
1
1
1
1
1

0.12
0.094
0.094
0.10
0.10
0.13

79.66
0,77
0.29
-1.61
-1 .2 4
-0.0 64

80.22
1.22
0.74
-1 .1 4
-0 .7 6
0.56

1.00
1.00
1.02
1.02
1.00

Intercept
A-tme
B-temp
A^
B^
AB

Final Equation in Terms of Coded Factors:


yieid
+79.94
+0,99
+0.52
- 1 .3 8
-

1.00

=
* A
* B
*
*

+0.25 * A * B

Final Equation in Terms of Actual Factors:


yieId
-1430.52285
+7.80749
+ 13.27053
-0.055050
-0.040050
+0.010000

=
*
*
*
*
*

time
temp
time^
temp^'
time * temp

Diagnostics Case Statistics


Student
Cook's Outlier
Run Standard Actual Predlcted
t
Order
Order Valu
Valu Residual Leverage Residual Distance
8
6
9
n
12
10
7
1
5
3
13
2
4

1
2
3
4
5
6
7
8
9
10
11
12
13

76.50
78.00
77.00
79.50
75.60
78.40
77.00
78.50
79.90
80.30
80.00
79.70
79.80

76.30
77.79
76.83
79.32
75.78
78.59
77.21
78.67
79.94
79.94
79.94
79.94
79.94

0.20
0.21
0.17
0.18
-0 .1 8
-0 .1 9
-0.21
-0 .1 7
-0.0 40
0.36
0.060
-0 .2 4
-0 .1 4

0.625
0.625
0.625
0.625
0.625
0.625
0.625
0.625
0.200
0.200
0.200
0.200
0.200

1.213
1.275
1.027
1.089
-1.1 0 7
-1 .1 9 5
-1 .2 8 3
-1 .0 1 9
-0 .1 6 8
1.513
0.252
-1 .0 0 9
-0 .5 8 8

0.409
0.452
0.293
0.329
0.341
0,396
0.457
0.289
0.001
0.095
0.003
0.042
0.014

1.264
1.347
1.032
1.106
-1.1 29
-1.2 40
-1.3 58
-1.0 23
-0 .1 5 6
1.708
0.235
-1.0 10
-0.5 59

La localizacin del punto estacionario tambin podra encontrarse utilizando la solucin general de
la ecuacin 11-7. Observe que
0.995
-1.376
0.1250
B=
b = 0.515
0.1250 -1.001
y, por la ecuacin 11-7, el punto estacionario es
x=-B'%
1 -0.7345
2 -0.0917

-0.0917 '0.995
-1.0096 0.515

0.389
0.306

11-3 ANLISIS DE UNA SUPERFICIE DE RESPUESTA DE SEGUNDO ORDEN

445

182.1

179.7
177.4
175.0
172.6
170.3
74.00
167,9
77.93

80.29

82.64

85.00

87.36

89.71

92.07

Tiempo
a) La grfica de contorno

80.21
77.99 75.77 73.6B

182.1

92.07
89.24
83.69

167.9 ''77.93
>) La grfica de superficie de respuesta

Figura 11-11 Grficas de contomo y de superficie de respuesta de


la respuesta rendimiento, ejemplo 11-2.

Es d e c i r , = 0.389yj2.s = 0.306. En trminos de las variables naturales, el punto estacionario es


0.389=

-8 5

^,-175
0.306 = ^^

de donde se obtiene = 86.95 = 8 7 minutos de tiempo de reaccin y I 2 = 176.53= 176.5F. Este valor est
muy cerca del punto estacionario que se encontr por examen visual en la grfica de contorno de la figura
11-11, Al utilizar la ecuacin 11-8, la respuesta predicha en el punto estacionario puede encontrarse
como
= 80.21.

446

CAPTULO 11 MTODOS DE SUPERFICIES DE RESPUESTA

El anlisis cannico que se describe en esta seccin tambin puede usarse para caracterizar la super
ficie de respuesta. Primero es necesario expresar el modelo ajustado en la forma cannica (ecuacin
11-9). Los eigenvalores
y Xj son las races de la ecuacin de determinantes
|B-AI| = 0
- 1 .3 7 6 - ^
0.1250

0.1250
-1 .0 0 1 -A = 0

que se reduce a
A"+2.3788A + 1. 3639=0
Las races de esta ecuacin cuadrtica so n ij = -0.9641 yAj = -1.4147. Por lo tanto, la forma cannica del
modelo ajustado es
y = 80.21 - 0.964lH-f - 1.4147w,'
Puesto que tanto como son negativas y el punto estacionario est en la regin de exploracin, se con
cluye que el punto estacionario es un mximo.

En algunos problemas MSR puede ser necesario encontrar la relacin entre las variables cannicas
{w,} y las variables del diseo {j:,}. Esto es particularmente cierto cuando es imposible operar el proceso
en el punto estacionario. Como una ilustracin, suponga que en el ejemplo 11-2 el proceso no pudo ope
rarse en = 87 minutos y ^ 2 = 176.5F debido a que esta combinacin de factores resulta en un costo ex
cesivo. Se quiere regresar ahora del punto estacionario a un punto con un costo menor sin incurrir en
prdidas considerables en el rendimiento. La forma cannica del modelo indica que la superficie es me
nos sensible a la prdida de rendimiento en la direccin w^. La exploracin de la forma cannica requiere
convertir los puntos del espacio (w^, W2) en puntos del espacio
x^).
En general, las variables x se relacionan con las variables cannicas w por
w = M '(x - Xs)
donde M es una matriz ortogonal (k X k). Las columnas de M son los eigenvectores normalizados asocia
dos con {A,}. Es decir, si m, es la columna /-sima de M, entonces m, es la solucin de
(B - A,I)m, = O

(11-10)

para la que
= 1.
El procedimiento se ilustra usando el modelo de segundo orden ajustado del ejemplo 11-2. P arali =
-0.9641, la ecuacin 11-10 queda como
(-1-376+0.9641)
0.1250

m il
0.1250
(- L 0 0 1 -1-0.9641) ."*21.

0'
0

-0 .4 12 9 w ii-l-0 .12 5 0 /7i2 j = O


0.1250m ii - 0 .0 3 77 m ji = O

Quiere obtenerse la solucin normalizada de estas ecuaciones, es decir, aquella para la que wfi +ml^ = 1.
No existe una solucin nica para estas ecuaciones, por lo que lo ms conveniente es asignar un valor ar-

11-3 ANLISIS DE UNA SUPERFICIE DE RESPUESTA DE SEGUNDO ORDEN

bitrario a una de las incgnitas, resolver el sistema y normalizar la solucin. Al hacer m


= 0.3027. Para normalizar esta solucin,
y m'j se dividen entre

447

= 1, se encuentra

= V(0.3027)' +(1)^ = 1.0448


Se obtiene as la solucin normalizada
m'

0.3027

1,0448

1.0448

1.0448

1.0448

= 0,2897

que es la primera columna de la matriz M.


Utilizando Aj = -1.4147 puede repetirse el procedimiento anterior, obtenindose Wi2 = -0.9574 y
m 22 = 0.2888 como la segunda columna de M. Por lo tanto, se tiene
0.2897 -0.9574'
M = 0.9571
0.2888
La relacin entre las variables w y x es
_H-2_

0.2897

0.9571 jcj-0.389

-0.9574

0.2888

0.306

= 0,2897(a:i - 0 .389)+ 0.9571(j:, - 0.306)


ivj = -0.9574(Xi - 0.389)+0.2888( a:2 - 0.306)
Si quisiera explorarse la superficie de respuesta en la vecindad del punto estacionario, podran determi
narse los puntos apropiados en los cuales hacer las observaciones en el espacio (wj, W2) y usar despus la
relacin anterior para convertir estos puntos en el espacio
para que puedan realizarse las corridas.

11-3.3

Sistem as d e cordilleras

No es raro encontrar variaciones de las superficies de respuesta con mximos o mnimos puros o con pun
tos silla estudiadas en la seccin anterior. Los sistemas de cordilleras, en particular, son muy comunes.
Considere la forma cannica del modelo de segundo orden presentado anteriormente en la ecuacin
11-9:
y=

Suponga ahora que el punto estacionario x, est dentro de la regin de experimentacin; adems, sea que
una o ms de las A, sean muy pequeas (por ejemplo. A; = 0). Entonces la variable de respuesta es muy in
sensible a las variables w multiplicadas por las A; pequeas.
En la figura 11-12 se presenta una grfica de contorno en la que se ilustra esta situacin para = 2 va
riables con Al = 0. (En la prctica, A, estara cerca de cero pero no sera exactamente igual a cero.) En teo
ra, el modelo cannico para esta superficie de respuesta es

448
*2

CAPTULO 11

MTODOS DE SUPERFICIES DE RESPUESTA


^2

u>2

Figura 11-12 Grfica de contomo de un sistema


de cordilleras estacionarias.

Figura 11-13 Grfica de contorno de un sistema de


cordilleras crecientes.

conAj negativa. Observe que el marcado estiramiento en la direccin w, ha resultado en una lnea de cen
tros en 3>= 70 y el ptimo puede tomarse en cualquier lugar a lo largo de esta lnea. A este tipo de superfi
cie de respuesta se le llama sistema de cordilleras estacionarias.
Si el punto estacionario est muy apartado de la regin de exploracin para el ajuste del modelo de
segundo orden y una A, (o ms) est cerca de cero, entonces la superficie puede ser un sistema de cordille
ras crecientes. En la figura 11-13 se ilustra una cordillera creciente para k = 2 variables c o n lj cerca de
cero yAj negativa. En este tipo de sistema de cordilleras no pueden hacerse inferencias acerca de la verda
dera superficie o del punto estacionario porque x, est fuera de la regin donde se ha ajustado el modelo.
Sin embargo, la exploracin adicional est garantizada en la direccin w^. Si/lj hubiera sido positiva, este
sistema se habra llamado cordillera descendente.

11 '3.4

Respuestas mltiples

Muchos problemas de superficies de respuesta incluyen el anlisis de varias respuestas, como en el ejem
plo 11-2, donde el experimentador midi tres. En dicho ejemplo, el proceso se optimiz nicamente con
respecto a la respuesta rendimiento yi.
La consideracin simultnea de respuestas mltiples requiere construir primero un modelo de super
ficie de respuesta apropiado para cada respuesta y despus intentar encontrar un conjunto de condicio
nes de operacin que optimice en cierto sentido todas las respuestas o que al menos las mantenga en los
rangos deseados. Un estudio completo del problema de las respuestas mltiples se ofrece en Myers y
Montgomery [85 a],
En el ejemplo 11-2 pueden obtenerse modelos para las respuestas viscosidad y peso molecular (yj yyi,
respectivamente) de la siguiente manera:
5>2 = 7 0 .0 0 - 016Xi - 0.95^:^ - 0.69x - 6.69x1 ~
5>3 = 3386.2-1-205.1a:i -I-17.4A:,
En trminos de los niveles naturales del tiempo (^i) y la temperatura (I2), estos modelos son
=-9030.74-1-11393^1-t-97.7081 j
- 275x10'"

- 0.26757^^ - 5 x 1 0 -'

= -6 3 0 8 .8 -1 -4 1 .0 2 5 ^ 1 -1 -3 5 .4 7 3 ^ 2

11-3 ANLISIS DE UNA SUPERFICIE DE RESPUESTA DE SEGUNDO ORDEN

449

En las figuras 11-14 y 11-15 se presentan las grficas de contomo y superficie de respuesta para estos modelos.
Un enfoque relativamente directo para optimizar varias respuestas que funciona bien cuando slo
hay pocas variables en el proceso es la superposicin de las grficas de contorno de cada respuesta. En la
figura 11-16 se muestra una grfica de superposicin para las tres respuestas del ejemplo 11-2, con los
contornos para los que^, (rendimiento) a 78.5,62 3^2(viscosidad) 68, yy^ (peso molecular Mn) < 3400.
Si estos lmites representan condiciones importantes que el proceso debe satisfacer, entonces, como se
muestra en la porcin no sombreada de la figura 11-16, existen varias combinaciones del tiempo y la tem
peratura que resultarn en un proceso satisfactorio. El experimentador puede hacer el examen visual de
182.1

170.3

~6aoo^r~~62 00
167,9 ^ B T ~ r 58.00
77.93
80.29
82.64

85.00
Tiempo

87.36

89.71

92.07

a ) La grfica de contorno

b) La grfica de la superficie de respuesta

Figura 11-14 Grfica de contomo y grfica de la superficie de


respuesta de la viscosidad, ejemplo 11-2.

450

CAPTULO 11 MTODOS DE SUPERFICIES DE RESPUESTA

Tiempo
a) La grfica de contorno

6) l_a grfica de la superficie de respuesta

Figura 11-15 Grfica de contorno y grca de la superficie de


respuesta del peso molecular, ejemplo 11-2.

la grfica de contorno para determinar las condiciones de operacin apropiadas. Por ejemplo, es posible
que el experimentador est ms interesado en la regin ms grande de las dos regiones factibles que se
muestran en la figura 11-16.
Cuando hay ms de tres variables del diseo, se hace muy complicada la superposicin de las grficas
de contorno, ya que la grfica de contorno es bidimensional, y /r - 2 de las variables del diseo deben man
tenerse constantes para construir la grfica. Con frecuencia se necesita una gran cantidad de ensayo y
error para determinar cules son los factores que deben mantenerse constantes y qu niveles seleccionar
para obtener la mejor vista de la superficie. Por lo tanto, existe inters prctico en mtodos de optimiza
cin ms formales para las respuestas mltiples.

11-3 ANLISIS DE UNA SUPERFICIE DE RESPUESTA DE SEGUNDO ORDEN

451

182,1

167.91
77.93

80.29

82.64

85.00

87.36

89.71

92.07

Tiempo

Figura 11-16 Regin del ptimo encontrada superponiendo las su


perficies de respuesta del rendimiento, la viscosidad y el peso molecular,
ejemplo 11-2.

Un enfoque popular consiste en formular y resolver el problema como un problema de optimizacin


restringida. Para ilustrar este enfoque utilizando el ejemplo 11-2, el problema podra formularse como
Mx^i
sujeto a
62sy^ <68
3^3 <3400
Se cuenta con varias tcnicas numricas que pueden usarse para resolver este problema. En ocasiones se
hace referencia a estas tcnicas como mtodos de programacin no lineal. 1 paquete de software
Design-Expert resuelve esta versin del problema utilizando un procedimiento de bsqueda directa. Las
dos soluciones encontradas son
tiempo = 83.5

temperatura = 177.1

= 79.5

tiempo = 86.6

temperatura = 172.25

% = 79.5

y
Observe que la primera solucin es la regin factible superior (la ms pequea) del espacio del diseo
(referirse a la figura 11-16), mientras que la segunda solucin es la regin ms grande. Ambas soluciones
estn muy cerca de los lmites de las restricciones.
Otro enfoque til para la optimizacin de respuestas mtiltiples es usar la tcnica de optimizacin si
multnea popularizada por Derringer y Suich [37]. Su procedimiento hace uso de las funciones con condi
cin de deseable. El enfoque general consiste en convertir primero cada respuesta^, en una funcin con
condicin de deseable individual d que vara en el rango
0<,. < 1
donde si la respuesta)^, est en su meta u objetivo, entonces d = 1, y si la respuesta est fuera de una regin
aceptable, d = 0. Despus las variables del diseo se eligen para maximizar la condicin de deseable global

......
donde hay m respuestas.

452

CAPITULO 11 METODOS DE SUPERFICIES DE RESPUESTA

Las funciones con condicin de deseable individual estn estructuradas como se indica en la figura
11-17. Si el objetivo T para la respuesta y es un valor mximo,
O
d=

'y-O
\T-L)
1,

y<L
L^y^T

(11-11)

y>T

cuando la ponderacin r = 1, la funcin con condicin de deseable es lineal. Al elegir r > 1 se pone ms
inters en estar cerca del valor objetivo, y cuando se elige O < r < 1 esto tiene menos importancia. Si el ob
jetivo para la respuesta es un valor mnimo,
1
d=

/U
TT- y ]\f
\U-Tj
O

y<T
( 11- 12)

T^y<U
y>U

La funcin con condicin de deseable de dos colas que se muestra en la figura ll-1 7 c supone que el obje
tivo se localiza entre los lmites inferior (L) y superior {U), y se define como
O

/y - LTV\r^
d=

\T~Lj
(U-y\
U~T
O

y<L
L<y<T
(11-13)
T<y<U
y>U

Se us el paquete de software Design-Expert para resolver el ejemplo 11-2 utilizando el enfoque de la


funcin con condicin de deseable. Se eligi T = 80 como el objetivo para la respuesta rendimiento, U =
70, y se fij la ponderacin de esta condicin de deseable individual igual a la unidad. Se hizo T = 65 para
la respuesta viscosidad con L = 62 y 7 = 68 (para ser consistente con las especificaciones), con ambas
ponderaciones r^ = r2 1. Por ltimo, se indic que cualquier peso molecular abajo de 3400 era acepta
ble. Se encontraron dos soluciones.
Solucin 1:
Tiempo = 86.5
5), - 78.8

Temperatura = 170.5
h = 65

D = 0.822
5>3 = 3287

Solucin 2:
Tiempo = 82
y, = 78.5

Temperatura - 178.8
= 65

D = 0.792
% = 3400

La solucin 1 tiene la condicin de deseable global ms alta. Observe que resulta en una viscosidad acor
de con el objetivo y en un peso molecular aceptable. Esta solucin est contenida en la ms grande de las
dos regiones de operacin de la figura 11-16, mientras que la segunda solucin est contenida en la regin
ms pequea. En la figura 11-18 se muestran las grficas de la superficie de respuesta y de contorno de la
funcin con condicin de deseable global D.

11-3 ANLISIS DE UNA SUPERFICIE DE RESPUESTA DE SEGUNDO ORDEN

a) El objetivo (blanco) es maximizar y

b) El objetivo (blanco) es minimizar y

c) El objetivo (blanco) es que y est tan cerca como sea posible de la especificacin

Figura 11-17 Funciones con condicin de deseables individuales para la optimiza


cin simultnea.

453

454

CAPITULO 11

METODOS DE SUPERFICIES DE RESPUESTA

180.00
90.00

177.50
87.50
175 .'
85.00
T e m p e ra tu ra
T ie m p o

172.50
170.00
a)

80,00
S u p e r f ic ie d e r e s p u e s t a

Tiempo
fi) Grfica de coritorno

Figura 11-18 Grfica de la superficie de respuesta y de contorno de la funcin con con


dicin de deseable del ejemplo 11-2.

11-4 DISEOS EXPERIMENTALES PARA AJUSTAR SUPERFICIES DE RESPUESTA

11-4

455

DISEO S EXPERIMENTALES PA R A AJUSTAR


SUPERFICIES DE RESPUESTA

El ajuste y anlisis de superficies de respuesta se facilita en gran medida con la eleccin apropiada del di
seo experimental. En esta seccin se revisan algunos aspectos de la seleccin del diseo apropiado para
ajustar superficies de respuesta.
Cuando se selecciona un diseo de superficie de respuesta, algunas de las caractersticas deseables en
el diseo son las siguientes:
1. Proporciona una distribucin razonable de los puntos de los datos (y en consecuencia informa
cin) en toda la regin de inters.
2. Permite que se investigue la adecuacin del modelo, incluyendo la falta de ajuste.
3. Permite que los experimentos se realicen en bloques.
4. Permite que los diseos de orden superior se construyan secuencialmente.
5. Proporciona una estimacin interna del error.
6. Proporciona estimaciones precisas de los coeficientes del modelo.
7. Proporciona un buen perfil de la varianza de prediccin en toda la regin experimental.
8. Proporciona una robustez razonable contra los puntos atpleos o los valores faltantes.
9. No requiere un gran nmero de corridas.
10. No requiere demasiados niveles de las variables independientes.
11. Asegura la simplicidad del clculo de los parmetros del modelo.
Estas caractersticas entran en conflicto en ocasiones, por lo que con frecuencia debe aplicarse la discrecionalidad al seleccionar un diseo. Para mayor informacin sobre la eleccin de un diseo de superficie
de respuesta, referirse a Myers y Montgomery [85a], Box y Draper [16b] y Khuri y Comell [67],

11'4.1

D iseos para ajustar el m odelo de primer orden

Suponga que quiere ajustarse el modelo de primer orden en k variables


k

(11-14)

Hay una clase nica de diseos que minimizan la varianza de los coeficientes de regresin

}. Se trata

de los diseos de primer orden ortogonales. Un diseo de primer orden es ortogonal si todos los elemen
tos que estn fuera de la diagonal de la matriz (X'X) son cero. Esto implica que la suma de los productos
cruzados de las columnas de la matriz X sea cero.
La clase de los diseos de primer orden ortogonales incluye los factoriales 2^ y las fracciones de la se
rie 2*^en las que los efectos principales no son alias entre s. Al usar estos diseos se supone que los niveles
bajo y alto de los k factores estn codificados en los niveles usuales 1 .
El diseo 2* no permite la estimacin del error experimental a menos que se hagan rplicas de algu
nas corridas. Un mtodo comn de incluir las rplicas en el diseo 2* es aumentar el diseo con varias ob
servaciones en el centro (el puntos:, = O, / = 1, 2 ,..., k ). L,a adicin de puntos centrales al diseo 2^ no
influye en las
} para i > 1, pero la estimacin deySo se convierte en el gran promedio de todas las obser
vaciones. Adems, la adicin de puntos centrales no altera la propiedad de ortogonalidad del diseo. En

456

CAPTULO 11

MTODOS DE SUPERFICIES DE RESPUESTA

Figura 11-19 El diseo smplex para


a ) k - 2 variables y b) k = 3 variables.

el ejemplo 11-1 se ilustra el uso de un diseo 2^aumentado con cinco puntos centrales para ajustar un mo
delo de primer orden.
Otro diseo de primer orden ortogonal es el diseo smplex. El diseo smplex es una figura de lados
regulares con k + 1 vrtices en k dimensiones. Por lo tanto, el diseo smplex para /c = 2 es un tringulo
equiltero, y para A: = 3 es un tetraedro regular. En la figura 11-19 se muestran diseos smplex de dos y
tres dimensiones.

11'4.2

D iseos para ajustar el m odelo de segundo orden

En el ejemplo 11-2 se hizo la introduccin informal (e incluso antes en el ejemplo 6-6) del diseo central
compuesto o DCC para ajustar un modelo de segundo orden. Se trata de la clase ms popular de diseos
usados para ajustar estos modelos. En general, el DCC consta de un factorial 2^ (o de un factorial fraccio
nado de resolucin V) con rip corridas, 2k corridas axiales o estrella y c corridas centrales. En la figura
11-20 se muestra el DCC para k = 2 y k = 3 factores.
El despliegue prctico de un DCC surge con frecuencia a travs de la experimentacin secuencial,
como en los ejemplos 11-1 y 11-2. Es decir, se ha usado un diseo 2* para ajustar un modelo de primer or
den, este modelo ha presentado falta de ajuste, y despus se agregaron las corridas axiales para permitir la
incorporacin de los trminos cuadrticos en el modelo. El DCC es un diseo muy eficiente para ajustar
el modelo de segundo orden. Hay dos parmetros en el diseo que deben especificarse; la distancia a de
las corridas axiales al centro del diseo y el nmero de puntos centrales tic- A continuacin se analiza la
eleccin de estos dos parmetros.

11-4 DISEOS EXPERIMENTALES PARA AJUSTAR SUPERFICIES DE RESPUESTA

45 7

*2

(O,a)
(-1.+1)

(-a, 0)

(0,0)

(ot, 0)
(+1,-1)

H ,-1)
(0,-a)

Figura 11-20 Diseos centrales compuestos para fc = 2 y A; = 3.

Rotabilidad
Es importante que el modelo de segundo orden proporcione buenas predicciones en toda la regin de in
ters. Una manera de definir buenas es requerir que el modelo tenga una varianza razonablemente
consistente y estable de la respuesta predicha en los puntos de inters x. Recuerde, por la ecuacin 10-40,
que la varianza de la respuesta predicha en algn punto x es
K [ X x )] = a ^ x '(X 'X J - ix

Boxy Hunter [17a] propusieron que un diseo de superficie de respuesta de segundo orden debe ser rotable. Esto significa que la V[5>(x)] es la misma en todos los puntos x que estn a la misma distancia dl cen
tro del diseo. Es decir, la varianza de la respuesta predicha es constante en esferas.
En la figura 11-21 se muestran los contornos de
constante para el ajuste del modelo de se
gundo orden utilizando el DCC en el ejemplo 11-2. Observe que los contornos de desviacin estndar
constante de la respuesta predicha son crculos concntricos. Un diseo con esta propiedad dejar la varanza de 5*sin cambio cuando el diseo se rota alrededor del centro (O, O,..., 0), de ah el nombre de dise
o rotable.
La rotabilidad es una base razonable para la seleccin de un diseo de superficie de respuesta. Puesto
que la finalidad de la MSR es la optimizacin, y la localizacin del ptimo se desconoce antes de correr el
experimento, tiene sentido el uso de un diseo que proporcione una precisin de estimacin igual en to
das las direcciones (puede demostrarse que cualquier diseo de primer orden ortogonal es rotable).
Un diseo central compuesto se hace rotable mediante la eleccin de a. El valor de a para la rotabili
dad depende del nmero de puntos en la porcin factorial del diseo; de hecho, a =
produce un di
seo central compuesto rotable, donde rip es el nmero de puntos usados en la porcin factorial del
diseo.
El DCC esfrico
La rotabilidad es una propiedad esfrica; es decir, tiene mayor sentido como criterio de diseo cuando la
regin de inters es una esfera. Sin embargo, no es importante tener una rotabihdad exacta para tener un
buen diseo. D e hecho, para una regin esfrica de inters, la mejor eleccin de a desde el punto de vista
de la varianza de prediccin para el DCC es hacer a = Vk. Este diseo, llamado DCC esfrico, coloca to
dos los puntos factoriales y axiales del diseo sobre la superficie de una esfera de radio VJc. Para una expo
sicin ms ampha del tema, ver Myers y Montgomery [85a].

458

CAPTULO 11

MTODOS DE SUPERFICIES DE RESPUESTA

0.3019

0.3484

T ie m p o

n ) C o n to r n o s d e V V 'll* ) )

b | L a g r f ic a d e ia s u p e r f ic ie d e r e s p u e s t a

Figura 11-21 Contornos de desviacin estndar cons


tante de la respuesta predicha para el DCC rotable, ejem
plo 11-2.

Corridas centrales en el D C C

La eleccin de a en el DCC est dictada principalmente por la regin de inters. Cuando esta regin es
una esfera, el diseo debe incluir corridas centrales para proporcionar una varianza razonablemente es
table de la respuesta predicha. En general, se recomiendan de tres a cinco corridas centrales.
El diseo de B ox-b eh nk en

Box y Behnken [13] han propuesto algunos diseos de tres niveles para ajustar superficies de respuesta.
Estos diseos se forman combinando factoriales 2* con diseos de bloques incompletos. Los diseos re-

11-4 DISEOS EXPERIMENTALES PARA AJUSTAR SUPERFICIES DE RESPUESTA

Tabla 11-8

Diseo de Box-Behnken
para tres variables

Corrida
1
2
3
4
5
6
7
8
9
10
11
12

-1
1
-1
1
O
O
O
0
-1
-1
1
1

13

o
o
o

14
15

459

Jh
O
O
O
O

sultantes suelen ser muy eficientes en trminos del nmero requerido de corridas, y son rotables o casi rotables.
En la tabla 11-8 se muestra el diseo de Box-Behnken para tres variables. El diseo tambin se ilustra
geomtricamente en la figura 11-22. Observe que el diseo de Box-Behnken es un diseo esfrico, con to
dos los puntos localizados en una esfera de radio V2. Asimismo, el diseo de Box-Behnken no contiene
ningn punto en los vrtices de la regin cbica creada por los h'mites superior e inferior de cada variable.
Esto podra ser una ventaja cuando los puntos de los vrtices del cubo representan combinaciones de los
niveles de los factores cuya prueba es prohibitivamente costosa o imposible debido a restricciones fsicas
del proceso.
Regin cuboidal de inters

Existen muchas situaciones en las que la regin de inters es cuboidal en lugar de esfrica. En estos casos,
una variante til del diseo central compuesto es el diseo central compuesto con centros en las caras o el
cubo con centros en las caras, en el que a = 1. En este diseo los puntos axiales o estrella se localizan en
los centros de las caras del cubo, como se muestra en la figura 11-23 para k = 3. Esta variante del diseo
central compuesto se usa en ocasiones debido a que slo requiere tres niveles de cada factor, y en la prc-

-t-1-r

Figura 11-22
factores.

Diseo de Box-Behnken para tres

Figura 11-23 Diseo central compuesto con centros


en las caras para k = 3.

460

CAPTULO 11 MTODOS DE SUPERFICIES DE RESPUESTA

1.00

-1.00

-1.00

(al Superficie de respuesta

0,00 >

1.00

(6) Grfica de contorno

Figura 11-24 Desviacin estndar de la respuesta predicha


centros en las caras con k = 3, ric = 3 y x = 0.

P^ra el cubo con

11-4 DISEOS EXPERIMENTALES PARA AJUSTAR SUPERFICIES DE RESPUESTA

461

Figura 11-25 D iseos eq u in ad iales para dos variables, a) Hexgono, b) Pen


tgono.

tica con frecuencia es difcil cambiar los niveles de los factores. Sin embargo, observe que los diseos cen
trales compuestos no son rotables.
El cubo con centros en las caras no requiere tantos puntos centrales como el DCC esfrico. En la
prctica, Hq = 2 o 3 t s suficiente para proporcionar una buena varianza de prediccin en toda la regin ex
perimental. Cabe sealar que en ocasiones se emplearn ms corridas centrales para dar una estimacin
razonable del error experimental. En la figura 11-24 se muestra la raz cuadrada de la varianza de predic
cin Vf^5>(x)] del cubo con centros en las caras para k = 3 con ric = 3 puntos centrales (Xj = 0). Observe
que la desviacin estndar de la respuesta predicha es razonablemente uniforme en una porcin relativa
mente larga del espacio del diseo.

Otros diseos
Existen muchos otros diseos de superficie de respuesta que en ocasiones son tiles en la prctica. Para
dos variables, podran usarse diseos compuestos de puntos cuya separacin en un crculo es igual y que
forman polgonos regulares. Puesto que los puntos del diseo son equidistantes del origen, a estos arre
glos con frecuencia se les llama diseos equirradiales.
Para )t = 2, un diseo equirradial rotable se obtiene combinando 2 ^ 5 puntos con una separacin
igual en un crculo con/ii ^ 1 punto en el centro del crculo. Diseos de particular utilidad parafc = 2 son
el pentgono y el hexgono. Estos diseos se muestran en la figura 11-25. Otros diseos tiles incluyen el
diseo compuesto pequeo, el cual consiste en un factorial fraccionado en el cubo de resolucin III* (los
efectos principales son alias de las interacciones de dos factores y ninguna de las interacciones de dos fac
tores es alias entre s) y las corridas axiales y centrales usuales, y la clase de los diseos hbridos. Estos di
seos pueden ser de valor considerable cuando es importante reducir el nmero de corridas tanto como
sea posible.
En la tabla 11-9 se muestra un diseo compuesto pequeo para/: = 3 factores. Este diseo usa la frac
cin un medio estndar del diseo 2^ en el cubo, ya que satisface los criterios de la resolucin III*. El dise
o tiene cuatro corridas en el cubo y seis corridas axiales, y debe incluir al menos un punto central. Por lo
tanto, el diseo tiene un mnimo de TV= 11 ensayos, y el modelo de segundo orden en fc = 3 variables tiene
p = 10 parmetros por estimar, por lo que se trata de un diseo muy eficiente con respecto al nmero de
corridas. El diseo de la tabla 11-9 tiene Wc = 4 corridas centrales. Se seleccion a = 1.73 para obtener un
diseo esfrico debido a que el diseo compuesto pequeo no puede hacerse rotable.
En la tabla 11-10 se muestra un diseo hbrido para A: = 3. Algunos de estos diseos tienen niveles
irregulares, y esto puede ser un factor limitante para su aplicacin. Sin embargo, se trata de diseos muy

462

CAPTULO 11 MTODOS DE SUPERFICIES DE RESPUESTA

Tabla 11-9

Orden
estndar
1
2
3
4
5
6
7
8
9
10
11
12
13
14

Diseo compuesto pequeo


para k = 3 factores

1.00
1.00
- 1.00
- 1.00
-1.73
1.73
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00

X2

^3

1.00
- 1.00
1.00
- 1.00
0.00
0.00
-1.73
1.73
0.00
0.00
0.00
0.00
0.00
0.00

- 1.00
1.00
1.00
- 1.00
0.00
0.00
0.00
0.00
-1.73
1.73
0.00
0.00
0.00
0.00

pequeos, y poseen excelentes propiedades de la varianza de prediccin. Para mayores detalles acerca de
los diseos compuestos pequeos y los diseos hbridos, referirse a Myers y Montgomeiy [85a].

11-4.3

Form acin de bloques en los diseos de superficie de respuesta

Cuando se usan diseos de superficie de respuesta, con frecuencia es necesario considerar la formacin
de bloques para eliminar las variables perturbadoras. Por ejemplo, este problema puede ocurrir cuando
un diseo de segundo orden se ensambla secuencialmente a partir de un diseo de primer orden, como se
ilustr en los ejemplos 11-1 y 11-2, Puede transcurrir tiempo considerable entre que se corre el modelo de
primer orden y se corren los experimentos complementarios requeridos para construir un diseo de se-

Tabla 11-10

Orden
estndar
1
2
3
4
5
6
7
8
9
10
11

Diseo hbrido para k = 3


factores

Xl
0.00
0.00
- 1.00
1.00
- 1.00
1.00
1.41
-1.41
0.00
0.00
0.00

*2
0.00
0.00
- 1.00
- 1.00
1.00
1.00
0.00
0.00
1.41
-1.41
0.00

1.41
-1.41
0.71
0.71
0.71
0.71
-0.71
-0.71
-0.71
-0.71
0.00

11-4 DISEOS EXPERIMENTALES PARA AJUSTAR SUPERFICIES DE RESPUESTA

463

gundo orden, y durante este tiempo las condiciones de prueba pueden cambiar, haciendo necesaria la for
macin de bloques.
Se dice que un diseo de superficie de respuesta se forma de bloques ortogonales si se divide en blo
ques tales que sus efectos no afecten las estimaciones de los parmetros del modelo de superficie de res
puesta. Si se usa un diseo 2* o 2*'"'' como un diseo de superficie de respuesta de primer orden, pueden
usarse los mtodos del captulo 7 para disponer las corridas en 2 bloques. Los puntos centrales de estos
diseos debern asignarse por igual entre los bloques.
Para hacer la formacin de bloques ortogonales de un diseo de segundo orden, deben satisfacerse
dos condiciones. Si hay w* observaciones en el bloque 6-simo, entonces estas condiciones son

1. Cada bloque debe ser un diseo ortogonal de primer orden; es decir,


^

=0

i ^ j = O, 1,

para toda b

u=l

donde
y Xj^ son los niveles de las variables /-sima y y-sima en la corrida w-sima del experi
mento con
= 1 para toda u.
2. La fraccin de la suma de cuadrados total para cada variable con que contribuye cada bloque,
debe ser igual a la fraccin de las observaciones totales que estn contenidas en el bloque;
es decir.

X.

i = \, 2,

para tod ab

X.

donde N es el nmero de corridas del diseo.


Como un ejemplo de la aplicacin de estas condiciones, considere un diseo central compuesto rotable en = 2 variables con = 12 corridas. Los niveles aij yx^ de este diseo pueden escribirse en la matriz
del diseo

x^
-1
-1
1
-1
-1
1
1
1
0
0
0
D = 1.414 0
0
-1.414 0
0
1.414
0
-1.414
0
0
0
0

Bloque 1

Bloque 2

Observe que el diseo se ha dispuesto en dos bloques, con el primer bloque consistiendo en la porcin
factorial del diseo ms dos puntos centrales y el segundo bloque consistiendo en los puntos axiales ms

464

CAPTULO 11 MTODOS DE SUPERFICIES DE RESPUESTA

dos puntos centrales adicionales. Es claro que la condicin 1 se satisface; es decir, ambos bloques son di
seos de primer orden ortogonales. Para investigar la condicin dos, considere primero el bloque 1 y ob
serve que

E ^1 = z

u=l

^2=4

U=1

= E

= 8

Til = 6

Por lo tanto,

N
X,..

A
12

As, la condicin 2 se satisface en el bloque 1. Para el bloque 2 se tiene


l : 4 = l : 4 .= 4
H=1
=1

2 = 6

Por lo tanto,
2
E * *
K=1
N

y . xi

12

Puesto que la condicin 2 tambin se satisface en el bloque 2, este diseo est formado de bloques ortogonales.
En general, el diseo central compuesto siempre puede construirse para hacer la formacin de blo
ques ortogonales en dos bloques con el primer bloque consistiendo en rip puntos factoriales ms cf
tos centrales y el segundo bloque consistiendo en
= 2A: puntos axiales ms Wq4 puntos centrales. La
primera condicin de la formacin de bloques ortogonales se cumplir siempre independientemente del
valor que se use para a en el diseo. Para que la segunda condicin se cumpla,

(11-15)

El miembro izquierdo de la ecuacin 11-15 es laVrip, y despus de sustituir esta cantidad, la ecuacin para
el valor de a que resultar en la formacin de bloques ortogonales puede resolverse como
1/2
a =

n p jn ^ + n c ^ )
+ cf)

(11-16)
^

114 DISEOS EXPERIMENTALES PARA AJUSTAR SUPERFICIES DE RESPUESTA

465

Este valor de a no dar como resultado, en general, un diseo rotable o esfrico. Si se requiere que el
diseo tambin sea rotable, entonces a =
y
+ cf)

No siempre es posible encontrar un diseo que satisfaga exactamente la ecuacin 11-17. Por ejemplo, si
fc = 3, j; = 8 y
= 6, la ecuacin 11-17 se reduce a
1/2 _ 8 (6 + w;^)
(8)^'^ =

2{S+rt(,p)

2.83 =

48+ 8W|^
16+2(,^

Es imposible encontrar valores de Kca y cf que satisfagan exactamente esta ltima ecuacin. Sin embar
go, observe que si ticf = 3 y
= 2, entonces el segundo miembro es
4 8 + 8 (2 )

. g .

1 6 + 2 (3 )

'

por lo que el diseo se separa en bloques casi ortogonales. En la prctica podra relajarse un tanto el re
querimiento de la rotabilidad o bien el de la formacin de bloques ortogonales sin ninguna prdida im
portante de informacin.
El diseo central compuesto es muy verstil en cuanto a su capacidad para incorporar la formacin
de bloques. Si k es lo suficientemente grande, la porcin factorial del diseo puede dividirse en dos o ms
bloques. (El nmero de bloques factoriales debe ser una potencia de 2, con la porcin axial formando un
solo bloque.) En la tabla 11-11 se presentan varias disposiciones tiles de la formacin de bloques para el
diseo central compuesto.
Tabla 11-11

Algunos diseos centrales compuestos rotables y casi rotables que se separan en bloques ortogonales
k

5
iR ep .

6
iR ep .

7
^Rep,

Bloque(s) factoiial(es)
4

16

32

16

64

32

128

64

16

16

16

10

10

22

20

riA

10

10

12

12

14

14

ncA
Nmero total de puntos en el
bloque axial
Nmero total de puntos N del
diseo

11

10

14

11

18

14

25

18

14

20

30

54

33

90

54

169

80

np
Nmero de bloques
Nmero de puntos en cada
bloque
Nmero de puntos centrales
en cada bloque
Nmero total de puntos en
cada bloque
Bloque axial

Valores de a
Separacin en bloques ortogonales

1.4142 1.6330

2.0000 2.3664 2,0000 2.8284 2.3664 3.3636 2.8284

Rotabilidad

1.4142

2.0000 2.3784 2.0000 2.8284 2.3784 3.3333

1.6818

2.8284

466

CAPTULO 11

MTODOS DE SUPERFICIES DE RESPUESTA

Cabe destacar dos puntos importantes acerca del anlisis de varianza cuando el diseo de superficie
de respuesta se ha corrido en bloques. El primero se refiere al uso de los puntos centrales para calcular
una estimacin del error puro. Slo los puntos centrales que se corren en el mismo bloque pueden consi
derarse como rplicas, por lo que el trmino del error puro slo puede calcularse dentro de cada bloque.
Si la variabilidad es consistente en todos los bloques, entonces estas estimaciones del error puro podran
agruparse. El segundo punto se refiere al efecto de bloque. Si el diseo se forma de bloques ortogonales
en m bloques, la suma de cuadrados de los bloques es
m

ryl

(11-18)
1=1

donde B, es el total de las observaciones en el bloque ft-simo y G es el gran total de las N observaciones
en los m bloques. Cuando los bloques no son exactamente ortogonales, puede usarse la prueba general de
significacin de la regresin (el mtodo de la suma de cuadrados extra) que se describi en el captulo 10.

11'4.4

D iseos (ptimos) generados por computadora

Los diseos estndares de superficie de respuesta estudiados en las secciones anteriores, como el diseo
central compuesto y el diseo de Box-Behnken y sus variantes (como el cubo con centros en las caras), son
de uso generalizado porque son diseos bastante generales y flexibles. Si la regin experimental es un
cubo o una esfera, de manera tpica existe un diseo de superficie de respuesta que ser aplicable al pro
blema. Sin embargo, ocasionalmente un experimentador se encuentra con una situacin en la que el dise
o estndar de superficie de respuesta puede no ser una eleccin obvia. Los diseos generados por
computadora son una alternativa por considerar en estos casos.
Hay tres situaciones en las que puede ser apropiado algn tipo de diseo generado por computadora.
1. Una regin experimental irregular. Si la regin de inters del experimento no es un cubo o una esfera,
los diseos estndares quiz no sean la mejor eleccin. Las regiones de inters irregulares ocurren con
bastante frecuencia. Por ejemplo, un experimentador est investigando las propiedades de un adhesivo
particular. El adhesivo se aplica a dos piezas y despus se cura a una temperatura elevada. Los dos facto
res de inters son la cantidad de adhesivo aplicada y la temperatura de curado. En los rangos de estos dos
factores, tomados como -1 a -I-1 en la escala de la variable codificada usual, el experimentador sabe que si
se aplica muy poco adhesivo y la temperatura de curado es muy baja, las piezas no se pegarn satisfacto
riamente. En trminos de las variables codificadas, esto lleva a una restriccin sobre las variables del dise
o, por ejemplo
-L 5 < x , +X2

donde a:i representa la cantidad aplicada de adhesivo y x 2 la temperatura. Adems, si la temperatura es de


masiado elevada y se aplica mucho adhesivo, las piezas resultarn daadas por la fatiga trmica o bien
ocurrir un pegado inadecuado. Por lo tanto, hay otra restriccin sobre los niveles de los factores
+ x^ l

En la figura 11-26 se muestra la regin experimental que resulta de aplicar estas restricciones. Observe
que las restricciones eliminan de hecho dos de los vrtices del cuadrado, produciendo una regin experi-

11-4 DISEOS EXPERIMENTALES PARA AJUSTAR SUPERFICIES DE RESPUESTA

467

Figura 11'26 Regin restringida del diseo en dos variables.

mental irregular (en ocasiones a estas regiones irregulares se les llama latas abolladas). No existe nin
gn diseo de superficie de respuesta estndar que se ajuste exactamente a esta regin.
2. Un modelo no estndar. Por lo general, un experimentador elige un modelo de superficie de respues
ta de primer o de segundo orden, consciente de que este modelo emprico es una aproximacin del verda
dero mecanismo subyacente. Sin embargo, en ocasiones el experimentador puede tener un conocimiento
o idea especial acerca del proceso bajo estudio que puede sugerir un modelo no estndar. Por ejemplo, el
modelo
y = Pq

+ ^ 2^ 2
, x , X. + ^ i

"I"^11^1 *^22^2
+

puede ser de inters. El experimentador estara interesado en obtener un diseo eficiente para ajustar
este modelo reducido de cuarto grado. Como otra ilustracin, en ocasiones se encuentran problemas de
superficie de respuesta en los que algunos de los factores del diseo son variables categricas. No hay di
seos de superficie de respuesta estndares para esta situacin (referirse a Myers y Montgomery [85a]
para un estudio de las variables categricas en problemas de superficie de respuesta).
3. Requerimientos inusuales para el tamao de la muestra. Ocasionalmente, un experimentador quiz
necesite reducir el ntimero de corridas requeridas en un diseo estndar de superficie de respuesta. Por
ejemplo, suponga que se pretende ajustar un modelo de segundo orden en cuatro variables. El diseo
central compuesto para esta situacin requiere entre 28 y 30 corridas, dependiendo del nmero de puntos
centrales seleccionados. Sin embargo, el modelo slo tiene 15 trminos. Si las corridas tienen un costo
muy elevado o se llevan mucho tiempo, el experimentador querr un diseo con menos ensayos. Aun
cuando los diseos generados por computadora pueden usarse para este fin, por lo general se cuenta con
enfoques mejores. Por ejemplo, puede construirse un diseo compuesto pequeo para cuatro factores

468

CAPTULO 11

MTODOS DE SUPERFICIES DE RESPUESTA

con 20 corridas, incluyendo cuatro puntos centrales, y tambin se cuenta con un diseo hbrido con ape
nas 16 corridas. stas son en general elecciones superiores al uso de un diseo generado por computado
ra para reducir el nmero de ensayos.
Gran parte del desarrollo de los diseos generados por computadora se deriva del trabajo de Kiefer
[65a, b] y Kiefer y Wolfowitz [66] en la teora de los diseos optimales. Por diseo optimal se entiende un
diseo que es mejor con respecto a algn criterio. Se requieren programas de computadora para cons
truir estos diseos. El enfoque usual es especificar un modelo, determinar la regin de inters, seleccio
nar el nmero de corridas que debern hacerse, especificar el criterio de optimalidad y despus elegir los
puntos del diseo de un conjunto de puntos candidatos que el experimentador considerara usar. D e ma
nera tpica, los puntos candidatos son una matriz de puntos distribuidos en la regin factible del diseo.
Hay varios criterios de optimahdad populares. Quiz el de uso ms generahzado es el criterio de opti
malidad D. Se dice que un diseo es optimal D si
K x 'x r ^ i

se minimiza. Ocurre que un diseo optimal D minimiza el volumen de la regin de confianza conjunta
para el vector de los coeficientes de regresin. Una medida de la eficiencia relativa del diseo 1 respecto
del diseo 2 de acuerdo con el criterio D est dada por
Vp

D ,=

(11-19)
^ l( x ;x ,r

donde Xj y X2 son las matrices X de los dos diseos y p es el nmero de parmetros del modelo.
El criterio de optimalidad^ slo se ocupa de las varianzas de los coeficientes de regresin. U n diseo
es optimaM si minimiza la suma de los elementos de la diagonal principal de (X'X)^[a sta se le llama la
traza de (X'X)"^ denotada generalmente como tr(X'X)']. Por lo tanto, un diseo optim al^ minimiza la
suma de las varianzas de los coeficientes de regresin.
Puesto que muchos experimentos de superficie de respuesta se refieren a la prediccin de la respues
ta, los criterios de la yarianza de prediccin son de gran inters prctico. Quizs el ms popular de estos
criterios sea el criterio de optimalidad G. Se dice que un diseo es optimal G si miimiza la varianza de
prediccin escalada mxima en la regin del diseo. Es decir, si el valor mximo de

en la regin del diseo es un mnimo, donde N es el nmero de puntos del diseo. S el modelo tiene p pa
rmetros, la eficiencia G de un diseo es precisamente

ni3x ^ I

El criterio V considera la varianza de prediccin en un conjunto de puntos de inters en la regin del dise
o, por ejemplo Xj, Xj,..., x. El conjunto de puntos podra ser el conjunto de candidatos del que se selec
cion el diseo, o podra ser alguna otra coleccin de puntos que tienen un significado especfico para el
experimentador. Un diseo que minimiza la varianza de prediccin promedio en este conjunto de m pun
tos es un diseo optimal V.
En conjunto, a los criterios de diseo que se han venido estudiando suele llamrseles criterios d op
timalidad alfabtica. Existen algunas situaciones en las que el diseo optimal alfabtico se conoce o bien

11-4 DISEOS EXPERIMENTALES PARA AJUSTAR SUPERFICIES DE RESPUESTA

469

puede construirse analticamente. U n buen ejemplo es el diseo 2^, que es optimal D , A , G y Fpara ajus
tar el modelo de primer orden en k variables o para ajustar el modelo de primer orden con interaccin.
Sin embargo, en la mayora de los casos el diseo optimal no se conoce y debe emplearse un algoritmo ba
sado en computadora para encontrar un diseo. Muchos paquetes de software de estadstica que sopor
tan experimentos diseados cuentan con esta capacidad. La mayora de los procedimientos para construir
diseos se basan en el algoritmo de intercambio. En esencia, el experimentador selecciona una matriz de
puntos candidatos y un diseo inicial (quiz al azar) a partir de este conjunto de puntos. Entonces el algo
ritmo intercambia los puntos que estn en la matriz, pero no en el diseo, con los puntos que estn actual
mente en el diseo, en un esfuerzo por mejorar el criterio de optimalidad seleccionado. Debido a que no
se evalan explcitamente todos los diseos posibles, no hay garanta de que se ha encontrado un diseo
optimal, pero el procedimiento de intercambio suele asegurar que se obtiene un diseo que est cerca
del optimal. Algunas implementaciones repiten varias veces el proceso de construccin del diseo, empe
zando con diseos iniciales diferentes, para incrementar la posibilidad de que se obtendr un diseo final
que est muy cerca del optimal.
Para ilustrar algunas de estas ideas, considere el experimento del adhesivo expuesto anteriormente y
que llev a la regin experimental irregular de la figura 11-26. Suponga que la respuesta de inters es la
fuerza de desprendimiento y que quiere ajustarse un modelo de segundo orden para esta respuesta. En la
figura ll-2 7 a se muestra un diseo central compuesto con cuatro puntos centrales (12 corridas en total)
inscrito dentro de esta regin. Se trata de un diseo que no es rotable, pero es el DCC ms grande que
puede ajustarse dentro del espacio del diseo. Para este diseo | (X'X)*' | = 1.852 E-2, y la traza de (X 'X ) ^
es 6.375. En la figura ll-27a tambin se muestran los contornos de desviacin estndar constante de la
respuesta predicha, calculada suponiendo que <7=1. En la figura 11-276 se muestra la grfica de superfi
cie de respuesta correspondiente.
En la figura ll-2S a y en la tabla 11-12 se muestra un diseo optimalD de 12 corridas para este proble
ma, generado con el paquete de s o f tw a ie Design-Expert. Para este diseo, | (X 'X )* | = 2.153 E -4. Observe
que el criterio D es considerablemente mejor para este diseo que el DCC inscrito. La eficiencia relativa
del DCC inscrito con respecto al diseo optimal D es
D

[l(x;x,)-|^Vp
=
li(x;x,)-'h

)/6

f'0.0002153V
0.01852

= 0.476

Es decir, el DCC inscrito tiene una eficiencia de slo 47.6% que la del diseo optimalD. Esto implica que
tendran que hacerse 1/0.476 = 2.1 rplicas del DCC (o aproximadamente el doble) para tener la misma
precisin de la estimacin de los coeficientes de regresin que la que se consigue con el diseo optimal D.
La traza de (X'X)"' es 2.516 para el diseo optimal D , lo cual indica que la suma de las varianzas de ls
coeficientes de regresin es considerablemente ms pequea para este diseo que para el DCC. En las fi
guras ll-2 8 a y fc se muestran tambin los contornos de desviacin estndar constante de la respuesta pre
dicha y la grfica de la superficie de respuesta asociada (suponiendo que a = 1). En general, los contornos
de la desviacin estndar de la prediccin son ms bajos para el diseo optimalD que para el DCC inscri
to, particularmente cerca de los lmites de la regin de inters, donde el DCC inscrito no incluye ninguno
de los puntos del diseo.
En la figura ll-29a se muestra un tercer diseo, creado al tomar las dos rplicas de los vrtices de la
regin en el diseo optimal D y pasarlas al centro del diseo. Esto podra ser una idea tl, ya que la figura
ll-28fc muestra que la desviacin estndar de la respuesta predicha se incrementa hgeramente cerca del
centro de la regin del diseo para el diseo optimalD. En la figura ll-29a se muestran tambin los con
tornos de desviacin estndar constante de la prediccin para este diseo o^XimaXDmodificado, y en la fi-

470

CAPTULO n

MTODOS DE SUPERFICIES DE RESPUESTA

1.00 I

0.60

h"

0.004

0.60

0.00
*1

1.00

(a) El diseo y los contornos de i/V (y(M|l/ii* constante

1.00

-0.60
-1.00 ^-i.OO

{h) La grfica de superficie de respuesta


Figura H-27 Un diseo central compuesto inscrito para la regin restringida del diseo
de la figura 11-26,

11-4 DISEOS EXPERIMENTALES PARA AJUSTAR SUPERFICIES DE RESPUESTA


2

1.00

0.50

h"

0.00

-0.50

-1.00

(o) El diseo y loe contornos de V v ly ix W constante

1.00

-0.50

-1.00 '-1.00
ib) La grfica de superficie de respuesta

Figura 11-28 Un diseno optimal D para la regin restringida del diseo de la figura
11-26.

471

472

CAPTULO 11 MTODOS DE SUPERFICIES DE RESPUESTA

Tabla 11'12

Diseo optimal D para la


regin restringida de la
figura 11'26

Orden
estndar

Xi

1
2
3
4
5
6
7
8
9
10
11
12

-0.50
1.00
-0.08
-1.00
1.00
0.00
-1.00
0.25
-1.00
1.00
0.00
-0.08

-1.00
0.00
-0.08
1.00
-1.00
1.00
0.25
-1.00
-0.50
0.00
1.00
-0.08

gura ll-2 9 b se muestra la grfica de la superficie de respuesta. El criterio D para este diseo es | (X'X)'
= 3.71
y la eficiencia relativa es
1/6

= 0.91

0.000371

Es decir, este diseo es casi tan eficiente como el diseo optimalZ). La traza de (X'X) ^es 2.448 para este
diseo, un valor ligeramente mayor que el que se obtuvo para el diseo optimal D. Los contornos de des
viacin estndar constante de la prediccin para este diseo dan la impresin visual de ser al menos tan
buenos como los del diseo optimal D, particularmente en el centro de la regin.
Los diseos generados por computadora con base en los criterios de optimalidad alfabtica pueden
ser ciertamente tiles en situaciones en las que la regin experimental no es ni esfrica ni cuboidal. Sin
embargo, no son sustitutos de los diseos estndares en la mayora de los problemas. Los diseos optimales alfabticos se generan apegndose estrictamente a un solo criterio y, como se seal al principio de la
seccin 11-4, donde se enlistaron varios criterios para diferentes diseos, incluyen varios que son de ca
rcter un tanto cualitativo o subjetivo. En problemas experimentales reales, por lo general hay muchos
criterios que es necesario evaluar para seleccionar un diseo. Para un estudio ms amplio de este tema,
referirse a Myers y Montgomery [85a, captulo 8].

11-5

EXPERIMENTOS C O N MEZCLAS

En las secciones anteriores se presentaron diseos de superficie de respuesta para aquellas situaciones en
las que los niveles de cada factor son independientes de los niveles de otros factores. En los experimentos
con mezclas, los factores son los componentes o ingredientes de una mezcla y, por consiguiente, sus nive
les no son independientes. Por ejemplo, sa:i,
-,^ p denota las proporciones d e p componentes de una
mezcla, entonces
0 < j:,. < 1

+x^ +

i = , 2,

= 1

(es decir, 100%)

11-5 EXPERIMENTOS CON MEZCLAS

1.00

0,50

h"

0,00

-0.50

-1.00

1.00
la) El diseo y los contornos de Vviy()l/o^ constante

1.00

-1.00

-1,00

(6) La grfica de superficie de respuesta

Figura 11-29 Un diseo optimal D modificado para la regin restringida del diseo de la fi
gura 11-26.

473

474

CAPTULO 11

I, +

MTODOS DE SUPERFICIES DE RESPUESTA

- 1
o)

b)

F igura 11-30 E spacio de los factores


restringidos p a ra m ezclas con a ) p = 2
com ponentes y
= 3 com ponentes.

F igura 11-31

Sistema coordenado trilineal.

Estas restricciones se ilustran grficamente en la figura 11-30 para p ~ 2 y p = 3 componentes. Para dos
componentes, el espacio de los factores del diseo incluye todos los valores de los dos componentes que
estn sobre el segmento de recta
+ X2 = 1, con cada componente siendo acotado por Oy 1. Con tres
componentes, el espacio de la mezcla es un tringulo con vrtices que corresponden a las formulaciones
que son mezclas puras (mezclas que son 100% de un solo componente).
Cuando hay tres componentes en la mezcla, la regin experimental restringida puede representarse
convenientemente en papel milimtrico trilineal, como se muestra en la figura 11-31. Cada uno de los
tres lados de la grfica de la figura 11-31 representa una mezcla que no contiene nada de alguno de los
tres componentes (el componente indicado en el vrtice opuesto). Las nueve lneas de graduacin en
cada direccin marcan incrementos de 10% en el componente respectivo.
Los diseos smplex se usan para estudiar los efectos de los componentes de una mezcla sobre la va
riable de respuesta. Un diseo smplex reticular { p , m } para^ componentes consta de los puntos definidos por los siguientes arreglos de las coordenadas: las proporciones asumidas por cada componente
toman los m -H 1 valores que estn separados por una distancia igual de O a 1,
=

2 ,...,P

(11-21)

y se usan todas las combinaciones posibles (mezclas) de las proporciones de la ecuacin 11-21. Como mi
ejemplo, sean p = 3 y m = 2. Entonces

jc,. = 0,1,1

= 1,2,3

11-5 EXPERIMENTOS CON MEZCLAS

Retcula [4,2]

475

Retcula [4,3|

Fieura 11-32 Algunos diseos smplex reticulares para p = 3 y p = 4 componentes.

y el diseo smplex reticular consta de las seis corridas siguientes:

(X, , x x , ) = (1, o, 0), (0,1,0), (0,0,1), ( i , i , 0), ( i , O, i), (O, I , i)


En la figura 11-32 se ilustra este diseo. Los tres vrtices (1 ,0 ,0), ( 0 ,1,0) y ( 0 ,0 ,1) son las mezclas puras,
mientras que los puntos (j, 0), (y, O, y) y (O, j, j ) son mezclas binarias o mezclas de dos componentes lo
calizadas en los puntos medios de los tres lados del tringulo. En la figura 11-32 se muestran tambin los
diseos smplex reticulares {3 ,3 }, {4 ,2 } y {4 ,3 }. En general, el nmero de puntos en un diseo smplex
reticular {p, m } es

{p+m-\)\

Una alternativa del diseo smplex reticular es el diseo smplex de centroide. En un diseo smplex
de centroide conp componentes, hay 2^-1 puntos, que corresponden a lasp permutaciones de (1, 0, 0, ...,
0), las ( 2) permutaciones de ( |, y. O,..., 0), las ( f ) permutaciones de (j, y, j, O,..., 0),..., y el centroide glo
bal (j,
..., f ) . En la figura 11-33 se muestran algunos diseos smplex de centroide.

Figura 11-33

Diseos smplex de centroide con a )p = 3 componentes y b ) p = 4 componentes.

476

CAPTULO 11

MTODOS DE SUPERFICIES DE RESPUESTA

Una crtica a los diseos smplex descritos antes es que la mayora de las corridas ocurren en la fron
tera de la regin y, por consiguiente, incluyen slop - 1 de losp componentes. Suele ser deseable aumen
tar el diseo smplex reticular o de centroide con puntos adicionales en el interior de la regin donde las
mezclas estarn formadas por la totalidad de losp componentes. Para un estudio ms amplio, ver Cornell
[33] y Myers y Montgomery [85a].
Los modelos para mezclas difieren de los polinomios usuales empleados en los diseos de superficie
de respuesta debido a la restriccin Se, = 1. Las formas estndares de los modelos para mezclas que se
usan ampliamente son
Lineal:

Cuadrtco:

<j

Cbico completo;

E(y) = X

+E S

i= l

i< j

+ 2 Z 2
i< j< k

Cbico especial:
E (y)= ^

i:

7^

(11-25)

i< j< k

Los trminos de estos modelos tienen interpretaciones relativamente simples. En las ecuaciones
11-22 a 11-25, el parmetro representa la respuesta esperada para la mezcla pura;c, = 1 yjc^ = Ocuando
i ^ i. A la porcin
se le llama porcin de mezcla lineal. Cuando hay curvatura derivada de una
mezcla no lineal entre pares de componentes, los parmetros 8,^representan una mezcla sinrgica o bien
antagnica. Los trminos de rdenes superiores suelen ser necesarios en los modelos para mezclas por
que 1) los fenmenos estudiados pueden ser complejos y 2) la regin experimental con frecuencia es la re
gin de operabidad completa y, en consecuencia, es grande y requiere un modelo elaborado.

EJEMPLO 1 1 - 3 ...............................................................................................................................................
Una mezcla de tres componentes
ComeU [33] describe el experimento con una mezcla en el que se combinaron tres componentes polietileno (a:i), poliestireno (jcj) y polipropileno (Xj) para hilar una fibra que se usar en cortinas. La variable
de respuesta de inters es la elongacin del hilo en kilogramos de fuerza aplicada. Se usa un diseo smplex

11-5 EXPERIMENTOS CON MEZCLAS


Tabla 11-13

Punto del
diseo
1
2
3
4
5
6

477

El diseo smplex reticular { 3 ,2 } para el problema de la elongacin del hilo

Proporciones de los componentes


X,

X2

0
1
2
1
i
2
O

O
O
0
1
2

Xj

Valores observados
de la elongacin

Valor promedio_
de la elongacin (y)

11.0.12.4
15.0.14.8.16.1
8.8,10.0
10.0, 9.7,11.8
16.8,16.0
17.7,16.4,16.6

11.7
15.3
9.4
10.5
16.4
16.9

reticular para estudiar el producto. El diseo y las respuestas observadas se muestran en la tabla 11-13.
Observe que todos los puntos del diseo incluyen mezclas puras o binaras; es decir, tnicamente se usan
a lo sumo dos de los tres componentes en cualquier formulacin del producto. Tambin se corren rplicas
de las observaciones, con dos rplicas de cada una de las mezclas puras y tres rplicas de cada una de las
mezclas binarias. La desviacin estndar del error puede estimarse a partir de estas rplicas de las observa
ciones como d = 0.85. Comell ajusta el polinomio de segundo grado de la mezcla a los datos, obteniendo
y = 11.7x, + 9.4X2 +16.4JT3 -l-19.0xixj + llA x ^ x ^ - 9.6x^x^

Puede demostrarse que este modelo es una representacin adecuada de la respuesta. Observe que como
^3 >
> ^ 2 , se concluira que el componente 3 (poHpropUeno) produce el hilo con la elongacin mxi
ma. Adems, puesto que

y ^13 son positivos, la mezcla de los componentes 1 y 2 o de los componentes

1 y 3 produce valores ms altos de la elongacin de los que se esperaran si nos limitramos a promediar
las elongaciones de las mezclas puras. Se trata de un ejemplo de los efectos de mezclado sinrgicos. Los
componentes 2 y 3 tienen efectos de mezclado antagnicos, ya que ^23 es negativa.
En la figura 11-34 se grafican los contornos de la elongacin, lo cual puede ser de utilidad para inter
pretar los resultados. A l examinar la figura, se observa que si se desea la elongacin mxima, deber ele
girse la mezcla de los componentes 1 y 3, la cual est formada por aproximadamente 80% del componente
3 y 20% del componente 1.

Figura 11-34 Contornos de la elongacin estimada del


hilo constante en el modelo de segundo orden para la mez
cla del ejemplo 11-3.

478

CAPITULO 11

METODOS DE SUPERFICIES DE RESPUESTA

Se seal ya que los diseos smplex reticular y smplex de centroide son diseos de puntos fronte
ra. Si el experimentador quiere hacer predicciones acerca de las propiedades de mezclas completas, se
ra muy deseable contar con ms corridas en el interior del smplex. Se recomienda aumentar los
diseos smplex ordinarios con corridas axiales y el centroide global (si el centroide no es ya un punto
del diseo).
El eje del componente i es la recta o rayo que se extiende del punto base j:, = 0,Xj= l/(p - 1), para toda
j ^ i, al vrtice opuesto donde j:, = l,Xj = Opara toda; ^ i. El punto base siempre se localizar en el cen
troide de la frontera de ( p - 2) dimensiones del diseo smplex que est opuesto al vrtice x = 1, Xj = O
para toda; i. [A la frontera se le llama en ocasiones el (p - 2)-llano.] La longitud del eje del componente
es una unidad. Los puntos axiales se sitan sobre los ejes de los componentes a una distancia A del cen
troide. El valor mximo de A es (p - !)//>. Se recomienda que las corridas axiales se coloquen a la mitad en
tre el centroide del diseo smplex y cada vrtice para que A = (p - 1 ) / ^ . En ocasiones a estos puntos se
les llama mezclas de verificacin axial, porque es una prctica comtin excluirlas cuando se ajusta el mode
lo preliminar de la mezcla y usar despus las respuestas en estos puntos axiales para verificar la adecua
cin del ajuste del modelo preliminar.
En la figura 11-35 se muestra el diseo smplex reticular {3, 2} aumentado con los puntos axiales.
Este diseo tiene 10 puntos, con cuatro de ellos en el interior del diseo smplex. La retcula smplex {3,
3} soportar el ajuste del modelo ctbico completo, mientras que la retcula smplex aumentada no lo
har; sin embargo, la retcula smplex aumentada permitir al experimentador ajustar el modelo cbico
especial o agregar al modelo cuadrtico trminos especiales de cuarto orden, como /3i233^i^2^3 La
retcula smplex aumentada es superior para estudiar la respuesta de mezclas completas en el sentido de
que puede detectar y modelar la curvatura en el interior del tringulo que no puede tomarse en conside
racin por los trminos del modelo cbico completo. La retcula smplex aumentada tiene ms potencia
para detectar la falta de ajuste que la retcula {3,3}. Esto es de particular utilidad cuando el experimenta
dor no est seguro acerca del modelo apropiado que debe usar y tambin planea construir un modelo secuencialmente empezando con un polinomio simple (quiz de primer orden), probar el modelo para la

Figura 11-35

Un diseo smplex reticular aumentado.

11-5 EXPERIMENTOS CON MEZCLAS

479

falta de ajuste, despus aumentar el modelo con trminos de rdenes superiores, probar el nuevo modelo
para la falta de ajuste y as sucesivamente.
En algunos problemas de mezclas surgen restricciones sobre los componentes individuales. Las res
tricciones sobre la frontera inferior de la forma
/,. <;c,. 1

i = l,X ...,p

son muy comunes. Cuando slo estn presentes restricciones sobre la frontera inferior, la regin factible
del diseo sigue siendo un diseo smplex, pero se inscribe dentro de la regin del smplex original. Esta
situacin puede simplificarse mediante la introduccin de pseudocomponentes, definidos como
(1 1 -2 6 )

con

< 1. Entonces
x[+x'^+---+x'j,

=1

por lo que el uso de pseudocomponentes permite utilizar diseos tipo smplex cuando las fronteras infe
riores forman parte de la situacin experimental. Las formulaciones especificadas por el diseo smplex
para los pseudocomponentes se transforman en formulaciones para los componentes originales invirtiendo la transformacin de la ecuacin 11-26. Es decir, si j:'es el valor asignado al pseudocomponente i-simo en una de las corridas del experimento, el componente i-simo de la mezcla original es
x ..= i + 1

(11-27)

Cuando los componentes tienen restricciones tanto sobre la frontera superior como la inferior, la re
gin factible deja de ser un diseo smplex; ser, en cambio, un poltopo irregular. Puesto que la regin
experimental no tiene una forma estndar, los diseos generados por computadora son muy tiles para
este tipo de problemas de mezclas.

EJEMPLO 1 1 . 4 ...............................................................................................................................................
Formulacin de una pintura
U n experimentador est intentando optimizar la formulacin de una pintura automotriz de recubrimien
to total. Se trata de productos complejos que tienen requerimientos de desempeo muy especficos. El
cliente quiere, en particular, que la dureza Knoop exceda de 25 y que el porcentaje de slidos est abajo
de 30. El recubrimiento total es una mezcla de tres componentes, que consiste en un monmero (a;i), un
entrelazador (a:2) y una resina (jcj). Existen restricciones sobre las proporciones de los componentes:
+x^ -t-x, = 100

5 < jCj < 25


25<x^ < 4 0
50<jc3 < 7 0
El resultado es la regin de experimentacin restringida ilustrada en la figura 11-36. Puesto que la regin
de inters no es smplex, se usar un diseo optimal D para este problema. Suponiendo que posiblemente
ambas respuestas sern modeladas con un modelo cuadrtico de una mezcla, el diseo optimal > ilustra-

480

CAPTULO 11 MTODOS DE SUPERFICIES DE RESPUESTA


Monmero

25.00

Resina

Entrelazador

Figura 11-36 La regin experimental restringida para


el problema de la formulacin de la pintura del ejem
plo 11-4 (mostrada en la escala real del componente).

Tabla 11-14

Diseo optimal D para el problema de la formulacin de la


pintura del ejemplo 11-4
Monmero Entrelazador Resina Dureza Slidos
Orden
X2
estndar Corrida
yi
29
9.539
50.00
32.50
17.50
2
1
27.33
26
50.00
40.00
1
10.00
2
29.21
60.00
17
25.00
15.00
4
3
28
30.46
50.00
25.00
25.00
4
13
74.98
35
25,00
70,00
5.00
7
5
31.5
62.50
31
32.50
5.00
3
6
21
15.59
56.25
32.50
11.25
6
7
19.2
55.00
20
40.00
5.00
11
8
23.44
29
53.33
28.75
18.13
10
9
32.49
25
63.13
28.75
14
8.13
10
23.01
50.00
19
25.00
25.00
12
11
14
41.46
60.00
25.00
15.00
9
12
30
32.98
50.00
40.00
10.00
5
13
70.95
23
25.00
70.00
5.00
14
8

11-5 EXPERIMENTOS CON MEZCLAS


Tabla 11-15

481

Ajuste del modelo para la respuesta dureza

Response: hardness
ANOVA for Mixture Quadratic Model
Anaiysis of variance tabla [Partial sum of squaresl
Sum of
Mean
Square
Source
Squares
DF
Model
279.73
5
55.95
Linear Mixture
29.13
2
14.56
1
72.61
AB
72.61
1
179.67
AC
179.67
BC
8.26
1
8.26
23.58
Residual
188.63
8
Lack of Fit
63.63
4
15.91
Pur Error
125.00
4
31.25
Cor Total
468.36
13
Std. Dev.
Mean
C .V .

PRESS

Component
A-Monomer
B-Crossiinker
C-Resin
AB
AC
BC

R-Squared
Adj R-Squared
Pred R-Squared
Adeq Precisin

4.86
24.79
19.59
638.60
Coefficient
Estmate
23.81
16.40
29.45
44.42
-44.01
13.80

iF
1
1
1
1
1
1

Standard
Error
3.36
7.68
3.36
25.31
15.94
23.32

F
Valu
2.37
0.62
3.08
7.62
0.35

Prob > F
0.1329
0.5630
0.1174
0.0247
0.5703

0.51

0.7354

0.5973
0.3455
-0.3635
4.975
95% Ci
Low
16.07
-1 .3 2
21.71
-1 3 .9 5
-8 0 .7 8
-39 .97

95% CI
High
31.55
34.12
37.19
102.80
-7 .2 5
67.57

Rnal Equatlon In Terms of Pseudo Components:


hardness =
+23.81 * A
+ 16.40 * B
+29.45 * C
+44.42 * A * B
-44.01 * A * C
+ 13.80 * B C

do en la figura 11-36 puede generarse utilizando Design-Expert. Se supuso que, adems de las seis corridas
requeridas para ajustar el modelo cuadrtico de una mezcla, se haran cuatro corridas diferentes adicio
nales para verificar la falta de ajuste y que se haran rplicas de cuatro de estas corridas a fin de proporcio
nar una estimacin del error puro. Design-Expert utiliz los vrtices, los centros en los bordes, el centroide
global y las corridas de verificacin (los puntos localizados a la mitad entre el centroide y los vrtices)
como los puntos candidatos.
El diseo con 14 corridas se muestra en la tabla 11-14 junto con las respuestas dureza y slidos. Los re
sultados del ajuste de modelos cuadrticos para ambas respuestas se resumen en las tablas 11-15 y 11-16.
Observe que los modelos cuadrticos se ajustan muy bien tanto a la respuesta dureza como a la respuesta
slidos. En estas tablas se muestran las ecuaciones ajustadas para ambas respuestas (en trminos de los
pseudocomponentes). En las figuras 11-37 y 11-38 se muestran las grficas de contorno de las respuestas.
La figura 11-39 es una grfica de superposicin de las dos superficies de respuesta, donde se muestra
el contomo de la dureza Knoop de 25% y el contorno de 30% para los slidos. La regin factible para este
producto es el rea sin sombrear cerca del centro de la grfica. Evidentemente, existen varias elecciones

Tabla 1 - 6

Ajuste del modelo para la respuesta slidos

R esponse: solid s
ANOVA for M ixture Quadratic M odel
A nalysis o f variance ta b le [Partial $um o f squares]
M ean
S u m of
DF
Square
S q u ares
Source
859.59
4297.94
5
Model
1465.66
2
2931.09
Linear M ixture
211.20
1
211.20
AB
1
2 85.67
285.67
AC
1036.72
1
1036.72
BC
33.35
266.79
8
Residual
4
34.98
139.92
Lack o fF it
31.72
4
126.86
Pur Error
Cor Total
4564.73
13
Std. Dev.
Mean
C.V.
PRESS
C om p onent
A-Monomer
B-Crossiinker
C-Resin
AB
AC
BC

R-Squared
Adj R-Squared
Pred R-Squared
Adeq Precisin

5.77
33.01
17.49
991.86
CoefTicient
E stm ate
26.53
46.60
73.23
-75 .76
-55 .50
-154.61

DF
1
1
1
1
1
1

Standard
Error
3.99
9.14
3,99
30.11
18.96
27.73

Final Equation in Term s o f P seu d o C om ponents:


solids =
+26.53 * A
+46.60 * B
+73.23 * C
-7 5 .7 6 * A * B
-5 5 .5 0 * A * C
-154.61 * B * C
Monmero
25.00

Entrelazador

Resina

Figura 11-37 Grca de contorno de la respuesta dureza


Knoop, ejemplo 11-4.

F
V alu
25.78
43.95
6.33
8 .57
31.09

Prob > F
<0.0001
<0.0001
0.0360
0.0191
0.0005

1.10

0.4633

0.9416
0.9050
0.7827
15.075
95%CI
Low
17.32
25.53
64.02
-145.19
-9 9 .2 2
-218.56

95% Cl
High
35.74
67.68
82.43
-6 .3 4
-11 .77
-90 .67

11-5 EXPERIMENTOS CON MEZCLAS


Monmsro

25.00

Entrelazador

Resina

Figura 11-38 Grfica de contorno de la respuesta slidos,


ejemplo 11-4.

45.00
Entrelazador

5.00

70.00
Resina

Figura 11-39 Grfica de contorno de las respuestas dureza


Knoop y porcentaje de slidos, donde se indica la regin factible
para la formulacin de la pintura.

483

484

CAPTULO 11

MTODOS DE SUPERFICIES DE RESPUESTA

para las proporciones del monmero, el entrelazador y la resina para el recubrimiento total que redunda
r en un producto que satisfaga los requerimientos de desempeo.

11-6

O PERACIO N EVOLUTIVA

Personal de investigacin y desarrollo aplica con frecuencia la metodologa de superficies de respuesta en


operaciones de plantas piloto. Cuando se aplica a un proceso de produccin a gran escala, suele hacerse
una sola vez (o con poca frecuencia), ya que el procedimiento experimental es relativamente minucioso.
Sin embargo, las condiciones que fueron ptimas para la planta piloto quiz no lo sean para el proceso a
gran escala. La planta piloto puede producir 2 libras de producto por da, mientras que el proceso a gran
escala puede generar 2000 libras diarias. Esta escalacin de la planta piloto al proceso de produccin a
gran escala da por lo general como resultado la distorsin de las condiciones ptimas. Incluso si la planta
a gran escala empieza a operar en el ptimo, con el tiempo se desva de ese punto debido a las variacio
nes en las materias primas, los cambios ambientales y el personal de operacin.
Se requiere un mtodo para el monitoreo y el mejoramiento continuo de un proceso a gran escala
cuyo objetivo sea mover las condiciones de operacin hacia el ptimo o despus de una desviacin. El
mtodo no deber requerir cambios grandes o repentinos de las condiciones de operacin que pudieran
interrumpir la produccin. La operacin evolutiva (EVOP, por sus siglas en ingls) fue propuesta por Box
[12c] como un procedimiento de operacin con estas caractersticas. Est diseado como un mtodo de
operacin rutinaria en la planta que lleva a cabo el personal de manufactura con un mnimo de asistencia
del equipo de investigacin y desarrollo.
La EVOP consiste en introducir de manera sistemtica pequeos cambios en los niveles de las va
riables de operacin bajo consideracin. Generalmente se em plea un diseo 2^ para hacer esto. Se su
pone que los cambios de las variables son lo suficientem ente pequeos para que no ocurran
perturbaciones serias en el rendimiento, la calidad o la cantidad, pero lo suficientem ente grandes
para descubrir en ltima instancia mejoras potenciales en el desem peo del proceso. Se colectan da
tos de las variables de respuesta de inters en cada punto del diseo 2*'. Cuando se ha hecho una ob
servacin en cada punto del diseo, se dice que se ha completado un ciclo. Entonces pueden
calcularse los efectos y las interacciones de las variables del proceso. Finalmente, despus de varios
ciclos, el efecto de una o ms variables del proceso o sus interacciones sobre la respuesta puede pare
cer significativo. En este punto se debe tomar una decisin para modificar las condiciones de opera
cin bsicas a fin de mejorar la respuesta. Cuando se han detectado las condiciones mejoradas, se
dice que se ha terminado una fase.
Para probar la significacin de las variables e interacciones del proceso, se necesita una estimacin
del error experimental. sta se calcula a partir de los datos del ciclo. Adems, el diseo 2'"se centra por lo
general en torno a las mejores condiciones de operacin actuales. Mediante la comparacin de la res
puesta en este punto con los 2* puntos de la porcin factorial, es posible verificar la curvatura o cambio en
la media (CIM, por sus siglas en ingls); es decir, si el proceso en realidad se centra en el mximo, por
ejemplo, entonces la respuesta en el centro deber ser significativamente mayor que las respuestas en los
puntos perifricos del diseo 2'^.
En teora, la EVOP puede aplicarse a it variables del proceso. En la prctica es comn considerar slo
dos o tres variables. Se presentar un ejemplo del procedimiento para dos variables. B oxy Draper [16a]
ofrecen un estudio detallado del caso de tres variables, incluyendo las formas y hojas de trabajo necesa
rias. Myers y Montgomery [85a] revisan la implementacin en computadora de la EVOP.

485

11-6 OPERACIN EVOLUTIVA

Figura 11-40 Un diseo V- para la EVOP.

EJEMPLO U - 5 ...............................................................................................................................................
Considere un proceso qumico cuyo rendimiento es una funcin de la temperatura (jci) y la presin (xj). Las
condiciones de operacin actuales sonjCi = 250F yjCj = 145 psi. El procedimiento EVOP utiliza el diseo 2^
ms el punto central mostrado en la figura 11-40. El ciclo se completa corriendo cada punto del diseo en
orden numrico ( 1 ,2 ,3 ,4 ,5 ) . Los rendimientos del primer ciclo se muestran tambin en la figura 11-40.
Los rendimientos del primer ciclo se anotan en la hoja de clculo EVOP, la cual se muestra en la ta
bla 11-17. Al trmino del primer ciclo no puede hacerse ninguna estimacin de la desviacin estndar.
Tabla 11-17
5
2

Hoja de clculo EVOP para el ejemplo 11-5, n = 1


3
-1I
4

Condiciones de operacin

(1)

Ciclo: = 1
Respuesta: Rendimiento

Fase: 1
Fecha: 1/11/00

Clculo de los promedios

Clculo de la
desviacin
estndar

( 2)

(3)

(4)

(5)
Suma anterior S =
Promedio anterior
S =

(i) Suma del ciclo anterior


() Promedio del ciclo anterior
(iii) Nuevas observaciones

84.5

84.2

84.9

84.5

84.3

Nueva S = rango x

(v) Diferencias [() - (tw)]


(v) Nuevas sumas [() -1- (/)]
(v) Nuevos promedios
= (v)/n]

84.5
84.5

84.2
84.2

84.9
84.9

84,5
84.5

84.3
84.3

Rango de (v)=
Nueva suma S =
Nuevo promedio 5 =
Nueva suma S
w- 1

Clculo de los efectos


Efecto de la temperatura = K y , + >4

Clculo de los lmites de error


Para el nuevo promedio = - 7=5 =
V

~ y s ) = 0-45

Efecto de la presin = 1 (3^3 + >5 ->2 > 4) = 0.25


Efecto de la interaccin T x P =
+ ^3 >4 ^5) = 0.15

Para los nuevos efectos - = 5 =

Efecto del cambio en la media = i (>2 +

Para el cambio en la media

+ >4 + >5

) = 0.02

1.78

S=

486

CAPTULO 11

Tabla 11-18

MTODOS DE SUPERFICIES DE RESPUESTA

Hoja de clculo EVOP para el ejemplo 11-5, n


3
4

Condiciones de operacin

Ciclo: n = 2
Respuesta: Rendimiento

Fase:1
Fecha: 1/11/00

Clculo de los promedios

Clculo de la
desviacin
estndar

(1)

(2)

(3)

(4)

(5)

84.5

84.2

84.9

84.5

84.3

Suma anterior S =

(ii) Promedio del ciclo anterior

84.5

84.2

84.9

84.5

84.3

Promedio anterior S =

(i) Nuevas observaciones

84.9

84.6

85.9

83.5

84.0

Nueva S = rango x

(/) Suma del ciclo anterior

(iv) Diferencias [ ( ) - (h)]


(v) Nuevas sumas [(i) + (iii)]
(vi) Nuevos promedios |y, = (v)/n]

-0-4
169.4
84.70

-0.4
168.8
84.40

+ 1.0
168.0
84.00

0.3
168.3
84.15

Nueva suma S = 0.60


Nuevo promedio 5 =
Nueva suma S
= 0.60
n 1

Clculo de los lmites de error

Clculo de los efectos


Efecto de la temperatura = ^(3^3 + y,

- 1.0
170.8
85.40

/ 5V. = 0.60
Rango de (v) = 2.0

= 0.43

Para el nuevo promedio =

= 0.85

Efecto de la presin = 2(^3 + >5 ^2 >'4) ~ 0.58


Efecto de la interaccin T X P = j(y^ + y ^ - y ^ - y ) = 0.83

Para los nuevos efectos - ^ S = 0.85

Efecto del cambio en la media = 5


-0.17

Para el cambio en la media

+ ^4 + y 5 4^1) =

1.78
Jn

= 0.76

Los efectos y la interaccin de la temperatura y la presin se calculan de la manera usual para un di


seo 2^.
Despus se corre un segundo ciclo y los datos del rendimiento se registran en otra hoja de clculo
EVOP, la cual se muestra en la tabla 11-18. Al final del segundo ciclo, el error experimental puede esti
marse y las estimaciones de los efectos pueden compararse con lmites aproximados de 95% (dos desvia
ciones estndar). Observe que el rango se refiere al rango de las diferencias del rengln (iv); por lo tanto,
el rango es -1-1.0 - (-1.0) = 2.0. Puesto que ninguno de los efectos de la tabla 11-18 excede sus lmites de
error, probablemente el verdadero efecto sea cero, y no se contemplan modificaciones en las condiciones
de operacin.
En la tabla 11-19 se muestran los resultados de un tercer ciclo. Ahora, el efecto de la presin excede
su lmite de error y el efecto de la temperatura es igual al lmite de error. Probablemente ahora se justifi
que un cambio en las condiciones de operacin.
A la luz de los resultados, parece razonable empezar una nueva fase EVOP alrededor del punto (3).
Por lo tanto,
= 225F y X2 = 150 psi seran el centro del diseo 2^ en la segunda fase.
Un aspecto importante de la EVOP es la retroalimentacin de informacin generada por el proceso
para operadores y supervisores. Esto se consigue mediante un tablero con informacin EVOP a la vista
de todos. En la tabla 11-20 se muestra el tablero de informacin para este ejemplo al final del ciclo 3.

11-6 OPERACIN EVOLUTIVA

Tabla 11-19

5
2

487

Hoja de clculo EVOP para el ejemplo 11-5, n = 3

Fase: 1
Fecha: 1/11/00
Clculo de la
desviacin
estndar

Ciclo: n = 3
Respuesta: Rendimiento

3
1 4

Clculo de los promedios

(l) Nuevas observaciones


(tV) Diferencias [(w) - (i)]
(v) Nuevas sumas [(i) + (ih)]
( v i ) Nuevos promedios [y
, = (v)/]

(3)

(2)

(1)

Condiciones de operacin
(i) Suma del ciclo anterior
() Promedio del ciclo anterior

169.4
84.70

168.8
84.40

170.8
85.40

85.0

84.0

86.6

-0.30
254.4
84.80

+0.40
252.8
84.27

- 1.20
257.4
85.80

(4)

Clculo de los efectos


Efecto de la temperatura =
Efecto de la presin =
Efecto de la interaccin T

(5)

168.3 Suma anterior S = 0.60


168.0
84.15 Promedio anterior S =
84.00
0.60
85.2 Nueva S = rango x
84.9
. = 0.56
-0.90
-1.05 Rango de (v)= 1.60
252.9
253.5 Nueva suma S = 1,16
84.30
84,50 Nuevo promedio S =
Nueva suma S
= 0.58
n -
Clculo de los lmites de error
Para el nuevo promedio =

+ ^4 y^ >5) = 0.67

=0.67

-y^ ~y*) = 0.87


P = \ i y 2 + y^y^y)

Para los nuevos efectos ^ S = 0.67

QM

Efecto del cambio en la media = y

1.78.
Para el cambio en la media ~r^S = 0.60

+ >3 + y, + j's - 4^]) =

-0 .0 7

~Jn

labia 11-20

Tablero de informacin EVO ciclo 3


Respuesta;

Hendimiento porcentual

Requerimiento: Maximizar

85.80

B4.50
150

84.80
140
84.30

84.27
I
245

250

I
255

Temperatura

Lmites de error para los promedios: 0.67


Temperatura
0.67
Efectos con
Presin
0.87
lmites de error
de 95%:
TxP
0.64
Cambio en la media
0.07
Desviacin estndar
0.58

0.67
0.67
0.67
0.60

488

CAPTULO 11

Tabla 11 '21

Valores de

MTODOS DE SUPERFICIES DE RESPUESTA

10

k=5
9
10

0.30
0.24
0.23

0.35
0.27
0.26

0.37
0.29
0.28

0.38
0.30
0.29

0.39
0.31
0.30

0.40
0.31
0.30

0.40
0.31
0.30

0.40
0.32
0.31

0.41
0.32
0.31

La mayora de las cantidades de la hoja de clculo EVOP se obtienen directamente del anlisis del di
seo factorial 2^. Por ejemplo, la varianza de cualquier efecto, como
+ ys~y2 -yd^ ss simplemente a^ln,
donde s la varianza de las observaciones (y). Por lo tanto, los lmites de error de dos desviaciones es
tndar (que corresponden a 95%) para cualquier efecto seran 2cr/V. La varianza del cambio en la me
dia es
F(CIM ) = F
( 2 0 \a ^
= (5 < r + 1 6 < r f) =

[25j

Por lo tanto, los lmites de error de dos desviaciones estndar para el CIM son (2V20/25)(r/V =
1.78ff/V.
La desviacin estndar a se estima por el mtodo del rango. Sea quey,() denote la observacin en el
punto del diseo i-simo en el ciclo n, y quey,() denote el promedio correspondiente dey,(n) despus de
n ciclos. Las cantidades del rengln (v) de la hoja de clculo EVOP son las diferencias)^,() -y (n -l). La
varianza de estas diferencias es
(n -1 )

(n -1 )

El rango de las diferencias, por ejemplo


se relaciona con la estimacin de la desviacin estndar de las
diferencias por
= Rold^. El factor dj depende del nmero de observaciones utilizadas para calcular
Entonces R J d 2 = ^nl(n - 1), por lo que puede usarse

para estimar la desviacin estndar de las observaciones, donde k denota el nmero de puntos que se uti
lizaron en el diseo. Para un diseo 2^ con un punto central se tiene k = 5, y para un diseo 2^ con un pun
to central se tiene k ~ 9. Los valores de/*._ se dan en la tabla 11-21.

11-7
11-7.1

DISEO R O BU STO
A ntecedentes

A lo largo de este libro se ha hecho hincapi en la importancia del uso de experimentos diseados estads
ticamente en el proyecto, desarrollo y mejoramiento de productos y procesos. A partir de la dcada de
1980, los ingenieros y cientficos han adquirido la conciencia creciente de los beneficios del uso de experi

11-7 DISEO ROBUSTO

489

mentos diseados y, en consecuencia, ha habido muchas reas de aplicaciones nuevas. Una de las ms im
portantes de stas es el diseo robusto, donde la atencin se centra en uno o ms de los siguientes puntos:
1. El diseo de sistemas (productos o procesos) que no sean sensibles a factores ambientales que
puedan afectar el desempeo una vez que el sistema se ha desplegado en el campo. Un ejemplo
es la formulacin de una pintura para exteriores que debe tener gran duracin cuando se expo
nga a una variedad de condiciones climticas. Puesto que las condiciones climticas no son del
todo predecibles, y ciertamente no son constantes, el responsable de la formulacin del producto
quiere que ste sea robusto contra un amplio rango de factores de temperatura, humedad y pre
cipitacin pluvial que afectan el desgaste y acabado de la pintura.
2. El diseo de productos para que no sean sensibles a la variabilidad transmitida por los compo
nentes del sistema. Un ejemplo es el diseo de un amplificador electrnico para que el vohaje de
salida est tan cerca como sea posible del valor nominal deseado, independientemente de la va
riabilidad de los parmetros elctricos de los resistores, transistores y fuentes de poder que son
los componentes del aparato.
3. El diseo de procesos para que el producto manufacturado est tan cerca como sea posible de las
especificaciones nominales, aun cuando sea imposible controlar con toda precisin algunas va
riables del proceso (como la temperatura) o las caractersticas de las materias primas.
4. Determinar las condiciones de operacin de un proceso para que las caractersticas crticas del
producto estn tan cerca como sea posible del valor objetivo deseado y la variabilidad en torno a
este objetivo se minimice. Ejemplos de este tipo de problema ocurren con frecuencia. Uno de
ellos sucede en la manufactura de semiconductores, donde sera deseable que el espesor del xi
do de una oblea estuviera lo ms cerca posible del espesor objetivo promedio, as como que la va
riabilidad del espesor a lo largo de la oblea (una medida de uniformidad) fuese lo ms pequea
posible.
A principios de la dcada de 1980, el ingeniero japons Genichi Tkguchi introdujo un enfoque para
resolver problemas de este tipo, a los que se hace referencia de manera conjunta como el problema del di
seo paramtrico robusto (RPD, por sus siglas en ingls) (ver Tkguchi y Wu [109] y Thguchi [108a, b]). Su
errfoque se bas en la clasificacin de las variables de un proceso o producto como variables de control (o
controlables) y variables de ruido (o no controlables) para despus encontrar los ajustes de las variables
controlables que minimizan la variabilidad transmitida a la respuesta por las variables no controlables. Se
establece el supuesto de que aun cuando los factores de ruido no son controlables en el sistema a gran es
cala, pueden controlarse para los fines de un experimento. Referirse a la figura 1-1 para una ilustracin
grfica de las variables controlables y no controlables en el contexto general de un experimento diseado.
Tkguchi introdujo algunos mtodos estadsticos novedosos y ciertas variantes de las tcnicas estable
cidas como parte de este procedimiento RPD, Hizo uso de diseos factoriales altamente fraccionados y
otros tipos de diseos fraccionados obtenidos a partir de arreglos ortogonales. Su metodologa gener
mltiples debates y controversias. Parte de la polmica surgi porque la metodologa de Tkguchi fue de
fendida en Occidente inicialmente (y principalmente) por empresarios, y la ciencia estadstica subyacente
no haba sido revisada adecuadamente por los especialistas. Para finales de la dcada de 1980, los resulta
dos de una revisin muy completa indicaron que aun cuando los conceptos de ingeniera de Tkguchi y el
objetivo global del RPD tenan bases slidas, haba problemas de fondo con esta estrategia experimental
y con los mtodos para el anhsis de datos. Para detalles especficos de estos temas, ver Box [12d], Box,
Bisgaard y Fung [14], Hunter [59a, b], Montgomery [80b], Myers y Montgomery [85a] y Pignatiello y
Ramberg [94]. Muchas de estas preocupaciones se encuentran resumidas tambin en el amplio panel de

i-i^fSscscscMr^c^

p r ^ c ^ N ^ n in c ^ c s v o
O ^ H c^ S s m ^c^ cs

c s (s c s c s r ^ r ^ c s r ^ c s

\ o o o r ^ O \ ^ v o v c 's D i>

o
osoooo^'o^odo^cs
t-H ^ I < CS| t-H 1-H 7i Ol

0
C

1I t-hc S ( N < N t

ICN

^C V j'^O 'O fH O O ^O O C ^^

ONa/Sod/Saro'oS
^ ^ I 1I fSl 1-H Ol T( 7i

"S

1
a ^ ^ v -H a ^ ^ o ^ ^ c o
^O savodo ooo^noN
T( T( 11 T(
I I

' ^ [^ O V O O S v S O N

' 0 0 < r 5 r o r - < N ^ c N i - i

s<L>
2
c

u
S
cd

^ ^ f < > ( S c O i ic<5i(N

0
tb

Cu

i
d)
O
rA

490

I ^ <N es <N en tn m

11-7 DISEO ROBUSTO

491

discusin publicado en Technometrics (ver Nair, et al. [86]). En el material suplementario del texto de este
captulo tambin se comentan e ilustran muchos de los problemas implcitos en los mtodos tcnicos de
Taguchi.
La metodologa de Tkguchi para el problema RPD gira en tom o al uso de un diseo ortogonal para
los factores controlables, el cual se cruza con un diseo ortogonal separado para los factores de ruido.
En la tabla 11-22 se presenta un ejemplo de Byrne y Tkguchi [23] que trata del desarrollo de un mtodo
para ensamblar un conector elastomtrico en un tubo de nylon que producira la fuerza de separacin re
querida. Hay cuatro factores controlables, cada uno con tres niveles (A = interferencia, 5 = espesor de la
pared del conector, C = profundidad de insercin y ) = porcentaje de adhesivo), y tres factores de ruido
o no controlables ( = tiempo de acondicionamiento, F = temperatura de acondicionamiento y G = hu
medad relativa del acondicionamiento). El panel a de la tabla 11-22 contiene el diseo para los factores
controlables. Observe que se trata de un diseo factorial fraccionado de tres niveles; especficamente, es
un diseo 3'^. Tkguchi lo llama el diseo de arreglo interior. El panel b de la tabla 11-22 contiene un dise
o 2^ para los factores de ruido, al que Ikguchi llama el diseo de arreglo exterior. Entonces se realiza
cada corrida del arreglo interior para todas las combinaciones de tratamientos del arreglo exterior, pro
ducindose las 72 observaciones de la fuerza de separacin que se muestran en la tabla. A este tipo de di
seo se le llama diseo de arreglo cruzado.
Ikguchi sugiri que los datos de un experimento de arreglo cruzado se resumieran con dos estads
ticos: el promedio de cada observacin en el arreglo interior para todas las corridas del arreglo exterior
y un resumen de estadsticas que intentaba combinar informacin acerca de la media y la varianza, lla
mado relacin seal a ruido. Las relaciones seal a ruido se definen a propsito para que un valor mxi
mo de la relacin minimice la variabilidad transmitida por las variables de ruido. Entonces se lleva a
cabo un anlisis para determinar cules son los ajustes de los factores controlables que dan como resul
tado 1) una media tan prxima como sea posible al objetivo deseado y 2) un valor mximo de la relacin
seal a ruido.
El examen de la tabla 11-22 revela un problema importante con la estrategia de diseo de Tkguchi; a
saber, el enfoque del arreglo cruzado llevar a un experimento muy grande. En el ejemplo tratado aqu
slo hay siete factores, pero el diseo tiene 72 corridas. Adems, el diseo de arreglo interno es un diseo
3^^ de resolucin III (ver el captulo 9 para un estudio de este diseo), por lo que a pesar del gran nmero
de corridas, no es posible obtener ninguna informacin acerca de las interacciones entre las variables con
trolables. D e hecho, incluso la informacin acerca de los efectos principales est potencialmente corrom
pida, ya que los efectos principales tienen estrechas relaciones de alias con las interacciones de dos
factores. Ocurre tambin que las relaciones seal a ruido de Ictguchi son problemticas; al maximizarse la
relacin no se minimiza necesariamente la variabilidad. Referirse al material complementario del texto
para mayores detalles.
Un punto importante acerca del diseo de arreglo cruzado es que s proporciona informacin acerca
de las interacciones factor controlable x factor de ruido. Estas interacciones son cruciales para la solu
cin de un problema RPD. Por ejemplo, considere las grficas de las interacciones de dos factores de la fi
gura 11-41, donde x es el factor controlable y 2 el factor de ruido. En la figura 11-4la no hay ninguna
interaccin X x 2; por lo tanto, no hay ningn valor de la variable controlable jn; que afecte la variabilidad
transmitida a la respuesta por la variabiUdad enz. Sin embargo, en la figura ll-41ft hay una fuerte interaccinA: X z. Observe que cuando a: se pone en el nivel bajo, hay mucho menos variabilidad en la variable de
respuesta que c u a n d o e s t en el nivel alto. Por lo tanto, a menos que haya como mnimo una interaccin
factor controlable x factor de ruido, no hay ningn problema de diseo robusto. Como se ver en la si
guiente seccin, enfocarse en la identificacin y el modelado de estas interacciones es una de las claves de
un enfoque ms eficiente y eficaz del RPD.

492

CAPTULO 11

MTODOS DE SUPERFICIES DE RESPUESTA

Figura 11-41 El papel de la interaccin control X ruido en un diseo robusto.

11-7.2

El enfoque de la superficie de respuesta para el diseo robusto

Como se seal en la seccin anterior, las interacciones entre los factores controlables y los de ruido son
la clave en un problema de diseo robusto. Por lo tanto, es lgico usar un modelo de respuesta que incluya
tanto a los factores controlables como a los factores de ruido y sus interacciones. Para ilustrar, suponga
que se tienen dos factores controlablesa:i y jcj y un solo factor de ruido z^. Se supone que tanto los factores
controlables como el de ruido se expresan como las variables codificadas usuales (es decir, tienen su cen
tro en cero y tienen lmites inferior y superior a). Si quiere considerarse un modelo de primer orden que
incluya las variables controlables, un modelo lgico es
+ /3,X , + ^ 2^ 2 +/3i2^1^2 +7i^ 1 +^11^1^1 +<521^^2^! +

(11-28)

Observe que este modelo incluye los efectos principales de ambos factores controlables, su interaccin, el
efecto principal de la variable de ruido y las dos interacciones entre las variables controlables y la de rui
do. A este tipo de modelo, el cual incorpora a las variables controlables y las de ruido, suele llamrsele
modelo de respuesta o de reaccin. Excepto cuando al menos uno de los coeficientes de regresin n Y^21
sea diferente de cero, no habr ningn problema de diseo robusto.
Una ventaja importante del enfoque del modelo de respuesta es que tanto los factores controlables
como los factores de ruido pueden colocarse en un solo diseo experimental; es decir, puede evitarse la
estructura de los arreglos interior y exterior del enfoque de Taguchi. Al diseo que contiene tanto los fac
tores controlables como los de ruido suele llamrsele diseo de arreglo combinado.
Como se seal anteriormente, se supone que las variables de ruido son aleatorias, aun cuando son
controlables para los fines de un experimento. Especficamente, se supone que las variables de ruido es
tn expresadas en unidades codificadas, que tienen valor esperado cero, varianza
y que si hay varias
variables de ruido, tienen covarianzas cero. Bajo estos supuestos es sencillo encontrar un modelo para la
respuesta media tomando el valor esperado de y en la ecuacin 11-28. Se obtiene as
^ y ) ~ Po *^1-^1 *'^2^2 *^12^ 1^2

donde el subndice z del operador expectativa es un recordatorio para tomar el valor esperado con respec
to a ambas variables aleatorias de la ecuacin 11-28, Zi y e. Para encontrar un modelo de la varianza de la

11-7 DISEO ROBUSTO

493

r e s p u e s ta s e usa el enfoque de la transmisin del error. Primero, el modelo de respuesta de la ecuacin


11-28 se expande en una serie de Taylor de primer orden alrededor de
= 0. Se obtiene as

= Po+^iXi+^iX2+PnXiX^

+ (y j +<3iiXj

)Zi + R + e

donde R es el trmino del residuo de la serie de Thylor. Como es comn en la prctica, se ignorar el tr
mino del residuo. Ahora puede obtenerse la varianza de y aplicando el operador varianza en esta ltima
expresin (sin K). El modelo para la varianza resultante es
Vy) = o \ { y ,+ d , ,x , + d ,, x ,f

D e nueva cuenta se ha usado el subndice z en el operador varianza como recordatorio de que tan to z^
co m o E son variables aleatorias.

Se han derivado modelos simples para la media y la varianza de la variable de respuesta de inters.
Observe lo siguiente:

1. Los modelos de la media y la varianza incluyen nicamente las variables controlables. Esto signi
fica que es potencialmente posible fijar las variables controlables para alcanzar un valor objetivo
de la media y minimizar la variabilidad transmitida por la variable de ruido.
2. Aun cuando en el modelo de la varianza intervienen slo las variables controlables, incluye asi
mismo los coeficientes d e regresin d e la interaccin entre las variables controlables y la de ruido.
Es as como la variable de ruido influye en la respuesta.
3. El modelo de la varianza es una funcin cuadrtica de las variables controlables.
4. El modelo de la varianza (dejando de lado o^) es slo el cuadrado de la pendiente del modelo de
respuesta ajustado en la direccin de la variable de ruido.
Para dar un uso operacional a estos modelos sera necesario;
1. Realizar un experimento y ajustar un modelo de respuesta apropiado, tal como la ecuacin
11-28.
2. Sustituir los coeficientes de regresin desconocidos en los modelos de la media y la varianza con
sus estimaciones de mnimos cuadrados del modelo de la respuesta o de reaccin, y sustituir la
del modelo de la varianza con el cuadrado medio de los residuales que se encontr cuando se
ajust el modelo de respuesta.
3. O ptim izar lo s m o d e lo s d e la m ed ia y la varianza u tilizan do lo s m to d o s estn dares d e op tim iza
cin d e resp uestas m ltip les revisadas en la secci n 11-3.4.

Es muy sencillo generalizar estos resultados. Suponga que hay A:variables controlables y/-variables de
ruido. El modelo de respuesta general que incluye estas variables se escribir como
><x,z) = /(x)-)-/i(x,z)-h

(11-29)

donde /(x) es la porcin del modelo que incluye slo las variables controlables y h{\, z) son los trminos
que incluyen los efectos principales de los factores de ruido y las interacciones entre los factores controla
bles y los de ruido. D e manera tpica, la estructura de h(x, z) es

494

CAPT-ILO 11

MTODOS DE SUPERFICIES DE RESPUESTA

z)= E

y/^. + 2 S
i= l ;-"l

La estructura de/(x) depender de cul sea el tipo de modelo que el experimentador considere apropiado
para las variables controlables. Las elecciones lgicas son el modelo de primer orden con interaccin y el
modelo de segundo orden. Si se supone que las variables de ruido tienen media cero, varianza a \ y covarianzas cero, y que las variables de ruido y los errores aleatorios e tienen covarianzas cero, entonces el mo
delo de la media para la respuesta es
,[y (x , z)] = / ( x )
(11-30)
y el modelo de la varianza para la respuesta es
faX x, z ) l

az..

(11-31)

Myers y Montgomery [85a] presentan una forma un tanto ms general de la ecuacin 11-31 basada en la
aplicacin directa de un operador de varianza condicional al modelo de respuesta.

EJEMPLO 1 1 - 6 ...............................................................................................................................................
Para ilustrar el procedimiento anterior, considere nuevamente el ejemplo 6-2 en el que se estudiaron cua
tro factores en un diseo factorial 2* para investigar su efecto sobre la rapidez de filtracin de un producto
qumico. Se supondr que el factor >1, la temperatura, es difcil de controlar en el proceso a gran escala,
pero que puede controlarse durante el experimento (el cual se llev a cabo en una planta piloto). Los
otros tres factores, la presin (B), la concentracin (C) y la velocidad de agitacin (D), son fciles de con
trolar. Por lo tanto, el factor de ruido es la temperatura, y las variables controlables ati, X2 yxj son la pre
sin, la concentracin y la velocidad de agitacin, respectivamente. Puesto que tanto los factores
controlables como el factor de ruido estn en el mismo diseo, el diseo factorial 2'^utilizado en este ex
perimento es un ejemplo de un diseo de arreglo combinado.
Utilizando los resultados del ejemplo 6-2, el modelo de respuesta es
/'21.625^ 7 j _ f9.875] V _1_ fl4.625\
z^ +
y ( x , Z i ) = 70.06
X2 +
2
2 ,
l 2
/18.125'j
2

V V -1XjZi

['16.625\
l

x.z.

= 70.06-I-IO.8IZ1 +4.94x^ -I-7.31a:3 - 9Mx^z^ + %.?>\x^z^


Utilizando las ecuaciones ll- 3 0 y ll- 3 1 ,s e encuentra que los modelos de la media y la varianza son
E,[y{T, Z j ) ]= 70. 06 -1- 4. 941:2 -1- 7 . 3 1 x 3

y
y . [><X, Zj)] =

(10.81 - 9.06X, -I- 8.31;t3 f + 0 ^

= a",(116.91-I-82.0&C,' -1- 69.06x 3' -1 9 5 .88x,


-H 79.66X3 -150.58;t2X3)-l-a"
respectivamente. Suponga ahora que los niveles bajo y alto de la variable de ruido, temperatura, se corrie
ron a una desviacin estndar a ambos lados de su valor tpico o promedio, de tal modo que a ' = 1, y que
se usa
= 19.51 (ste es el cuadrado medio de los residuales obtenido al ajustar el modelo de respuesta).
Por lo tanto, el modelo de la varianza queda como
K JX x. Z i)]= 136.42-195.8&C2 -1-179.66x 3 -150.58x2;C3 -1- 82.08x2" -I-69.O6X3"

11-7 DISEO ROBUSTO

495

X, = Velocidad de agitacin

Figura 11-42 Contornos del ndice de filtracin medio constante, ejemplo 11-6,
conx, - temperatura = 0.

En la figura 11-42 se presenta la grfica de contorno del paquete de software Design-Ej^ert de los
contornos de respuesta del modelo de la media. Para construir esta grfica se fij el factor de ruido (tem
peratura) en cero y el factor controlable no significativo (presin) tambin en cero. Observe que la rapi
dez de filtracin promedio se incrementa cuando tanto la concentracin como la velocidad de agitacin
se incrementan. Design-Expert constituir tambin de manera automtica grficas de la raz cuadrada de
los contornos de la varanza, que denomina propagacin del error (o POE, por sus siglas en ingls). Evi
dentemente, la POE no es sino la desviacin estndar de la variabilidad que se transmite a la respuesta
como una funcin de las variables controlables. En la figura 11-43 se muestra la grfica de contorno y la
grfica de superficie de respuesta tridimensional de la POE, obtenida con Design-Expert (en esta grfica
la variable de ruido se mantiene constante en cero, como se explic anteriormente).
Suponga que el experimentador quiere mantener una rapidez de filtracin promedio de cerca de 75 y
minimizar la variabilidad alrededor de este valor. En la figura 11-44 se muestra una grfica de superposi
cin de los contornos de la rapidez de filtracin media y la POE como una funcin de la concentracin y la
velocidad de agitacin, las variables controlables significativas. Para conseguir los objetivos deseados ser
necesario mantener la concentracin en el nivel alto y la velocidad de agitacin muy cerca del nivel inter
medio.

El ejemplo 11-6 ilustra el uso de un modelo de primer orden con interaccin como el modelo para los
factores controlables,/(x). Se presenta ahora un ejemplo adaptado de Montgomery [80b] que incluye un
modelo de segundo orden.

496

CAPTULO 11 MTODOS DE SUPERFICIES DE RESPUESTA

I , = Velocidad de agitacin
a) Grfica de contorno

6) Grfica de superficie de respuesta

Figura 11-43 Grfica de contorno y superficie de respuesta de la propagacin del error


(POE) en el ejemplo 11-6, con x, = temperatura = 0.

11-7 DISEO ROBUSTO

497

1.00

-o .s o
Concentracin

X, -

0.00
0.50
Velocidad de agitacin

1.00

Grfica de superposicin de los contornos de la media y la POE del


ndice de filtracin, ejemplo 11-6, con x, = temperatura = 0.

Figura 11-44

EJEMPLO 1 1 - 7 ...............................................................................................................................................
En ima fbrica de semiconductores se realiz un experimento que incluy dos variables controlables y tres
variables de ruido. En la tabla 11-23 se muestra el diseo de arreglo combinado utilizado por los experimen
tadores. El diseo es una variante de 23 corridas de un diseo central compuesto que se cre empezando
con un DCC estndar para cinco factores (la porcin del cubo es un diseo 2^ y eliminando las corridas
axiales asociadas con las tres variables de ruido. Este diseo soportar un modelo de respuesta que tiene un
modelo de segundo orden en las variables controlables, los efectos principales de las tres variables de ruido
y las interacciones entre los factores controlables y los de ruido. El modelo de respuesta ajustado es
Xx, z) = 3 0 .3 7 - 2,92Xi - 4.13x, + Z 6 0 x l -l-Zl&c^" +l.%lx^x^
-I-2 .7 3 2

2 .3 3 2

-I-2 . 33 Z3 - Q .llx^z^+Q .W x^z^ +2.5&CjZ3

-l-2.01XjZj - I . 43JC2Z2 -1.56x22^

Los modelos de la media y la varianza son


E^[y(x, z)] = 3 0 .3 7 - 2.92x^ - 4.13x^ +2.6Qxf + 2 1 ^ 1 +2.%lx,x^
y
z)]= 19.26-1-3.20j:j -1-12.45^:^ -I-7.52a:i" +%.52xl +2.2U^x^
donde se han sustituido las estimaciones de los parmetros del modelo de respuesta ajustado en las ecua
ciones de los modelos de la media y la varianza y, como en el ejemplo anterior, se supone que
= 1, En
las figuras 11-45 y 11-46 se presentan las grficas (de Design-Expert) de contorno de la media y la POE del
proceso (recuerde que la POE es la raz cuadrada de la varianza de la superficie de respuesta) generadas a
partir de estos modelos.

498

CAPITULO 11

Tabla 11-23

METODOS DE SUPERFICIES DE RESPUESTA

Experimento de arreglo combinado con dos variables controlables y tres variables de ruido, ejemplo 11-7

Nmero de corrida

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23

Figura 11-45

1.00

1.00

1.00
1.00
1.00

1.00
-

1.00

1.00
-

1.00

1.00
-

1.00

1.00
-1.00
1.00
-1.00
1.00
- 2.00

1.00
1.00

1.00

1.00

1.00
-1.00
1.00
1.00
-1.00
-1.00
1.00
1.00
-1.00
-1.00
1.00
1.00
0.00
0.00
-2.00

1.00

1.00
1.00
1.00

1.00
1.00
1.00
1.00

1.00
1.00
1.00
1.00
1.00
1.00
1.00

-1.00

1.00

1.00

-1.00
-1.00
1.00
-1.00
1.00
1.00
-1.00
-1.00
1.00
1.00
-1.00
1.00
-1.00
-1.00
1.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00

-1.00

-1.00
-1.00
-1.00
-1.00
-1.00
1.00
1.00
1.00

1.00
1.00
1.00
1.00
1.00

1.00
0.00
0.00

0.00

0.00

0.00

0.00

0.00

0.00
0.00

2.00
0.00
0.00

0.00

0.00

0.00

0.00

0.00

0.00

0.00
0.00

2.00
0.00

0.00

Grfica de contorno del modelo de la media, ejemplo 11-7.

0.00

44.2
30.0
30.0
35.4
49.8
36.3
41.3
31.4
43.5
36.1
22.7
16.0
43.2
30.3
30.1
39.2
46.1
36.1
47.4
31.5
30.8
30.7
31.0

11-7 DISEO ROBUSTO

Figura 11-46 Grfica de contorno de la POE, ejemplo 11-7.


1.001

0.50

* 0.00

-0.50

1.00
Figura lt-47 Superposicin de los contornos de la media y la POE para el ejem
plo 11-7, con la regin en blanco indicando condiciones de operacin satisfactorias
para la media y la varianza.

499

500

CAPTUI,0 11 MTODOS DE SUPERFICIES DE RESPUESTA

En este problema es deseable mantener la media del proceso abajo de 30. Al inspeccionar las figuras
11-45 y 11-46, es claro que se necesitar hacer un ajuste si se quiere hacer pequea la varianza del proce
so. Puesto que slo hay dos variables controlables, una forma lgica de llegar a este arreglo es superponer
los contornos de la respuesta media constante y la varianza constante, como se muestra en la figura 11-47.
Esta grfica muestra los contornos para los que la media del proceso es menor o igual que 30 y la desvia
cin estndar del proceso es menor o igual que 5. La regin delimitada por estos contornos representara
una zona de operacin tpica de respuesta media baja y varianza del proceso baja.

n -8

PROBLEMAS

11-1. En una planta qumica se produce oxgeno licuando aire y separndolo por destilacin fraccionada en sus ga
ses componentes. La pureza del oxgeno es una funcin de la temperatura del condensador principal y de la
relacin de la presin entre las columnas superior e inferior. Las condiciones de operacin actuales son tem
peratura (I,) = -220C y la relacin de la presin (l^) = 1.2. Utilizando los datos siguientes, encontrar la tra
yectoria del ascenso ms pronunciado:
Tfemperatura ( |,) ndice de la presin (^2) Pureza
-225
-225
-215
-215

1.1

-220
-220
-220
-220

1.2
1.2
1.2
1.2

82.8
83.5
84.7
85.0
84.1
84.5
83.9
84.3

1.3
L1
1.3

11-2. U n ingeniero industrial ha desarrollado un modelo de simulacin por computadora para un sistema de in
ventario de dos artculos. Las variables de decisin son la cantidad del pedido y el punto de reorden de cada
artculo. La respuesta que debe minimizarse es el costo total del inventario. El m odelo de simulacin se usa
para producir los datos que se muestran en la tabla siguiente. Identificar el diseo experimental. Encontrar
la trayectoria del descenso ms pronunciado.

Artculo 1

Artculo 2

Cantidad del
pedido (li)

Pimto de
reorden (^2)

Cantidad del
pedido (I 3)

100

25
45
25
25
45
45
25
45
35
35
35

250
250
300
250
300
250
300
300
275
275
275

140
140
140

100
100
100
140

120
120
120

Punto de
reorden (I 4)
40
40
40
80
40
80
80
80
60
60
60

Costo
total
625
670
663
654
648
634
692

686
680
674
681

11-8 PROBLEMAS

501

11-3. Verificar que el siguiente diseo es smplex. Ajustar el modelo d primer orden y encontrar la trayectoria del
ascenso ms pronunciado.

*1
0
-V 2
0
V2

X2
V2
0
-V I
0

^3
-1
1
-1
1

y
18.5
19.8
17.4
22.5

11-4. Para el modelo de primer orden


y = 60+1.5j:j - O.&tj +2.0a:3
encontrar la trayectoria del ascenso ms pronunciado. Las variables estn codificadas como -1 a:, 1.
11-5. La regin de experimentacin de tres factores son el tiempo (40 < Tj < 80 min), la temperatura (200 < Tj <
300C) y la presin (20 < P < 50 psig). Se ha ajustado un modelo de primer orden en variables codificadas a
los datos del rendimiento de un diseo 2*. El modelo es
>= 30 + 5a:j + 2 .5 x 2 +3.5j:3
El punto Ti = 85, Tj 325, P = 60 est en la trayectoria del ascenso ms pronunciado?
11-6. La regin de experimentacin de dos factores son la temperatura (100 < T < 300F) y la velocidad de ali
mentacin del catalizador (10 < C < 30 Ib/pulg). Un modelo de primer orden con las variables codificadas
usuales 1 se ha ajustado a la respuesta peso molecular, obtenindose el modelo siguiente:
y = 2(K)0+125a:, -1-40x2
a)
b)

Encontrar la trayectoria del ascenso ms pronunciado.


Se desea mover a una regin donde los pesos moleculares rebasen 2500. Con base en la informacin que
se tiene por la experimentacin en esta regin, aproximadamente cuntos pasos en la trayectoria del as
censo ms pronunciado se necesitan para moverse a la regin de inters?
11-7. La trayectoria del ascenso ms pronunciado suele calcularse suponiendo que el modelo es en realidad de pri
mer orden; es decir, que no hay interaccin. Sin embargo, incluso si hay interaccin, el ascenso ms pronun
ciado que se determina ignorando la interaccin seguir produciendo por lo general buenos resultados. Para
ilustrar, suponga que se ha ajustado el modelo
y = 20-h5jCj -

+3x^x^

utilizando variables codificadas (-1 < x < -1-1).


a) Ti-azar la trayectoria del ascenso ms pronunciado que se obtendra si se ignorara la interaccin.
b) Tlazar la trayectoria del ascenso ms pronunciado que se obtendra incluyendo la interaccin en el mo
delo. Compararla con la trayectoria que se encontr en el inciso a.
11-8. Los datos que se muestran en la siguiente tabla se recolectaron en un experimento para optimizar el creci
miento de un cristal como una funcin de tres variables
y ^3- Son deseables los valores grandes de y (ren
dimiento en gramos). Ajustar un modelo de segundo orden y analizar la superficie ajustada. Bajo qu
conjunto de condiciones se alcanza el crecimiento mximo?

502

CAPITULO 11

METODOS DE SUPERFICIES DE RESPUESTA

Xi
^1
1
1
1
1
1
1
1
-1.682
1.682
0
0
0
0
0
0
0
0
0
0

-1
-1
1
1
-1
-1
1
1
0
0
-1.682
1.682
0
0
0
0
0
0
0
0

JC3
1
1
-1
1
1
1
-1
1
0
0
0
0
-1.682
1.682
0
0
0
0
0
0

y
66
70
78
60
80
70
100
75
100
80
68
63
65
82
113
100
118
88
100
85

11-9. Un ingeniero qumico recolect los siguientes datos. La respuesta^ es el tiempo de filtracin, Jc, es la tempe
ratura y X2 es la presin. Ajustar un modelo de segundo orden.

-1
1
1
-1.414
1.414
0
0
0
0
0
0
0

X2
-1
1
-1
1
0
0
-1.414
1.414
0
0
0
0
0

y
54
45
32
47
50
53
47
51
41
39
44
42
40

a) Qu condiciones de operacin se recomendaran si el objetivo es minimizar el tiempo de filtracin?


b) Qu condiciones de operacin se recomendaran si el objetivo es operar el proceso con una velocidad
de filtracin media muy prxima a 46?
11-10. El diseo hexagonal que se presenta a continuacin se usa en un experimento que tiene como objetivo ajus
tar un modelo de segundo orden:

11-8 PROBLEMAS

1
0.5
-0.5
-1
-0.5
0.5
0
0
0
0
0

503

^2
0
V0.75
JO.75
0
-J0J5
-VO.75
0
0
0
0
0

68
74
65
60
63
70
58
60
57
55
69

a)
b)
c)
d)

Ajustar el modelo de segundo orden.


Efectuar el anlisis cannico. Qu tipo de superficie se ha encontrado?
Qu condiciones de operacin para Jc, y X2 llevan al punto estacionario?
Dnde se correra este proceso si el objetivo es obtener una respuesta que est tan cerca de 65 como sea
posible?
11-11. Un experimentador corri un diseo de Box-Behnken y obtuvo los siguientes resultados, donde la variable
de respuesta es la viscosidad de un polmero:

Nivel
Alto
Intermedio
Bajo

Ifemperatura
200
175
150

Corrida
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

Velocidad de
agitacin

Presin

10.0
7.5
5.0

25
20
15

-Ti
-1
+1
-1
+1
-1
+1
-1
+1
0
0
0
0
0
0
0

X2
-1
-1
+1
+1
0
0
0
0
-1
+1
-1
+1
0
0
0

X3
0
0
0
0
-1
-1
+1
+1
-1
~1
+1
+1
0
0
0

535
580
596
563
645
458
350
600
595
648
532
656
653
599
620

a) Ajustar el modelo de segundo orden.


b) Efectuar el anlisis cannico. Qu tipo de superficie se ha encontrado?

+1
0
-1

X2
+1
0
-1

^3
+1
0
-1

504

CAPTULO 11 MTODOS DE SUPERFICIES DE RESPUESTA

c)
d)

Qu condiciones de operacin para x^, X2 y X: llevan al punto estacionario?


Qu condiciones de operacin se recomendaran si es importante obtener una viscosidad que est tan
cerca de 600 como sea posible?
11-12. Considere el diseo central compuesto de tres variables que se niuestra a continuacin. Analizar los datos y
sacar conclusiones, suponiendo que se quiere maximizar la conversin (yi) con la actividad (y2) entre 55 y 60.

Conversin
Corrida_________

Tiempo
(min)

Tfemperatura
(C)

Catalizador
(%)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

-1.000
1.000
-1.000
1.000
-1.000
1.000
-1.000
1.000
0.000
0.000
0.000
0.000
-1.682
1.682
0.000
0.000
0.000
0.000
0.000
0.000

-1.000
-1,000
1.000
1.000
-1.000
-1.000
1.000
1.000
0.000
0.000
0.000
0.000
0.000
0.000
-1.682
1.682
0.000
0.000
0.000
0.000

-1.000
-1.000
-1.000
-1.000
1.000
1.000
1.000
1.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
-1.682
1.682
0.000
0.000

Actividad
74.00
51.00
88.00
70,00
71.00
90,00
66.00
97.00
81.00
75.00
76.00
83.00
76.00
79.00
85.00
97.00
55.00
81.00
80.00
91,00

53.20
62.90
53.40
62.60
57.30
67.90
59,80
67.80
59.20
60.40
59.10
60.60
59.10
65.90
60.00
60.70
57.40
63.20
60.80
58.90

11-13. Un fabricante de herramientas de corte ha desarrollado dos ecuaciones empricas para la vida de la herra
mienta en horas (yi) y para el costo de la herramienta en dlares (y2). Ambos modelos son funciones hoeales
de la dureza del acero (xi) y de la fecha de fabricacin (xj). Las dos ecuaciones son

5>j = 10-l-5xj + 2x^


% = 2 3 + 3 x .^+4 x 2

y ambas ecuaciones son vlidas en el rango-1.5 <x < 1.5. El costo unitario de la herramienta debe estar aba
jo de $27.50 y la vida debe exceder 12 horas para que el producto sea competitivo. Existe algn conjunto de
condiciones de operacin factible para este proceso? Dnde se recomendara correr este proceso?
11-14. Se corre un diseo central compuesto en un proceso de deposicin qumica por vapor y se obtienen los datos
experimentales que se muestran a continuacin. Se procesaron simultneamente cuatro unidades experi
mentales en cada corrida del diseo, y las respuestas son la media y la varianza del espesor, calculadas en las
cuatro unidades.

11-8 PROBLEMAS

_1
1
_1
1
1.414
-1.414
0
0
0
0
0
0

X2

-1
-1
1
1
0
0
1.414
-1.414
0
0
0
0

360.6
445.2
412.1
601.7
518.0
411.4
497.6
397.6
530.6
495.4
510.2
487.3

505

6.689
14.230
7.088
8.586
13.130
6.644
7.649
11.740
7.836
9.306
7.956
9.127

a) Ajustar un modelo a la respuesta media. Analizar los residuales.


b) Ajustar un modelo a la respuesta varianza. Analizar los residuales.
c) Ajustar un modelo a ln(^). Este modelo es superior al que se encontr en el inciso b l
d) Suponga que se quiere que el espesor medio est en el intervalo 450 25. Encontrar un conjunto de con
diciones de operacin que consiga este objetivo y que al mismo tiempo minimice la varianza.
e) Comentar los aspectos de la minlmizacin de la varianza del inciso d. Se ha minimizado tambin la va
rianza total del proceso?
11-15. Verificar que el diseo de primer orden ortogonal es tambin un diseo de primer orden rotable.
H -16. Demostrar que aumentar un diseo 2* con puntos centrales no afecta las estimaciones de ( = 1 ,2..... k),

pero que la estimacin de la ordenada al origen

es el promedio de las 2* -I-

observaciones.

11-17. E diseo central compuesto rotable. Puede demostrarse que un diseo de segundo orden es rotable si
= Osi fl O f) (o ambas) son impares y si
Demostrar que para el diseo central
compuesto estas condiciones llevan a a = (npY'* para la rotabilidad, donde
es el nmero de puntos en la
porcin factorial.
11-18, Verificar que el diseo central compuesto que se muestra abajo est separado en bloques ortogonales:

^1
0
0
1
1
-1
-1

X2
0
0
1
-1
-1
1

Bloque 3

Bloque 2

Bloque 1
^3
0
0
1
-1
1
-1

0
0
1
1
-1
-1

*2
0
0
1
-1
1
-1

^3
0
0
-1
1
1
-1

X2
-1.633
1.633
0
0
0
0
0
0

0
0
-1.633
1.633
0
0
0
0

0
0
0
0
-1.633
1.633
0
0

11-19. Formacin de bloques del diseo central compuesto. Considere un diseo central compuesto para = 4 varia
bles en dos bloques. Puede encontrarse siempre un diseo rotable formado de bloques ortogonales?
11-20. Cmo puede correrse un diseo hexagonal en dos bloques ortogonales?

506

CAPTULO 11 MTODOS DE SUPERFICIES DE RESPUESTA

11-21. En la tabla siguiente se muestra el rendimiento durante los cuatro primeros ciclos de un proceso qumico.
Las variables son el porcentaje de concentracin (xj) en los niveles 30,31 y 32 y la temperatura (jc^) en 140,
142 y 144F. Hacer el anlisis utilizando mtodos EVOP.

Condiciones
Ciclo

(1)
60.7
59.1
56.6
60.5

1
2
3
4

(2)
59.8
62.8
59.1
59.8

(3)

(4)

(5)

60.2
62.5
59.0
64.5

64,2
64,6
62.3
61.0

57.5
58.3
61.1
60.1

11-22. Suponga que se aproxima una superficie de respuesta con un modelo de orden d^, tal como y = Xj/Sj + e,
cuando la verdadera superficie est descrita por un modelo de orden d 2 > d es decir, E{y) = XjSi -I- Xj/Jja) Demostrar que los coeficientes de regresin son sesgados, es decir, que (^ i) =
donde A =
(X'iXi)-iX'jX2. Es comn llamar a A la matriz alias.
Si di = 1 y 2 = 2, y se utiliza un diseo 2* completo para ajustar el modelo, usar el resultado del inciso a
para determinar la estructura de los alias.
c) Si di = 1,1^2 = 2 y /c = 3, encontrar la estructura de los alias, suponiendo que se usa un diseo 2^^ para
ajustar el modelo.
d) Si di = 1, 2 = 2 y A: = 3, y se utiliza el diseo smplex del problema 11-3 para ajustar el modelo, determi
nar la estructura de los alias y comparar los resultados con el inciso c.
11-23. En un artculo (Conozcamos todos el cuadrado latino, en Quality Engineering, vol. 1, pp. 453-465), J.S.
Hunter ilustra algunos de los problemas asociados con los diseos factoriales fraccionados y - f . El factory4
es la cantidad de etanol agregada a un combustible estndar y el factor B representa la relacin aire/com
bustible. La variable de respuesta es la emisin de monxido de carbono (CO) en g/m^ El diseo se mustra abajo:
b)

Diseo
A

0
1
2
0
1
2
0
1
2

0
0
0
1
1
1
2
2
2

-1
0
+1
-1
0
-Hl
-1
0
-1-1

Observaciones
y

Xi
-1
-1
-1
0
0
0
+1
-1-1
-1-1

66
78
90
72
80
75
68
66
60

62
81
94
67
81
78
66
69
58

Observe que se ha usado el sistema de notacin de 0 , 1 y 2 para representar los niveles bajo, intermedio y alto
de los factores. Se ha usado tambin una notacin geomtrica de - 1 , 0 y -H1. Se hacen dos rplicas de cada
corrida del diseo.
a) Verificar que el modelo de segundo orden
>>= 78.5-l-4.5;ti - 7.0x2 ~

- 9.0x^x2

es un modelo razonable para este experimento. Ttazar los contornos de la concentracin de CO en el es


pacio Xi, X2-

11-8 PROBLEMAS

507

b) Suponga ahora que en lugar de slo dos factores, se usaron cuatro factores en un diseo factorial frac
cionado 3^2y que se obtuvieron exactamente los mismos datos que en el inciso a. El diseo sera el si
guiente:

Diseo
B
0

Observaciones

O
O
0

1
1

+1

2
2
2

-1

+1

+1

+1

+1

-1

2
0

-1
O

-1

2
2

+1

-1

-1

-1

-1

-1

+1

+1

o
o
o

+1
-1

o
o

+1

+1
-1

66
78
90
72
80
75

62
81
94
67
81
78

+1

68

66

-1

66

69
58

60

Confirmar que este diseo es un arreglo ortogonal L,.


c) Calcular los promedios marginales de la respuesta CO en cada nivel de los cuatro factores^, B, C y D.
Construir grficas de estos promedios marginales e interpretar los resultados. Los factores C yD pare
cen tener efectos grandes? Estos factores tienen en realidad algn efecto sobre la emisin de CO? Por
qu su efecto aparente es grande?
d) El diseo del inciso b permite el ajuste del modelo

-1

1=1

Suponga que el verdadero modelo es

1=1

1-1

i<j

Demostrar que si las representan las estimaciones de mnimos cuadrados de los coeficientes del mode
lo ajustado, entonces
^ (^ 0

00 ~ 013 ~

~ 034

E (02)=02-(0n+0u+0u)l2
e

C 0 3 ) = 0 , - ( 0 i2 + 0 ^ ) / 2

E(h)^0,-(0n+023)/2
E { K ) = 0 n - { 0 n - 0^)12
E(h)=02iH 0u+0u+034)/2
E iK )= 0 3 3 -i0 ^^~ 0 n )l2 + 0 ,,
E (K )= 0

~ ( 0 i2 - 0 2 , ) I 2 + 0 , ,

Ayuda esto a explicar los efectos grandes de los factores C y Z) que se observaron grficamente en el in
ciso c?

508

CAPTULO 11 MTODOS DE SUPERFICIES DE RESPUESTA

11-24. Suponga que es necesario disear un experimento para ajustar un modelo cuadrtico en la regin -1 < j:; <
+ 1, i = 1 ,2 sujeto a la restriccin + atj < 1. Si se viola la restriccin, el proceso no funcionar adecuada
mente. N o es posible hacer ms de n = 12 corridas. Establecer los siguientes diseos:
a) U n modelo DCC inscrito con punto central en
^ X2 = 0.
b) U n diseo factorial 3^ inscrito con punto central en
= X2 = -0.25.
c) Un diseo optimal D.
d) Un diseo optimal D modificado que sea idntico al del inciso c, pero con todas las rplicas de las corri
das en el centro del diseo.
e) Evaluar el criterio |(X'X)-*| para cada diseo.
f) Evaluar la eficiencia D para cada diseo en comparacin con el diseo optimal D del inciso c.
g) Qu diseo preferira el lector? Por qu?
11-25. Considere un diseo 2 para ajustar un modelo de primer orden.
a) Evaluar el criterio D \ (X'X)-i | para este diseo.
b) Evaluar el criterio A tr(X'X)'i para este diseo.
c) Encontrar la varianza de prediccin escalada mxima para este diseo. Este diseo es optimal G?
11-26. Repetir el problema 11-25 utilizando un modelo de primer orden con las interacciones de dos factores.
11-27. Un ingeniero qumico desea ajustar una curva de calibracin para un nuevo procedimiento utilizado para
medir la concentracin de un ingrediente particular de un producto fabricado en sus instalaciones. Pueden
prepararse 12 muestras, cuya concentracin es conocida. El ingeniero quiere construir un modelo para las
concentraciones medidas. Piensa que una curva de calibracin lineal ser adecuada para modelar la concen
tracin medida como una funcin de las concentraciones conocidas; es decir, y = ^ -I-I- e, donde x es la
concentracin real. Estn bajo consideracin cuatro diseos experimentales. El diseo 1 consta de seis corri
das con la concentracin conocida 1 y seis corridas con la concentracin conocida 10. El diseo 2 consta de
cuatro corridas con las concentraciones 1,5.5 y 10. El diseo 3 consta de tres corridas con las concentraciones
1 ,4 ,7 y 10. Por tiltimo, el diseo 4 consta de tres corridas con las concentraciones 1 y 10 y seis corridas con la
concentracin 5,5.
a) Graficar la varianza de prediccin escalada para los cuatro diseos en la misma grfica en el rango de la
concentracin 1 < x 10. Qu diseo sera preferible?
b) Calcular el determinante de (X'X)-i para cada diseo. Qu diseo sera preferible de acuerdo con el
c)
d)
e)

criterio D I
Calcular la eficiencia/J de cada diseo en comparacin con el mejor diseo que se haya encontrado en
el inciso b.
Para cada diseo, calcular la varianza de prediccin promedio en el conjunto de puntos dado por x = 1,
1.5, 2, 2.5, ..., 10. Qu diseo sera preferible de acuerdo con el criterio F?
Calcular la eficiencia F d e cada diseo en comparacin con el mejor diseo que se haya encontrado en el

inciso d.
f) Cul es la eficiencia G de cada diseo?
11-28. Resolver de nuevo el problema 11-27, suponiendo que el modelo que el ingeniero quiere ajustar es cuadrti
co. Evidentemente, ahora slo pueden considerarse los diseos 2, 3 y 4.
11-29. U n experimentador quiere correr un experimento de una mezcla de tres componentes. Las restricciones so
bre las proporciones de los componentes son las siguientes:
0.2<:C i < 0 .4

0.1S;t2 < 0.3


0.4 <

< 0.7

a) Establecer un experimento para ajustar un modelo cuadrtico para mezclas. Usar n = 14 corridas, con
cuatro rplicas. Usar el criterio D.
b) li-azar la regin experimental.

11-8 PROBLEMAS

509

c) Establecer un experimento para ajustar un modelo cuadrtico para mezclas can = 12 corridas, supo
niendo que tres de estas corridas son rplicas. Usar el criterio D.
d) Comentar los dos diseos que se encontraron.
11-30. Myers y Montgomery [85a] describen un experimento con una mezcla de gasolina en el que intervienen tres
componentes de la mezcla. No hay restricciones sobre las proporciones de la mezcla, y se us el siguiente di
seo con 10 corridas:

Punto del diseo


1

2
3
4
5

O
0
1
1
1

O
0

0
1

0
1
2

i3
i6

3
2
3

10

y, mi/gal
24.5, 25.1
24.8, 23.9
22.7, 23.6
25.1
24.3
23.5
24.8,24.1
24.2
23.9
23.7

a) Qu tipo de diseo utilizaron los experimentadores?


b) Ajustar un modelo cuadrtico para mezclas a los datos. Es adecuado este modelo?
c) Graficar los contornos de la superficie de respuesta. Qu mezcla se recomendara para maximizar las
millas por galn?
11-31. Considere el experimento del llenado de las botellas del ejemplo 6-1. Suponga que el porcentaje de carbonatacin (A) es una variable de ruido (en unidades codificadas
= 1).
a) Ajustar el modelo de respuesta a estos datos. Se trata de un problema de diseo robusto?
b) Encontrar el modelo de la media y el modelo de la varianza o bien la POE.
c) Encontrar un conjunto de condiciones que resulten en una desviacin del llenado promedio tan prxima
a cero como sea posible con varianza transmitida mnima.
11-32. Considere el experimento del problema 11-12. Suponga que la temperatura es una variable de ruido (<7^ = 1
en unidades codificadas). Ajustar modelos de respuesta para las dos respuestas. Se trata de un problema de
diseo robusto con respecto a ambas respuestas? Encontrar un conjunto de condiciones que maximicen la
conversin con la actividad entre 55 y 60 y que minimice la variabilidad transmitida por la temperatura.
11-33. Se ha corrido un experimento en un proceso que aplica un material de recubrimiento a una oblea. En cada
corrida del experimento se fabric una oblea y se midi varias veces el espesor del recubrimiento en varios si
tios de la misma. Despus se obtuvo la mediaj'i y la desviacin estndarde la medicin del espesor. Los da
tos (adaptados de Box y Draper [16b]) se muestran en la tabla siguiente:

Corrida
1
2
3
4
5
6
7

Velocidad
-1.000
0.000
1.000
-1.000
0.000
1.000
-1.000

Presin
-1.000
-1.000
-1.000
0.000
0.000
0.000
1.000

Distancia
-1.000
-1.000
-1.000
-1.000
-1.000
-1.000
-1.000

Media

Desviacin estndar

y
24.0
120.3
213.7
86.0
136.6
340.7
112.3

yi
12.5
8.4
42.8
3.5
80.4
16.2
27.6

510

CAPTULO 11 MTODOS DE SUPERFICIES DE RESPUESTA

Media
Corrida

1.000

9
-

11

12
13
14
15
16
17
18
19
20

23
24
25
26
27
a)

1.000

0.000

1.000

1.000

0.000
1.000

1.000

0.000
1.000
-

1.000
1.000

1.000
1.000

1.000

1.000

1.000

0.000
0.000
0.000
1.000

0.000
1.000

1.000
1.000

1.000

0.000
1.000
-

1.000

0.000
0.000
0.000
1.000
1.000

1.000

0.000
1.000

21

22

1.000
1.000

0.000

10

Presin

Velocidad

Distancia
-

Desviacin estndar

1.000
1.000
1.000

>'1
256.3
271.7
81.0
101.7
357.0
171.3
372.0
501.7
264.0
427.0
730.7
220.7
239.7
422.0
199.0
485.3
673.7
176.7
501.0

1.000

1010.0

1.000
1.000

0.000
0.000
0.000
0.000
0.000

0.000
0.000
0.000
0.000
1.000
1.000
1.000
1.000
1.000

'z_________
4.6
23.6

0.0
17.7
32.9
15.0

0.0
92.5
63.5

88.6
21.1
133.8
23.5
18.5
29.4
44.7
158.2
55.5
138.9
142.4

Qu tipo de diseo utilizaron los experimentadores? Es sta una buena eleccin del diseo para ajus

tar un modelo cuadrtico?


b) Construir los modelos para ambas respuestas.
c) Encontrar un conjunto de condiciones ptimas que resulten en una media tan grande como sea posible
con la desviacin estndar menor que 60.
11-34. Vna variacin del yemplo 6-2. En el ejemplo 6-2 se encontr que una de las variables del proceso {B = pre
sin) no era importante. Al eliminar esta variable se producen dos rplicas de un diseo 2^. Los datos se
muestran enseguida:
c

> 4(+ )
45,48

A (r)
71,65

57.75

121.19
72.25

-t-

68,80

60,65

68.25

43,45

100,104

73.00

1124.67

86,96

81.75

134.92

-t-

75,70

Suponer que C y D son factores controlables y que A es una variable de ruido.


a) Ajustar un modelo para la respuesta media.
b) Ajustar un modelo para la respuesta
c) Encontrar las condiciones de operacin que resulten en la respuesta de rapidez de filtracin media que
d)

exceda 75 con varianza mnima,


Comparar los resultados obtenidos con los del ejemplo 11-6, en el que se aplic el enfoque de la transmi
sin del error. Hasta qu punto son similares las dos respuestas?

Experimentos
con factores
aleatorios

A lo largo de gran parte de este libro se ha supuesto que los factores de un experimento son factores f^os,
es decir, los niveles de los factores usados por el experimentador son los niveles de inters especfico. La
implicacin de esto es, desde luego, que las inferencias estadsticas que se hacen acerca de estos factores
se restringen a los niveles especficos estudiados. Es decir, si se investigan tres tipos de materiales, como
en el experimento de la vida de la batera del ejemplo 5-1, las conclusiones slo son vlidas para esos ti
pos especficos de materiales. Una variante de esto ocurre cuando el factor o factores son cuantitativos.
En estas situaciones, con frecuencia se usa un modelo de regresin que relaciona la respuesta con los fac
tores para predecir la respuesta en la regin que abarcan los niveles de los factores usados en el diseo ex
perimental. Varios ejemplos de esto se presentaron en los captulos 5 al 9. En general, cuando se trabaja
con un efecto fijo, se dice que el espacio inferencial del experimento es el conjunto especfico de los nive
les de los factores investigados.
En algunas situaciones experimentales, los niveles de los factores se eligen al azar de una poblacin
ms grande de niveles posibles, y el experimentador quiere sacar conclusiones acerca de la poblacin
completa de los niveles, no slo de los que se usaron en el diseo experimental. En esta situacin se dice
que se trata de un factor aleatorio. Se empieza con una situacin simple, un experimento con un solo fac
tor en el que el factor es aleatorio y se usa esto para introducir el modelo de efectos aleatorios para el an
lisis de varianza y los componentes de la varanza. Los factores aleatorios ocurren tambin normalmente
en experimentos factoriales, as como en otros tipos de experimentos. Este captulo se enfoca en los mto
dos para el diseo y anlisis de experimentos factoriales con factores aleatorios. En el captulo 13 se pre
sentarn los diseos anidados y de parcelas subdivididas, dos situaciones en las que es frecuente
encontrar factores aleatorios en la prctica.

12-1

M ODELO C O N EFECTOS ALEATORIOS

Es comn que un experimentador est interesado en un factor que tiene un gran nmero de posibles nive
les. Cuando el experimentador selecciona aleatoriamente a de estos niveles de la poblacin de los niveles
del factor, entonces se dice que el factor es aleatorio. Puesto que los niveles del factor utilizados realmente
en el experimento se eligieron al azar, se hacen inferencias acerca de la poblacin completa de los niveles
del factor. Se supone que la poblacin de los niveles del factor es de tamao infinito o bien lo suficientemen

511

512

CAPTULO 12 EXPERIMENTOS CON FACTORES ALEATORIOS

te grande para considerarla infinita. No es frecuente encontrar situaciones en las que la poblacin de los ni
veles del factor sea lo suficientemente pequea para emplear el enfoque de una poblacin finita. Referirse
a Bennett y Franklin [9] y Searle y Fawcett [101] para una revisin del caso de una poblacin finita.
El modelo estadstico lineal es
= 1, 2,
fl
(12-1)
donde tanto t, como eson variables aleatorias. Si t, tiene varianza a] y es independiente de E, la varianza
de cualquier observacin es
V { y ,)= l+ a ^

A las varianzas a J y se les llama los componentes de la varianza, y al modelo (ecuacin 12-1) se le llama
modelo de efectos aleatorios o de los componentes de la varianza. Para probar hiptesis en este modelo se
requiere que las
sean NID(0, a% que las {r} sean NID(0,
que t y e sean independientes.^
La suma de cuadrados identidad
( 12- 2)

sigue siendo vlida. Es decir, se hace la particin de la variabilidad total en las observaciones en un com
ponente que mide la variacin entre los tratamientos
y un componente que mide la variacin
dentro de los tratamientos (55^). Probar hiptesis acerca de los efectos de tratamientos individuales no
tiene sentido, por lo que en su lugar se prueban hiptesis acerca del componente de la varianza a I :
=Q

(12-3)

Si
= O, todos los tratamientos son idnticos; pero si > O, existe variabilidad entre los tratamientos.
Como anteriormente, SS e/o^ se distribuye como ji-cuadrada coniV -a grados de libertad y, bajo la hipte
sis nula,
^e distribuye como ji-cuadrada con a - 1 grados de libertad. Ambas variables alea
torias son independientes. Por lo tanto, bajo la hiptesis nula a l = O, el cociente
SS Tratam ientos
MS Tratam ientos
a -1
(12-4)
Po=-

MS,

SS,

N~a
se distribuye como F c o ^ a - \ y N - a grados de libertad. Sin embargo, es necesario examinar los cuadra
dos medios esperados para tener la descripcin completa del procedimiento de prueba.
Considere
E{MS Tratamientos ) = ------E{SS
a \

a -1

Tratamientos ) =

E
>=)

i
V /= i

a -1

n
1
N

N_
a n

ES

Cuando se eleva al cuadrado y se toma la funcin esperanza de las cantidades entre corchetes, se observa
que los trminos que incluyen a son reemplazados por <rJ como ( t) = 0. Adems, los trminos que in1 El supuesto de que las {r,} son variables aleatorias independientes impca que el supuesto usual de que
efectos fijos no se aplica al modelo de efectos aleatorios.

r,- = Odel modelo de

124 MODELO CON EFECTOS ALEATORIOS

513

cluyen
y
son reemplazadosporno^,
y
respectivamente. Por otra parte, to
dos los productos cruzados que incluyen a r, y e,-, tienen valor esperado cero. Esto lleva a
[Nfi^ + N a l + a o ^ - N f i ^ ~ n o l - o ^ ]

o
=

(12-5)

De manera similar, puede demostrarse que


E (M S ^ ) = a^

(1 2 -6 )

Por los cuadrados medios esperados, se observa que bajo Hf tanto el numerador como el denomina
dor del estadstico de prueba (ecuacin 12-4) son estimadores insesgados de a^, mientras que bajo
el
valor esperado del numerador es mayor que el valor esperado del denominador. Por lo tanto,
deber
rechazarse para los valores de F qque sean muy grandes. Esto implica una regin crtica de una cola supe
rior, por lo que
se rechaza si fg > K , a - i, n El procedimiento de clculo y el anlisis de la tabla de varianza del modelo de efectos aleatorios son
idnticos a los que se utilizaron en el caso de efectos fijos. Sin embargo, las conclusiones son muy diferen
tes, ya que se aplican a la poblacin completa de los tratamientos.
Por lo general habr inters en estimar los componentes de la varianza (a^ya^) del modelo. Ai pro
cedimiento que se usa para estimar d^yo^ se le llama mtodo del anlisis de varianza, ya que hace uso de
las lneas de la tabla del anlisis de varianza. El procedimiento consiste en igualar los cuadrados medios
esperados con sus valores observados en la tabla del anlisis de varianza y despejar los componentes de la
varianza. Al igualar los cuadrados medios observados con los esperados en el modelo de efectos aleato
rios con un solo factor, se obtiene

y
MS^ =

Por lo tanto, los estimadores de los componentes de la varianza son


a" =

(12-7)

y
a] = -

(-12-8)

Para tamaos de las muestras desiguales, se reemplaza n en la ecuacin 12-8 con


.
=

a -1

";
a

(12-9)

En el mtodo del anlisis de varianza para estimar los componentes de la varianza no se requiere el
supuesto de normalidad. Produce estimadores de cPy crj que son los mejores estimadores cuadrticos in
sesgados (es decir, de todas las funciones cuadrticas insesgadas de las observaciones, estos estimadores
tienen mnima varianza).

514

CAPTULO 12 EXPERIMENTOS CON FACTORES ALEATORIOS

Ocasionalmente, el mtodo del anlisis de varianza produce una estimacin negativa de uno de los
componentes de la varianza. Evidentemente, los componentes de la varianza son por definicin no nega
tivos, por lo que la estimacin negativa de un componente de la varianza se considera con cierta preocu
pacin, U n curso de accin es aceptar la estimacin y usarla como evidencia de que el verdadero valor del
componente de la varianza es cero, suponiendo que la variacin muestral llev a la estimacin negativa.
Esto tiene un atractivo intuitivo, pero adolece de algunas dificultades tericas. Por ejemplo, usar cero en
lugar de la estimacin negativa puede alterar las propiedades estadsticas de otras estimaciones. Otra al
ternativa es volver a estimar el componente de la varianza negativa utilizando un mtodo que produzca
siempre estimaciones no negativas. Una alternativa ms es considerar la estimacin negativa como evi
dencia de que el modelo lineal supuesto es incorrecto y examinar de nuevo el problema. El tratamiento
completo de la estimacin de los componentes de la varianza se ofrece en Searle [99a, b], Searle, Casellay
McCullogh [100] y Burdick y Graybill [22].

T E M P L O

.....................................................................................................................................................................................................................

Una compaa textil fabrica un tejido en un gran nmero de telares. Le gustara que los telares fueran ho
mogneos a fin de obtener un tejido de resistencia uniforme. El ingeniero del proceso sospecha que, ade
ms de la variacin usual de la resistencia dentro de las muestras del tejido del mismo telar, puede haber
tambin variaciones significativas en la resistencia entre un telar y otro. Para investigar esta posibilidad, el
ingeniero selecciona cuatro telares al azar y hace cuatro determinaciones de la resistencia del tejido fabri
cado en cada telar. Este experimento se corre de manera aleatoria, y los datos obtenidos se muestran en la
tabla 12-1. Se realiza el anlisis de varianza, el cual se muestra en la tabla 12-2, Por el anlisis de varianza
se concluye que los telares de la planta difieren significativamente.
Los componentes de la varianza se estiman con
= 1.90 y
= 2 9 .7 3 -1 .9 0 ^ ^ ^ ^
Por lo tanto, la varianza de cualquier observacin de la resistencia se estima con
=1.90+6.96=8.86.
La mayor parte de esta variabilidad es atribuible a las diferencias entre los telares.

Este ejemplo ilustra un uso importante de los componentes de la varianza; la separacin de las dife
rentes fuentes de variabihdad que afectan un producto o sistema. El problema de la variabilidad de un
producto se presenta co frecuencia en el control de calidad, y en muchas ocasiones es difcil aislar las

Tabla 12-1 Datos de la resistencia del ejemplo 12-1


Observaciones
4
3
2
Tfelares
1
96
99
97
98
1
92
93
90
91
2
97
95
95
96
3
98
99
96
4
95

yi
390
366
383
388
1527 = x .

12-1 MODELO CON EFECTOS ALEATORIOS


Tabla 12-2

515

Anlisis de varianza de los datos de la resistencia

Fuente de
variacin
Tfclares
Error
Tbtal

Suma de
cuadrados
89.19
22.75
111.94

Grados de
libertad
3
12
15

Cuadrado
medio
29.73
1.90

Fo
15.68

Valor P
<0.001

fuentes de la variabilidad. Por ejemplo, este estudio puede haber sido motivado por una gran variabilidad
en la resistencia del tejido, como se ilustra en la figura 12-la. En esta grfica se presenta la salida del pro
ceso (resistencia del tejido) modelado como una distribucin normal con varianza
= 8.86. (sta es la
estimacin de la varianza de cualquier observacin de la resistencia del ejemplo 11-1.) Las especificacio
nes superior e inferior de la resistencia se muestran tambin en la figura 12-la, y es relativamente inme
diato ver que una proporcin bastante grande de la salida del proceso se sale de las especificaciones (las
reas sombreadas de las colas de la figura 12-la). El ingeniero del proceso se ha preguntado por qu es
tan grande la cantidad de tejido defectuoso que debe desecharse, reelaborarse o degradarse a un produc
to de menor calidad. La respuesta es que la mayor parte de la variabilidad de la resistencia del producto es
el resultado de las diferencias entre los telares. El desempeo irregular de los telares podra ser el resulta
do de una instalacin incorrecta, un mantenimiento deficiente, una supervisin ineficaz, operadores sin
la capacitacin suficiente, fibra de entrada defectuosa, etctera.
El ingeniero del proceso debe intentar ahora aislar las causas especficas de la diferencia en el desem
peo de los telares. Si pudiera identificar y ehminar estas fuentes de variabilidad entre los telares, sera
posible reducir considerablemente la varianza de la salida del proceso, quiz hasta d J = 1.90, la estima
cin del componente de la varianza dentro del telar (error) en el ejemplo 12-1. En la figura 12-16 se mues
tra la distribucin normal de la resistencia de la fibra con ctJ = 1.90. Observe que la proporcin del
producto defectuoso en la salida se ha reducido radicalmente. Aun cuando es improbable que pueda eli
minarse toda la variabilidad entre los telares, es claro que una reduccin significativa en este componente
de la varianza incrementara sensiblemente la calidad de la fibra producida.

LS (especificacin inferior)

US (especificacin superior)

a) Variabilidad de la salida del proceso.

6) Variabilidad de la salida del proceso si

Figura 12-1 Salida del proceso en el problema de la


resistencia de la fibra.

516

CAPTULO 12 EXPERIMENTOS CON FACTORES ALEATORIOS

Es sencillo encontrar un intervalo de confianza para el componente de la varianza cF. Si las observa
ciones siguen una distribucin normal e independiente, entonces {N~)MSpj6^ se distribuye como Xs-aPor lo tanto,
X l-(a l2 ),N -B

^2

A a n ,N ~ a

=l-a

y un intervalo de confianza de 100(1 - a) por ciento para


es
(N -a )M S ,
{N - a ) M S^

(12-10)

X,-

X a l2 ,N - a

Considere ahora el componente de la varianza (jf. El estimador puntual de a j es


,2 _

^ ^Tratamientos

La variable aleatoria (a + n a ] ) se distribuye como %U, y {N-a)MSEla^ se distribuye


como Xn-.- Por lo tanto, la distribucin de probabilidad d e e s una combinacin lineal de dos variables
aleatorias ji-cuadrada, por ejemplo
donde
+ na\
i =

n {N -a )

n (fl-l)

Desafortunadamente, no puede obtenerse una expresin predeterminada para la distribucin de esta


combinacin lineal de variables aleatorias ji-cuadrada. Por lo tanto, no es posible construir un intervalo
de confianza exacto p a r a a ^ En Graybill [50] y Searle [99a] se presentan procedimientos aproximados.
Ver tambin la seccin 12-7.
2 2
Es sencillo encontrar una expresin exacta para un intervalo de confianza del cociente a ,
+ (T).
Se trata de un cociente con significado, ya que refleja la.proporcin de la varianza de una observacin [re
cuerde que Vfyij) = o l + (^] que es el resultado de las diferencias entre los tratamientos. Para desarrollar
este intervalo de confianza en el caso de un diseo balanceado, observe que
Y
son varia
bles aleatorias independientes y, adems, que puede demostrarse que
M S J a ^

Por lo tanto,
F

MS Tratam ientos
a
<
MS^
na] + a

=l-a

( 12- 11)

Al reordenar la ecuacin 12-11, puede obtenerse la siguiente expresin;


(12-12)

=l-a
a

donde
MS*Tratam ientos
n

M S.

" a 2 ,a - l,N - a

(12-13a)

12-2 DISEO FACTORIAL DE DOS FACTORES ALEATORIOS

MS Tratam ientos
M S,

517

(12-13b)
Pi - . a l 2 , a - l , N - i

Observe que L y U son los lmites de confianza inferior y superior del intervalo 100(1 - a) por ciento, res
pectivamente, del cociente al/a^. Por lo tanto, un intervalo de confianza de 100(1 - a) por ciento para
+ a^) es
U
+U

(12-14)

Para ilustrar este procedimiento, se encontrar un intervalo de confianza de 95% de a]l{a] -I- d^)
para los datos de la resistencia del ejemplo 12-1. Recuerde que
= 29.73, MS^ = 1.90, a = 4,n
= 4,Fq q25 313 = 4.47y'o,975,3,i2 ~ 1/^0.025,12,3 = 1/14.34 = 0.070. Por lo tanto, por las ecuaciones 12-lZayb,

'29.73V 1 '

L=- 1 = 0.625
4 . 1.90 jU.47,

7 29.73V 1 '
-1 = 54.883
1.90 j\0.070,
y por la ecuacin 12-12, el intervalo de confianza de 95% para o^/{al + (f) es

0.625
1.625 ol +o^

0.39:

o l +a^

54.883
55.883

<0.98

Se concluye que la variabilidad entre los telares explica entre 39 y 98% de lavarianza en la resistencia ob
servada del tejido producido. Este intervalo de confianza es relativamente ancho debido al tamao pe
queo de la muestra que se us en el experimento. Sin embargo, es evidente que la variabilidad entre los
telares ( a j) no es insignificante.

12-2

DISEO FACTORIAL DE DOS FACTORES ALEATORIOS

Suponga que se tienen dos factores, A y B, y que ambos tienen un gran nmero de niveles de inters
(como en la seccin anterior, se supondr que el nmero de niveles es infinito). Se escogern al azar a ni
veles del factor y b niveles del factor 5 , y estos niveles de los factores se incluirn en un diseo experi
mental factorial. Si el experimento se hace con n rplicas, las observaciones pueden representarse con el
modelo hneal
i = l, 2, ..., a
(12-15)
k = l,2 , ..., n
donde todos los parmetros del modelo, t, /?,, (t/?),^ y
son variables aleatorias independientes. Tkmbin
se supondr que las variables aleatorias t yS,,
y ej^ siguen una distribucin normal con media cero y

518

CAPTULO 12 EXPERIMENTOS CON FACTORES ALEATORIOS

varianzas dadas por V(r) = a \ , V(^) = a ^ , F[(r)S),y] = a y Vi^uk) =


quier observacin es

Por lo tanto, la varianza de cual


(1 2 -1 6 )

yol

,a l^ y ( ^ son los componentes de la vaanza. Las hiptesis que quieren probarse sonio:<7^ = O,
=OyHf,:ol^ = 0 . Observe la similitud con el modelo de efectos aleatorios de un solo factor.
Los clculos numricos del anlisis de varianza se mantienen sin cambios; es decir, 5S^, SSg, S S ^ , SSj
y SSe se calculan como en el caso de efectos fijos. Sin embargo, para formar los estadsticos de prueba, de
ben examinarse los cuadrados medios esperados. Puede demostrarse que
E(MSg ) = a^
E(M S ab ) =

+ana^p

(12-17)

y
E (M S ,) = a^
Por los cuadrados medios esperados se observa que el estadstico apropiado para probar la hiptesis
de que no hay interaccin,
= O, es
P

(1 2 -1 8 )
M Se

ya que bajo H qtanto el numerador como el denominador de tienen valor esperado y slo si H es fal
sa (M5^b) es mayor que ^(MSc). El cociente Fq se distribuye como
.y . De manera similar, para
probar H q-o I = O se usara
f
que se distribuye como

(12-19)

a - ix - i), y para probar To:a^ = O el estadstico es

que se distribuye como


_i)(6- 1)- Todas estas pruebas son de una sola cola superior. Observe que estos
estadsticos de prueba no son los mismos que se usaran si ambos factores ^4 y B fuesen fijos. Los cuadra
dos medios esperados se usan siempre como gua para construir los estadsticos de prueba.
En muchos experimentos que incluyen factores aleatorios existe al menos inters tanto en estimar los
componentes de la varianza como en la prueba de las hiptesis. Los componentes de la varianza pueden
estimarse con el mtodo del anlisis de varianza, es decir, igualando los cuadrados medios observados de
las lneas de la tabla del anlisis de varianza con sus valores esperados y resolviendo para los componentes
de la varianza. Se obtiene as
d" = MS^
* 2 _
-

n
M S, - M S ^
..............................

an
M S^ - M S ^
bn

(12-21)

12-2 DISEO FACTORIAL DE DOS FACTORES ALEATORIOS

519

como las estimaciones puntuales de los componentes de la varianza en el modelo de efectos aleatorios de
dos factores. En la seccin 12-7 se revisarn otros mtodos para obtener estimaciones puntuales de los
componentes de la varianza y los procedimientos para construir intervalos de confianza.
EJEMPLO .........................................................................................................................................................
Estudio de capacidad o aptitud de sistem as de medicin
Con frecuencia se usan experimentos diseados estadsticamente para investigar las fuentes de variabili
dad que afectan a un sistema. Una aplicacin industrial comn es usar un experimento diseado para es
tudiar los componentes de la variabilidad en un sistema de medicin. Estos estudios se conocen
comnmente como estudios de capacidad o aptitud de instrumentos de medicin (calibradores) o estu
dios de repetibilidad y reproductibilidad (R&R) de instrumentos de medicin (calibradores), ya que s
tos son los componentes de la variabilidad de inters.
En la tabla 12-3 se muestra un experimento R&R de instrumentos de medicin tpico (de Montgomery [80a]). Se usa un instrumento o calibrador para medir una dimensin crtica de una pieza. Se han se
leccionado 20 piezas del proceso de produccin, y tres operadores escogidos al azar miden dos veces cada
pieza con este calibrador. El orden en que se hacen las mediciones est completamente aleatorizado, por
lo que se trata de un experimento factorial de dos factores en el que los factores del diseo son las piezas y
los operadores, con dos rplicas. Las piezas y los operadores son factores aleatorios. Es vlida la identi
dad del componente de la varianza de la ecuacin 12-15; es decir,
a ] = a ] + a ] + a ] ^ + o ^

donde a J es la variabilidad total (que incluye la variabihdad debida a las diferentes piezas, la variabilidad
debida a los diferentes operadores y la variabilidad debida al calibrador), a ^ es el componente de la va
rianza de las piezas, a^ es el componente de la varianza de los operadores, 0 ]^ es el componente de la valabla 12-3 El experimento de la capacidad o aptitud del sistema de
medicin del ejemplo 12-2
Nmero de
la pieza
Operador 1
Operador 2
Operador 3
1
21
20
20
20
19
21
2
24
23
24
24
23
24
3
20
21
19
21
20
22
4
27
27
28
26
27
28
5
19
18
19
18
18
21
6
23
21
24
21
23
22
7
22
21
22
24
22
20
8
19
17
18
20
19
18
9
24
23
25
23
24
24
10
25
23
26
25
24
25
11
21
20
20
20
21
20
12
18
19
17
19
18
19
13
23
25
25
25
25
25
14
24
24
23
25
24
25
15
29
30
30
28
31
30
16
26
26
25
26
25
27
17
20
20
19
20
20
20
18
19
21
19
19
21
23
19
25
26
25
24
25
25
20
19
19
18
17
19
17

520

CAPTULO 12 EXPERIMENTOS CON FACTORES ALEATORIOS

rianza que representa la interaccin entre las piezas y los operadores, y t^ es el error experimental
aleatorio. De manera tpica, al componente de la varianza se le llama la repetibilidad del instrumento
de medicin (calibrador), ya que puede considerarse que refleja la variacin obtenida cuando la misma
pieza es medida por el mismo operador, y es comn llamar a

la reproductibilidad del instrumento de medicin (calibrador), ya que refleja la variabilidad adicional en


el sistema de medicin que resulta del uso del instrumento por parte del operador. Estos experimentos
suelen realizarse con el objetivo de estimar los componentes de la varianza.
En la tabla 12-4 se muestra el anlisis de varianza de este experimento. Los clculos se realizaron uti
lizando la rutina Balanced ANOVA (anlisis de varianza balanceado) de Minitab, Con base en los valores
P, se concluye que el efecto de las piezas es grande, que los operadores quiz tengan un efecto pequeo y
que no hay ninguna interaccin significativa pieza-operador. La ecuacin 12-21 puede usarse para esti
mar los componentes de la varianza de la siguiente manera:
62.39-0.71

(3)(2)

d \=
'

^1 _ o 71
0.015
(20)(2)

a 7 1 ^ _ 0 .1 4

= 0.99
La parte inferior de la salida de Minitab de la tabla 12-4 contiene los cuadrados medios esperados del
modelo aleatorio, con los nmeros entre parntesis representando los componentes de la varianza [(4)
representa T, (3) representa
, etc.]. Se presentan tambin las estimaciones de los componentes de la
varianza, junto con el trmino del error que se utiliz para probar ese componente de la varianza en el
anlisis de varianza. Ms adelante se estudiar la terminologa modelo no restringido; sta no tiene rele
vancia en los modelos aleatorios.
Observe que la estimacin de uno de los componentes de la varianza,
es negativa. Desde luego,
esto no tiene sentido, ya que por definicin las varianzas son no negativas. Desafortunadamente, pueden
obtenerse estimaciones negativas de los componentes de la varianza cuando se usa el mtodo de estima
cin del anlisis de varianza (lo cual se considera una de sus desventajas). Existen varias maneras de abor
dar esta situacin. Una posibilidad es suponer que la estimacin negativa significa que el componente de
la varianza en realidad es cero y simplemente se hace cero, dejando sin cambios las dems estimaciones
no negativas. Otro enfoque es estimar los componentes de la varianza con un mtodo que asegure estima
ciones no negativas (este enfoque se revisar brevemente en la seccin 12-7). Por ltimo, podra observar
se que el valor P del trmino de interaccin de la tabla 12-4 es muy grande, tomar esto como evidencia de
que
es en realidad cero (es decir, que no hay efecto de interaccin) y ajustar un modelo reducido de la
forma
yij, =

ijk

que no incluye el trmino de interaccin. ste es un enfoque relativamente senclo y que con frecuencia
funciona casi tan bien como los mtodos ms elaborados.

E
L.
4)

h- '

O
<Q
UJ
c_ 4;
o -O
O
E

'O ro o

- c\J

Q. o ro O h- 'O
o - 0
1
O O O

lA f \J O s

f - 00

u. in '4' OJ
'O OO h
^ o
00

ro o h- ro

cNj

</) c- 00 CM rvj
E
o ro K) N
<NJ - o o

so ro

Qt
L. T)
(0 4) ^
D
TO" o

^
ru
w
o
co * sn ^
L.
c ^ + +
(0 V)
0> 4#
c t- fO K> tO
C
^
T? rvj (M (Nj
0)
*- o + + (.> c
^
4
a M ^ ^ '4'
v'
X 3 w
LU w

O
u
u
UJ
(A
OJ

OO lA

3
-a
cd
y
Xi
C/5

Q
>
MO
^ r\j

O
ro

u
c

>
V
o s
a o
>s'0
H c
(O

B
O
O

/> ir> r - o o <NJ


t/i rg t - m o
>r 'O O lA

m f\j h- O' *4*
00
r\j m
<M
irT
(^ C 00 O
ir *
K
-

u
*0
i

<D n
u- a

41
U
c
(0

4->
c oo
4)
st Os
c
to fVJ o u o. Q E o o o
> O 1

(O
>

cd

>

E
t- K fO '4
4>
4-*

o
4-*
<0

4)
Q.
O

<D
C
<

0)
O
3
O

c- o;
O a
4^ O
(O 4c c.
fi- -M O <0
0> ^
^
(Q O. <Q C- O

C/> Q. O Q. U4 h-

4)
O
L.
3
O
v>

c- 4)
O Q.
4- O
CD
4- (. 4-
^ 0) ^
a (Q

tO
^
c

o. o auj

r - OJ K) ^

521

522

CAPTULO 12 EXPERIMENTOS CON FACTORES ALEATORIOS

Tabla 12-5

Anlisis de varianza del modelo reducido, ejemplo 12-2

Anlisis de varianza (diseos balanceados)


Factor
part

Type Le ve L s V a l e s
20
1
ran d om
8
15
3
1
o p e r a t o r rand om

2
9
16
2

3
10
17
3

4
11
18

5
12
19

6
13
20

7
14

A n a L y s i s of V a r i a n c e for y
So ur c e
part
operator
Error
TotaL

DF
19
2
98
119

Sou rc e
1 part
2 operator
3 Error

SS
1185.425
2. 6 1 7
86.550
1274.592
Variance
component
10.2513
0.0106
0.8832

MS
62.391
1.308
0.883
Error
trra
3
3

F
70.64
1.48

P
0 . 00 0
0.232

E x p e c t e d Mean Sq u ar e for Each Term


(using u n r e s t r i c t e d mod el )
(3) + 6(1)
(3) + 40(2)
(3)

En la tabla 12-5 se muestra el anlisis de varianza del modelo reducido. Puesto que no hay trmino de
interaccin, los dos efectos principales se prueban contra el trmino del error, y las estimaciones de los
componentes de la varianza son
62.39-0.88
(3)(2)

1.31-0.88

'

(20)(2)
= 0.88

Por ltimo, la varianza del calibrador podra estimarse como la suma de las estimaciones de los compo
nentes de la varianza
^
como
^Llibr^dor =

= 0.88-h0.0108
= 0.8908
La variabilidad del calibrador parece ser pequea en comparacin con la variabilidad del producto. Se
trata generalmente de una situacin deseable, la cual implica que el calibrador tiene la capacidad de dis
tinguir entre las diferentes gradaciones del producto.

12-3

MODELO M IXTO C O N DOS FACTORES

Se considera ahora la situacin en que uno de los factores,^4, est fijo y el otro, B, es aleatorio. Se le llama
anlisis de varianza del modelo mixto. El modelo estadstico lineal es
i = 1,1,...,a
yak =

y =

k - = l,l,...,n

(1 2 -2 2 )

523

12-J MODELO MIXTO CON DOS FACTORES

Aqu r, es un efecto fjo,^y es un efecto aleatorio, se supone que la interaccin


es un efecto aleatorio y
es un error aleatorio. Se supone tambin que las {r} son efectos fijos tales que
= Oy que pj es
una variable aleatoria NID(0, ). El efecto de la interaccin, (r/3),j, es una variable aleatoria normal con
media Oy varianza [(a - l)la]al^; sin embargo, la operacin suma del componente de la interaccin en el
rango del factor fijo es igual a cero. Es decir,

(T /3 ),= W .y

= 0

i= l

Esta restriccin implica que algunos elementos de la interaccin en diferentes niveles del factor fijo no
son independientes. De hecho, puede demostrarse (ver el problema 12-25) que

La covarianza entre (r/3),y y (rjS),y. para j ^ j' es cero, y el error aleatorio


es NID(0, o^). Puesto que la
sma de los efectos de la interaccin en los niveles del factor fijo es igual a cero, a esta versin del modelo
mixto con frecuencia se le llama modelo restrngido.
En este modelo la varianza de (r^),y se define como [( en vez de como
para simplificar
los cuadrados medios esperados. El supuesto (t^) = O tambin tiene un efecto sobre los cuadrados me
dios esperados, los cuales puede demostrarse que son

E(M Sg) = o ^+ a n a ]

E(MS^) = o^+na%

(12-23)

y
(M 5 ^ )= a "

Por lo tanto, el estadstico de prueba apropiado para probar que las medias de los efectos del factor fijo
son iguales, o H(,:r = O, es
M S .

que tiene la distribucin de referencia

. i, (. ix*. i). Para probar // : a ^, el estadstico de prueba es


^
F

con la distribucin de referencia


= O, se usara

M S ^

MSg
= -------

M Se

Por ltimo, para probar la hiptesis de la interaccin

que tiene la distribucin de referencia


_ ,j.
En el modelo mixto es posible estimar los efectos del factor fijo como
^
^i = y i.-y ...

(12-24)
i = 1,2,..., a

524

CAPTULO 12 EXPERIMENTOS CON FACTORES ALEATORIOS

Los componentes de la varianza ct^, a y a ^ pueden estimarse aplicando el mtodo del anlisis de varianza. Al eliminar la primera ecuacin de las ecuaciones 12-23 quedan tres ecuaciones con tres incgnitas,
cuyas soluciones son
, M S g-M S ^
d l =- ^ ^
^
an
(12*25)
o , . = ---------------------------

= MS^

Este enfoque general puede emplearse para estimar los componentes de la varianza en cualquier modelo
mixto. Despus de eliminar los cuadrados medios que contienen factores fijos, siempre quedar un siste
ma de ecuaciones que puede resolverse para los componentes de la varianza.
En los modelos mixtos, el experimentador puede tener inters en probar hiptesis o en construir in
tervalos de confianza para las medias de tratamientos individuales del factor fijo. Al utilizar estos proce
dimientos, deber tenerse cuidado de usar el error estndar apropiado de la media de los tratamientos. El
error estndar de la media de los tratamientos del efecto fijo es
Cuadrado medio para probar el efecto fijo
Nmero de observaciones en la media de cada tratamiento.

bn

Observe que esto es simplemente el error estndar que se usara si ste fuera un modelo con efectos fijos,
salvo porque M5 se ha reemplazado con el cuadrado medio que se us en la prueba de la hiptesis.

EJEMPLO 1 2 - 3 ..............................................................................................................................................
Retomando el experimento de la capacidad o aptitud del sistema de medicin
Considere de nuevo el experimento R&R del calibrador descrito en el ejemplo 12-2. Suponga ahora que
slo tres operadores usan este calibrador, de tal modo que los operadores son un factor fijo. Sin embargo,
puesto que las piezas se eligen al azar, se trata ahora de un experimento con un modelo mixto.
El anlisis de varianza del modelo misto se muestra en la tabla 12-6. Los clculos se realizaron utili
zando la rutina Balanced ANOVA (anlisis de varianza balanceado) de Minitab. Se especific el uso del
modelo restringido en el anlisis de Minitab, el cual gener tambin los cuadrados medios esperados para
este modelo. En la salida de Minitab, la cantidad Q[2] indica una expresin cuadrtica que incluye al ope
rador del efecto de factor fijo. Es decir, Q[2] =
/ (6 -1 ). Las conclusiones son similares al ejemplo
12-2. Los componentes de la varianza pueden estimarse con la ecuacin 12-25 como
an

62.39-0.99
(3)(2)

,
&

0.71-0.99
X operadores =

---------------- ------------------^ ------------------------------------ =

----------------- 2 ---------------"

d" = MS^ = 0.99


Estos resultados tambin se muestran en la salida de Minitab. De nueva cuenta, resulta una estimacin
negativa del componente de la varianza de la interaccin. U n curso de accin apropiado sera ajustar un

u
<0

0 ->

0)

TJ

01 O

fM

CD

>o ro o

Q. O

T-* f\j

3 "O
cr of
t/ M

ro

r - 'O

o - oo
o o o

lA <\ O'

o
C

<Ll 4i^

'W '

01

H 0 ) +

+ +

4
^
^ M r 'f
X 3

<s
*>t

(/) f - oo C4 r\j
ac O' o ^ on
K K) r - o

ro o h- ro

>o

'o o

O e
c.
c- 0)

ro

f\i

(0
(D
- 00 lA T _4
co
>
M O
' f\
0)
>
V

ro

01 E
Cl 0
> sa
1- c
<0

*o
o;
X

4->
c.
10
CL

<A f - to ro

"O _ sO f\J <M


O

r\j <
nO

s t f - 00

Co
4-<
u
CD
u.

<Q cW

11- fsj '4* M


C^ do h-

rj O

LJ

>s
o
*h9
O
c
IQ

L.
(0
>

</> lA h - o O (NJ
(/> <\J < m O O
o (A lA
4
ir\ (\j h - O -(NJ lA K
00
fSJ
T
Tu. o
A

tn
1tn
>s
<0
c
<

0^ h o tro

o o
1

rvj 00 O
K ) o
o
_
O
4->
(Q

o
o
M
<0
i.
0)
a
o

0) 4-* <M
U C lO
c 0) M
ra C <M
mrm O
U a o
(D e
> 0
u

c.
o
*
(0

01
Q.
0)
O
o
c.

fi. +J
4- o (Q
( - 0) c. _ 4J
O (0 Q. (0 L. O
</> a o a u i

0)
O
L.
D
O
co

O
+J
<
4-J <0
(0 a
O. o

10
u
0
a
o
-1* C4- O
t(9 ( .
auj

- r\j ro s t

525

526

CAPTULO 12

EXPERIMENTOS CON FACTORES ALEATORIOS

modelo reducido, como se hizo en el ejemplo 12-2. En el caso de un modelo mixto con dos factores, esto
lleva a los mismos resultados del ejemplo 12-2.

Modelos mixtos alternativos


Se han propuesto varias versiones diferentes del modelo mixto. Estos modelos difieren de la versin res
tringida del modelo mixto estudiado anteriormente en los supuestos establecidos acerca de los compo
nentes aleatorios. A continuacin se revisa brevemente uno de estos modelos alternativos.
Considere el modelo
+

+ 7 y + ( y ),

donde
= 1,2,..., a) son efectos fijos tales que
= Oy yyjcyXy y son variables aleatorias no co
rrelacionadas que tienen media cero y varianzas V(Yj) =
Y
Observe que
aqu no se usa la restriccin impuesta anteriormente sobre el efecto de la interaccin; por consiguiente, a
esta versin del modelo mixto se le llama con frecuencia modelo mixto no restringido.
Es posible demostrar que los cuadrados medios esperados para este modelo son (referirse al material
suplementario del texto de este captulo)

,_

E {M S ^ ) = a^ + n al^ +

E(MSg)=

+noly -HanaJ

E (M S ^ )^ a ^+ n a l

(12-26)

E(MS,) = o^
Al comparar estos cuadrados medios esperados con los de la ecuacin 12-23, se observa que la nica dife
rencia evidente es la presencia del componente de la varianza cr^ en el cuadrado medio esperado del
efecto aleatorio, (En realidad, hay otras diferencias debido a las definiciones diferentes de la varianza del
efecto de la interaccin en los dos modelos.) Por consiguiente, se probara la hiptesis de que el compo
nente de la varianza del efecto aleatorio es igual a cero (^o:a^ = 0) usando el estadstico
=

en contraste con probar


con F q = M S^M S e en el modelo restringido. La prueba deber ser ms
conservadora cuando se emplee este modelo porque por lo general
ser mayor que MS^.
Los parmetros de los dos modelos guardan una relacin cercana. De heeho, puede demostrarse que
P j= Y i+ ( ^ ) .j

12-3 MODELO MIXTO CON DOS FACTORES

527

Puede usarse el mtodo del anlisis de varanza para estimar los componentes de la varianza. Con re
ferencia a los cuadrados medios esperados, se encuentra que el nico cambio de las ecuaciones 12-25 es
que
M S -M S ,

an
Estos dos modelos son casos especiales del modelo mixto propuesto por Scheff [98b, d]. En este mo
delo se supone que las observaciones pueden representarse con
7 = 1 ,2 ,...,6

k
donde

son variables aleatorias independientes. La estructura de /n,j es


m ^ = /i+ T ,+ b j+ c ,j

= i

Cj=0

j=

Las varianzas y covarianzas de bj y cj se expresan a travs de las covarianzas de las mj. Adems, los par
metros de los efectos aleatorios en otras formulaciones del modelo mixto pueden relacionarse con b y c.
El anlisis estadstico del modelo de Scheff es idntico al del modelo restringido tratado aqu, salvo por
que, en general, el estadstico MSJMS^ no siempre se distribuye como F cuando io: t = Oes verdadera.
A la luz de esta multiplicidad de modelos mixtos, una pregunta lgica es: qu modelo deber usarse?
La mayora de los especialistas en estadstica prefieren el modelo restringido, mismo que se encuentra
con mayor frecuencia en la literatura del tema. El modelo restringido es en realidad un poco ms general
que el no restringido, ya que en el primero la covarianza entre dos observaciones del mismo nivel del fac
tor aleatorio puede ser positiva o negativa, mientras que en el segundo esta covarianza slo puede ser po
sitiva. Si la estructura correlativa de los componentes aleatorios no es grande, entonces cualquiera de los
dos modelos mixtos es apropiado, y slo hay diferencias menores entre ellos. Cuando se haga referencia
ms adelante a los modelos mixtos, se supondr la estructura del modelo restringido. Sin embargo, si hay
correlaciones grandes en los datos, entonces quiz deba emplearse el modelo de Scheff. La eleccin del
modelo deber ser siempre dictada por los datos. El artculo de Hocking [56] es un resumen claro de dife
rentes modelos mixtos.
EJEMPLO 1 2 - 4 ...............................................................................................................................................
El modelo no restringido
Algunos paquetes de software de computadora tienen soporte para un solo modelo mixto. Minitab sopor
ta tanto el modelo restringido como el no restringido, aun cuando la seleccin por omisin es el modelo
no restringido. En la tabla 12-7 se muestra la salida de Minitab para el experimento del ejemplo 12-3 utili
zando el modelo no restringido. Observe que los cuadrados medios esperados concuerdan con los de la
ecuacin 12-26. Las conclusiones son idnticas a las del anlisis del modelo restringido, y las estimaciones
de los componentes de la varanza son muy similares.

o
CO

I. v
o -o
c o

r - -4-

-o ro o
- (M

lU
t- -o
10 11
3 H
D- u
v> -T- ^
t= <->+

a. o M O

'O

o t - 00

n
(SJ
u
a)
+

(Q (O

in f\j O'
U-

o o o

fl> (U ^ -i ^
E i- ro K1 ro
C V V

-J- P4
"O 00 r -

o <- O'
M ro
O
,

- O

o
L.

^o

ro

(UJ

M
(
3
o
T3
8
t

13
x>

iC
(D
/ i

IT>
>N

V -

o
o
rvi
c^
</> r \ j 1! - l A o
^
>0 o
m

lA

OO

0)

Os

' T

(N j i n

h -

O n h -

o>

Os -

O N

(D

c
o
a

K> Os
T -

Os

O
u

1^

(Q

(M

CO O
K l nO

Os
T f i-

_ l

o
E
o

> ^ -0
H

q
Oi

(0

>

' *

(Q
U

>

<u
O
4 -* 4 *<
U

(0
u

o
4n

CA

528

^4 ^

flO
c

>
U

'C

ro

Q)
4-<

OI
o

ra

0
>

f\J ! ^

V ) (N J

o .

E
fi- o

c/> m
00

(Q
>

a>
cd
N

V I - 0 0 OJ <sj

00
r

<D p /-s
a c/> ^
X 3 w

00

o h- lo

D f \ j f \J NJ

0)
*- Oi i- + +

1^

c.

0>

<0 -

H
C-

(0
Q.

a
o

(/)

>s

4-

(.

10

ra

c-

a>

4-*

o
tn

n
a .

Q .

(0

c.

a u j

O
V )

(0

<

rt

'

f i-

Qi

( - 4 -^ 0
0 - C-

(0

(Q

4)

(0
c_

4-*

u .

r j

(0 I .U
ro

12-4 DETERMINACIN DEL TAMAO DE LA MUESTRA CON EFECTOS ALEATORIOS

12-4

529

DETERM INACIN DEL T A M A O DE LA M UESTRA


C O N EFECTOS ALEATORIOS

Pueden usarse las curvas de operacin caracterstica del apndice para determinar el tamao de la mues
tra en experimentos con factores aleatorios. Se empieza con el modelo de efectos aleatorios con un solo
factor de la seccin 12-1. La probabilidad del error tipo II para el modelo de efectos aleatorios es
= 1 - /"{Rechazar
\
es falsa}
=

(12-28)

De nueva cuenta se requiere la distribucin del estadstico de prueba F q =


bajo la hip
tesis alternativa. Puede demostrarse que si es verdadera {p] > 0), la distribucin de es F central con
a - \ y N - a grados de libertad.
Puesto que la probabilidad del error tipo II del modelo de efectos aleatorios se basa en la distribucin
F central usual, podran usarse las tablas de la distribucin F del apndice para evaluar la ecuacin 12-28.
Sin embargo, es ms simple determinar la sensibilidad de la prueba mediante el uso de las curvas de ope
racin caracterstica. En la parte IV del apndice se presenta una serie de estas curvas para varios valores
de los grados de Ubertad del numerador, de los grados de libertad del denominador y de 0.05 y 0.01. En
estas curvas se grafica la probabilidad del error tipo II contra el parmetro X, donde
A = J i -h^

(12-29)

Observe que A incluye dos parmetros desconocidos, y a ] . Quiz pueda estimarse a] si se tiene una
idea acerca de cunta variabilidad de la poblacin de tratamientos es importante detectar. Puede esco
gerse una estimacin de recurriendo a la experiencia previa o discrecionalmente. En ocasiones es til
definir el valor de o] que quiere detectarse en trminos del cociente tjJ/cr^.

EJEMPLO 1 2 - 5 ...............................................................................................................................................
Suponga que se han seleccionado cinco tratamientos al azar con seis observaciones por tratamiento y que
a = 0.05, y quiere determinarse la potencia de la prueba cuando tJ es igual a <r^. Puesto que a = 5, n = 6 y
a] = a^, puede calcularse
A = 71 + 6(1") = 2.646
Por la curva de operacin caracterstica con a - \ = A ,N -a = 25 grados de libertad y a = 0.05, se encuen
tra que
/3=0.20
y por lo tanto la potencia es de aproximadamente 0.80.

Tkmbin puede usarse el incremento porcentual en la desviacin estndar de un mtodo de observa


cin para determinar el tamao de la muestra. Si los tratamientos son homogneos, entonces la desvia
cin estndar de una observacin seleccionada al azar es a. Sin embargo, si los tratamientos son
diferentes, la desviacin estndar de una observacin elegida al azar es

530

CAPTULO 12 EXPERIMENTOS CON FACTORES ALEATORIOS

Si P es el incremento porcentual fijo en la desviacin estndar de una observacin ms all del cual se de*
sea rechazar la hiptesis nula, entonces
= 1 + 0 . 0 1 P
a

- ^ = (l + Q M P f

Por lo tanto, utilizando la ecuacin 12-29, se encuentra que


A = - J l + ^ = yll+n[(l + 0 .0 1 P f - 1 ]

(12-30)

Para una/* dada pueden usarse las curvas de operacin caracterstica de la parte VI del apndice para en
contrar el tamao de la muestra deseado.
Tambin pueden usarse las curvas de operacin caracterstica para determinar el tamao de la mues
tra del modelo de efectos aleatorios con dos factores y del modelo mixto. Se utiliza la parte VI del apndi
ce para el modelo de efectos aleatorios. El parmetro A, los grados de libertad del numerador y los grados
de libertad del denominador se muestran en la mitad superior de la tabla 12-8. Para el modelo mixto de
ben usarse las partes V y VI del apndice. Los valbres apropiados de
y A se muestran en la mitad infe
rior de la tabla 12-8.
Tabla 12-8 Parmetros de las curvas de operacin caracterstica de las tablas V y VI del apndice para los modelos con dos
factores de efectos aleatorios y mixto
El modelo de efectos aleatorios
Grados de
Grados de
libertad del
libertad del
Factor
A
numerador
denominador
bnal
1+ a -1
ana\

1+

n trL

AB

H --

Factor

Parmetro

A (fijo)

b n ^ rf
-1
a[a^ + nal^]

B (aleatorio)

,= J

AB

A= ^

b -l

(a -l)( -l)

(a -l)(b -l)

ab(n - 1)

+ nal.

ana\
no\.

El modelo mixto
Grados de libertad
del numerador

Grados de libertad
del denominador

Parte del
apndice

a~\

( f l~ l) ( i- l)

h -\

ah{n - 1)

VI

(a - l)( fc - l)

abin - 1)

VI

12-5 REGLAS PARA LOS CUADRADOS MEDIOS ESPERADOS

531

12-5 REGLAS PARA LOS CUADRADOS MEDIOS ESPERADOS

Una parte importante de cualquier problema de diseo experimental es la realizacin del anlisis de varianza. Esto implica determinar la suma de cuadrados de cada componente del modelo y el nmero de
grados de libertad asociados con cada suma de cuadrados. Despus, para construir los estadsticos de prueba
apropiados, deben determinarse los cuadrados medios esperados. En situaciones de diseo complejas,
particularmente las que incluyen modelos aleatorios o mixtos, con frecuencia es til contar con un proce
dimiento formal para este proceso.
Se presentar un conjunto de reglas para anotar los cuadrados medios esperados en cualquier experi
mento factorial balanceado, anidado^ o factorial anidado. (Observe que los arreglos parcialmente balan
ceados, como los cuadrados latinos y los diseos de bloques incompletos, se excluyen explcitamente.)
Estas reglas son estudiadas por varios autores, incluyendo Scheff [98d], Bennett y Franklin [9], Comfield
y Hikey [34] y Searle [99a, b]. Mediante el examen de los cuadrados medios esperados puede desarrollar
se el estadstico apropiado para probar hiptesis acerca de cualquier parmetro del modelo. El estadsti
co de prueba es el cociente de los cuadrados medios que se elige, de tal modo que el valor esperado del
cuadrado medio del num erador difiere del valor esperado del cuadrado medio del denominador nica
mente por el componente de la varianza o el factor fijo en el que se tiene inters.
Siempre es posible determinar los cuadrados medios esperados de cualquier modelo como se hizo en
el captulo 3, es decir, mediante la aplicacin directa del operador valor esperado. Este mtodo de ierza
bruta, como suele llamrsele, puede ser muy laborioso. Las reglas que se presentan a continuacin pro
ducen siempre los cuadrados medios esperados sin recurrir al enfoque de fuerza bruta y, con la prctica,
su uso se vuelve relativamente simple. Cuando se aplican a un modelo mixto, estas reglas producen cua
drados medios esperados que son consistentes con los supuestos del modelo mixto restringido de la sec
cin 12-3. Las reglas se ilustran utilizando el modelo factorial de efectos fijos con dos factores.

Regla 1, El trmino del error del modelo, ej j, se escribe como E(j,y, donde el subndice m denota el
subndice de la rplica. Para el modelo con dos factores, esta regla implica que
se convierte en

Regla 2. Adems de una media global () y un trmino del error


el modelo contiene todos los
efectos principales y las interacciones cuya existencia supone el experimentador. Si existen todas las in
teracciones posibles entre los k factores, entonces hay (*) interacciones de dos factores, (*) interacciones
de tres factores,..., 1 interaccin de k factores. Si uno de los factores de un trmino aparece entre parnte
sis, entonces no hay interaccin entre ese factor y los dems factores de ese trmino.

Regla 3. Para cada trmino del modelo, los subndices se dividen en tres clases; a) vivos: aquellos que es
tn presentes en el trmino y no estn entre parntesis; b) muertos: aquellos que estn presentes en el tr
mino y estn entre parntesis; y c) ausentes: aquellos subndices que estn presentes en el modelo pero no
en ese trmino particular.
Por lo tanto, en (r0)j, i y j son subndices vivos y A: es un subndice ausente, y en
k es un subndice
vivo, mientras que i y j son subndices muertos.
^ Los diseos anidados se estudian en el captulo 13.

532

CAPTULO 12 EXPERIMENTOS CON FACTORES ALEATORIOS

Regla 4. Grados de libertad. El nmero de grados de libertad de cualquier trmino del modelo es el pro
ducto del nmero de niveles asociados con cada subndice muerto y el nmero de niveles asociados con
cada subndice vivo menos 1.
Por ejemplo, el nmero de grados de libertad asociados con
es (a - l)(ft - 1 ), y el nmero de gra
dos de libertad asociados con
es ab{n - 1).
Regla 5. Cada trmino del modelo tiene asociado con l un componente de la varianza (efecto aleato
rio) o bien un factor fijo (efecto fijo). S una interaccin contiene al menos un efecto aleatorio, la interac
cin completa se considera aleatoria. Un componente de la varianza tiene letras griegas como subndices
para identificar el efecto aleatorio particular. Por lo tanto, en un modelo mixto de dos factores con el fac
t o r ^ fijo y el factor B aleatorio, el componente de la varianza de 5 es ct ^, y el componente de la varianza
tA B es
. Un efecto fijo se representa siempre por la suma de cuadrados de los componentes del mo
delo asociados con ese factor dividida por sus grados de libertad. En el ejemplo tratado aqu, el efecto de
A es
a

a - 1

Regla 6. Cuadrados medios esperados. Para obtener los cuadrados medios esperados, se elabora la tabla
siguiente. Hay un rengln para cada componente (cuadrado medio) del modelo y una columna para cada
subndice. Arriba de cada subndice se escribe el nmero de niveles del factor asociados con ese subndice
y si el factor es fijo (F) o aleatorio (R). Las rplicas siempre se consideran aleatorias.
a) En cada rengln se escribe 1 si uno de los subndices muertos en el componente del rengln coin
cide con el subndice de la columna:

Factor

F
a
i

F
b
i

R
n
k

Pj

b) En cada rengln, si cualquiera de los subndices del componente del mismo coincide con el sub
ndice de la columna, se escribe Osi el encabezado de la columna es un factor fijo y 1 si es un fac
tor aleatorio:

F
a
i
0

Factor
Pj
(ii)k

0
1

F
b
j

R
n
k

0
0
1

12-5 REGLAS PARA LOS CUADRADOS MEDIOS ESPERADOS

533

c) En las posiciones del rengln que quedan vacas se escribe el nmero de niveles que aparecen in
dicados arriba del encabezado de la columna:

Factor
r,
P

F
a
i
O
a

F
b
j
b
Q

R
n
k
n
n

(T/S),y

t m . . . . ___________l ___

d) Para obtener los cuadrados medios esperados de cualquier componente del modelo, primero se
cubren todas las columnas cuyos encabezados sean subndices vivos de ese componente. Des
pus, en cada rengln que contiene al menos los mismos subndices que los del componente bajo
consideracin, se toma el producto de los nmeros visibles y se multiplica por el factor fijo o alea
torio apropiado de la regla 1, La suma de estas cantidades es el cuadrado medio esperado del
componente del modelo bajo consideracin. Por ejemplo, para encontrar
se cubre la co
lumna i. El producto de los nmeros visibles en los renglones que contienen al menos el subndi
ce i son bn (rengln 1), O(rengln 3) y 1 (rengln 4). Observe que i no est presente en el rengln
2. Por lo tanto, el cuadrado medio esperado es

En la tabla 12-9 se presenta la tabla completa de los cuadrados medios esperados para este diseo. En
las tablas 12-10 y 12-11 se muestran las derivaciones de los cuadrados medios esperados para los modelos
con dos factores, aleatorio y mixto, respectivamente. Observe que se ha supuesto la versin restringida
del modelo mixto para producir los cuadrados medios esperados. En el ejemplo siguiente se considera un
diseo factorial con tres factores.
EJEMPLO 1 2 - 6 ......................................................................................................................... .....................
Considere un experimento factorial de tres factores con a niveles del factor^, b niveles del factor B, c ni
veles del factor C y n rplicas. El anlisis de este diseo, suponiendo que todos los factores son de efectos

Tabla 12-9 Derivacin de los cuadrados medios esperados, modelo de


efectos fijos con dos factores
F
F
R
a
b
n
Cuadrado
Factor
i
k
medio esperado
j
0

a^ + ------^
a 1

ia -)(b -l)
(T

534

CAPTULO 12 EXPERIMENTOS CON FACTORES ALEATORIOS

Tabla 12-10 Derivacin de los cuadrados medios esperados, modelo de


efectos aleatorios con dos factores
R
R
R
Cuadrado
b
n
a
medio esperado
k
i
Factor
i
b
n
+ na% + bnal
1
h
n
+ nal^ + ana^p
1
a
n
+ no%
1
1
1
1
1

Tabla 12-11 Derivacin de los cuadrados medios esperados, modelo


mixto con dos factores
R
F
R
n
Cuadrado
a
b
k
medio esperado
i
Factor
J
h

a
0
1

1
1
1

n
n
1

Tabla 12-12 Derivacin de los cuadrados medios esperados, modelo de


efectos aleatorios con tres factores
R
R
R
R
n
b
c
a
l
k
Factor
i
i
n
b
c
T1
n
c
a
1
p
1
n
a
b
Yk
n
1
c
1
n
b
1
1
(tY)k
1
n
a
1
1
n
1
1
1
1
1
1
e]ki

a -l
+ ana\

Cuadrado
medio esperado
+ cna]f, + bnal^ + n a \ + bcnal
+ cna^p + ana^^ +
+ ac<7^
+ bna^ + ana^^ + na]^ + abna^^
a^ + na]^ + cna]f
^
a^-Vna\^-Vana\
a^ + na^^

12-6 PRUEBAS FAPROXIMADAS

535

fijos, se presenta en la seccin 5-4. Ahora se determinan los cuadrados medios esperados suponiendo que
todos los factores son aleatorios. El modelo estadstico apropiado es
m

Utilizando las reglas descritas antes, en la tabla 12-12 se derivan los cuadrados medios esperados.
Se observa, al examinar los cuadrados medios esperados de la tabla 12-12, que siv4, B y C son factores
aleatorios, entonces no existe ninguna prueba exacta para los efectos principales. Es decir, si se quiere
probar la hiptesis a \ = O, no es posible formar un cociente de dos cuadrados medios esperados tal que el
nico trmino del numerador que no est en el denominador sea bcna] . El mismo fenmeno ocurre para
los efectos principales de 5 y C. Observe que efectivamente existen las pruebas apropiadas para las in
teracciones de dos y tres factores. Sin embargo, es posible que las pruebas de los efectos principales sean
de importancia bsica para el experimentador. Por lo tanto, cmo debern probarse los efectos principa
les? Este problema se considera en la siguiente seccin.

12-6

PRUEBAS F APRO XIM AD AS

Es frecuente que en experimentos factoriales con tres o ms factores incluidos en un modelo aleatorio o
mixto, as como en otros diseos ms complejos, no exista un estadstico de prueba exacto para ciertos
efectos de los modelos. Una posible solucin a este dilema es suponer que ciertas interacciones son insig
nificantes. Para ilustrar, si fuera razonable suponer que todas las interacciones de dos factores del ejem
plo 12-6 son insignificantes, entonces podra hacerse
= O, y sera posible conducir
pruebas de los efectos principales.
Aun cuando parece tratarse de una posibilidad atractiva, es necesario sealar que debe haber algo en
la naturaleza del proceso o algn conocimiento previo slido que permita suponer que una o ms de
las interacciones son insignificantes. En general, no es sencillo establecer este supuesto, y tampoco debe
r hacerse a la ligera. No debern eliminarse ciertas interacciones del modelo sin evidencia concluyente
de que es apropiado hacerlo. Un procedimiento defendido por algunos experimentadores es probar pri
mero las interacciones, despus fijar en cero aquellas interacciones que se hayan encontrado no significa
tivas, para despus suponer que estas interacciones son cero cuando se prueben otros efectos en el mismo
experimento. Aun cuando en ocasiones se aplica en la prctica, este procedimiento puede ser riesgoso, ya
que cualquier decisin respecto a una interaccin est sujeta tanto al error tipo I como al error tipo II.
Una variante de esta idea es agrupar ciertos cuadrados medios en el anlisis de varianza para obtener
una estimacin del error con ms grados de libertad. Por ejemplo, suponga que en el ejemplo 12-6 no fue
significativo el estadstico de prueba Fq = M S ^J M S e. Por lo tanto,
= O no se rechaza, y tanto
como MSe estiman la varianza del error o^. El experimentador podra considerar la agrupacin o
combinacin de MS^c y
de acuerdo con
_ abc( n- l ) MS^ + ( a -l)( - l) (c - l) M 5 ^ ^ ^
abc{n~l)+(a~l)(b-l)(c-l)
de tal modo que E(MSe') = o^. Observe que
tiene abc(n 1) -I- (a - l)(b - l)(c - 1 ) grados de libertad,
en comparacin con los abc(n - 1) grados de libertad del MS e original.
El riesgo de agrupar es que puede incurrirse en un error tipo II y combinar con el error el cuadrado
medio de un factor que en realidad es significativo, obtenindose as un nuevo cuadrado medio residual

536

CAPTULO 12 EXPERIMENTOS CON FACTORES ALEATORIOS

(MSe ) que es muy grande. Esto har que sea ms difcil detectar otros efectos significativos. Por otra par
te, si el cuadrado medio del error original tiene un nmero muy pequeo de grados de libertad (por ejem
plo, menos de seis), el experimentador quiz tenga mucho que ganar al hacer la agrupacin, ya que podra
conseguirse as un incremento potencialmente considerable de la precisin de pruebas posteriores. Un
procedimiento razonablemente prctico es el siguiente. Si el cuadrado medio del error original tiene seis
o ms grados de libertad, no hacer la agrupacin. Si el cuadrado medio del error original tiene menos de
seis grados de libertad, hacer la agrupacin slo si el estadstico F del cuadrado medio que se agrupar no
es significativo para un valor grande de a, tal como a = 0.25.
Cuando no es posible suponer que ciertas interacciones son insignificantes y sigue siendo necesario
hacer inferencias acerca de los efectos para los que no existen pruebas exactas, puede emplearse un pro
cedimiento atribuido a Satterthwaite [97]. El mtodo de Satterthwaite utiliza combinaciones lineales de
cuadrados medios, por ejemplo,
MS' = MS^ + +MS^

(12-31)

MS =MS^ + ---+ MS^

(12-32)

y
donde los cuadrados medios de las ecuaciones 12-31 y 12-32 se seleccionan de tal modo que E(MS') E{MS") sea igual a un mltiplo del efecto (el parmetro del modelo o el componente de la varianza) con
siderado en la hiptesis nula. Entonces el estadstico de prueba sera

que se distribuye aproximadamente como Fp^

donde

(M .. + - + M

5 . ) - ......

F np y
es el nmero de grados de libertad asociados con el cuadrado medio MS. No existe la seguridad
de que p y q sean enteros, por lo que puede ser necesario hacer una interpolacin en las tablas de la distrib u c i n f. Por ejemplo, en el modelo de efectos aleatorios con tres factores (tabla 12-12), es relativamente
sencillo ver que un estadstico de prueba apropiado para
= O sera F = MS'jMS", con
M S'= M S ^ + M S ^ c

Los grados de libertad de F se calcularan con las ecuaciones 12-34 y 12-35,


La teora subyacente de esta prueba es que tanto el numerador como el denominador del estadstico
de prueba (ecuacin 12-33) se distribuyen aproximadamente como mltiplos de variables aleatorias

12-6 PRUEBAS F APROXIMADAS

537

ji-cuadrada, y puesto que no aparece ningn cuadrado medio en el numerador o el denominador de la


ecuacin 12-33, el numerador y el denominador son independientes. Por lo tanto, en la ecuacin 12-33, F
se distribuye aproximadamente como
Satterthwaite hace hincapi en que deber prestarse atencin
al aplicar el procedimiento cuando algunos de los cuadrados medios de M S y MS" aparezcan con signos
negativos. Gaylor y Hopper [48] reportan que si M S' =
-M S^, entonces la aproximacin de Sattert
hwaite tiene una validez razonable si
MS,

y s i/i <

100

y /a

> /i/2 .

EJEMPLO 1 2 - 7 ...............................................................................................................................................
Se estudia la cada de la presin medida en una vlvula de expansin de una turbina. El ingeniero de dise
o considera que las variables importantes que influyen en las lecturas de la cada de la presin son la
temperatura del gas en la admisin (A), el operador (B) y el manmetro especfico que utiliza el operador
(C). Estos tres factores se incluyen en un diseo factorial, con la temperatura del gas fya y el operador y el
manmetro aleatorios. En la tabla 12-13 se muestran los datos codificados de dos rplicas. El modelo hneal de este diseo es
y^jj, =

+yk

+ (ty )^ H M j ,

+ ijk

donde t es el efecto de la temperatura del gas


es el efecto del operador (5) y y*, es el efecto del ma
nmetro (C).
El anUsis de varianza se muestra en la tabla 12-14. Se ha agregado la columna titulada Cuadrados
medios esperados a esta tabla, y las entradas de esta columna se derivan por los mtodos estudiados en la
seccin 12-5. Por la columna Cuadrados medios esperados, se observa que existen pruebas exactas para
todos los efectos esperados salvo el efecto principaM , En la tabla 12-14 se muestran los resultados de es
tas pruebas. Para probar el efecto de la temperatura del gas, o H(:r = O, podra usarse el estadstico
F=

M S'
MS"

Tabla 12-13 Datos codificados de la cada de la presin para el experimento de la turbina


Tfemperatura del gas {A)
60T
75F
Operador
(B)
Operador
{B)
Manmetro
(Q
1
2
3
4
1
2
3
4
1
-2
0
-1
4
14
6
1
-7
-3
-9
-8
4
14
0
2
6
2
-6
-5
-8 -3
22
8
6
-5
4
-1
-2 -7
24
6
2
2
3
-1
-4
0 -2
20
2
3
-5
-2
-8
-7
4
16
0
0
-1

90F
Operador (B)
1
2
3
4
-8
-2
-1
-2
-8
20
-2
1
-8
1
-9
-8
3
-7
-8
3
-2
-1
-A
1
-1
-2
-1
3

ro
o

o
^

O
CTs o
o o
V

o
o

O r1-H ^
o
o

ON ON en
^
c< rH

Tf

o^
ro

W-)
vo
o

f - f e '
+
+
+
+
"to "to "b %

+
+
"to "tt ^

C ^ S ^ t J - sO C ^ ' sO
1I

'O

r ^ O \r --o > r --i-< o r ^

es
o
i-H

C O f*^ T -H r^ O N V 0 0
CN
T-i
tn

c^

H
3 c3
>

538

t-H

I
I'

CQ
O
a
2
o.
O

u
o"
i-i

E
"2
U
'3

S ^ X ^ ^ c e2

12-6 PRUEBASE APROXIMADAS

539

donde
MS' =MS^

M S " = MS ^ + MS ^ c

ya que
bcnZt]
E( MS' ) - E{ MS") = y Para determinar el estadstico de prueba para H q:t = O, se calculan
MS' =MS ^ + M 5^ c
= 511.68+13.84 = 525.52
M S " = M S ^ + M S ^ c

= 202.00 + 34.47 = 236.47

MS"

236.47

Los grados de libertad de este estadstico se encuentran con las ecuaciones 12-34 y 12-35 de la siguiente
manera:
^

M 5 ^ /2 + M 5 ^ /1 2

(525.52)"_______
(511.68)V 2+(13.84)"/12

= = 2 .1 1 = 2

y
M S \ j 6 + M S \ r ! ^

(236.47)"
= 7.88=^8
(2 0 2 .00)"/6+ (34.47)"/4
Al comparar F = 2.22 con Fo qs, 2,s = 4.46, no puede rechazarse //q. El valor F aproximado es P = 0.17.
La interaccin AB, o temperatura-operador, es grande, y hay ciertos indicios de una interaccinvlC o
temperatura-manmetro. El anlisis grfico de las interaccionesAB yAC, ilustrado en la figura 12-2, indi
ca que el efecto de la tem peratura puede ser grande cuando se usan el operador 1 y el manmetro 3. Por lo
tanto, parece posible que los efectos principales de la tem peratura y el operador estn enmascarados por
la interaccin AB grande.

En la tabla 12-15 se presenta la salida de la rutina Balanced ANOVA (anlisis de varianza balancea
do) de Minitab para el experimento del ejemplo 12-7. Se ha especificado el modelo restringido. Q[l] re
presenta el efecto fijo de la presin del gas. Observe que las entradas de la tabla del anlisis de varianza

540

CAPITULO 12 EXPERIMENTOS CON FACTORES ALEATORIOS

100
75

" 50
ss
<
(/] 25
JS
0)

$ o
1^
-2 5
C=3
-5 0

60

75

90

Figura 12-2 Interacciones en el experimento de la cada de la presin.

concuerdan en general con las de la tabla 12-14, salvo por la p ru e b a f de la temperatura del gas (factorv4).
Minitab indica que la prueba no es exacta (lo que se ve por los cuadrados medios esperados). La Prueba
Sintetizada construida por Minitab es en realidad el procedimiento de Satterthwaite, pero usa un estads
tico de prueba diferente del que se utiliz aqu. Observe que, por la salida de Minitab, el cuadrado medio
del error para probar el factor A es
(4 )+ (5 )-7 = M S ^ + M S ^, - M S ,,,
cuyo valor esperado es
+ na\

[(4)-H (5)-(7)]=
+ b n a l ~ { o ^ + n o t/sy
\ . ),

+cnol +bnat
que es un cuadrado medio del error apropiado para probar el efecto promedio de A . Esto es una muy bue
na ilustracin de que puede haber ms de una manera de construir los cuadrados medios sintticos usa
dos en el procedimiento de Satterthwaite. Sin embargo, se preferira en general la combinacin lineal de
los cuadrados medios que se seleccionaron, en lugar de la que eligi Minitab, ya que no incluye ningn
cuadrado medio con signo negativo en las combinaciones lineales.
El anlisis del ejemplo 12-7, suponiendo el modelo no restringido, se presenta en la tabla 12-16.
La diferencia principal con el modelo restringido es que ahora los valores esperados de los cuadrados me
dios de los tres efectos principales son tales que no existe ninguna prueba exacta. En el modelo restringido,
los dos efectos aleatorios promedio podran probarse contra su interaccin, pero ahora el cuadrado me
dio esperado de B incluye a
y a ct , y el cuadrado medio esperado de C incluye a a y a <7^ . De nueva
cuenta, Minitab construye cuadrados medios sintticos y prueba estos efectos con el procedimiento de
Satterthwaite. Las conclusiones generales no son radicalmente diferentes del anlisis del modelo restrin
gido, adems del cambio grande en la estimacin del componente de la varianza del operador. El modelo
no restringido produce una estimacin negativa de . Puesto que el factor manmetro no es significativo
en ninguno de los dos anhsis, es posible que sea pertinente alguna reduccin del modelo.

E
(-

T -

i-J

-C

o r
^

O J

(0
U i

to

E
u

%o O

00

o o - o o - rw

4-

o o o o o o o

0)
<(Q

u -o m o o o ^ ro iA

Ki o T-

'O

'

V -*

O
L.

4 ) sO
-O
O
S

U J

+
/-s

>0

r o

0"D m
V>

(M -j- o

fM '

H -

' H m

0) w

QO

-> 0 0

< -

t\J

'O

M lA

c o

c u
n
Q>

4- '

(O

o> ^

c-

trth -'o ^ h -r^ 'o r^


* ttj

< y > 0 0 r ^ 0 0 h - ^ ^ 0

T-T-rorvj'j*'4*ro<^
o ro m - rsj
lA -

CO

O O l-f'f-f-f'f-t-' 0 C

</> O
E 'O

<NJ

o ro ro

< A O O O O O O O O O O O O O O O O

Lll 3

O s

W 'I^

S-#

c. rvj
o

/1 ' O fM
trt
r\j

O J

r -

r O

r\j

o d

*<4 ^

fV j

r o

^ - r ^ O

4 O
'O

( .

r o

s ^ O

U i

4^
4-

Q s

01

o n

o
u

f V J T

h -

Ow

t .

ro

O J

fN J ' O

(0

fN J ' O

K )

O
* f-

>

4)
U

Of

o;

9 )

_ f

(0

3
3 -

) - o
Q . 0)
X

1-

co

T3

"C

(0
>

(0

(0
u

O
(0
ll.

0)

fi-

0>

o
4-*

Q ,

(0

Q .

4>

01

c .

Q )

(A

0>

to

4A

CO

o .

(0

<D

<0

<x

U
C. K -

< /> ( 9

9f
Q .
O

O
0>

O
' c

O
(U ic

C J)h -

c .

h -

0^

<0

(D

(D

(0

Q .

(0

<9

C9

19

U>

o
_

(Q
4^

fS i

s .

t
o>
4 <*

(0

19

4 -

c
X

(0

40

1,

O
4^

3
(0

ra
c-

4) 19
O *

f i-

1/ )

(A

6
c_

fi-

0)

<D

O .

19

'M

1
0>
o

<A

4-*
O

c_

19

(0

O
4

41
a
o

W
3
CD
19

K
(0
(0
19

>
CO

0>

CO

t-

O
c .

4->

0)

U)

&

19

O
4-

-O

Q .

(D
fi.

H*

(D
L.

4 -

4>

0
4^

h M
(0

( .

19

U I

- O

c
X

41

4
U

(-

- C V

if O

- ^ lA

tm
K

(0
<g
(9

i/ i

cU J

01

o ;

h -

O
U J

-O

0 !(

c
CO
c .

r o
1

li.

1
ik

<Q

)
4>
l

o
o

4 >
4 -

CJ

(D
c-

(0

r o

f\j

4
o )->

V)

f\j

/>

C-

<0
t-

X
__^

f -

4 >
O )

D )

K*

o
4J

'

o
4J

c .

f -

4->

H -

(_
>
U
'T 3

LA
lA 6 0 O
p o i r i N i

<Q
'C

>

h -

r g
O
r o

o
u -

V) r o

U J

4^

m
0)
(J

c .

s ^ r ^ r s - o o e o

0)

8
T J
c
a;
u

-*c

a .

<a
>

CNJ

U OJ

h - o h- '

K > 0 0 - Q s OO

K
(/)
3

'4 -

> s'-'

01 C .< \ | '0 '* 0 < V J I \ J '0 < N


4-

U J

O T c />

541

E
IL
0)
H-

X X X

T - sO
o

h>

L. <
0 Q> ^
M- * 0 'H-'
0 ^
0 E
+
5 "O
J 0) ^
O"
lA
C/) <-)
.1- OO
C C<p 4- +
<U V)

u-OKlsOOO'Nil/^
K1 ^ O lA
lA ^
rM O O ^ fNj cNi O

'H.
B

<A
c

fr*
v i lA
w \-i'
nO OO

o
tL

^
o ^

nO

'O 'O OO sO

- +

^ ^
(A

^
O

hw ' w '
1

(A LA 'O s o
r- 1^
</)
+ + +
JZ

- h-

co o o h -o o r^ T -'4-o
E'O fM ^O stO ^O O '.^

I
i

M K>
V
l u OO '4 '
O
fSI

(0
UJ

--^0000^-00
h - ^ ro o Os 00 oo

c '4*

"O c ^

0^ 3 r\j <NJ fsj CM fM <M CM

lA
S-' ^

V)

t-t-rofM -4-^ rO io

T-

lA -

CM

u O) !- + + + + + +
V c
^
,1- ^
X M OO 00 DO co 00 OO 00 00
UJ D W
'w'
L.
o E
h - 00
C. i . * -t h-

K i PO - (M

ro lO

Ov

nj

<oso<M ot^a^r^-O f\j


C/>K>OO^OHOO^r-iAK>

13

e
"i

m t 4
ro ro N O O O O
00 M
n o ^ h - lA
f\J
CVJ r* 1^ Os
o <4^
K>

lA f\J fNJ
f^

<A
0) O
3 >0
_i
(0
>

-s
3
T3

a
o
L.
A

<rt rn '4- ro
0)
>

c
cd
>
(i>
o
.2
-2

'O
r^
-H
J3

542

u . rvi ro CM
a

Q) T3
a 0)
>s X
1 - !*-

e
o
T3
C
0
u

E
O
T5
C
(Q
L.

(Q
>
*<O
.
O

tA

i
L.
O
+J
O
<0
U_

1M
<0
(ry

O
+-
<0
u
a
o.
o

</)
0)
D)
3
(0
D

(Q
C
<

0)
o

<Q
1(/) 4>
O (0 O.
</> O O

0)
D)
3
(0
(i>
V
U
en tO
3 O
4->
<0 4^
CD o; C9 CO
^' O4 C.
0> 3 t - 0>
Q. (0 O a
O iS 4-I o
0) 4c K <Q * L.
0 ) 1 - - C. 1 - O (0
3 (/> v> 01 V)
<0 n (9 a (D
O
(D (J) O o U9 UJ K

I- o j ro in
o r^j o j lA
c- fNj rvi
t.

t_ Q>
Ui 4i^

r\j so r rn h -

O
HOf
U
c
(0

-J

st ^

<0 fO ^ '4E ^ o lA

UJ
^ Nt Ov Os f\J o K>
s t sO lA h 00 O
lA t - ro lA lA
m
ro fO
'4- <M r
1 rsj
1 1 ho

V
<J c
c 0)
(0 c
o
Q.
(D 6
> O
u

V
4>>
1
U.
+J
O
<Q
X
4)

4^
O
X

0)
o
_
3
O
(/)

o
4)
M

h - o OO
O Os o Os
a
c. sO S - lA
O
UJ

9>
O)
3
re
u>

e_
O
V
re

C
(0

(/)
4^
U)
0)
i-

1(/>
(0
<J

3
(0
tj

41
CQ)
O
3
4->
(0
re 0)
U i*
0) 3
1
a re O a
o Cd M O
u
4c 4c (0
1- O
t) CO 0)
re re & re
o U) O U ) liJ

M ro

lA so 1^ 00

O
V
re
u
0
a
o

to
0>

4->
(/)

4-
C
X
v>

h-

L.
O

O
0>
N
OT
0>
4-<
C
>s
<o

(/)
e
4)
1O
u
u
J

0
4^
re 4>
1O)
4 V) d) 3
U re O. re
u
o U7
3
O
fNJ ro
O

12'7 ALGUNOS TEMAS ADICIONALES SOBRE LA ESTIMACIN DE LOS COMPONENTES DE LA VARIANZA

12-7

543

ALG U NO S TEM AS ADICIONALES SOBRE LA ESTIM ACIN DE LOS


COM PONENTES DE LA V A R IA N ZA

Como se seal anteriormente, la estimacin de los componentes de la varianza en un modelo aleatorio o


mixto reviste con frecuencia considerable importancia para el experimentador. En esta seccin se presen
tan algunos resultados y tcnicas adicionales que son tiles para estimar los componentes de la varianza.
La atencin se centra en los procedimientos para encontrar intervalos de confianza para los componentes
de la varianza, y se ilustra asimismo cmo encontrar estimaciones de mxima verosimilitud de los compo
nentes de la varianza. El mtodo de mxima verosimilitud puede ser una alternativa til cuando el mto
do del anlisis de varianza produce estimaciones negativas.

12-7.1

Intervalos de confianza aproximados para los componentes de la varianza

Cuando se introdujo el modelo de efectos aleatorios en la seccin 12-1, se presentaron intervalos de con
fianza exactos de 100(1 - a ) por ciento para y para otras funciones de los componentes de la varianza en
ese diseo experimental simple. Siempre es posible encontrar un intervalo de confianza exacto para cual
quier funcin de los componentes de la varianza que es el valor esperado de uno de los cuadrados medios
del anlisis de varianza. Por ejemplo, considere el cuadrado medio del error. Puesto que E(MS e) =
siempre es posible encontrar un intervalo de confianza exacto para
ya que la cantidad

tiene una distribucin ji-cuadrada con/^ grados de libertad. El intervalo de confianza exacto de 100(1 - a )
por ciento es
LM S^

f^M S^

- < a" < \


Xall,fe

(12-36)

Desafortunadamente, en experimentos ms complejos en los que intervienen varios factores del dise
o no es posible por lo general encontrar intervalos de confianza exactos para los componentes de la va
rianza de inters, ya que estas varianzas no son el valor esperado de un solo cuadrado medio del anlisis
de varianza. Sin embargo, los conceptos fundamentales de las pseudo pruebas F aproximadas de Satterthwaite, introducidos en la seccin 12-6, pueden emplearse para construir intervalos de confianza
aproximados de los componentes de la varianza para los que no se cuenta con ningn intervalo de con
fianza exacto.
Recuerde que el mtodo de Satterthwaite utiliza dos combinaciones lineales de cuadrados medios
M S '= M S ,+ - + M S ,

M S"= M S^ + --+ M S ^
con el estadstico de prueba
MS"
que tiene una distribucin F aproximada. Al utilizar los grados de libertad apropiados paraA5' yMS", de
finidos en las ecuaciones 12-34 y 12-35, este estadstico F puede usarse en una prueba de significacin
aproximada del parmetro o del componente de la varianza de inters.

544

CAPTULO 12 EXPERIMENTOS CON FACTORES ALEATORIOS

Para probar la significacin de un componente de la varianza, por ejemplo a j , las dos combinaciones
lineales, M S' y MS", se eligen de tal modo que la diferencia en sus valores esperados sea igual a un mlti
plo del componente, por ejemplo
E (M S ')-E {M S ")= ka l
E {M S')~ E{M S")

(12-37)

La ecuacin 12-37 proporciona una base para una estimacin puntual de


M S '- M S "
(12-38)

= A S , + . . + M S , - A / S . -

Los cuadrados medios {MS) de la ecuacin 12-38 son independientes, donde \a&fJ!vISJa] = SSJa] tienen
distribuciones ji-cuadrada con/j grados de libertad. La estimacin del componente de la varianza, , es
una combinacin lineal de mltiplos de los cuadrados medios, y r d lla l sigue una distribucin ji-cuadrada
aproximada con r grados de libertad, donde
1
1=1
{ M S ^ + - + M S ^ - M S ^ -------------M S ^ Y
~

, MS^

^ M S I

fs

(12-39)

, M S I

fu

Este resultado slo puede usarse si d i > 0 . Como r no ser un entero en la mayora de los casos, por lo ge
neral ser necesario hacer una interpolacin de las tablas ji-cuadrada. Graybill [50] establece un resulta
do general para r.
Ahora bien, puesto que rd /o^ tiene una distribucin ji-cuadrada aproximada con r grados de libertad.
- 1 - a
07.

X a l 2 ,r

O^

= l-
A l- n /2 ,r

Por lo tanto, un intervalo de confianza aproximado de 100(1 - a) por ciento para cTq es
O^
X a t l, r

(12-40)
A l-a /2 ,r

EJEMPLO 1 2 - 8 ...............................................................................................................................................
Para ilustrar este procedimiento, considere nuevamente el experimento del ejemplo 12-7, donde se us
un modelo mixto con tres factores en un estudio de la cada de la presin en una vlvula de expansin de
una turbina. El modelo es
yuM =

+P + v ,

+(^)fc + ( ^ ) j k

1Z-7 ALGUNOS TEMAS ADICIONALES SOBRE LA ESTIMACIN DE LOS COMPONENTES DE LA VARIAN2A

545

donde x es un efecto fijo y todos los dems efectos son aleatorios. Se encontrar un intervalo de confianza
aproximado para a]^.M utilizar los cuadrados medios esperados de la tabla 12-14, se observa que la dife
rencia en los valores esperados de los cuadrados medios para el efecto de la interaccin de dos factores
A B y el efecto de interaccin de tres factores A B C es un mltiplo del componente de la varianza de
inters, al^.
)

+cno] ^

,2

Por lo tanto, la estimacin puntual de

es
^ 134.91 -19.26 _
(3)(2)

y
^

(134.91-19.26)^
( -l)(ft-l)

(a -l)( -l)(c -l)

El intervalo de confianza aproximado de 95% para


siguiente manera:
2

^ 0 .0 2 5 ,r

(134.91)^
(2)(3)

(19.26)^
(2)(3)(2)

se encuentra entonces con la ecuacin 12-40 de la

2
^ 0 .9 7 5 ,r

(4.36)(19.28) ^
11.58
7,26

^ (4.36)(19.28)

0.61
<137.81

Este resultado es consistente con los resultados de la prueba f exacta para


da de que este componente de la varianza es diferente de cero.

12'7.2

, en que hay evidencia sli

Mtodo de grandes muestras modificado

El mtodo de Satterthwaite de la seccin anterior es una forma relativamente simple de encontrar un in


tervalo de confianza aproximado para un componente de la varianza que puede expresarse como una
combinacin lineal de cuadrados medios, por ejemplo
Q

(12-41)
/=!

El mtodo de Satterthwaite funciona bien cuando los grados de libertad de cada cuadrado medio M5, son
relativamente grandes, y cuando todas las constantes c, de la ecuacin 12-41 son positivas. Sin embargo,
en ocasiones algunas de las c, son negativas. Graybill y Wang [51] propusieron un procedimiento llamado
mtodo de grandes m uestras modificado, que puede ser una alternativa muy til del mtodo de Sattert
hwaite. Si todas las constantes c, de la ecuacin 12-41 son positivas, entonces el intervalo de confianza mo
dificado de 100(1 - ) por ciento de una muestra grande para a l es
&1- - 2

1=1

G f c f MS f a < &l + 1 1 ; H f c f M S f
Vi=i

(12-42)

546

cAPfruLO

12

e x p e r im e n to s c o n f a c t o r e s a l e a t o r i o s

donde
y

Observe que una variable aleatoria F con un nmero infinito de grados de libertad en el denominador es
equivalente a una variable aleatoria ji-cuadrada dividida por sus grados de libertad.
Considere ahora el caso ms general de la ecuacin 12-41, donde las constantes c, no tienen restric
ciones sobre el signo. Esto puede escribirse como
= X c^MS, - 2

cMS,

c Cj > O

(12-43)

j= P + l

=1

Ting, etal [110], dan un intervalo de confianza inferior aproximado de 100(1 - a ) por ciento paratr^ como
(12-44)
donde
P

GfcfMSf+

F ,= X

p-1

i= l

j= P + l

i= l

SE

H c ^ M S j + 2

G ic,c,M S,M S,

y=p+ i

= i -

^ a, f i.f i

G* = l

s iF > l

(/> -l).

'
y

/,

G^ = 0

si P = \

fi

Estos resultados tambin pueden extenderse para incluir intervalos de confianza aproximados para
cocientes de componentes de la varianza. Para una relacin completa de estos mtodos, referirse al exce
lente libro de Burdick y Graybill [22].

HJEMPLO 1 2 - 9 ...............................................................................................................................................
Para ilustrar el mtodo de grandes muestras modificado, considere nuevamente el modelo mixto con tres
factores del ejemplo 12-7. Se encontrar un intervalo de confianza inferior aproximado de 95% para
.
Recuerde que la estimacin puntual de
es
ABC

en

134.91-19.26
( 3 )(2 )

= 1 9 .2 8

12-7 ALGUNOS TEMAS ADICIONALES SOBRE LA ESTIMACIN DE LOS COMPONENTES DE LA VARIANZA

547

Por lo tanto, en la notacin de la ecuacin 12-43, c, = Cj = V^, y


G, = l - ; ^

- l - i =

. 5

^ 0 .0 5 ,6 ,

____ 1 = ^
0.43

'^ 0 .9 5 ,1 2 ,

^
iF o .o ,.6 .n -y -(G ,y F lo ,,s .n -(2 r
G
= -----------------------------------------
P

^ 0 .0 5 ,6 ,1 2

(aO O -1)^-(0.524)^(100)^-(1.3)^ _
3.00
Gi, = 0

Por la ecuacin 12-44


^ 1

^1

^ 2

^2

^^A B C

"* ^ 1 2 ^ 1 ^ 2

AB

ABC

= (0.524)' (1 / 6 )' (134.91)' +(1.3)' (1 / 6 )' (19.26)'


+ (-0.054)(l / 6)(1 / 6)(134.91)(19.26)
= 152.36
As, un lmite de confianza inferior aproximado de 95% para a]^ es
= 19.28- V5236 = 6.94
Este resultado es consistente con los resultados de la prueba F exacta para este efecto.

12-7.3

Estimacin de mxima verosimilitud de componentes de la varanza

En este captulo se ha subrayado el mtodo del anlisis de varianza para estimar los componentes de la
varianza debido a que es relativamente directo y hace uso de cantidades familiares: los cuadrados medios
de la tabla del anlisis de varianza. Sin embargo, el mtodo tiene ciertas desventajas, incluyendo la moles
ta tendencia a producir en ocasiones estimaciones negativas. Adems, el mtodo del anlisis de varianza
es en realidad un mtodo de estimador de momentos, una tcnica que los especialistas en estadstica ma
temtica prefieren en general no usar para estimar parmetros, debido a que resulta con frecuencia en es
timaciones de parmetros que no tienen buenas propiedades estadsticas. A la tcnica de estimacin de
parmetros preferida se le llama mtodo de mxima yerosimilitud. La implementacin de este mtodo
puede ser un tanto complicada, en particular para el modelo de un diseo experimental, pero en cierto
sentido el mtodo de mxima verosimilitud selecciona estimaciones de los parmetros que, para un mo
delo y una distribucin del error especificados, maximiza la probabilidad de ocurrencia de los resultados
mustrales. Una descripcin general muy adecuada del mtodo de mxima verosimilitud aplicado a mo
delos de diseos experimentales se ofrece en Milliken y Johnson [79].
La revisin completa del mtodo de mxima verosimilitud sale del alcance de este libro, pero la idea
general puede ilustrarse con suma facilidad. Soponga que x es una variable aleatoria con una distribucin

548

CAPITULO 12 EXPERIMENTOS CON FACTORES ALEATORIOS

de probabilidad/(jc; 6), donde Oes un parmetro desconocido. SeaA:i,;c2J


observaciones. Entonces la funcin de verosimilitud de la muestra es

una muestra aleatoria de n

L(9) = f(x,-, e ) - f ( x , ; e ) ........./ ( ^ ;0 )


Observe que ahora la funcin de verosimilitud es una funcin nicamente del parmetro desconocido 6.
El estimador de mxima verosimilitud de 0 es el valor de 0 que maximiza la funcin de verosimilitud L(6).
Para ilustrar cmo se aplica esto en el modelo de un diseo experimental con efectos aleatorios, con
sidere un modelo de dos factores con a = b = n = 2. El modelo es
y^ , = f ^ + h + P j + ( ^ i j + ^ i , k

con i = , 2, j = 1, 2 y k = 1, 2. La varianza de cualquier observacin es

y las covarianzas son


= i , j = j \ k ^ k '

C o v ( y ^ . y , . . , . ) = o l + o l + a l ^

= ol

i *

= a ]
=

(12-45)

i'

J = j'

j ^ j '

Es conveniente considerar las observaciones como un vector 8 x 1, es decir,


>'ni
3^112
>'211

y=

>'212

yi21
yi22
y 221
L3'222 ,

y las varianzas y covarianzas pueden expresarse como una matriz de covarianza 8 x 8


2 =
^22 J

donde 2 n , 222, 2 i2 y 221 = 2 '12 son matrices 4 x 4 definidas de la siguiente manera:


az

a l + a l

a.

a l + o l +al
^ 11 ^ 2 2
a:

ol

a.

al

a l + a l + a l.

0
0

o]

2 = 0
0

0
0

0
0

al
a: +a], + a
a.

12-7 ALGUNOS TEMAS ADICIONALES SOBRE LA ESTIMACIN DE LOS COMPONENTES DE LA VARIANZA

549

y 221 es slo la transpuesta de 2i2. Entonces cada observacin sigue una distribucin normal con varianza
cr J, y si se supone que todas las N = abn observaciones tienen una distribucin normal conjunta, entonces
la funcin de verosimilitud del modelo aleatorio queda como
L{ii, a], o ] ,

donde jjv es un vector N y. 1 compuesto de unos. Las estimaciones de mxima verosimilitud e,


son los valores de estos parmetros que maximizan la funcin de verosimilitud. Tambin sera de
seable restringir las estimaciones de los componentes de la varianza a valores no negativos. Por lo tanto,
en la prctica la funcin de verosimilitud se maximizara sujeta a esta restriccin.
La estimacin de los componentes de la varianza por el mtodo de mxima verosimilitud requiere
software de computadora especializado. Algunos paquetes de software de estadstica general cuentan
con esta capacidad. El sistema SAS calcula estimaciones de mxima verosimilitud de los componentes de
la varianza de modelos aleatorios o mixtos con la rutina SAS PROC MIXED. Se ilustrar el uso de la ruti
na PROC MIXED aplicndola al modelo factorial de dos factores introducido en los ejemplos 12-2 y
12-3.
Considere primero el ejemplo 12-2. Se trata del modelo de un diseo factorial de efectos aleatorios
con dos factores. El mtodo del anlisis de varianza ha producido una estimacin negativa del componen
te de la varianza de la interaccin. Las estimaciones negativas de los componentes de la varianza pueden
evitarse en la rutina PROC MIXED especificando el uso del mtodo de mxima verosimilitud restringi
da (o residual) (REML, por sus siglas en ingls). En esencia, la REML restringe las estimaciones de los
componentes de la varianza a valores no negativos.
La rutina PROC MIXED del sistema SAS requiere como entrada la matriz de covarianza de los par
metros del modelo. La estructura de un modelo aleatorio en el que todas las variables aleatorias son mu
tuamente independientes es
7,^1

G=

O o]l
o

(12-46)

donde las I son matrices identidad. (La estructura de la covarianza de un modelo puede especificarse en
la rutina PROC MIXED con la opcin TYPE = structure en el enunciado RANDOM.) La estructura de
la covarianza del modelo del ejemplo 12-2 se especifica como TYPE = SIM (el valor por omisin de
PROC MIXED), que especifica la estructura simple de la covarianza para los parmetros del modelo da
dos en la ecuacin 12-46.
En la tabla 12-17 se presenta la salida de la rutina PROC MIXED de SAS para el experimento del
ejemplo 12-2. Se especific el mtodo de estimacin REML de los componentes de la varianza. La salida
se ha anotado con nmeros para facilitar la descripcin que se presenta a continuacin:
1. Estimaciones de los componentes de la varianza y la salida relacionada.
2. Parmetro covarianza. Identifica los parmetros del modelo:
y
3. Cociente de la varianza estimada del efecto y la varianza estimada del error residual:

4. Estimaciones de los parmetros. Son las estimaciones REML de los componentes de la varianza
],
y a^. Observe que la estimacin REML de
es cero.

(0)
a
.

o>
3
O
ro

oo
r

a
<
-
N

O O

A
o. o
00

t
Qi

>0|

ISI

NO

en
UJ

0> fO lA ro
C 3
r-

' fM (M<M
O ^
^ T- ^ ^

L.
0)
4^

V) O

0>

<Q

0)
ro (\j

_i--rg
V
fl >
V) V
<0 - J

O
t.
lA UJ
"O
C/)

(Q

(/>
4>
(O
e

-o
o

h~
<

a>
o
c
<0
(D
>
O

o o o o

I" O
<

t-H

M I

Q ^

(O

LLI O .

^ <
O .

O. UJ
O O

o 00 o
o r-- ra
O 00 sO
sO N o
oo
fsj ro sO
ro h- fSJ
O fO

o ro O
a
ro
ro
'O
^
ro
oo
00

o
o
o
o
o
o
o
o

o O
o o o
K o o
< o o
O o o
LUo o
Q. o o
o o o

O
o
o
o
o
o
o
o

Os
lA

r-

I- (MOs o
O ro h- o
< nO lA o
a, 'O r- o
o ro o
o fMo
o oo o

(0

O
o
o
o
o
o
o
o

co
rg
lA
so
CNJ
o

o ro o o

(O
>

o o
I

a,
X
<f
<

0 oo (Mo
o N- ro o
H Os >o o
< N* >0 o
Q o o o
UJ - o o
Q. o o o
o o o o
o o o

Os
rw
o
ro
o
o
o
o

o
IE
- o

f-

h- o o o o

0
<
tL.

Os o o
ro <\j o
l A 00 o
ro ro o
o
o
o
c
T- o o
o sO o

le
o

f\J ^ o
(M .Jt o
Os *4- o
r c o
>o fvj o
o f- o
T- m o
O fsj O

CL

V)

C\J ^
ro o

^
On
h-

o o o o
I

ro ^ o
>o r\j o
4- o
o
o
o

o o
o

^ lA r. o
(O Os 00 o
3
<M o
-o Os lA O
-I- ro so O
<A o cv o
<u o o o
o o o

LA lA LA
C5 O
O

o o
O

o ro

(D

tn

CL
O

00 00 Os
ro 00 LA
lA O ro
o >o <>

1
o ro o
1

CL

00

O r^
lA ro o
rs.
ro
O 00 ^

o sO

<
O
LU *

<0 t -

CL R>
o 3

CL <

K T

0 I- I- -1-

> UJ Q V>
o CL < < a>

o o a. o. o

__
rg

S
(.
(0
0.
>
o

550

Q
O
1<
0
UJ
0.
O

LU
CL (0
O 3
-O
1 - - -1
< <
CL 0 . o :

LU o>orNJoo>oso^ro
3 O ro Ov Os Os LA
1 o 00 ro SO 'O MOs
<c <Do 00 Os K <ro
> > 00 ^
o o o o o
Os
f\J M(NJ o
L. fM
1
1
1
O
'fc
O
c
c
o
0)
c O
4-1
0>
4->
u
(Q
<0
E
V
s
4p>
o
4
-*
T5
O
t
o
4o
L
U
c
O
c
"O o

HH
c o 1- c
V o O M (0
en
<0 r- Qi
4- 1
c
( 4<i
E <A^
0
E (Q
4^
-Ir0) o >s^
4-*
(0 4-
(0
a;
c m O)
U. c c
l-f
o
L
U
o
o
_. 0
V) _l
H 4-* -H (U*0 O) -M*
N
O
O a . (0
> c to -1 4) z:
o
<

(0 UJ
E
u o * c
3 O
(0 (0
(0 E ( ^
o; ^ ce 4- UJ
W(M
A o > C/> Q <
1

0>
a
a
3

4>
3
O
-1

(0
a
i
<

N
-1
E
tu
fi
w

0)
c.
3
D
0>
O
O
(.
Q.
A
Oi
X
l-H
E
4>

(/)
0)
4-
co
Q
r*

w
(0
3
'O

lA - ir>
O
O

O
O

>t
f\
o
ui

.o
o
o
o

M
4
4-
<Q
g

4iJ
V)
UJ

' o
o
o

o
X

c.

UJ

"O
-H

lA
00
so
h-

o
(M
'O
so
^

tn

OJ

V)

L,

(0
>
O
o

r<D

lA
fO
O

Kl

c.

V
U
e
(D

C
O

(D
Q.

00
00

C.
0.

UJ

-M
0)
E
<0

N. . nJo
ro
>o
fn
00
1

*"

4l
(0
6
M
co
l

r\j o NO ro
't o Kl
>0 0 ^
CNJ o To fO
in o 00
(NJ O co
*
O O O

4->
<D
E
0>
u
c
<0
(.
0
>
o
o

>
0
flC

0
O
H
<

UJ
0.
o

h -O
OO o
csj o
lA o
O O
M O
O O
O O

O O
1 1

o o o
o o o
Q o o
o o o
o o o
o o o
o o o
o o o
t
o o o

fi
<
.

oe
<
0.

ro o
Os o
^ o
^ o
ro o
r\i o
oo o
K )0
t

4->
(Q
QC

o o
h- o
oo o
K) o
^4^ o
O
o o
sO o

o
o
o
o
o
O
o
o

o -

UJ
3
-1
>
A
u
c
O

0>
4^
(0
E
4-*

UJ

oo
rsj
lA
'O
rvj
o
0

o>
c

r> o o
*1

o
4-
a
B
>s

"O
o
E
O
1<

<

C O
o o

<Q 4-* P'


e <0 - *
0)
<A 4- > ^

c
o
*1- c
c. O
0>
4. cf* >
1-4O *1- -O
C O
C U O
O

*f- C -f4- <0 - i


<0
Q,
E V) ^
c. 4
o X -1
^ (Q

o o UJ A _| l-H
o
--1i -J
4-i 0) -o O) (0 0 .(D U C -0 - N _l
* ^ > C < D ^ a > t -E
( C. (0 *0
^ (Q UJ
u 0 <- C -1 *1- S a
W M C. C <0 .c
0>^

(Q 4 -U J ^

U<M

A O > CO O < (/> 1

u.
A
(.
0.

co
4-
O
V
NHUl
D
V

tO
4M
O
00

HH
4
&
>s
1-

X
u.

u.
A
o

00
ro

u.
o
Z

CNJ

O
ff

4-
0}
K

fiC
o
0>
o
3
O
i/ i

<

UJ

0.
O

0
UJ
0. A

e
(
.

OlOOJOOOsO^CAJ
o ro o v M iN jr ^ r^ O O O K J h -I ^ O O i A
<0 o oo Os m%f
>
. .^ h
- .
o o o o o
Os
(Ni
<VJ f\| rsj O
^
1 1 1 ^

(0
s

fOs
hrO
lA
O
I
O
1

O 3
* "O
* - K i

>

Q 0 W

<

<

o. ct

0
O

U
(0

0.(0
0 3

a.

-Q
-

>

->

h -

-I-

0 0 M

< <

01

^ . C

551

552

CAPTULO 12 EXPERIMENTOS CON FACTORES ALEATORIOS

5. Error estndar de la estimacin. Es el error estndar (se) para muestras grandes de la estimacin
del parmetro; se(&f) =
6. El estadstico Z asociado con la varianza estimada:
Z = a] I se{d]).
7. Valor P del estadstico Z calculado.
8. Nivel alfa usado para calcular el intervalo de confianza.
9. Lmites inferior y superior de un intervalo de confianza de la teora normal para muestras gran
des de 100(1 ^ a) por ciento para los componentes de la varianza:
L = a ] - Z ^ ,,s e { a ] )
U ^ d ]+ Z ^,,se{d ])
10. Matriz asinttica de la covarianza de las estimaciones. Es la matriz de la covarianza para mues
tras grandes de las estimaciones de los componentes de la varianza.
11. Medidas del ajuste del modelo para comparar el ajuste de modelos alternativos.
Observe que los resultados de la rutina PROC MIXED de SAS coinciden muy de cerca con los valores pre
sentados en el ejemplo 12-2 cuando el modelo reducido (sin el trmino de la interaccin) se ajust a los datos.
En el ejemplo 12-3 se consider el mismo experimento, pero se supuso que los operadores eran un
factor fijo, lo cual llev a un modelo mixto. La rutina PROC MIXED de SAS puede emplearse para esti
mar los componentes de la varianza para esta situacin. La estructura de la covarianza de las observacio
nes, suponiendo que todas las variables aleatorias son mutuamente independientes (es decir, el modelo
misto no restringido), es
C o v (y ^ ^ ,

+a^

i = i J

= j ' , k = k'

= o]

i = i j

( 12A1)

j j

i^j'
La matriz de la covarianza de los parmetros del modelo_ es
G=

O
O u il
/)

(12-48)

(Esto se especifica en el enunciado TYPE = SIM en la entrada de la rutina PROC MIXED.) En la tabla
12-18 se muestra la salida de la rutina PROC MIXED de SAS para la forma no restringida del modelo
mixto del ejemplo 12-3. De nueva cuenta se seleccion el mtodo RBML. La estimacin del componente
de la varianza para el factor pieza es muy similar a la estimacin que se obtuvo utilizando el modelo
aleatorio. La estimacin de la varianza del error residual tambin es similar. Adems, la salida incluye
una prueba F para el efecto fijo.
12-8

PROBLEMAS

12-1. Una fbrica textil tiene un gran nmero de telares. Se supone que cada telar produce la misma cantidad de
tela por minuto. Para investigar este supuesto, se eligen cinco telares al azar y se registra su produccin en
tiempos diferentes. Se obtienen los siguientes datos:
Telar
1
2
3
4
5

14.0
13.9
14.1
13.6
13,8

Produccin (Ib/min)
14.2
14.1
13.8
13.9
14.1
14.2
14.0
13.8
13.9
13.6

14.0
14.0
14.0
13.9
13.8

14.1
14.0
13.9
13.7
14.0

12-8 PROBLEMAS

553

a) Explicar por qu este ejcperimento es de efectos aleatorios. Todos los telares tienen la misma produc
cin? Utilizar a = 0.05.
b) Estimar la variabilidad entre los telares.
c) Estimar la varianza del error experimental.
d) Encontrar un intervalo de confianza de 95% para aj / (oj +
e) Analizar los residuales de este experimento. Considera el lector que se satisfacen los supuestos del an
lisis de varianza?
12-2. Un fabricante sospecha que los lotes de materia prima suministrados por su proveedor difieren de manera
significativa en el contenido de calcio. Hay un gran nmero de lotes actualmente en el almacn. Se seleccio
nan cinco de ellos para hacer un estudio. Un qumico hace cinco determinaciones en cada lote y obtiene los
siguientes datos:
Lote 1
23.46
23.48
23.56
23.39
23.40

Lote 2
23.59
23.46
23.42
23.49
23.50

Lote 3
23.51
23.64
23.46
23.52
23.49

Lote 4
23.28
23.40
23.37
23.46
23.39

Lote 5
23.29
23.46
23.37
23.32
23.38

fl) Existe una variacin significativa en el contenido de calcio de un lote a otro? Utilizar a = 0,05.
b) Estimar los componentes de la varianza.
c) Encontrar un intervalo de confianza de 95% para aj / (a^ + o^)d) Analizar los residuales de este experimento. Se satisfacen los supuestos del anlisis de varianza?
12-3. En una fbrica metalrgica se usan varios hornos para calentar ejemplares de metal. Se supone que todos los
hornos operan a la misma temperatura, aunque se sospecha que quiz no sea ste el caso. Se seleccionan al
azar tres hornos y se registran sus temperaturas en cargas sucesivas. Los datos recabados son los siguientes:
Horno
1
2
3

491.50
488.50
490.10

498.30
484.65
484.80

Temperatura
498.10
493.50
479.90
477.35
488.25
473.00

493.60
471.85

478.65

a) Existe una variacin significativa de la temperatura entre los hornos? Utilizar a = 0.05.
b) Estimar los componentes de la varianza de este modelo.
c) Analizar los residuales de este experimento y sacar conclusiones acerca de la adecuacin del modelo.
12-4. En un artculo de Journal ofthe Electrochemical Society (vol. 139, no. 2, pp. 524-532) se describe un experi
mento para investigar la deposicin de vapor a baja presin del polisilicio. El experimento se llev a cabo en
el reactor de alta capacidad de Sematech en Austin, Texas. El reactor tiene varias posiciones para las obleas,
y se seleccionan al azar cuatro de estas posiciones. La variable de respuesta es la uniformidad del espesor de
la pelcula. Se hicieron tres rplicas del experimento y se obtuvieron los siguientes datos:

Posicin de la oblea
1
2
3
4

2.76
1.43
2.34
0.94

Uniformidad
5.67
1.70
1.97
1.36

4.49
2.19
1.47
1.65

554

CAPTULO 12 EXPERIMENTOS CON FACTORES ALEATORIOS

a) Hay alguna diferencia en las posiciones de las obleas? Utilizar a - 0.05.


b) Estimar la variabilidad debida a las posiciones de las obleas.
c) Estimar el componente del error aleatorio.
d) Analizar los residuales de este experimento y comentar la adecuacin del modelo,
12-5. Considere el experimento de la deposicin de vapor del problema 12-4.
a) Estimar la variabilidad total de la respuesta uniformidad.
b) Qu parte de la variabilidad total de la respuesta uniformidad se debe a la diferencia entre las posicio
nes en el reactor?
c) Hasta qu nivel podra reducirse la variabilidad de la respuesta uniformidad si pudiera eliminarse la va
riabilidad entre una posicin y otra en el reactor? Considera el lector que sta es una reduccin signifi
cativa?
12-6. En un artculo e, Journal ofQ uality Technology (vol. 13, no. 2, pp. 111-114) se describe un experimento para
investigar los efectos de cuatro sustancias qumicas blanqueadoras sobre la brillantez de la pulpa. Estas cua
tro sustancias qumicas se seleccionaron al azar de una poblacin grande de agentes blanqueadores poten
ciales. Los datos son los siguientes:
Sustancia qumica
1

2
3
4

Brillantez de la pulpa

76.208
82.876
77.199
74.466
92.746
81.914
80.346
73.385
80.522
79.306
78.017
91.596
80.802
80.626
79.417
77.364
77.386
78.358___________________
77.544
78.001
__________________
_________________

a) Existe alguna diferencia en los tipos de sustancias qumicas? Utilizar a = 0.05.


b) Estimar la variabilidad debida al tipo de sustancias qumicas.
c) Estimar la variabilidad debida al error aleatorio.
d) Analizar los residuales de este experimento y comentar la adecuacin del modelo.
12-7. Considere el modelo de efectos aleatorios, balanceado, en una variable. Desarrollar un procedimiento para
encontrar un intervalo de confianza de 100(1 - a ) por ciento para a^l{ol +
12-8. Referirse al problema 12-1.
a) Cul es la probabilidad de aceptar
si
es 4 veces la varianza del error <7^?
b) Si la diferencia entre los telares es lo suficientemente grande para incrementar la desviacin estndar de
una observacin en 20%, quiere detectarse esto con una probabilidad de al menos 0.80. Qu tamao de
la muestra deber usarse?
12-9. Se llev a cabo un experimento para investigar la capacidad o aptitud de un sistema de medicin. Se seleccio
naron diez piezas al azar, y dos operadores escogidos aleatoriamente midieron tres veces cada pieza. Las
pruebas se hicieron en orden aleatorio y se obtuvieron los siguientes datos:

Nmero
de pieza
1
2
3
4
5
6
7
8
9
10

1
50
52
53
49
48
52
51
52
50
47

Mediciones del
operador 1
2
49
52
50
51
49
50
51
50
51
46

3
50
51
50
50
48
50
51
49
50
49

1
50
51
54
48
48
52
51
53
51
46

Mediciones del
operador 2
2
48
51
52
50
49
50
50
48
48
47

3
51
51
51
51
48
50
50
50
49
48

12-8 PROBLEMAS

12-10.

12-11.

12-12.

12-13.
12-14.

12-15.

12-16.

12-17.
12-18.
12-19.

12-20.

12-21.
12-22.

555

a) Analizar los datos de este experimento.


b) Encontrar estimaciones puntuales de los componentes de la varanza utilizando el mtodo del anlisis de
varianza.
Considere nuevamente los datos del problema 5-6. Suponga que ambos factores, las mquinas y los operado
res, se eligen al azar.
a) Analizar los datos de este experimento.
b) Encontrar estimaciones puntuales de los componentes de la varianza utilizando el mtodo del anlisis de
varianza,
Considere nuevamente los datos del problema 5-13. Suponga que ambos factores son aleatorios.
a) Analizar los datos de este experimento.
b) Estimar los componentes de la varianza.
Suponga que en el problema 5-11 las posiciones en el homo se seleccionaron aleatoriamente, dando como
resultado un experimento con un modelo mixto. Analizar de nuevo los datos de este experimento bajo este
nuevo supuesto. Estimar los componentes apropiados del modelo.
Analizar de nuevo el experimento de los sistemas de medicin del problema 12-9, suponiendo que los opera
dores son un factor fijo. Estimar los componentes apropiados del modelo,
En el problema 5-6, suponga que slo hay cuatro mquinas de inters, pero los operadores se seleccionaron
aleatoriamente.
a) Qu tipo de modelo es apropiado?
b) Efectuar el anlisis y estimar los componentes del modelo.
Mediante la aplicacin del operador valor esperado, desarrollar los cuadrados medios esperados del modelo
factorial mixto con dos factores. Usar los supuestos del modelo restringido. Verificar los resultados con los
cuadrados medios esperados de la tabla 12-11 para constatar que concuerdan.
Considere el diseo factorial de tres factores del ejemplo 12-6. Proponer los estadsticos de prueba apropia
dos para todos los efectos principales y las interacciones. Repetir para el caso en que .<4y B son fijos y C es
aleatorio.
Considere el experimento del ejemplo 12-7. Analizar los datos para el caso en que^, B yC son aleatorios.
Deducir los cuadrados medios esperados de la tabla 12-14.
Considere un experimento factorial de cuatro factores donde el factor>4 tiene a niveles, el factor5 tiene b ni
veles, el factor C tiene c niveles, el factor D tiene d niveles y hay n rplicas. Anotar las sumas de cuadrados, los
grados de libertad y los cuadrados medios esperados para los siguientes casos. Suponer el modelo restringido
para todos los modelos mixtos. Puede usarse un paquete de computadora como Minitab.
a) A, B, C y D son factores fijos.
b) A, B, C y D son factores aleatorios.
c) A es fijo y B, C y D son aleatorios.
d) A y B son fijos y C y D son aleatorios.
e) A, B y C son fijos y D es aleatorio.
Existen pruebas exactas para todos los efectos? Si no es as, proponer estadsticos de prueba para los efectos
que no puedan probarse directamente.
Considere nuevamente los incisos c, dye del problema 12-19. Obtener los cuadrados medios esperados su
poniendo un modelo no restringido. Puede usarse un paquete de computadora como Minitab. Comparar los
resultados obtenidos con los del modelo restringido.
En el problema 5-17, suponga que los tres operadores se seleccionaron al azar. Analizar los datos bajo estas
condiciones y sacar conclusiones. Estimar los componentes de la varianza.
Considere el modelo factorial de tres factores
i = l, 2, ..., a
yijt = f^+^i +^J +7k
+i Mj k
y = 2, ..., b
= 1, 2, ..., c
Suponiendo que los tres factores son aleatorios, desarroUar la tabla del anlisis de varianza, incluyendo los
cuadrados medios esperados. Proponer los estadsticos de prueba apropiados para todos los efectos.

556

CAPTULO 12 EXPERIMENTOS CON FACTORES ALEATORIOS

12-23. El modelo factorial de tres factores para una sola rplica es


y,j, -

12-24.

12-25.
12-26.
12-27.

12-28.

12-29.
12-30.

12-31.

12-32.

12-33.
12-34.

/ w+ T , . + ^ . + Y , + ( t / 3 ) . . + ( M

jic

+ (^ ).*

+^ijk

Si todos los factores son aleatorios, puede probarse alguno de las efectos? Si las interacciones de tres facto
res y (T^),y no existen, es posible probar todos los dems efectos?
En el problema 5-6, suponga que tanto las mquinas como los operadores se escogieron al azar. Determinar
la potencia de la prueba para detectar un efecto de la mquina tal que <7^ = a \ donde <t^ es el componente de
la varianza del factor mquina. Son suficientes dos rplicas?
En el anlisis de varianza del modelo mixto de dos factores, demostrar que Co\[(Tfi), (rP).j\ = -(1/a)
para
i ^ i'.
Demostrar que el mtodo del anlisis de varianza siempre produce estimaciones puntuales insesgadas de los
componentes de la varianza en cualquier modelo aleatorio o mixto.
Invocando los supuestos de .normalidad usuales, encontrar una expresin para la probabilidad de obtener
una estimacin negativa de un componente de la varianza por el mtodo del anlisis de varianza. Utilizando
este resultado, escribir un enunciado para la probabilidad de que j < Oen un anlisis de varianza de un fac
tor. Comentar la utilidad de este enunciado de probabilidad.
Analizar los datos del problema 12-9, suponiendo que los operadores son fijos y utilizando tanto la forma no
restringida como la restringida de los modelos mixtos. Comparar los resultados que se obtienen con los dos
modelos.
Considere el modelo mixto de dos factores. Demostrar que el error estndar de la media del factor fijo (por
ejemplo. A) es [MSji^/bny^.
Considere los componentes de la varianza del modelo aleatorio del problema 12-9.
a) Encontrar un intervalo de confianza exacto del 95% para a^.
b) Encontrar intervalos de confianza aproximados del 95 % para los otros componentes de la varianza utili
zando el mtodo de Satterthwaite.
Usar el experimento descrito en el problema 5-6 y suponer que ambos factores son aleatorios. Encontrar un
intervalo de confianza exacto del 95% para a^. Construir intervalos de confianza aproximados del 95% para
los otros componentes de la varianza utilizando el mtodo de Satterthwaite.
Considere el experimento de tres factores del problema 5-17 y suponga que los operadores se seleccionaron
al azar. Encontrar un intervalo de confianza aproximado del 95 % para el componente de la varianza del ope
rador.
Resolver de nuevo el problema 12-30 utilizando el mtodo de grandes muestras modificado que se describe
en la seccin 12-7.2. Comparar las dos series de intervalos de confianza obtenidas y comentarlas.
Resolver de nuevo el problema 12-32 utilizando el mtodo de grandes muestras modificado que se describe
en la seccin 12-7.2. Comparar este intervalo de confianza con el que se obtuvo anteriormente y comentario.

Diseos anidados
y de parcelas
subdivididas

En este captulo se introducen dos importantes tipos de diseos experimentales: el diseo anidado y el di
seo de parcelas subdivididas. Estos dos diseos encuentran una aplicacin razonablemente generaliza
da en el uso industrial de los experimentos diseados. Con frecuencia incluyen tambin uno o ms
factores aleatorios, por lo que algunos de los conceptos introducidos en el captulo 12 tendrn cabida
aqu.

13-1

DISEO A N ID A D O DE D O S ETAPAS

En algunos experimentos con factores mltiples, los niveles de uno de los factores (por ejemplo el factor
B) son similares pero no idnticos a los diferentes niveles de otro factor (por ejemplo j4). A un arreglo
como ste se le llama diseo anidado o jerrquico, con los niveles del factor B anidados bajo los niveles
del factor j4. Por ejemplo, considere una compaa que compra su materia prima a tres proveedores dife
rentes. La compaa quiere determinar si la pureza de la materia prima de cada proveedor es la misma.
Hay cuatro lotes de materia prima disponibles de cada proveedor, y se harn tres determinaciones de la
pureza en cada lote. La situacin se describe en la figura 13-1.
Se trata de un diseo anidado de dos etapas, con los lotes anidados bajo los proveedores. A primera
vista se podra preguntar por qu no es un experimento factorial. Si fuera un experimento factorial, en
tonces el lote 1 se referira siempre al mismo lote, el lote 2 se referira siempre al mismo lote, etctera.
Evidentemente, no es ste el caso, ya que los lotes de cada proveedor son nicos para ese proveedor
particular. Es decir, el lote 1 del proveedor 1 no tiene relacin con el lote 1 de cualquier otro proveedor,
el lote 2 del proveedor 1 no tiene relacin con el lote 2 de cualquier otro proveedor, etctera. Para sub
rayar el hecho de que los lotes de cada proveedor son diferentes, se pueden num erar como 1, 2, 3 y 4
para el proveedor 1; 5 ,6 ,7y 8 para el proveedor 2; y 9,10,11 y 12 para el proveedor 3, como se muestra en
la figura 13-2.
En ocasiones quiz no se sepa si un factor est cruzado en un arreglo factorial o anidado. Si los niveles
del factor pueden numerarse arbitrariamente como en la figura 13-2, entonces el factor est anidado.

557

558

CAPTULO 13 DISEOS ANIDADOS Y DE PARCELAS SUBDIVIDIDAS

Vin

Observaciones -<

^141

J'211

>221

>231

>241

>311

>321

>331

>341

>232

>242

>312

>322

>332

>342

>243

>313

>323

>333

>343

^111

J'l22

^132

^142

^212

>121

'v ^113

^123

^133

^143

>213

y^23

Figura 13'1 Diseo anidado de dos etapas.

I S 'l.l

Anlisis estadstico

El modelo estadstico lineal para el diseo anidado de dos etapas es

f/ = l, 2,..., a
yijk ~

7 ~ ij 2,...,

Jc = l,

(13-1)

b
n

Es decir, hay a niveles del factor^4, b niveles del factor B anidados bajo cada nivel d e ^ , y n rplicas. El
subndice j{i) indica que el nively-simo del factor B est anidado bajo el nivel /-simo del factor^. Resul
ta conveniente considerar que las rplicas estn anidadas dentro de la combinacin de los niveles d e ^ y
S; por lo tanto, se usa el subndice {ij)k para el trmino del error. Se trata de un diseo anidado balancea
do, ya que hay el mismo nmero de niveles de B con cada nivel d e ^ y el mismo nmero de rplicas. Puesto
que no todos los niveles del factor 5 aparecen dentro de todos los niveles del factor^, no puede haber in
teraccin entre A y B.
La suma de cuadrados total corregida puede escribirse como
b

_b

yJ+iyi,~y,.)+iyij,-yi,)f
/=1 ;=1 A:=l

(i3-2)

-1 ;=1 k =

Al desarrollar el miembro derecho de la ecuacin 13-2, se obtiene


S 2
1=1 y=l

(y>jic - y - ) ' = ( 3 ^ - . . - ? ) '

i=l ;=1

- h )' (13-3)

ya que los tres trminos con productos cruzados son cero. La ecuacin 13-3 indica que puede hacerse la
particin de la suma de cuadrados total en una suma de cuadrados debida al factor j4, una suma de cua
drados debida al factor B bajo los niveles d e ^ , y una suma de cuadrados debida al error. Simblicamente,
la ecuacin 13-3 puede escribirse como
SSj. = S S ^ +

-I-55^

(13-4)

Hay abn - 1 grados de libertad para SS^, a - 1 grados de libertad para SS^, a ( b - l ) grados de Hbertad para
SS b(a ) y ^b(n - 1) grados de libertad para el error. Observe que abn - 1 = (a - 1 ) -l- a(fe - 1 ) + ab(n -1 ). Si
los errores son NID(0, (/), cada una de las sumas de cuadrados del miembro derecho de la ecuacin 13-4

Proveedores
Lotes

Figura 13-2

Disposicin alternativa del diseo anidado de dos etapas.

559

13-1 DISEO ANIDADO DE DOS ETAPAS

Tabla 13-1

Cuadrados medios esperados en el diseo anidado de dos etapas

A fijo
B fijo

E{MS)
E(MS^)

E{MSba))

A fijo
B aleatorio
+

a -\

a -1

A aleatorio
B aleatorio
cj^ + na\ + bna^,
+ nal

a (b -l)

E(MSe)_________________ ^

________________

puede dividirse por sus grados de libertad para obtener cuadrados medios con una distribucin indepen
diente tales que el cociente de dos cuadrados medios cualesquiera se distribuye como F.
Los estadsticos apropiados para probar los efectos de los factores^! y 5 dependen de s i^ y B son fyos
o aleatorios. Si los factores/1 y B son fijos, se supone que 2 JLj r, = Oy 2*^^
= O(/ = 1 , 2 , a). Es decir,
la suma de los efectos del tratam iento^ es cero, y la suma de los efectos del tratamiento B es cero dentro
de cada nivel de^l. De manera alternativa, sj4 y B son aleatorios, se supone que tes NID(0, a j ) y que
es NID(0, ff^). Ikmbin es frecuente encontrar modelos mixtos con^i fijo y 5 aleatorio. Los cuadrados
medios esperados pueden determinarse aplicando directamente las reglas del captulo 12. Para el modelo
mixto, estos cuadrados medios esperados suponen la forma Festnngida del modelo del captulo 12. En la
tabla 13-1 se muestran los cuadrados medios esperados para estas situaciones.
La tabla 13-1 indica que si los niveles d e ^ y B son jos,Ho.T = Ose prueba conM SJM Sgy
=O
se prueba con ASs^^f/MS^. Si A es un factor fijo y B es aleatorio, entonces Ho:t = O se prueba con
MS aIMS b(^^ y
= Ose prueba con
Por ltimo, si ta n to ^ como B son factores aleatorios,
Ho-ol = Ose prueba con
y Ho.a ^ = Ocon
El procedimiento de prueba se resume
en la tabla del anlisis de varianza, como se muestra en la tabla 13-2. Las frmulas para calcular las sumas
de cuadrados se obtienen desarrollando las cantidades de la ecuacin 13-3 y simplificando. stas son
=

J_t

2 2

-1 y-l

abi
^ 2

y - l i l

^ 1=1 ;=)

(13-6)
yi

(13-7)

=1 ;=1 t= l

Tabla 13-2

Tabla del anlisis de varianza para el diseo anidado de dos etapas

Fuente de
variacin

Suma de
cuadrados

Grados de
libertad

bn'2 ( y , - y . y

a -1

B dentro de A

X H (. - y -f

fl(f,-l)

Error
Tbtal

ab(n - 1)
E 2 (j'* ~ p J

abn - 1

Cuadrado
medio
MS^

MS^

560

CAPTULO 13 DISEOS ANIDADOS Y DE PARCELAS SUBDIVIDIDAS

Se observa que la ecuacin 13-6 para

puede escribirse como


Esto expresa la idea de que


mados en todos los niveles de

. i - " '

te

es la suma de cuadrados entre los niveles de B para cada nivel d e ^ , su

EJEMPLO 1 3 - 1 ...............................................................................................................................................
Considere una compaa que compra materia prima en lotes de tres proveedores diferentes. La pureza de
esta materia prima vara considerablemente, lo cual ocasiona problemas en la manufactura del producto
terminado. Quiere determinarse si la variabilidad de la pureza es atribuible a las diferencias entre los pro
veedores. Se seleccionan al azar cuatro lotes de materia prima de cada proveedor, y se hacen tres determi
naciones de la pureza en cada lote. Se trata, desde luego, de un diseo anidado de dos etapas. Los datos,
despus de codificarlos restando 93, se muestran en la tabla 13-3. Las sumas de cuadrados se calculan de
la siguiente manera:
a

...2

,.2
.=1 M

= 1 5 3 . 0 0 - ^ ^ = 148.31
36
.,2

bn
=

abn

(-5)^ -l-(4)^ -h(14)^ ] (4)(3)^'' ^


^ ^ ^

= 19.75-4.69=15.06

36

= ^[(0)^ +(-9)^ + (-1)" + - +(2)^ +(6)^]-19.75


= 89.67-19.75=69.92

; =i

,=i ;=l

= 153.00-89.67= 63.33

Tabla 13-3

Datos codificados de la pureza del ejemplo 13-1 (Codificacin:


- pureza - 93)________________
Proveedor 1
Proveedor 2
Proveedor 3
Lotes

Totales de los lotes

ya.

Totales de los proveedores

Vl

1
-1
0

-2
-3
-4

-2
0
1

1
4
0

1
-2
-3

0
4
2

-1
0
-2

0
3
2

2
4
0

-2
0
2

1
-1
2

3
2
1

-9

-1

-A

-3

-5

14

13-1 DISEO ANIDAIX) DE DOS ETAPAS


Tabla 13-4

561

Anlisis de varianza de los datos del ejemplo 13-1

Fuente de
variacin

Suma de
cuadrados

Proveedores
Lotes (dentro de los proveedores)
Error
Total

15.06
69.92
63.33
148.31

Grados de
libertad

Cuadrado
medio

2
9
24
35

7.53
7.77
2.64

Cuadrado medio
esperado
+
+
<r^+ 3a^

Fo

Valor P

0.97
2.94

0.42
0.02

En la tabla 13-4 se resume el anlisis de varianza. Los proveedores son fijos y los lotes aleatorios, por lo
que los cuadrados medios esperados se obtienen de la columna de en medio de la tabla 13-1 y se repiten
por conveniencia en la tabla 13-4. Por el examen de los valores P, se concluira que no hay ningn efecto
significativo sobre la pureza debido a los proveedores, pero la pureza de los lotes de materia prima del
mismo proveedor difieren significativamente.

Las implicaciones prcticas de este experimento y del anlisis son muy importantes. El objetivo del
experimentador es encontrar la fuente de la variabilidad en la pureza de la materia prima. Si sta es resul
tado de las diferencias entre los proveedores, el problema puede resolverse seleccionando al mejor
proveedor. Sin embargo, esa solucin no es aplicable aqu porque la principal fuente de variabilidad es la
variacin de la pureza de un lote a otro dentro de los proveedores. Por lo tanto, el problema debe atacarse
trabajando con los proveedores para reducir su variabilidad de un lote a otro. Esto puede implicar modifi
caciones en los procesos de produccin de los proveedores o en su sistema interno de control de calidad.
Observe lo que habra pasado si se hubiera hecho un anhsis incorrecto de este diseo como un expe
rimento factorial de dos factores. Si se considera que los lotes estn cruzados con los proveedores, se ob
tienen los totales de los lotes de 2, -3, -2 y 16, donde cada celda lote x proveedores contiene tres rplicas.
Por lo tanto, puede calcularse una suma de cuadrados debida a los lotes y una suma de cuadrados de in
teraccin. El anlisis de varianza factorial completo se muestra en la tabla 13-5, suponiendo un modelo mixto.
Este anlisis indica que los lotes difieren significativamente y que hay una interaccin significativa
entre los lotes y los proveedores. Sin embargo, es difcil ofrecer una interpretacin prctica de la interac
cin lotes X proveedores. Por ejemplo, esta interaccin significativa quiere decir que el efecto del pro
veedor no es constante de un lote a otro? Adems, la interaccin significativa aunada al efecto no
significativo del proveedor podra llevar al anahsta a concluir que los proveedores en realidad difieren,
pero su efecto est enmascarado por la interaccin significativa.

Tabla 13-5

Anlisis de varianza incorrecto del diseo anidado de dos etapas del ejemplo 13-1 como un diseo factorial
(proveedores fijos, lotes aleatorios)

Fuente de
variacin
Proveedores (5)
Lotes (B)
InteraccinS x B
Error
Total

Suma de
cuadrados

Grados de
libertad

Cuadrado
medio

15.06
25.64
44.28
63.33
148.31

2
3
6
24
35

7.53
8.55
7.38
2.64

F,
1.02
3.24
2.80 .

Valor/*
0.42
0.04
0.03

562

CAPTULO 13 DISEOS ANIDADOS Y DE PARCELAS SUBDIVIDIDAS

Clculos
Algunos paquetes de software de estadstica realizarn el anlisis de un diseo anidado. En la tabla 13-6
se presenta la salida del procedimiento Balanced ANOVA (anlisis de varianza balanceado) de Minitab
(utilizando el modelo restringido). Los resultados numricos concuerdan con los clculos manuales re
portados en la tabla 13-4. Minitab tambin reporta los cuadrados medios esperados en la parte inferior de
la tabla 13-6. Recuerde que el smbolo g [l] es un trmino cuadrtico que representa el efecto fijo de los
proveedores, por lo que en la notacin que se usa aqu,

!3[1] =

a - 1

Por lo tanto, el trmino del efecto fijo en el cuadrado medio esperado de Minitab para los proveedores
12Q[1] = 122f^j rf / ( 3 - 1 ) = 6 2 , r f , resultado que concuerda con el que se presenta en el algoritmo ta
bular de la tabla 13-4.
En ocasiones no se cuenta con un programa de computadora especializado para analizar diseos ani
dados. Sin embargo, observe, al comparar las tablas 13-4 y 13-5, que
SS^ +SSs^g = 25.64-1-44.28= 69.92= SSg^^)
Es decir, la suma de cuadrados de los lotes dentro de los proveedores se compone de la suma de cuadra
dos de los lotes ms la suma de cuadrados de la interaccin lotes x proveedores. Los grados de libertad
poseen una propiedad similar; es decir.
Lotes
3

Lotes x Proveedores _ Lotes dentro de los proveedores


6

Por lo tanto, un programa de computadora para analizar diseos factoriales podra usarse tambin para
analizar diseos anidados agrupando el efecto principal del factor anidado y las interacciones de ese
factor con el factor bajo el que est anidado.

Tabla 13-6

Salida de Minitab (Balanced ANOVA) [anlisis de varianza balanceado] para el ejemplo 13-1

Anlisis de varianza (diseos balanceados)


Factor
SuppUer
Batch(SuppUer)

Type L ev e ls V a l e s
1
f ixed
3
1
random
A

2
2

3
3

anee for P u ri t y
Source
Supplier
Batch(Suppl1er>
Error
Total
S ou r c e
S u p p U er
Batch(Su|
Error

DF
2
9
24
35

SS
15. 056
6 9. 9 1 7
63.333
148.306

MS
7.528
7.769
2.639

F
0.97
2.94

P
0.416
0. 0 1 7

Var l anc e Error E x p e c t e d M ea n S q u a r e for Each Te rm


c o m p o n e n t t er m (us1ng r e s t r i c t e d mod e l )
(3) + 3(2) + i2a ci :
2
(3> + 3(2)
r)
1 .7 1 0
3
(3)
2.639

13-1 DISEO ANIDADO DE DOS ETAPAS

13' 1.2

563

Verificacin del diagnstico

La herramienta principal para verifcar el diagnstico es el anlisis residual. Para el diseo anidado de
dos etapas, los residuales son
etjk = Vijk -

%k

El valor ajustado es

y si se establecen las restricciones usuales sobre los parmetros del modelo (2, f, = OyH
2,

a), entonces

= 0 ,i = 1,

= y -y, ,y^n ) = yj, -yi..- Por consiguiente, el valor ajustado es


= >...+(>,.- x J + C J . - r , . . )
= %

Por lo tanto, los residuales del diseo anidado de dos etapas son
e,jk = y.jk ~ h

(1 3 -9 )

donde y. son los promedios de los lotes individuales.


Las observaciones, los valores ajustados y los residuales para los datos de la pureza del ejemplo
13-1 son:

Valor observado y,
1
-1
0
-2
-3
-A
-2
0
1
1
4
0
1
-2
-3
0
4
2
-1
0
-2
0
3
2
2

Valor ajustado
0.00
0.00
0.00
-3.00
-3.00
-3.00
-0.33
-0.33
-0.33
1.67
1.67
1.67
-1.33
-1.33
-1.33
2.00
2.00
2.00
-1.00
-1.00
-1.00
1,67
1.67
1.67
2.00

= y

=y^k-y.

1.00
-1.00
0.00
1.00
0.00
-1.00
-1.67
0.33
1.33
-0.67
2.33
-1.67
2.33
-0.67
-1.67
-2.00
2.00
0.00
0.00
1.00
-1.00
-1.67
1.33
0.33
0.00

564

CAPITULO 13 DISEOS ANIDADOS Y DE PARCELAS SUBDIVIDIDAS

Valor observado y,

Valor ajustado

4
0
-2
0
2
1
-1
2
3
2
1

2.00
2.00
0.00
0.00
0.00
0.67
0.67
0.67
2.00
2.00
2.00

/. =ynk-yu.
2.00
-2.00
- 2;oo
0.00
2.00
0.33
-1.67
1.33
1.00
0.00
-1.00

Pueden realizarse ahora las verificaciones de diagnstico usuales; incluyendo las grficas de probabilidad
normal, la verificacin de puntos atpicos y la graficacin de los residuales contra los valores ajustados.
Como una ilustracin, en la figura 13-3 se grafican los residuales contra los valores ajustados y contra los
niveles del factor proveedor.

II IIII IIT-]IIII[~TIIr - f 3

3
2

3
O

c o
-1

-2 rL
-

1
0
Valores predrchos

a) Grfica de los residuales contra los valores predichos

1
Proveedor
6)

Figura 13-3

Grfica de los residuales contra el proveedor

Grficas de los residuales del ejemplo 13-1.

U-1 DISEO ANIDADO DE DOS ETAPAS

565

En la situacin de un problema como el que se describe en el ejemplo 13-1, las grficas de los residua
les son particularmente tiles debido a la informacin de diagnstico adicional que contienen. Por ejem
plo, el anlisis de varianza ha indicado que la pureza media de los tres proveedores no difiere pero que
hay una variabilidad estadsticamente significativa de un lote a otro (es decir,
> 0 ). Pero, la variabili
dad dentro de los lotes es la misma para todos los proveedores? Se ha supuesto de hecho que ste es el
caso, y si no es cierto desde luego que nos gustara saberlo, ya que tiene un impacto prctico considerable
sobre la interpretacin de los resultados del experimento. La grfica de los residuales contra los provee
dores de la figura 13-3fe es una manera simple pero eficaz de verificar este supuesto. Puesto que la disper
sin de los residuales es aproximadamente la misma para los tres proveedores, se concluira que la
variabilidad en la pureza de un lote a otro es aproximadamente la misma para los tres proveedores.

13-1.3

Componentes de la varianza

Para el caso de efectos aleatorios, el mtodo del anlisis de varianza puede usarse para estimar los com
ponentes de la varianza
Por los cuadrados medios esperados de la ltima columna de la tabla
13-1, se obtiene
a^=MS^

(13-10)

,
- MS^
d l = ---- ------------ -

(13-11)

M S .

- M S g.j,

(13-12)

bn

En muchas aplicaciones de diseos anidados interviene un modelo mixto, con el efecto principal (A)
fjo y el factor anidado {B) aleatorio. ste es el caso para el problema descrito en el ejemplo 13-1; los pro
veedores (factor^) son fijos, y los lotes de materia prima (factor E) son aleatorios. Los efectos de los pro
veedores pueden estimarse con
.

^3 -

^3..

X.. -

-5
12
4
12
14
^2

13
36
13
36
13
36

-2 8
36
-1
36
29
36

Para estimar los componentes de la varianza <r^y tr ^, se elimina la lnea de la tabla del anlisis de varianza
relativo a los proveedores y se aphca el mtodo de estimacin del anHsis de varianza a las dos lneas si
guientes. Se obtiene as
d ' = M5g = 2.64

7 .7 7 -1 6 4
3

566
Etapa 1

CAPTULO 13

DISEOS ANIDADOS Y DE PARCELAS SUBDIVIDIDAS


Lote 1 ...

Figura 13-4 Diseo anidado escalonado de dos etapas.

Estos resultados se muestran tambin en la parte inferior de la salida de Minitab de la tabla 13-6. Por el
anlisis del ejemplo 13-1, se sabe que t no difiere significativamente de cero, mientras que el componente
de la varianza
es mayor que cero.
13'1-4

Diseos anidados por etapas

Un problema potencial en la aplicacin de los diseos anidados es que en ocasiones para obtener un n
mero razonable de grados de libertad en el nivel ms alto, puede terminarse con muchos grados de liber
tad (quiz demasiados) en las etapas inferiores. Para ilustrar, suponga que se estn investigando las
diferencias potenciales en el anlisis qumico entre diferentes lotes de m aterial Se planea tomar cinco
muestras por lote, y cada muestra se medir dos veces. Si quiere estimarse un componente de la varianza
para los lotes, entonces 10 lotes no sera una eleccin irrazonable. Esto resulta en 9 grados de libertad
para los lotes, 40 grados de libertad para las muestras y 50 grados de libertad para las mediciones.
Una manera de evitar esta situacin es usar un tipo particular de diseo anidado no balanceado lla
mado diseo anidado por etapas. En la figura 13-4 se muestra un ejemplo de un diseo anidado escalona
do. Observe que slo se toman dos muestras de cada lote; una de ellas se mide dos veces, mientras que la
otra una sola vez. Si hay a lotes, entonces habr a - 1 grados de libertad para los lotes (o, en general, la eta
pa superior), y todas las etapas inferiores tendrn exactamente a grados de libertad. Para ms informa
cin sobre el uso y el anlisis de estos diseos, ver Bainbridge [5], Smith y Beverly [104] y Nelson [88a, b,
c], as como el material suplementario del texto de este captulo.

13-2

DISEO A N ID A D O GENERAL DE m ETAPAS

Los resultados de la seccin 13-1 pueden extenderse fcilmente al caso de m factores completamente ani
dados. A este diseo se le llamara diseo anidado de m etapas. Como un ejemplo, suponga que una fun
dicin quiere investigar la dureza de dos formulaciones diferentes de una aleacin de metal. Se preparan
tres hornadas de cada formulacin de la aleacin, se seleccionan dos hngotes al azar de cada hornada
para probarlos, y se hacen dos mediciones de la dureza en cada lingote. La situacin se ilustra en la figura
13-5.
En este experimento, las hornadas estn anidadas bajo los niveles del factor formulacin de la alea
cin, y los lingotes estn anidados bajo los niveles del factor hornada. Por lo tanto, se trata de un diseo
anidado de tres etapas con dos rphcas.

13-2 DISEO ANIDADO GENERAL DE m ETAPAS

567

Formulacin
de la aleacin

Hornadas

Lingotes
^nn

^ n i

1^ ^ 1111

^1122

-^1321

^1311

^1321

y2111

^2121

^2211

^2221

^2311

5'2321

^1222

5'i312

^1322

J'2112

^2122

'2212

'2222

^2312

J'2312

Observaciones
'1212

Figura 13-5 Diseo anidado de tres etapas.

El modelo para el diseo anidado general de tres etapas es


i = 1,
; = i,
k = i,
1 = 1,

a
2, .
2, . . . , b
c
2, .
n
2, .

(13-13)

Para el ejemplo tratado aqu, r, es el efecto de la formulacin de la aleacin -sima,


es el efecto de la
hornada;-sima dentro de la aleacin /-sima,
es el efecto del lingote fc-simo dentro de la hornada

Figura 13-6 Fuentes de variacin en el ejemplo del diseo anidado de


tres etapas.

568

CAPTULO 13

DISEOS ANIDADOS Y DE PARCELAS SUBDIVIDIDAS

Tabla 13-7

Anlisis de varianza del diseo anidado de tres etapas

Fuente de
variacin

Suma de cuadrados

B (dentro d&A)

i j

C (dentro d eB )

2SE2
i

Total

k i

a-\

MS^

a{b-l)

M S b (A)

ab(c -

i k

Error

Grados de Cuadrado
libertad
medio

iynki-ynkf

1)

abc{n - 1)

MS^

aben -1

i k 1

;-sima y la aleacin -sima, y


es el trmino del error NID(0, a^) usual. La extensin de este modelo a
m factores es directa.
Observe que en el ejemplo anterior la variabilidad global de la dureza const de tres componentes:
uno que result de las formulaciones de las aleaciones, otro que se gener de las hornadas y uno ms que
sali del error de la prueba analtica. Estos componentes de la variabilidad en la dureza global se ilustran
en la figura 13-6.
Este ejemplo demuestra la manera en que se usa frecuentemente el diseo anidado en el anlisis de
procesos para identificar las principales fuentes de variabilidad en la salida. Por ejemplo, si el componen
te de la varianza de la formulacin de la aleacin es grande, entonces esto implica que la variabilidad glo
bal de la dureza podra reducirse utilizando nicamente una de las formulacioiies de la aleacin.
El clculo de las sumas de cuadrados y el anlisis de varianza del diseo anidado de m etapas son si
milares al anlisis presentado en la seccin 13-1. Por ejemplo, el anlisis de varianza del diseo anidado
de tres etapas se resume en la tabla 13-7. En esta tabla se muestran tambin las definiciones de las sumas
de cuadrados. Observe que son una extensin simple de las frmulas para el diseo anidado de dos eta
pas. Muchos paquetes de software de estadstica realizarn los clculos.
Para determinar los estadsticos de prueba apropiados deben encontrarse los cuadrados medios es
perados empleando los mtodos del captulo 12. Por ejemplo, si los factores^l y B son fijos y el factor C es
aleatorio, entonces los cuadrados medios esperados pueden derivarse como se indica en la tabla 13-8. En
esta tabla se indican los estadsticos de prueba apropiados para esta situacin.
Tabla 13'8

Derivacin de los cuadrados medios esperados para un diseo anidado


de tres etapas con A y B fijos y C aleatorio
F

Factor

a
i
0

b
J
b

c
k
c

n
l

Cuadrado medio esperado

n
f l- 1

^(1)

1
1

1
1

1
1

n
1

a{b-l)
al + nal

13-3 DISEOS CON FACTORES ANIDADOS Y FACTORIALES

13-3

569

DISEOS CON FACTORES ANIDADOS Y FACTORIALES

En experimentos con factores mltiples, algunos factores pueden estar incluidos en un arreglo factorial y
otros estar anidados. En ocasiones a estos diseos se les llama diseos factoriales-anidados. El anlisis
estadstico de un diseo as con tres factores se ilustra en el ejemplo siguiente.
EJEMPLO 1 3 - 2 ...............................................................................................................................................
Un ingeniero industrial estudia la insercin manual de componentes electrnicos en tarjetas de circuitos
impresos a fin de mejorar la rapidez de la operacin de ensamblaje. Ha diseado tres dispositivos de en
samblaje y dos arreglos del sitio de trabajo que parecen prometedores. Se necesitan operadores para rea
lizar el ensamblaje, y se decide seleccionar aleatoriamente cuatro operadores para cada combinacin
dispositivo-arreglo del sitio de trabajo. Sin embargo, debido a que los sitios de trabajo se encuentran en
diferentes puntos dentro de la planta, es difcil usar los mismos cuatro operadores para cada arreglo del
sitio de trabajo. Por lo tanto, los cuatro operadores escogidos para el arreglo 1 son diferentes de los cuatro
para el arreglo 2. Puesto que slo hay tres dispositivos y dos arreglos del sitio de trabajo, y los operadores
se escogen al azar, se trata de un modelo mixto. Las combinaciones de tratamientos de este diseo se co
rren en orden aleatorio y se obtienen dos rplicas. Los tiempos de ensamblaje se miden en segundos y se
muestran en la tabla 13-9.
En este experimento, los operadores estn anidados dentro de los niveles de los arreglos del sitio de
trabajo, mientras que los dispositivos y los arreglos del sitio de trabajo estn incluidos en un factorial. Por
lo tanto, este diseo tiene factores anidados y factoriales. El modelo lineal para este diseo es
i = l, 2, 3
ytju = / M + / + 0 J + Y , U )

+(^)fcO)

1 = 1,2, 3 ,4

1 = 1, 2

donde r, es el efecto del dispositivo /-simo,/3, es el efecto del arreglo del sitio de trabajoy-simo,
es el
efecto del operador A:-simo dentro del nivel/-simo del arreglo del sitio de trabajo, (r/3),y es la interaccin
dispositivo X arreglo del sitio de trabajo, {ty)uc(j) es la interaccin dispositivo x operadores dentro del
arreglo del sitio de trabajo, y
es el trmino del error usual. Observe que no puede existir ninguna in
teraccin arreglo del sitio de trabajo x operador porque no todos los operadores usan todos los arreglos
del sitio de trabajo. Asimismo, tampoco puede haber ninguna interaccin dispositivo x arreglo del sitio
de trabajo x operador. En la tabla 13-10 se derivan los cuadrados medios esperados utilizando el algo
ritmo tabular del captulo 12. Esto produce el anlisis de un modelo mixto restringido. El estadstico de
prueba apropiado para cualquier efecto o interaccin puede encontrarse inspeccionando esta tabla.
Tabla 13-9

Datos del tiempo de ensamblaje del ejemplo 13-2


Arreglo 1

Operador
Dispositivos 1
Dispositivos 2
Dispositivos 3
Totales de los operadores,
Tbtales de los arreglos, Xj

Arreglo 2

y.-,.

22
24
30
27
25
21

23
24
29
28
24
22

28
29
30
32
27
25

25
23
27
25
26
23

26
28
29
28
27
25

27
25
30
27
26
24

28
25
24
23
24
27

24
23
28
30
28
27

404

149

150

171

149

163

159

151

160

619

633

447
401

1252 =y.

570

CAPTULO 13 DISEOS ANIDADOS Y DE PARCELAS SUBDIVIDIDAS

Tabla 13-10 Derivacin del cuadrado medio esperado del ejemplo 13-2

Factor

F
P
R
R
3_________________________ 2
4
i _______
_____________k_____________l

r,.
Pj

O
3

2
0

4
4

2
2

~
~
2
_____ Cuadrado medio esperado
.

o^+2al^+B^
(t'+6ct^' + 24^

Yi^u)

<r'+6<Ty"

(rk a )

a^ + 2 <

\____________ l _____________l______________________________
En la tabla 13-11 se muestra el anlisis de varianza completo. Se observa que los dispositivos de en
samblaje son significativos y que los operadores dentro de los arreglos del sitio de trabajo tambin difie
ren significativamente. Est presente tambin una interaccin significativa entre los dispositivos y los
operadores dentro de los arreglos del sitio de trabajo, indicando que los efectos de los diferentes disposi
tivos no son los mismos para todos los operadores. Los arreglos del sitio de trabajo parecen tener un efec
to reducido sobre el tiempo de ensamblaje. Por lo tanto, para minimizar el tiempo de ensamblaje, la
atencin debera centrarse en los dispositivos tipo 1 y 3. (Observe que los totales de los dispositivos de la
tabla 13-9 son menores para los tipos 1 y 3 que para el tipo 2. Esta diferencia en las medias del tipo de dis
positivo podra probarse formalmente utilizando comparaciones mltiples.) Adems, la interaccin entre
los operadores y los dispositivos implica que algunos operadores son ms eficientes que otros al utilizar
los mismos dispositivos. Quizs estos efectos operador-dispositivo podran aislarse y los operadores cuyo
desempeo es menos eficiente podran mejorar impartindoles capacitacin adicional.

Clculos
Hay varios paquetes de software de estadstica que analizan con facilidad diseos factoriales-anidados,
incluyendo Minitab y SAS. En la tabla 13-12 se presenta la salida de Minitab (Balanced ANOVA, anlisis
de varianza balanceado), suponiendo la forma restringida del modelo mixto, para el ejemplo 13-2. Los
cuadrados medios esperados de la parte inferior de la tabla 13-12 concuerdan con los que se derivaron
con el mtodo tabular de la tabla 13-10. Q [^, Q[Z] y Q[4] son los efectos del factor fijo para los arreglos
del sitio de trabajo, los dispositivos, y la interaccin arreglo del sitio de trabajo X dispositivo, respectiva
mente. Las estimaciones de los componentes de la varianza son:
Operador (arreglo):
crj = 1.609
Dispositivo X operador (arreglo):
7^ = 1.576
Error:
= 2.333
Tabla 13-11 Anlisis de varianza del ejemplo 13-2

Fuente de variacin
Dispositivos (F)
Arreglos (L)
Operadores (dentro de los arreglos), O (L)
FL
FO{L)
Error
Tbtal

Suma de
cuadrados
82.80
4.08
71.91
19.04
65.84
56.00
299.67

Grados de
libertad
2
1
6
2
12
24
47

Cuadrado
medio
41.40
4.09
11.99
9.52
5.49
2.33

F,
7.54
0.34
5.15
1.73
2.36

Valor P
0.01
0.58
<0.01
0.22
0.04

(Q

C.
O

- ^ M 00 00
00 O o ^ M
in O o 00 o

o o o o o
u- .J* -4- U- '4' lA
ro ^ in h- ro

o m r* t - M

co ro ^0 sO T- 'O K1
EOOOO o ^ r o O K
o CK rO lA '4* K>

<- OMA r\i

K>

H- '
0)
0 -o
c- o n
(D E c-

n
K> r-i
UJ Nt

3
LJ
U0 0

0 LJ

</) o; <4*
-M fM
C o
!- 4-

O &
T - OO
+

V t-

4-
V) (Nj rg
"O 4> wp w
t- %0 sO
4->
O + +
0^ C
X V) sO 'O

u M n lA
w w w
t\J fM (\J
+ + +
^ O ^

f\J OJ f\J

O
3

co ro h- rg (M ro o hto 00 T- O " - M o
O O
O OO o vo
*
O O
^ <Nj O
CO T- 'O
0^
CM

'i

(0
>
W) <\J ^ K)
4)
E
f*
-

4)
>
4>
U
V O

Q. 0)
>s K
1- H-

E 'U

O
"O X
C *1
<0 H-

*J

3
O
X
(0

u . 4 - sC r\j CM C4 - r hO
^ (M *Ht

u
O

L.
0 3 <0 D

O C. 4->
O X <D X
(D (0 a - i -

L.
<0
>

4-

HO

(0

Li. _J O ^

(0
c
<

0> 4^
O c
C 4)
(0 c
r~ O
t- a
E
> o
u

O
O
>o

3
O
X

O
X
(0
U
'w'

-1
0

Of 4-1 4^

u 3 (9
c- o 13X 0)
O fo a

w
c
o

0) 4->

c- (Q
3 c-

4<
3

O
0> 4^

O
X

(- (Q
3 C.

CD

4^ 0)

-1

C.

x a
o
cu .
o -)t 4)
4> C 4*^ ^
3 <0 3 3 3
0 C 4- O 4-
X Q> X X X
(Q a*** Q -1^

1 o Li. U LU

3
O

- <\J O ^ in sO

0)

X a
*- o
IJU^
0)
fi- <
Mfi3 3 3 1.
4^ O 4- O to
X X X c 4>
(Q
U 0

'O K>
h- ro
ro

1- fNJ

4-
3

O
X
(9

0>
u
c
(0

(/)
X

ES
c. r>j *0 (A (A >0
0)
4^

4-
3

(/>
o 4)

t.
V
c.
cUi

>
o

1O

C.
k
LU

571

JC
u
10
111

l
l
'r
s
o w rI - >

o.

1^ oo to 'O

't - T3 11

O a

00 - o

tu e

o o o o o

3 0> -v ^
vn
O* 4-* C4 fvj ro -4</> 0
^ l_J f_l

lA < O fM O

u_ ^ 00 lA ' t lA
fo ^ m r - ro
> *
0 fM h - * - fM

w> hO ^ ^ - 'O ro
c 00 00 <> fNj co m
0 0 ro lA
K>
S 1
^ f - ^ C M A <M

(. +
<D"O

n
'

* ,~ ^ s o

C L.
(D 4- + +
0>
E <y
^
C. lA LA
^ C "W 'M'
) 3 fSJ fM
4-*
u O) + +
OJ c

+ +
^
lA lA
w* w' w
AJ M M
+ + +

X <a ^ > 0 0 ' 0 ' O nO


yj
(NJ fM f\J

C-

3
rn
t
O

i/i

Q> T < 3

5?
'o;

w (NJ

'
'c

1/3

X)
U5
yC 0
a
<L>
C/3
CQ
03

ti
<

S "D
0 0)
T3 X
c
<0

>H
(0

e
_ _

lA lA lA 'O

UJ 4->
0) 4^
u c
c
(0 C
1 -0
t. Q.
(D E
> 0

ro
00

0)
U
c
(0
1^ .
u

ra

>
*0
<A

Q)
V
C3 (Q 3
0 - -M
>s 0> ><
<0 a_ i 0 li-

(0
X
*
<0
c
<

-M
3

X
CQ

<1^
3

^
V
3

X
l
-1
'<mf

- OJ 4^
C. <Q
3 t>M 0
x a
't-

i k -K
0 0)
4) 4- 4^ (- 4-> 0 3 ( Q 3 3 3 C - '
(.0^4-04-0(D
3>sOX>sX(-4-
0 <0 a * f - <0 - t . 0
M -IO U -^U -LU I-

'O fO
h - ro
ro
'
T - fsj

^
4^
3

4-

c.

4-*
(J
(D
Lb.

U - - nO A J O J A J n I ^
A
^ rg s t

4-
3

cd
-i
( u
\ TD
lya
a
c

572

Q> *D
a 0)
X
K .1S-

tS

a>
>
Oj

O
c
8
i
c3

13

<

N r - \J Ov lA sO 0
CO ^ O lA 0>
AJ

(0
>

'-a

4;
-T3

v> ro h - <M C4 K i 0 r v a e o T - o v '^ r o o ^


0 o ^ s * 0 00 0 0

U
-

</>

>s
R1
_l
w
^

4 4^
0
- (0
X
3 (0
4-> 0>
-1
x a
W
T- 0
<.
U. -|C
0 ^ * 0>
C 4- (3 <0 3 3 3 C0 t- 4-> 0 4J 0
>s 0> X >s X CCO a * r - J T* u
_| 0 Li- ^ U. Ui
- fNj ro

'O

573

13-4 DISEO DE PARCELAS SUBDIVIDIDAS

En la tabla 13-13 se presenta el anlisis de Minltab del ejemplo 13-2 utilizando la forma no restringida
del modelo mixto. Los cuadrados medios esperados de la parte inferior de esta tabla son ligeramente di
ferentes de los que se reportaron para el modelo restringido y, por lo tanto, la construccin de los estads
ticos de prueba ser ligeramente diferente para el factor operadores (arreglo). Especficamente, el
denominador del cociente F de los operadores (arreglo) es la interaccin dispositivos x operadores
(arreglo) del modelo restringido (12 grados de libertad para el error), y es la interaccin arreglo x dispo
sitivos en el modelo no restringido (2 grados de libertad para el error). Puesto que
^ dispositivos >
^ ^ d is p o s itiv o s X o p e ra d o r (a rre g lo )! Yt^ne menos grados de libertad, se encuentra ahora que el operador dentro del
efecto del arreglo slo es significativo en el nivel aproximado de 12% (el valor P fue 0.002 en el anlisis del
modelo restringido). Adems, la estimacin del componente de la varianza a] = 1.083 es menor. Sin em
bargo, puesto que est presente un efecto grande de los dispositivos y una interaccin dispositivos x ope
rador (arreglo) significativa, seguira sospechndose que existe un efecto del operador y, por lo tanto, las
conclusiones prcticas de este experimento no son afectadas mucho por elegir la forma restringida o la no
restringida del modelo mixto. Las cantidades Q[l, 4] y Q[3,4] son trminos cuadrticos del tipo fijo que
contienen el efecto de interaccin arreglos x dispositivos.
Si no se cuenta con un paquete de software especializado como SAS o Minitab, entonces puede usar
se un programa para analizar experimentos factoriales con factores anidados y factoriales. As, el experi
mento del ejemplo 13-2 podra considerarse como un factorial de tres factores, con los dispositivos (F),
los operadores (O) y los arreglos (L) como los factores. Entonces se agruparan ciertas sumas de cuadra
dos y ciertos grados de libertad para formar las cantidades apropiadas requeridas para el diseo con los
factores anidados y factoriales de la siguiente manera:
Aniisis factorial
Suma de cuadrados
SSy
SSl
SSfl
SSo
SSpQ
^^FOL
ss,,
SSr

U -4

Grados de
libertad
2
1
2
3
3
6
6
24
47

Anlisis factorial-anidado
Grados de
Suma de cuadrados
libertad
SS^
2
ss.
1
2
^^0(L) ~ SSq -HSSi^Q

^^FO(L) ~ SSfQ -HSSpoL

12

ss^
SSr

24
47

D IS E O DE PA RCELA S SU B D IV ID ID A S

En algunos experimentos factoriales con factores mltiples quiz no sea posible la aleatorizacin comple
ta del orden de las corridas. Esto suele resultar en una generalizacin del diseo factorial llamada diseo
de parcelas subdivididas.
Como un ejemplo, considere un fabricante de papel que est interesado en tres mtodos diferentes
para preparar la pulpa y cuatro temperaturas de coccin diferentes de la pulpa y que desea estudiar el
efecto de estos dos factores sobre la resistencia a la tensin del papel. Cada rplica de un experimento fac
torial requiere 12 observaciones, y el experimentador ha decidido correr tres rplicas. Sin embargo, la ca

574

CAPTULO 13 DISEOS ANIDADOS Y DE PARCELAS SUBDIVIDIDAS

pacidad de la planta piloto slo permite realizar 12 corridas por da, por lo que el experimentador decide
correr una rplica en cada uno de tres das y considerar los das o las rplicas como bloques. En un da lle
va a cabo el experimento de la siguiente manera. Se produce un lote de pulpa con uno de los tres mtodos
bajo estudio. Despus este lote se divide en cuatro muestras, y la coccin de cada muestra se hace con una
de las cuatro temperaturas. Entonces se produce un segundo lote de pulpa utilizando otro de los tres m
todos. Este segundo lote tambin se divide en cuatro muestras que se prueban con las cuatro temperatu
ras. Despus se repite el proceso, utilizando un lote de pulpa producido por el tercer mtodo. Los datos se
muestran en la tabla 13-14.
Inicialmente, esto podra considerarse un experimento factorial con tres niveles del mtodo de pre
paracin (factor^) y cuatro niveles de la tem peratura (factor B) en un bloque aleatorizado. Si ste fuera
el caso, entonces el orden de experimentacin dentro de cada rplica o bloque debera ser completamen
te aleatorizado. Es decir, dentro de un bloque debera seleccionarse aleatoriamente una combinacin de
tratamientos (un mtodo de preparacin y una temperatura) y obtener una observacin, despus debera
seleccionarse aleatoriamente otra combinacin de tratamientos y obtener una segunda observacin, y as
sucesivamente hasta que se hayan tomado las 12 observaciones en el bloque. Sin embargo, el experimen
tador no recab los datos de esta manera. l hizo un lote de pulpa y obtuvo observaciones para las cuatro
temperaturas de ese lote. Debido a la economa para preparar los lotes y al tamao de los lotes, sta es la
nica manera factible de correr este experimento. Un experimento factorial completamente aleatorizado
requerira 36 lotes de pulpa, lo cual es totalmente irreaHsta. El diseo de parcelas subdivididas requiere
slo tres lotes de pulpa por bloque (rpUca), en este caso 9 lotes en total. Evidentemente, el diseo de par
celas subdivididas ha dado como resultado una eficiencia experimental considerable.
El diseo utilizado en el ejemplo de la pulpa es de parcelas subdivididas. Cada rpUca o bloque del di
seo de parcelas subdivididas se divide en tres partes llamadas parcelas completas, y a los mtodos de
preparacin se les llama tratamientos principales o de parcelas completas. Cada parcela completa se di
vide en cuatro partes llamadas subparcelas (o parcelas subdivididas), y se asigna una tem peratura a cada
una de ellas. A la tem peratura se le llama el tratamiento de la subparcela. Observe que si estn presentes
otros factores no controlados o fuera del diseo, y si estos factores no controlados varan cuando los m
todos para preparar la pulpa se modifican, entonces cualquier efecto de los factores fuera del diseo so
bre la respuesta estar completamente confundido (o mezclado) con el efecto de los mtodos para
preparar la pulpa. Puesto que los tratamientos de las parcelas completas de un diseo de parcelas subdivi
didas estn confundidos con las parcelas completas y los tratamientos de las subparcelas no estn confun
didos, es mejor asignar el factor en el que haya mayor inters a las subparcelas, de ser posible.
Este ejemplo es bastante tpico de la forma en que se usan los diseos de parcelas subdivididas en un
ambiente industrial. Observe que, en esencia, los dos factores se apUcaron en tiempos diferentes. Por
consiguiente, un diseo de parcelas subdivididas puede considerarse como dos experimentos combina-

Tabla 13-14 El experimento de la resistencia a la tensin del papel


Rplica (o
bloque) 1
Mtodo de preparacin
de la pulpa_________
Tfemperatura (F)
30
34
29
200
35
41
26
225
250
37
.38
33
275
36
42
36

Rplica (o
bloque) 2

28
32
40
41

31
36
42
40

Rplica (o
bloque) 3

31
30
32
40

31
37
41
40

35
40
39
44

32
34
39
45

13-4 DISEO DE PARCELAS SUBDIVIDIDAS

575

dos o superpuestos entre s. Un experimento tiene el factor parcela completa aplicado a las unidades
experimentales grandes (o es un factor cuyos niveles son difciles de cambiar) y el otro experimento tie
ne el factor subparcela aplicado a las unidades experimentales ms pequeas (o es un factor cuyos niveles
son fciles de cambiar).
El modelo lineal para el diseo de parcelas subdivididas es
y =

+^

+y* + ( ^ ) .
= l, 2 ,..., r
(13-15)

HPy)k
k = l,Z ...,b

donde r y
representan la parcela completa y corresponden respectivamente a los bloques (o rpli
cas), a los tratamientos principales (factor^) y al error de la parcela completa [rplicas (o bloques) x A);
y Yk
(py)jk y
representan la subparcela y corresponden respectivamente al tratamiento de la
subparcela (factor 5 ), las rplicas (o bloques) x 5 y las interaccionesv45, y al error de la subparcela (blo
ques X AB ). Observe que el error de la parcela completa es la interaccin rplicas (o bloques) x ^4 y que
el error de la subparcela es la interaccin de tres factores bloques x AB. Las sumas de cuadrados para es
tos factores se calculan como en el anlisis de varianza de tres factores sin rplicas.
Los cuadrados medios esperados del diseo de parcelas subdivididas, con las rplicas o bloques alea
torios y los tratamientos principales y los tratamientos de subparcelas fijas, se derivan en la tabla 13-15.
Observe que el factor principal {A) de la parcela completa se prueba contra el error de la parcela comple
ta, mientras que el subtratamiento (B) se prueba contra la interaccin rplicas (o bloques) x subtratamientos. La in te r a c c i n ^ se prueba contra el error de la subparcela. Observe que no hay pruebas para
el efecto de la rplica (o bloque) (^4) o la interaccin rplica (o bloque) x subtratamiento (AC).
El anlisis de varianza de los datos de la resistencia a la tensin de la tabla 13-14 se resume en la tabla
13-16. Puesto que tanto los mtodos de preparacin como las temperaturas son fijos y las rplicas son
aleatorias, son aplicables los cuadrados medios esperados de la tabla 13-15. El cuadrado medio de los
mtodos de preparacin se compara con el cuadrado medio del error de la parcela completa, y el cuadra-

Tabb 13-15 Derivacin del cuadrado medio esperado del disefto de parcelas subdivididas
T
a
b
1
F
F
R
Factor
i
k
h
i
r,
1
a
b
1
Parcela completa

y*

(ty)*

Wsk

(yMiik

1
1

0
1

0
1

1
1

Subparcela

Cuadrado medio esperado


+ aba^

(J^ + ba^g

a^ + aal,

a (no estimable)

578

CAPTULO 13

DISEOS ANIDADOS Y DE PARCELAS SUBDIVIDIDAS

subtratamiento. Esta situacin tambin es similar a un snbmuestreo, como lo describe Ostle [92]. Supo
niendo que A y B son fijos, los cuadrados medios esperados en este caso son
E iM S ^ ) = a ] + n a l+
anT
E { M S ^ )= a l+ r m l+

E{M S e ) = o I

(13-18)

Por lo tanto, no hay pruebas para los efectos principales a menos que la interaccin sea insignificante. La
situacin es exactamente la de un anlisis de varianza de dos factores con una observacin por celda. Si
los dos factores son aleatorios, entonces los efectos principales pueden probarse contra la interaccin^^.
Si slo uno de los factores es aleatorio, entonces el factor fijo puede probarse contra la interaccin AB.
En general, si se analiza un diseo factorial y todos los efectos principales y las interacciones son sig
nificativos, entonces deber examinarse con atencin cmo se realiz realmente el experimento. Puede
haber restricciones sobre la aleatorizacin en el modelo que no se tomaron en cuenta en el anlisis y, por
consiguiente, los datos no debern analizarse como un factorial.
13.5
13-5.1

O T R A S V A R IA N T E S D EL D ISE O D E PA RCELA S SU B D IV ID ID A S
D iseo de parcelas subdivididas con m s de dos factores

En ocasiones se encuentra que la parcela completa o la subparcela contendrn dos o ms factores, dis
puestos en una estructura factorial. Como un ejemplo, considere un experimento conducido en un homo
para hacer crecer un xido en una oblea de silicio. Las variables de respuesta de inters son el espesor de
la capa de xido y la uniformidad de la capa. Hay cuatro factores del diseo: la tem peratura (A), el fiujo
de gas (B), el tiempo (C) y la posicin de la oblea en el hom o (D). El experimentador planea correr un di
seo factorial 2^ con dos rplicas (32 ensayos). Ahora bien, los factores A y B (la tem peratura y el flujo de
gas) son difciles de cambiar, mientras que C y D (el tiempo y la posicin de la oblea) son fciles de modifi
car. Esto lleva al diseo de parcelas subdivididas que se muestra en la figura 13-7. Observe que las dos r
plicas del experimento estn subdivididas en cuatro parcelas completas, cada una de las cuales contiene
una combinacin de los ajustes de la tem peratura y el flujo de gas. Una vez que se eligen estos niveles,
cada parcela completa se subdivide en cuatro subparcelas, y se realiza un diseo factorial 2^ en los facto
res tiempo y posicin de la oblea, donde las combinaciones de tratamientos de la subparcela se pm eban
en orden aleatorio. nicamente se hacen cuatro cambios de la tem peratura y del flujo de gas en cada r
plica, mientras que los niveles del tiemjx) y la posicin de la oblea estn completamente aleatorizados.
U n modelo para este experimento, consistente con la ecuacin 13-16, es

y^kbn =

+Pj +Yk H M j k +^ijk +<5/


H ^ )ji

+(y5)t +(<5-^)^ +(/3y<5);w


i = l, 2
7 = 1,2

fc = l, 2
1 = 1, 2
m = l, 2

(13-19)

13-5 OTRAS VARIANTES DEL DISEO DE PARCELAS SUBDIVIDIDAS


Bloque 1

579

Bloque 2

Parcela
completa

Subparcsia

o+p-

+<^

-'

-6-0
+ D

0-0

O-O

-o+
D

Figura 13-7 Diseo de parcelas subdivididas con cuatro factores del diseo, dos en la parcela completa y dos
en la subparcela.

donde r, representa el efecto de la rplica, y y*, los efectos principales de la parcela completa, 6jk es el
error de la parcela completa, , y representan los efectos principales de la subparcela y
es el error
de la subparcela. Se han incluido todas las interacciones entre los cuatro factores del diseo. En la tabla
13-17 se presenta el anlisis de varianza de este diseo, suponiendo que las rplicas son aleatorias y que
todos los factores del diseo son efectos fijos. En esta tabla, a] y a] representan las varianzas de los erro
res de la parcela completa y de la subparcela, respectivamente, a ^ es la varianza de los efectos de los bloTabla 13-17 Anlisis abreviado de un diseo de parcelas subdivididas con los factores A y B en las parcelas completas
Fuente de
variacin
Rplicas (t,)

Suma de
cuadrados
^^Rpcas

Grados de
libertad
1
1

SS,

AB
Error de la parcela completa (0,,*)

SSa.

ss^

C{d)

SSc

1
1

SS^

CD
AC
BC
AD
BD
ABC
ABD
ACD
BCD
ABCD
Error de la subparcela
Tbtal

SSco
SS^c
SS^
s s ,.
^^ABC
S^ABD
^^ACD
S S bcd
S S abcd

SSsf
SSr

1
1
1
1
1
1
1
1
1
1
12
31

Cuadrado medio esperado


<jf-l-16crJ
7 + 8 ct + A
ol+8al+ B
al+8al + AB
ol + 8a
gI+C
al + D
a]+CD
a] + AC
al+BC
o] + AD
al+BD
al + ABC
al+ABD
al+ACD
a^+BCD
a^, + ABCD

580

CAPTULO 13 DISEOS ANIDADOS Y DE PARCELAS SUBDIVIDIDAS

ques, y (para simplificar) se han usado letras maysculas latinas para denotar los efectos de tipo fijo. Los
efectos principales y la interaccin de la parcela completa se prueban contra el error de la parcela com*
pleta, mientras que los factores de la subparcela y todas las dems interacciones se prueban contra el
error de la subparcela. Si algunos de los factores del diseo son aleatorios, los estadsticos de prueba se
rn diferentes. En algunos casos no habr ninguna prueba F exacta y deber usarse el procedimiento de
Satterthwaite (descrito en el captulo 12).
Los experimentos factoriales con tres o ms factores en una estructura de parcelas subdivididas tien
den a ser experimentos bastante grandes. Por otra parte, la estructura de parcelas subdivididas con fre
cuencia facilita la realizacin de un experimento grande. Por ejemplo, en el caso del horno de oxidacin,
los experimentadores slo tienen que cambiar ocho veces los factores que son difciles de modificar {A y
B), por lo que quiz un experimento de 32 corridas no sea demasiado ilgico. Es posible reducir el nme
ro de corridas utilizando un factorial fraccionado para los factores del diseo de inters.

13-5.2

D iseo de parcelas con doble subdivisin

El concepto de diseos de parcelas subdivididas puede extenderse a situaciones en las que pueden ocurrir
restricciones sobre la aleatorizacin en cualquier nmero de niveles dentro del experimento. Si hay dos
niveles de restricciones sobre la aleatorizacin, al arreglo se le llama diseo de parcelas con doble subdi
visin. En el ejemplo siguiente se ilustra este diseo.

EJEM PLO 1 3 - 3 ................................................... ............................................................................................


Un investigador estudia los tiempos de absorcin de un tipo particular de cpsula de antibitico. Hay tres
tcnicos, tres concentraciones de la dosis y cuatro espesores de la pared de la cpsula. Cada rplica de un
experimento factorial requerira 36 observaciones. El experimentador se ha decidido por cuatro rplicas,
y es necesario correr cada rplica en un da diferente. Observe que los das pueden considerarse como
bloques. Dentro de una rphca (o un bloque) (da), el experimento se realiza asignando una unidad de
antibitico a un tcnico que lleva a cabo el experimento con las tres concentraciones de la dosis y los cua
tro espesores de la pared. Una vez que se ha formulado una concentracin particular de la dosis, se prue
ban los cuatro espesores de la pared con esa concentracin. Despus se selecciona otra concentracin de
la dosis y se prueban los cuatro espesores de la pared. Por ltimo se prueba la tercera concentracin de la
dosis y los cuatro espesores de la pared. Mientras tanto, otros dos tcnicos del laboratorio tambin siguen
el mismo plan, empezando cada uno con una unidad de antibitico.
Observe que hay dos restricciones sobre la aleatorizacin dentro de cada rplica (o bloque): el tcni
co y la concentracin de la dosis. Las parcelas completas corresponden al tcnico. El orden en que se asig
nan los tcnicos a las unidades de antibitico se determina aleatoriamente. Las concentraciones de la
dosis forman tres subparcelas. La concentracin de la dosis puede asignarse aleatoriamente a una subpar
cela. Por ltimo, dentro de una concentracin particular de la dosis se prueban los cuatro espesores de la
pared de la cpsula de manera aleatoria, formando cuatro sub-subparcelas. A los espesores de la pared
suele llamrseles sub-subtratamientos. Puesto que hay dos restricciones sobre la aleatorizacin en el ex
perimento (algunos autores dicen que hay dos divisiones en el diseo), al diseo se le llama diseo de
parcelas con doble subdivisin. En la figura 13-8 se Uustran las restricciones sobre la aleatorizacin y el
arreglo experimental de este diseo.

13-5 OTRAS VARIANTES DEL DISEO DE PARCELAS SUBDIVIDIDAS

581

Espesor de la pared

Antibitico
asignado a
un tcnico

Concentracin
de la dosis
elegida

Primera
restriccin
sobre la
aieatorizaoin

Segunda
restriccin
sobre la
aleatorizacln

Tcnico
2

1
Bloques

Concentracin
de la dosis

1
2
3
4

1
2
3
4

1
2
3
4

1
2
3
4

1
2
3
4

1
2
3
4

1
2
3
4

1
2
3
4

1
2
3
4

Espesor de
la pared

Espesor de
la pared

1
2
3
4

1
2
3
4

1
2
3
4

1
2
3
4

1
2
3
4

1
2
3
4

1
2
3
4

1
2
3
4

1
2
3
4

Espesor de
la pared

1
2
3
4

1
2
3
4

1
2
3
4

1
2
3
4

1
2
3
4

1
2
3
4

1
2
3
4

1
2
3
4

1
2
3
4

Espesor de
la pared

1
2
3
4

1
2
3
4

1
2
3
4

T
2
3
4

1
2
3
4

1
2
3
4

1
2
3
4

1
2
3
4

1
2
3
4

Figura 13-8 D iseo de parcelas con doble subdivisin.

Un modelo estadstico lineal para el diseo de parcelas con doble subdivisin es


y,jkh

+/3;
+Yk +(y)/;t H Py)jk
+ .+ (^ < 5 ),+ (^ ),,
+ (y)^ +(tr<5)/. H^y^)jkh
i = l, 2 , . . . , r

(13-20)
donde t y (r/3),j representan la parcela completa y corresponden a las rplicas o bloques, a los trata
mientos principales (factor>) y al error de la parcela completa [rplicas (o bloques) x A)], respectiva-

582

CAPITULO 13 DISEOS ANIDADOS Y DE PARCELAS SUBDIVIDIDAS

mente; y
(ry),*.,
y
representan la subparcela y corresponden al tratamiento de la
subparcela (factor 5 ), las interacciones de rplicas (o bloques) x B yA B , y al error de la subparcela, res
pectivamente; y y los parmetros restantes corresponden a la sub-subparcela y representan, respectiva
mente, al tratamiento de la sub-subparcela (factor C) y a las interacciones restantes. A la interaccin de
cuatro factores (r^y),j,y, se le llama el error de la sub-subparcela.
Suponiendo que las rplicas (bloques) son aleatorias y que los dems factores del diseo son fijos,
pueden derivarse los cuadrados medios esperados como se muestra en la tabla 13-18. Las pruebas de los
tratamientos principales, los subtratamientos, los sub-subtratamientos y sus interacciones son obvias al
inspeccionar esta tabla. Observe que no existen pruebas para las rplicas o bloques ni para las interaccio
nes en las que intervienen rplicas o bloques.
El anlisis estadstico de un diseo de parcelas con doble subdivisin es como el de una sola rplica de
un factorial de cuatro factores. El nmero de grados de libertad de cada prueba se determina de la mane
ra usual. Para ilustrar, en el ejemplo 13-3, donde se manejaron cuatro rplicas, tres tcnicos, tres concen
traciones de la dosis y cuatro espesores de la pared, se tendran slo (r - l)(fl - 1) = (4 - 1)(3 - 1) = 6
grados de libertad del error de la parcela completa para probar a los tcnicos. Se trata de un nmero rela
tivamente pequeo de grados de libertad, y el experimentador podra considerar el uso de rplicas adicioTabla 13-18 Derivacin del cuadrado medio esperado para el diseo de parcelas con doble subdivisin
c
a
b
F
F
F
R
Factor
k
h
Cuadrado medio esperado
i
-I- abcdol
Parcela completa

Pj
m j

Subparcela

+ bcaL

Yk

(jV)k

<5.

a ^+ acal,

b
b
(y)*.

(^<5),-w.

O
o

(M i

+
r a b ^ l

b
b

Sub-subparcela

rac^ yl

+ aba\
+
( f + ba%

(a -lX c -l)

<7^+ aa.
(ft-l)(c -l)

0
Si(ikh)

(no estimable)

13-5 OTRAS VARIANTES DEL DISEO DE PARCELAS SUBDIVIDIDA5

A^B,

A,S,

583

AjB,
Parcelas
en franjas

A3B,
Figura 13-9 Una rplica (bloque) de un di
seo de parcelas subdivididas en franjas.

nales para incrementar la precisin de la prueba. Si hay a rplicas, se tendrn 2(r - 1 ) grados de libertad
para el error de la parcela completa. Por lo tanto, cinco rplicas producirn 2(5 - 1 ) = 8 grados de liber
tad, seis rplicas producirn 2(6 --1) = 10 grados de libertad, siete rplicas producirn 2(7 - 1 ) = 12 gra
dos de libertad, etctera. Por consiguiente, es probable que el experimentador no quiera correr menos de
cuatro rplicas, ya que se produciran as slo cuatro grados de libertad. Cada rplica adicional permite
ganar dos grados de libertad para el error. Si se cuenta con recursos para correr cinco rplicas, la preci
sin de la prueba podra incrementarse en un tercio (de seis a ocho grados de libertad). Adems, al pasar
de cinco a seis rplicas, hay 25% de ganancia adicional en la precisin. Si los recursos lo permiten, el expe
rimentador deber correr cinco o seis rplicas.
13'5,3

D iseo de parcelas subdivididas en ^ n j a s

El diseo de parcelas subdivididas en franjas ha tenido una amplia aplicacin en las ciencias agrcolas,
pero slo ocasionalmente encuentra un uso en la experimentacin industrial. En el caso ms simple, se
tienen dos f a c t o r e s y B. El facto r^ se aplica a las parcelas completas como en el diseo de parcelas sub
divididas estndar. Despus el factor 5 se aplica a fira^jas (que son en reaUdad slo otro conjunto de par-

Fuente de
variacin

Suma de
cuadrados

Rplicas (0 bloques)
A

r~l
SS^

SSs

(r-l)(ft-l)

AB

(a-l)(f.-l)
SSsp
SSr

al + abal

c] + ba],

b -1

Error^ de la parcela completa

Error de la subparcela
Tbtal

Cuadrado medio esperado

a~l

(r-l)(a-l)

Error^ de la parcela completa


B

Grados de
libertad

('-!)( ~ l ) ( i '- l )
rab -1

(-i)(fc-i)

584

CAPTULO 13 DISEOS ANIDADOS Y DE PARCELAS SUBDIVIDIDAS

celas completas) que son ortogonales a las parcelas completas originales utilizadas para el factor^. En la
figura 13-9 se ilustra una situacin en la que los dos factores^ y B tienen tres niveles. Observe que los ni
veles del factoryi estn confundidos (o mezclados) con las parcelas completas, y que los niveles del factor
B estn confundidos con las franjas (las cuales pueden considerarse como un segundo conjunto de parce
las completas).
Un modelo para el diseo de parcelas subdivididas en franjas de la figura 13-9, suponiendo y rplicas,
a niveles del factor A y b niveles del factor B, es
= 1, 2 , . . . , r
yij, = /^+ h
H M j k +^.jk
\ j = ,2 ,...,a
[k = l , 2 , . . . , b
donde
y (ry),,. son los errores de la parcela completa de los factores^ y B, respectivamente, y Eyj, es el
error de la subparcela usado para probar la interaccinj4B, En la tabla 13-19 se muestra un anlisis de
varianza abreviado, suponiendo q u e ^ y B son factores fijos y que las rplicas son aleatorias. En ocasiones
las rplicas se consideran como bloques.

13-6

PR O B LEM A S

13-1. El fabricante de la carga propulsora de una turbina est estudiando la rapidez de combustin del propulsor
obtenido de tres procesos de produccin. Se seleccionan al azar cuatro lotes del propulsor de la salida de
cada proceso y se hacen tres determinaciones de la rapidez de combustin de cada lote. Los resultados se
presentan a continuacin. Analizar los datos y sacar conclusiones.

Lote

1
25
30
26

Proceso 1
2
3
15
19
17
28
14
20

4
15
16
13

1
19
17
14

Proceso 2
2
3
23
18
21
24
21
17

4
35
27
25

1
14
15
20

Proceso 3
2
3
35
38
54
21
24
50

4
25
29
33

13-2. Se estudia el acabado superficial de piezas metlicas fabricadas en cuatro mquinas. Se conduce un experi
mento en el que cada mquina es operada por tres operadores diferentes y se colectan y prueban dos ejem
plares de cada operador. Debido a la ubicacin de las mquinas, se usan operadores diferentes en cada
mquina, y los operadores se eligen al azar. Los datos se muestran en la tabla siguiente. Analizar los datos y
sacar conclusiones.

Operador

Mquina 1
2
3
1
94
46
79
62
74
57

1
92
99

Mquina 2
3
2
76
85
68
79

1
88
75

Mquina 3
2
3
53
46
56
57

1
36
53

Mquina 4
3
2
62
40
47
56

13-3. Un ingeniero de manufactura est estudiando la variabilidad dimensional de un componente particular que
se produce en tres mquinas. Cada mquina tiene dos mandriles, y se seleccionan al azar cuatro componen
tes de cada mandril. Los resultados se presentan a continuacin. Analizar los datos, suponiendo que las m
quinas y los mandriles son factores fijos.

13-6 PROBLEMAS
Mquina 1

1
12
9
11
12

Mandril

Mquina 2

2
8
9
10
8

1
14
15
13
14

585

Mquina 3

2
12
10
11
13

2
16
15
15
14

1
14
10
12
11

13-4. Para simplificar la programacin de la produccin, un ingeniero industrial est estudiando la posibilidad de
asignar un tiempo estndar a una clase particular de tareas, con la creencia de que las diferencias entre las ta
reas son insignificantes. Para ver si esta simplificacin es posible, se seleccionan seis tareas al azar. Cada ta
rea se encarga a un grupo diferente de tres operadores. Cada operador completa dos veces la tarea en
momentos diferentes durante la semana, y se obtienen los resultados siguientes. Qu conclusiones pueden
sacarse acerca del uso del tiempo estndar comn para todas las tareas de esta clase? Qu valor se usara
para el estndar?
Threa
1
2
3
4
5
6

Operador 2

Operador 1
159.4
154.9
162.6
158.7
158.1
161.0

158.3
154.6
162.5
160.0
156.3
163.7

159.2
157.7
161.0
157.5
158.3
162.3

Operador 3
158.9
154.8
160.5
161.1
157,7
162.6

159.6
156,8
158.9
158.9
156.9
160.3

157,8
156,3
159,5
158,5
156.9
161.8

13-5. Considere el diseo anidado de tres etapas que se muestra en la figura 13-5 para investigar la dureza de una
aleacin. Utilizando los datos que se presentan a continuacin, analizar el diseo, suponiendo que la qumi
ca de la aleacin y las hornadas son factores fijos y que los lingotes son aleatorios. Usar la forma restringida
del modelo mixto.
Qumica de la aleacin
1
2

Hornadas
1
Lingotes

1
40
63

2
27
30

1
95
67

3
2
69
47

1
65
54

2
2

1
2
78
45

1
22
10

2
23
39

1
83
62

3
2
75
64

1
61
77

2
35
42

13-6. Analizar nuevamente el experimento del problema 13-5 utilizando la forma no restringida del modelo mixto.
Comentar las diferencias que se observan entre los resultados del modelo restringido y el no restringido.
Puede usarse un paquete de software de computadora.
13-7. Derivar los cuadrados medios esperados para el diseo anidado balanceado de tres etapas, suponiendo que
A es fijo y que B yC son aleatorios. Obtener las frmulas para estimar los componentes de la varianza. Supo
ner la forma restringida del modelo mixto.
13-8. Repetir el problema 13-7 suponiendo la forma no restringida del modelo mixto. Puede usarse un paquete de
software de computadora para hacerlo. Comentar las diferencias entre el anlisis y las conclusiones del mo
delo restringido y el no restringido.
13-9. Derivar los cuadrados medios esperados para el diseo anidado balanceado de tres etapas si los tres factores
son aleatorios. Obtener las frmulas para estimar los componentes de la varianza.

586

CAPITULO 13 DISEOS ANIDADOS Y DE PARCELAS SUBDIVIDIDAS

13-10. Verificar los cuadrados medios esperados que se dan en la tabla 13-1.
13-11. Diseos anidados no balanceados. Considere un diseo anidado de dos etapas no balanceado con b niveles de
B bajo el nivel z-simo de ^ y n rplicas en la celda y-sima.
a) Anotar las ecuaciones normales de mnimos cuadrados para esta situacin. Resolver las ecuaciones nor
males.
b) Construir la tabla del anlisis de varianza para el diseo anidado no balanceado de dos etapas.
c) Analizar los datos siguientes, utilizando los resultados del inciso b.
Factor^
Factor B

1
2
-3
1 ,

1
6
4
8

2
2
2
4
3

1
5
7
9
6

3
1
0
-3

13-12. Componentes de la varianza en el diseo anidado no balanceado de dos etapas. Considere el modelo
z = l, 2, ..., a
- 1 , 2 ,...,b
k = l ,2 ,
nj
donde A y B son factores aleatorios. Demostrar que
E {M S^) = o^.+ c^a]+ c^al
=
+ c ,o l
E (M S ^ )= a ^
donde

1=1 \y=i

1=1 j=i
a -\

'

N
a -1

13-13. Un ingeniero de procesos est probando el rendimiento de un producto manufacturado en tres mquinas.
Cada mquina puede operarse con dos ajustes de la potencia. Adems, una mquina tiene tres estaciones en
las que se fabrica el producto. Se conduce un experimento en el que cada mquina se prueba con ambos ajus
tes de la potencia, y se toman tres observaciones del rendimiento de cada estacin. Las corridas se hacen en
orden aleatorio, y los resultados se presentan a continuacin. Analizar este experimento, suponiendo que los
tres factores son fijos.

13-6 PROBLEMAS

Estacin
Ajuste de la potencia 1
Ajuste de la potencia 2

1
34.1
30.3
31.6
24.3
26,3
27.1

Mquina 1____
2
3
33.7
36.2
34.9
36.8
35.0
37.1
28.1
25.7
29.3
26.1
28.6
24.9

1
31.1
33.5
34.0
24.1
25.0
26.3

Mquina 2
2
33.1
34.7
33.9
24.1
25.1
27.9

587

Mquina 3
3
32,8
35.1
34.3
26.0
27.1
23.9

1
32,9
33,0
33.1
24.2
26.1
25,3

2
33.8
33.4
32.8
23.2
27.4
28.0

3
33.6
32.8
31.7
24.7
22.0
24.8

13-14. Suponga que en el problema 13-13 podran emplearse un gran nmero de ajustes de la potencia y que los dos
que se selercionaron para el experimento se escogieron a] azar. Obtener los cuadrados medios esperados para
esta situacin suponiendo la forma restringida del modelo mixto y hacer las modificaciones apropiadas al
anlisis anterior.
13-15. Analizar nuevamente el experimemo del problema 13-14 suponiendo la forma no restringida del modelo
mixto. Puede usarse un paquete de software de computadora para hacerlo. Comentar las diferencias entre el
anlisis y las conclusiones del modelo restringido y el no restringido.
13-16. Un ingeniero de estructuras est estudiando la resistencia de una aleacin de aluminio adquirida de tres fa
bricantes. Cada fabricante entrega la aleacin en barras de tamao estndar de 1.0,1.5 o 2.0 pulgadas. El
procesamiento de los diferentes tamaos de las barras a partir de un lingote comn implica tcnicas diferen
tes de forjado, por lo que este factor puede ser importante. Adems, las barras se forjan de lingotes fabrica
dos en hornadas diferentes. Cada fabricante entrega dos ejemplares de prueba de cada tamao de las barras
de tres hornadas. Los datos de la resistencia resultantes se presentan a continuacin. Analizar los datos, su
poniendo que los fabricantes y el tamao de las barras son fijos y las hornadas son aleatorias. Usar la forma
restringida del modelo mixto.

Hornada
Thmao de la barra; 1 pulgada
1 j pulgadas
2 pulgadas

Fabricante 1
1
2
3
1.230 1.346 1.235
1.259 1.400 1.206
1.316 1.329 1.250
1.300 1.362 1.239
1.287 1.346 1.273
1.292 1.382 1.215

Fabricante 2
1
2
3
1.301 1.346 1.315
1.263 1.392 1.320
1.274 1.384 1.346
1.268 1.375 1.357
1.247 1.362 1.336
1.215 1.328 1.342

Fabricante 3
1
2
3
1.247 1.275 1,324
1.296 1,268 1.315
1,273 1.260 1.392
1.264 1.265 1.364
1.301 1.280 1.319
1.262 1.271 1.323

13-17. Resolver de nuevo el problema 13-16 utilizando la forma no restringida del modelo mixto. Puede usarse un
paquete de software de computadora para hacerio. Comentar cualquier diferencia entre el anlisis y las con
clusiones del modelo restringido y el no restringido.
13-18. Suponga que en el problema 13-16 las barras pueden adquirirse en muchos tamaos y que los tres tamaos
que realmente se utilizaron en el experimento fueron seleccionados al azar. Obtener los cuadrados medios
esperados para esta situacin y hacer las modificaciones apropiadas al anlisis anterior. Usar la forma res
tringida del modelo mkto.
13-19. La normalizacin del acero se hace calentndolo arriba de la temperatura crtica, recalentndolo y despus
enfrindolo con aire. Este proceso incrementa la resistencia del acero, refina el grano y homogeneiza la es
tructura. Se lleva a cabo un experimento para determinar el efecto de la temperatura y de la duracin del
tratamiento trmico sobre la resistencia del acero normalizado. Se seleccionan dos temperaturas y tres dura-

588

CAPTULO 13 DISEOS ANIDADOS Y DE PARCELAS SUBDIVIDIDAS

dones El experimento se realiza calentando el homo a una temperatura seleccionada aleatoriamente e in


sertando tres ejemplares de prueba. Despus de 10 minutos se retira uno de ellos, despus de 20 minutos se
retira un segundo ejemplar y despus de 30 minutos se retira el ltimo. Entonces se corre la temperatura al
otro nivel y se repite el proceso. Se requieren cuatro corrimientos para recabar los datos, los cuales se mues
tran abajo. Analizar los datos y sacar conclusiones, suponiendo que ambos factores son fijos.

Corrimiento
1

3
4

Tiempo, minutos
10
20
30
10
20
30
10
20
30
10
20
30

Tfemperatura, F
1600
1500
89
63
54
91
62
61
80
50
72
52
69
59
73
48
74
81
69
71
88
54
92
48
64
59

13-20. Se disea un experimento para estudiar la dispersin de los pigmentos de una pintura. Se estudian cuatro
mezclas diferentes de un pigmento particular. El procedimiento consiste en preparar una mezcla particular y
en aplicarla despus a un panel utilizando tres mtodos (con brocha, por roco y con rodillo). La respuesta
medida es el porcentaje de reflectancia (coeficiente de reflexin) del pigmento. Se necesitan tres das para
correr el experimento, y los datos obtenidos se presentan a continuacin. Analizar los datos y sacar conclu
siones, suponiendo que las mezclas y los mtodos de aplicacin son fijos.

Da
1

2
3

Mtodo de
aplicacin
1
2
3
1
2
3
1
2
3

1
64.5
68.3
70.3
65.2
69.2
71.2
66.2
69.0
70.8

Mezcla
3
2
74.1
66.3
73.8
69.5
78.0
73.1
73.8
65.0
74.5
70.3
79.1
72.8
72.3
66.5
75.4
69.0
80.1
74.2

4
66.5
70.0
72.3
64.8
68.3
71.5
67.7
68.6
72.4

13-21. Repetir el problema 13-20, suponiendo que las mezclas son aleatorias y que los mtodos de aplicacin son fi
jos.
.
^
13-22. Considere el diseo de parcelas con doble subdivisin del ejemplo 13-3. Suponga que este experimento se
conduce como se describe y que se obtienen los datos que se muestran en la siguiente tabla. Analizar los da
tos y sacar conclusiones.

13-6 PROBLEMAS

Rplicas
(o bloques)

Concentracin
de las dosis
Espesor de la pared
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4

1
2

95
104
101
108
95
106
103
109
96
105
106
113
90
100
102
114

71
82
85
85
78
84
86
84
70
81
88
90
68
84
85
88

108
115
117
116
110
109
116
110
107
106
112
117
109
112
115
118

96
99
95
97
100
101
99
112
94
100
104
121
98
102
100
118

Tcnico
2
2
3
70
84
83
85
72
79
80
86
66
84
87
90
68
81
85
85

108
100
105
109
104
102
108
109
100
101
109
117
106
103
110
116

589

3
2

95
102
105
107
92
100
101
108
90
97
100
110
98
102
105
110

70
81
84
87
69
76
80
86
73
75
82
91
72
78
80
95

100
106
113
115
101
104
109
113
98
100
104
112
101
105
110
120

13-23. Resolver nuevamente el problema 13-22, suponiendo que los tcnicos se eligen al azar. Usar la forma restrin
gida del modelo mixto.
13-24. Suponga que en el problema 13-22 se usaron cuatro tcnicos. Suponiendo que todos los factores son fijos,
cuntos bloques debern correrse para obtener un nmero adecuado de grados de libertad para probar las
diferencias entre los tcnicos?
13-25. Considere el experimento que se describe en el ejemplo 13-3. Demostrar cmo se determinara el orden en
que se corren la combinaciones de tratamientos si este experimento se realizara como a) una parcela con do
ble subdivisin, b) una parcela subdividida, c) un diseo factorial en un bloque aleatorizado y d) un diseo
factorial completamente aleatorizado.

Otros tpicos
de diseo y
anlisis

El tema de los experimentos diseados estadsticamente es muy amplio. En los captulos previos se ha
ofrecido una presentacin introductoria de muchos de los conceptos y mtodos bsicos, aunque en algu
nos casos slo se ha podido presentar un panorama general. Por ejemplo, hay exposiciones que ocupan un
libro sobre tpicos, como la metodologa de superficies de respuesta, los experimentos con mezclas, la es
timacin de los componentes de la varianza y los diseos ptimos. En este captulo se presenta un panora
ma general de varios tpicos ms que el experimentador puede encontrar potencialmente tiles.

14-1
14'1.1

R E SPU ESTA S Y T R A N S FO R M A C IO N E S N O N O R M A LES


Seleccin de u n a transform acin; el m todo de Box-Cox

En la seccin 3-4.3 se estudi el problema de una varianza no constante de la variable de respuestay en


un experimento diseado, y se seal que se trata de una desviacin de los supuestos del anlisis de va
rianza estndar. Este problema de la desigualdad de la varianza ocurre con relativa frecuencia en la
prctica, muchas veces en conjuncin con una variable de respuesta no normal. Algunos ejemplos in
cluiran el conteo de defectos o partculas, los datos de proporciones, como el rendimiento o la propor
cin de productos defectuosos, o una variable de respuesta que sigue alguna distribucin sesgada (una
cola de la distribucin de la respuesta es ms larga que la otra). Se introdujo la transform acin de la
variable de respuesta como un mtodo apropiado para estabihzar la varianza de la respuesta. Se revisa
ron dos mtodos para seleccionar la forma de la transformacin, una tcnica grfica emprica y un pro
cedimiento esencialmente de ensayo y error en el que el experimentador simplemente intenta una o
ms transformaciones, y selecciona la que produce la grfica ms agradable o satisfactoria de los residua
les contra la respuesta ajustada.
En general, las transformaciones se usan para tres propsitos: estabilizar la varianza de la respuesta,
hacer que la distribucin de la variable de respuesta est ms cerca de la distribucin normal y mejorar el
ajuste del modelo a los datos. Este ltimo objetivo podra incluir la simphficacin del modelo, por ejem-

590

14-1 RESPUESTAS Y TRANSFORMACIONES NO NORMALES

591

po, eliminando trminos de interaccin. En ocasiones, una transformacin ser razonablemente eficaz
para conseguir de manera simultnea ms de uno de estos objetivos.
Se ha sealado ya que la familia de potencias de las transformaciones^*' = / es muy til, donde Aes el
parmetro de la transformacin que habr de determinarse (por ejemplo A = j significa usar la raz cua
drada de la respuesta original). Box y Cox [15] han indicado cmo puede estimarse el parmetro de la
transformacin A al mismo tiempo que los dems parmetros del modelo (la media global y los efectos de
los tratamientos). La teora fundamental en su procedimiento utiliza el mtodo de mxima verosimilitud.
El procedimiento de clculo real consiste en efectuar, para varios valores de A, el anlisis de varianza es
tndar de
y^-l
^
Xy^-^
^hiy

A^ O

A= 0

(14-1)

donde y = ln'[(l/) 2 Iny] es la media geomtrica de las observaciones. La estimacin de mxima verosi
militud de Aes el valor para el que la suma de cuadrados del error, por ejemplo 55^(A), es un mnimo. Este
valor de A se encuentra generalmente construyendo una grfica de 55^(A) contra Ay leyendo despus en la
grfica el valor de A que minimiza 55(A). En general, son suficientes entre 10 y 20 valores de A para esti
mar el valor ptimo. Si se necesita una estimacin ms precisa de A, podra realizarse una segunda itera
cin utilizando un nmero mayor de valores.
Observe que no es posible seleccionar el valor de A comparando directamente las sumas de cuadrados
del error obtenidas en los anlisis de varianza d e / , ya que para cada valor de A la suma de cuadrados del
error se mide en una escala diferente. Adems, surge un problema cony cuando A = 0; a saber, cuando A
tiende a c e r o ,/ tiende a la unidad. Es decir, cuando A = O, todos los valores de la respuesta son una cons
tante. El componente (y^- 1)/A de la ecuacin 14-1 alivia este problema porque cuando Atiende a cero, (y^
- 1)/A tiende a un lmite de \ny. El componente del divisor _y^ - 1 de la ecuacin 14-1 reescala las respues
tas para que las sumas de cuadrados del error sean comparables directamente.
Al utilizar el mtodo de Box-Cox, se recomienda que el experimentador use elecciones simples de A,
ya que es probable que la diferencia prctica entre A = 0.5 y A = 0.58 sea pequea, pero la transformacin
de la raz cuadrada (A = 0.5) es mucho ms fcil de interpretar. Obviamente, los valores de Aprximos a la
unidad sugeriran que no es necesaria ninguna transformacin.
Una vez que se ha seleccionado un valor de A por el mtodo de Box-Cox, el experimentador puede
analizar los datos utilizan d o / como la respuesta, a menos desde luego que A = O, en cuyo caso se usa Iny.
Es perfectamente aceptable utilizar y^^^ como la respuesta real, aun cuando las estimaciones de los par
metros del modelo tendrn una diferencia de escala y un corrimiento del origen en comparacin con los
resultados obtenidos cuando se usa / (o In y).
Es posible encontrar un intervalo de confianza aproximado de 100(1 - a ) por ciento para A calcu
lando
55* = 55(A)

t^
(14-2)

donde v es el nmero de grados de libertad, y graficando una recta paralela al eje A a la altura SS* sobre la
grfica de 55^(A) contra A. Entonces, al localizar los puntos sobre el eje A donde SS* corta la curva SS^(X),
pueden leerse directamente en la grfica los lmites de confianza para A. Si este intervalo de confianza in
cluye el valor A = 1, esto implica (como se seal antes) que los datos no soportan la necesidad de una
transformacin.

592

CAPTULO 14 OTROS TPICOS DE DISEO Y ANLISIS

EJEM PLO ..................................................................................................................................................


El procedimiento de Box-Cox se ilustrar utilizando los datos de la descarga pico presentados original
mente en el ejemplo 3-5. Recuerde que se trata de un experimento con un solo factor (ver la tabla 3-7
para los datos originales). Utilizando la ecuacin 14-1 se calcularon los valores de
para varios valo
res de A:

X
-1,00
-0.50
-0.25
0,00
0.25
0.50
0.75
1.00
1.25
1.50

ss^(A)
7922.11
687.10
232.52
91.96
46.99
35,42
40.61
62,08
109,82
208.12

En la figura 14-1 se muestra una grfica de los valores prximos al mnimo, en la que se observa que
X =^0.52 produce un valor mnimo de aproximadamente SS e{X) = 35.00. Un intervalo de confianza aproxi
mado de 95% paraA se encuentra calculando la cantidad SS* de la ecuacin 14-2 de la siguiente manera:
SS' = SS^{X) l-t= 35.00 H-

t 0.025,20
,20

(2.086)"
20

= 42.61
Al representar SS* en la grfica de la figura 14-1 y al leer los puntos de la escala Adonde esta recta mterseca la curva, se obtienen los lmites de confianza inferior y superior de A de A = 0.27 y A^ = 0.77. Puesto que
estos lmites de confianza no incluyen el valor 1, es correcto el uso de una transformacin, y la transforma
cin de la raz cuadrada (A = 0.50) que se us en realidad se justifica con facilidad.

Algunos programas de computadora incluyen el procedimiento de Box-Cox para seleccionar una


transformacin de la familia de potencias. En la figura 14-2 se presenta la salida de este procedimiento
como se implementa en Design-Expert para los datos de la descarga pico. Los resultados concuerdan en
gran medida con los clculos manuales resumidos en el ejemplo 14-1. Observe que la escala vertical de la
grfica de la figura 14-2 es ln[5S(A)].

144 RESPUESTAS Y TRANSFORMACIONES NO NORMALES

X- = 0,27

=0.77

Figura 14-1 Grfica de SS^(X) contra A para el ejemplo


14-1.

Grfica de Box-Cox transformaciones de potencias


Grfica de DESIGN-EXPERT
Descarga pico
L^mbda
Corriente
Mejor = 0.541377
Intervalo de confianza
bajo = 0.291092
intervalo de confianza
alto = 0.791662
Transformacin
recomendada
Raz cuadrada
(Lambda = 0.5)

20.32

16.14

11.95

5
7.76 -

3,58

Figura 14-2 Salida de Design-Expen para el procedimiento de Box-Cox.

593

594
14'1.2

CAPTULO 14

OTROS TPICOS DE DISEO Y ANLISIS

M odelo lineal generalizado

Con frecuencia las transformaciones de datos son una forma muy eficaz de abordar el problema de las
respuestas no normales y de la desigualdad asociada de la varianza. Como se ha visto en la seccin ante
rior, el mtodo de Box-Cox es una forma sencilla y eficaz de seleccionar la forma de la transformacin.
Sin embargo, puede haber problemas asociados con el uso de una transformacin de datos.
Un problema es que el experimentador puede sentirse incmodo al trabajar con la respuesta en la es
cala transformada. Es decir, el experimentador se interesa en el nmero de defectos, no en la raz cuadra
da del nmero de defectos, o en la resistividad en lugar del logaritmo de la resistividad. Por otra parte, si
una transformacin en realidad tiene xito y mejora el anlisis y el modelo asociado de la respuesta, los
experimentadores adoptarn por lo general con rapidez la nueva mtrica.
Un problema ms serio es que una transformacin puede resultar en un valor sin sentido para la va
riable de respuesta en alguna porcin del espacio de los factores del diseo que es de inters para el expe
rimentador. Por ejemplo, suponga que se ha usado la transformacin de la raz cuadrada en un
experimento que incluye el nmero de defectos observados en obleas de semiconductores, y para alguna
porcin de la regin de inters la raz cuadrada predicha del conteo de defectos es negativa. Es probable
que esto suceda en situaciones en las que el nmero real de defectos observados es pequeo. Por consi
guiente, el modelo del experimento ha producido una prediccin evidentemente no confiable justo en la
regin donde sera deseable que este modelo tuviera un buen desempeo predictivo.
Por ltimo, como se seal en la seccin 14-1.1, es frecuente el uso de transformaciones a fin de esta
bilizar la varianza, inducir la normalidad y simplificar el modelo. No existe la seguridad de que una trans
formacin conseguir eficazmente todos estos objetivos al mismo tiempo.
Una alternativa del enfoque tpico de la transformacin de datos seguida del anlisis estndar de m
nimos cuadrados de la respuesta transformada es usar el modelo lineal generalizado. Se trata de un enfo
que desarrollado por Nelder y Wedderburn [87] que en esencia unifica modelos lineales y no lineales con
respuestas normales y no normales. McCullagh y Nelder [76] ofrecen un completo estudio de los modelos
lineales generalizados y Myers y Montgomery [85b] proporcionan un tutorial. Tambin se presentan deta
lles adicionales en el material suplementario del texto de este captulo. Se ofrecer un panorama general
de los conceptos y se ilustrarn con dos ejemplos breves.
Un modelo lineal generalizado es bsicamente un modelo de regresin (el modelo de un diseo expe
rimental tambin es un modelo de regresin). Como todos los modelos de regresin, est constituido por
un componente aleatorio (lo que se ha llamado generalmente el trmino del error) y una funcin de los
factores del diseo (lasx) y algunos parmetros desconocidos (lasS). En un modelo de regresin lineal de
la teora normal estndar se escribe
y=

(14-3)

donde se supone que el trmino del error tiene una distribucin normal con media cero y varianza cons
tante, y la media de la variable de respuesta y es
E(y) = /^ =

+ M + ^ 2^2 +

(14-4)

A la parte x'/J de la ecuacin 14-4 se le llama predictor lineal. El modelo lineal generalizado contiene la
ecuacin 14-3 como un caso especial.
En un modelo lineal generalizado, la variable de respuesta puede tener cualquier distribucin que
sea un miembro de la familia exponencial. Esta famiha incluye las distribuciones normal, de Poisson, bi-

144 RESPUESTAS Y TRANSFORMACIONES NO NORMALES

595

nomal, exponencial y gamma, por lo que la familia exponencial es una coleccin rica y flexible de distri
buciones aplicables en muchas situaciones experimentales. Adems, la relacin entre la media de la
respuesta y el predictor lineal x'fi se determina por una funcin de enlace.
g(M )= x'0

(14-5)

El modelo de regresin que representa la respuesta media est dado entonces por
E(y) = fi = g -\x 'P )

(14-6)

Por ejemplo, a la funcin de enlace que lleva al modelo de regresin lineal ordinario en la ecuacin 14-3
se le llama enlace identidad, ya que // =
= x'fi. Como otro ejemplo, el enlace log (logartmico)
ln(A) = x'^

(14-7)

produce el modelo
=

(14-8)

El enlace logartmico se usa con frecuencia con datos de conteos (respuesta de Poisson) y con respuestas
continuas que presentan una distribucin que tiene una cola larga a la derecha (la distribucin exponen
cial o gamma). Otra funcin de enlace importante que se usa con datos binomiales es el enlace logit
In

= x'P

(14-9)

Esta eleccin de la funcin de enlace lleva al modelo


(W-10)
Hay muchas elecciones posibles de la funcin de enlace, pero debe ser siempre montona y diferenciable.
Observe asimismo que en un modelo lineal generalizado, la varianza de la variable de respuesta no tiene
que ser una constante; puede ser una funcin de la media (y de las variables predictoras a travs de la fun
cin de enlace). Por ejemplo, si la respuesta es de Poisson, la varianza de la respuesta es exactamente
igual a la media.
Para usar un modelo lineal generalizado en la prctica, el experimentador debe especificar una distri
bucin de la respuesta y una funcin de enlace. Despus se hace el ajuste del modelo o la estimacin de
los parmetros por el mtodo de mxima verosimilitud, el cual para la familia exponencial resulta ser una
versin iterativa de los mnimos cuadrados ponderados. Para los modelos de regresin lineal o de diseos
experimentales ordinarios con una variable de respuesta normal, esto se reduce a los mnimos cuadrados
estndares. Utilizando un enfoque que es anlogo al anlisis de varianza de datos de la teora normal,
pueden hacerse inferencias y la verificacin de diagnsticos para un modelo hneal generalizado. Referir
se a Myers y Montgomery [85b] para los detalles y ejemplos. Dos paquetes de software que soportan el
modelo lineal generalizado son SAS (PROC GENMOD) y S-PLUS.

EJEM PLO 1 4 - 2 ...............................................................................................................................................


El experimento de los defectos en las rejillas
En el problema 8-29 se introdujo un experimento para estudiar los efectos de nueve factores sobre los de
fectos en rejillas de planchas moldeadas de recuadros abiertos. Bisgaard y Fuller realizaron un interesan
te y litil anlisis de estos datos para ilustrar el valor de la transformacin de datos en un experimento

asooi-HvS^ii/Sa\oo^or<it^r4r^i-HO

T f - ON

1'I

es es

VD lO

On

a\ ^
T 1 e s e s

t-H

T-

od d
1 1 -H

^^OOOOOOOO^OO
oos '!t
o\ ICNOOCNO
'r^om^o^'rJfoc^o^cna^loc<>
i-H^fSodrodr-'OT-HOfncscnr4^o
'^'TH
r .r . r . r . '^ ^
r.^
r^*^
i n^ ^^ot>or*' ^ i O ^ o o ^*^cN
- ^ Co\' ^oC S,^'^
^ C S,Hs
^ Oo>
'<7^^ 00
' ^ ww
o r 4ww
d rcvl
4 ' t 00
^ d c 5 r H ' ^ ^'iTi^ o d

S
=3

o
^ a^
S 00 es 00 >

.1-Ho^ 'O
T-H00 1-H00 es

1
00 o \
CT\irj00 T
T

(T

1
-5o fH 00 d d
t
-H
tH d d 1

T
iooO^ oO^T
i io ^ ' o o N o a N O i ^ ' ^
vdt*^t^Osr^ov\Di>ioddrSdc<S^nd
rf^ (M
r.'^^ r. c<ir.* r. *
^
' vS^a\
\o i/^^ 0 \ tT
O -rH O ^
\0 \c
-^N\D SO
d.:^.d,:^

^ ^ooo^ooo^'^^r-.

ro

00
r^ vo 00
t-^
t-Hro
HI
1-Hrn tT

a.

'I

O
t
*oO<NoO<NV:)^c^ONt
is.o^'iDrOON
oomoo'^oOTfoOfn
^ oocooqo^oq^oq
' 0 /Sr4^ r 4 ^ ' o v S r 4 d r ^ ' r c ^ ^ c s d
o
t-T [C ^ Tt'd' 00 C^"rH irTr-Txn 00 es
T-H^T-ir^T-Hr^^vccNoo^^'j^^CNoq
^ H d.H.P.r^.Tt.r^.Q .t-h
d ^ p ^^^^ 1-jH
I

ou^<NV^O/^ptoosc;^osioasinp_5
ocsr^(N r--ow -joot^o^ooo^
vSc^^rni-Hrnt/rnr-^T-cnrHcOT-H'^

i-H(Nfn'^tn'cr^oo^c>^fS(nTj-vn'0
3

596

H 'l RESPUESTAS Y TRANSFORMACIONES NO NORMALES

597

diseado. Como se seal en el inciso/del problema 8-29, los autores utilizaron una modificacin de la
transformacin de la raz cuadrada que llev al modelo
= 2.513- 0.996X, - l . l l x , - 0.772x^ x,
donde, como de costumbre, las x representan los factores del diseo codificados. Esta transformacin
hace un excelente trabajo para estabilizar la varianza del nmero de defectos. En las dos primeras seccio
nes de la tabla 14-1 se presenta parte de la informacin acerca de este modelo. Bajo el encabezado
Ti-ansformados, la primera columna contiene la respuesta predicha. Observe que hay dos valores predichos negativos. El encabezado No transformados presenta los valores predichos no transformados, jun
to con los intervalos de confianza de 95% para la respuesta media en cada uno de los 16 puntos del diseo.
Puesto que hubo algunos valores predichos negativos, as como lmites de confianza inferiores negativos,
no fue posible calcular los valores de todas las entradas de esta seccin de la tabla.
La respuesta es en esencia una raz cuadrada del conteo de los defectos. Un valor predicho negativo
es claramente ilgico. Observe que esto ocurre donde los conteos observados fueron pequeos. Si es im
portante usar el modelo para predecir el desempeo en esta regin, el modelo puede ser no confiable.
Esto no deber tomarse como una crtica del experimento original ni del anlisis de Bisgaard y Fuller. Fue
un experimento de exploracin en extremo exitoso que defini con toda claridad las variables importan
tes del proceso. La prediccin no fue una de las metas originales, y tampoco fue el objetivo del anlisis
realizado por Bisgaard y Fuller.
Sin embargo, si hubiera sido importante obtener un modelo de prediccin, probablemente un modelo
lineal generalizado habra sido una buena alternativa para el enfoque de la transformacin. Myers y
Montgomery usan un enlace log (logartmico) (ecuacin 14-7) y una respuesta de Poisson para ajustar
exactamente el mismo predictor lineal dado por Bisgaard y Fuller. Esto produce el modelo
p ^

- 1 -1 7 6 j j - 0 .7 3 7 ijJi)

La tercera seccin de la tabla 14-1 contiene los valores predichos de este modelo y los intervalos de
confianza de 95% para la respuesta media en cada punto del diseo (obtenida con el procedimiento
PROC GENMOD de SAS). No hay valores predichos negativos (lo cual se asegura con la eleccin de la
funcin de enlace) ni lmites de confianza inferiores negativos. En la ltima seccin de la tabla se compa
ran las longitudes de los intervalos de confianza de 95% para la respuesta no transformada y el modelo li
neal generalizado (GLM). Observe que los intervalos de confianza del modelo lineal generalizado son
uniformemente ms cortos que sus contrapartes de mnimos cuadrados. Esto es un slido indicio de que
el enfoque del modelo lineal generalizado ha explicado la variabilidad y ha producido un modelo superior
en comparacin con el enfoque de la transformacin.

EJEM PLO 1 4 - 3 ...............................................................................................................................................


1 experimento del hilado de estambre
En la tabla 14-2 se presenta un diseo factorial 3^ que se realiz para investigar el desempeo de un hilado
de estambre bajo ciclos de carga repetida. El experimento se describe completo en Boxy Draper [16b]. La
respuesta es el nmero de ciclos hasta una falla. De manera tpica, los datos de confiabilidad como stos
son no negativos y continuos, y con frecuencia tienen una distribucin con una cola derecha alargada.
Los datos se analizaron inicialmente utilizando el enfoque estndar (mnimos cuadrados), y la trans
formacin de datos fue necesaria para estabilizar la varianza. Se encuentra que el logaritmo de los datos

598

CAPTULO 14 OTROS TPICOS DE DISEO Y ANLISIS


Tabla 14-2

Corrida
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27

El experimento del hilado de estambre

^1
1
-1
-1
-1
-1
-1
-1
-1
-1
0
0
0
0
0
0
0
0
0
1
1
1
1
1
1
1
1
1

Xj
-1
-1
-1
0
0
0
1
1
1
-1
-1
-1
0
0
0
1
1
1
-1
-1
-1
0
0
0
1
1
1

1
1
-1
1
-1
1
-1
1
-1
1
1
1
-1
1
-1
1
-1
0
1

Celos hasta
una falla
674
370
292
338
266
210
170
118
90
1414
1198
634
1022
620
438
442
332
220
3636
3184
2000
1568
1070
566
1140
884
360

Logaritmo
de los ciclos
hasta una falla
2.83
2.57
2.47
253
2.42
2.32
2.23
2.07
1.95
3.15
3.08
2.8
3.01
2.79
2.64
2.65
2.52
2.34
3.56
3.5
3.3
3.19
3.03
2.75
3.06
2.95
2.56

de los ciclos hasta una falla produce un modelo adecuado en trminos del ajuste global del modelo, as
como grficas satisfactorias de los residuales. El modelo es
logy= 2.751+ 0.3617;tj - 0.2739^:2 - 0.1711:^3
o en trminos de la respuesta original, ciclos hasta una falla,
j)= 2q2-751+0.36171, -.2739i2-0.mij3
Este experimento se analiz tambin utilizando el modelo lineal generalizado, seleccionando la dis
tribucin gamma para la respuesta y el enlace log (logartmico). Se us exactamente la misma forma del
modelo encontrada por el anlisis de mnimos cuadrados de la respuesta con la transformacin logartmi
ca. El modelo que result es
y= e^'

Ii - O-6313 - 0.38511,

En la tabla 14-3 se presentan los valores predichos del modelo de mnimos cuadrados y del modelo lineal
generalizado, junto con los intervalos de confianza de 9^% para la respuesta media de cada uno de los 27

.ONOoo^r<>^csi/^oopgNONor''^
O fnooooovni-H ^'0
!op>i^^^or4^^0'!Tprnt^oqt^i-HHooc5G50oqr^^oo

II

1^

c
00

<s ^ ^

O '0v% '5t< N <N f^^'

Nr-r'OOONr<>^c^r-r^cNP>r^pn-.
o 00 'Si
g-o r-r>g>O
'OtOt^^<^a^^<^^J:^\o^^0^t^'lr^^c^00CNC7^00r^llnC7^ ?3: lo O
t^NiOoor^t^oor^ooo' Si-uSc^od^ooi<<NTHO<HcK'0^ H
't^ooooor-)r-'
nio<Nr^^O0 /^Q^
fN ^ I-H ^
C S fS ^
^

i 2

S g

<S^^r^^OO^CSOO^;^00^' !t0Q r- o o o o o O O
1/^
N^'!trnvr}i-;f-vcr<^op'!Tpm^n^^CN es o o P P P p p
^
' iScSC^OmoHKoOOONOt--^ o c<
S ^ri o o wS e<S o
-S e
S?
^ ^ r-t-' \T '*D^t-'ONN^OOvOOC^f<^OcnOC^ es H c
oQ ONes 't
OS
1-Hes 1-H ^ r,
4>^
oT
vi
v
rT
t-^
oC
en
r-"
u
-T
t*^
't'^
^
ro
,^ O
So\
*0 o^ 00 es ^i>irj'5'.q'^ooo<Nr^\qvo'^oo
lo ONo^ es
s
cHt-^
in P
(S ^ s s s s ^
P
<N
00 o r^^<N'^'^
'r^O<N
o \- i>r^
c 3 es Q d
es T-f
t '*^ir)f^u^t5N
' r.........
- m
- s
- S2S o ^ C
a ^
V) ^ ' ->...............
-- - - m
e
a^ \.o 5
l> po.ww
^ ^ N ^o S

^^

ll

.5

ll

c s o ^ s C ' . p w ^ e s o o ( S O O O T t t - * o o r - t - - v > o o o o o ^ o ^ >


v ^ o o a N M i n w ^ O N ^ o o v % ' n o o o o ^ O N O o o o o r ) O f o" V)
or^io^vcr-'f^o
o
c ^ i r ^ v i < f s i o 0 N O t r i i - O ' - 5 0 N i > ^ v d i > 0 N e S * 0 0 f H 0 d ' 0 d
oo'O^^Tt'^ONr^
j t - f ^ ^ f - q O T t o Q r - a N a v v ^ f S o m o o o

<T5

es


^N.o^'.oo\e^ONor-'Tf
ofcKo6r^P5<^

>V
I

1-Hirj 1-H^
**m \o
0\ es
ON es
Tf es
es
r 1-T oo en ^ O
**v*T
>o O
s en O
Nto o
1K o r*Si> es es
Hes
i-H^
so
Os ^ rro
^ '

CS ^ ^ 1-^

o CTN^ 1-H 00 r-*


ON r-- r-- o^ es o^
\H
^
^ f. . *vcT rn
1-H <
T
iT
-l f- C\
O
N'Oin oq ^ c
SiO (S e^ 0^ CT^ ON

2 i2 {Co3 w

O^OOO^O'.OQe^OOeSOQOQf- -^^o^enlo^T-^00VJ000^t^v^^/^^
oesr^csavr5*^f*^aN?5?3sC'!throo'.qoqi-H^oqe^^oqe^^iOr^^ON
1-H I
<sddf^^*Hf!SdHo^odfn^oro^ ON es ^
fS
ON es
o o
^ ^
s) I(
so ^ e ^ e ^ C N ^ '-H ^
lO O
00
fO

|^

TT<fnt--eS'oQsooor'Oqor4
^t--w^\.0'TCSroi-^o^o^^CT^C^'^Dl-'^^Je^vor^esr^T-^oo^t'

cses<NeseseseseSSrnf*SesHeses r4eSS ror<Sr^e<c^e^e^esr<


C5
1-Hlo
r<r c-^ ctT r- es" e^ oo f<r f oo" r
es" ^ oo n r-" oC
t-;\o^w^e^^esoooi-'Ovr-'Oor-^ioiO
^eSTff<^iicNoqoONt-->/^
eseseseS(SeS(SfSi-HrieS(Ses'<^e^es'rNc^e<SeHenfnS*eseses
'O o

a^'0a^csa^c^^^0csw-)r4^r)'
S3g^
--. -. -t lo en r4 es -j ch es q 00 CN t-: esMcSNeseseseST-Hfnnesesesi

:$ ^
^
?S ^ S S S
icseseSencHeoeneneSene^ies

TH<smTi-ir>^(^ooa\o^^rn^jo^r^og2gT^c;^eq^jq^r^

599

600

CAPTULO 14 OTROS TPICOS DE DISEO Y ANLISIS

puntos del diseo. La comparacin de las longitudes de los intervalos de confianza revela que es posible
que el modelo lineal generalizado sea un mejor predictor que el modelo de mnimos cuadrados.

Los modelos lineales generalizados han encontrado amplia aplicacin en la investigacin y el desa
rrollo biomdico y farmacutico. Conforme ms paquetes de software incluyan esta capacidad, encontra
r una aplicacin ms amplia en el mbito de la investigacin y el desarrollo industrial general.

14'2

D A T O S N O B A LA N C EA D O S E N U N D ISE O FA C T O R IA L

El centro de atencin principal de este libro ha sido el anhsis de diseos factoriales balanceados, es de
cir, los casos en que en cada celda hay el mismo nmero n de observaciones. Sin embarg, es comtin en
contrar situaciones en las que el nmero de observaciones en las celdas son desiguales. Estos diseos
factoriales no balanceados ocurren por varias razones. Por ejemplo, el experimentador puede haber dise
ado inicialmente un experimento balanceado, pero debido a problemas imprevistos cuando se corre el
experimento, los cuales resultan en la prdida de algunas observaciones, termina trabajando con datos no
balanceados. Por otra parte, algunos experimentos no balanceados se disean expresamente de este
modo. Por ejemplo, ciertas combinaciones de tratamientos pueden ser ms costosas o ms difciles de co
rrer que otras, por lo que pueden hacerse menos observaciones en esas celdas. De manera alternativa, al
gunas combinaciones de tratamientos pueden ser de mayor inters para el experimentador debido a que
representan condiciones nuevas o np exploradas, por lo que puede optar por obtener rphcas adicionales
de dichas celdas.
La propiedad de ortogonalidad de los efectos principales y las interacciones, presente en los datos ba
lanceados, no es vhda en el caso no balanceado. Esto significa que las tcnicas del anlisis de varianza
usual no son aplicables. Por consiguiente, el anlisis de factoriales no balanceados es mucho ms difcil
que el de los diseos balanceados.
En esta seccin se ofrece un breve panorama general de los mtodos para abordar los factoriales no
balanceados, centrando la atencin en el caso del modelo de efectos fijos con dos factores. Suponga que
el nmero de observaciones en la celda )'-sima es nj. Adems, sea /z, =
el nmero de observacio
nes en el rengln -simo (el nivel /-simo del factorJ4), sea rtj = 2 ^^
el nmero de observaciones de la
columna;-sima (el nivel;-sirao del factor 5 ) y sea ,, = 2 2 n-- el nmero total de observaciones.

14-2.1

D atos proporcionales: u n caso sencillo

Una de las situaciones que incluye datos no balanceados presenta escasa dificuhad para el anhsis; se tra
ta del caso de los datos proporcionales. Es decir, el nmero de observaciones en la celda ij-ma. es
n-n,

(14-11)

Esta condicin implica que el nmero de observaciones en dos renglones o columnas cualesquiera es pro
porcional. Cuando ocurren datos proporcionales, puede emplearse el anhsis de varianza estndar. Slo

14-2 DATOS NO BALACEADOS EN UN DISEO FACTORIAL

601

es necesario hacer modificaciones menores en las frmulas del clculo manual de las sumas de cuadrados,
las cuales quedan como

a b
S S r ' S
/=1 /=sl
a

,,2

J
i-

y!

^,2

=i j=i "f
SS e = SSj. - SS^ - SSg - s s ^
y,.
=1 ;=1

=1 y-1 ^ii

Como un ejemplo de datos proporcionales, considere el experimento del diseo de la batera del
ejemplo 5-1. En la tabla 14-4 se muestra una versin modificada de los datos originales. Desde luego, los
datos son proporcionales; por ejemplo, en la celda 1,1 se tienen

20

observaciones. Los resultados que se obtienen al aplicar el anlisis de varianza usual a estos datos se pre
sentan en la tabla 14-5. Tknto el tipo de material como la tem peratura son significativos, lo cual concuerda
con el anlisis del conjunto completo de datos del ejemplo 5-1. Sin embargo, la interaccin que se observ
en el ejemplo 5-1 no est presente.
14'2.2

M todos aproximados

Cuando los datos no balanceados no se apartan demasiado del caso balanceado, en ocasiones es posible
usar procedimieiitos aproximados que convierten el problema no balanceado en uno balanceado. Esto

Tabla 14-4
Tipo de
material
1
2
3

Experimento del diseo de la batera con datos proporcionales


Ttemperatura, F
15
70
12
=
4
11 =4
34
40
130
155
80
75
74
180
21 = 2
22 ~ 2
136
115
159
126
31 = 2
138
1 = 8
y.i. = 1122

160

32 = 2
150
2 = 8
y.2. = 769

139

125
13 = 2
70
23 = 1
45
33= 1
96
3 = 4
y.3. = 269

1. = 10
58

y, = 896
2=5
^2.. = 581
3 = 5
^3.. = 683
=20
y = 2160

602

CAPTULO 14 OTROS TPICOS DE DISEO Y ANLISIS

Tabla 14-5

Anlisis de varianza de los datos del diseo de la batera


de la tabla 14-4
Fuente de
Suma de Grados de
Cuadrado
variacin
cuadrados
libertad
medio
'o
Tipos de material
8,170.400
2
4,085.20
5.00
Tfemperatura
16,090,875
2
8,045.44
9.85
Interaccin
5,907,725
4
1,476.93
1.18
Error
8,9SL000
11
816.45
Tbtal
39,150.000
19

hace, desde luego, que el anlisis sea tan slo aproximado, pero el anlisis de datos balanceados es tan
sencillo que con frecuencia el experimentador se ve tentado a usarlo. En la prctica, es necesario decidir
cundo los datos no son lo suficientemente diferentes del caso balanceado para hacer que el grado de
aproximacin introducido sea relativamente de escasa importancia. A continuacin se describen breve
mente algunos de estos mtodos aproximados. Se supone que todas las celdas contienen al menos una ob
servacin (es decir, nj > 1 ) .
Estimacin de observaciones fallantes
Si slo unas cuantas nj son diferentes, un procedimiento razonable es estimar los valores faltantes. Por
ejemplo, considere el diseo no balanceado de la tabla 14-6, Evidentemente, estimar el nico valor faltante de la celda 2,2 es un enfoque razonable. Para un modelo con interaccin, la estimacin del valor faltante en la celda ;-sima que minimiza la suma de cuadrados del error esy^. Es decir, el valor fallante se
estima tomando el promedio de las observaciones que estn disponibles en esa celda.
El valor estimado se trata como un dato real. La nica modificacin del anlisis de varianza es reducir
los grados de libertad del error en el nmero de observaciones faltantes que se han estimado. Por ejemplo,
si se estima el valor faltante en la celda 2,2 de la tabla 14-6, se usaran 26 grados de libertad en lugar de 27,
Apartado de datos
Considere los datos de la tabla 14-7. Observe que la celda 2,2 slo tiene una observacin ms que las otras.
Estimar los valores faltantes de las ocho celdas restantes quiz no sea una buena idea en este caso, ya que
esto resultara en estimaciones equivalentes a cerca de 18% de los datos finales. Una alternativa es apar
tar una de las observaciones de la celda 2,2, para obtener as un diseo balanceado con = 4 rplicas.
La observacin que se aparte deber elegirse al azar. Adems, en lugar de descartar completamente
la observacin, podra reintegrarse al diseo, despus elegir al azar otra observacin para apartarla y re-

Tabla 14-6

Renglones
1
2
3

Los valores nj para un


diseo no balanceado
Columnas
1
2
4
4
4
3
4
4

3
4
4
4

14'Z DATOS NO BALANCEADOS EN UN DISEO FACTORIAL

Tabla 14-7

Renglones
1
2
3

Los valores para un


diseo no balanceado
Columnas
1
2
4
4
4
5
4
4

603

3
4
4
4

petir el anlisis. Y, se esperara, estos dos anlisis no llevarn a interpretaciones antagnicas de los datos.
Si lo hacen, se sospecha que la observacin que se apart es un valor atpico o disparatado y deber mane
jarse en consecuencia. En la prctica es improbable que ocurra esta confusin cuando slo se aparta un
nmero reducido de observaciones y la variabilidad dentro de las celdas es pequea.
Mtodo de las medias no ponderadas
En este enfoque, introducido por Yates [113a], los promedios de las celdas se tratan como si fueran datos
y son objeto de un anlisis de datos balanceados estndar para obtener las sumas de cuadrados de los ren
glones, las columnas y la interaccin. El cuadrado medio del error se encuentra como

1=1 y-1 t=i


^

( -2)

Entonces, MS^ estima o^, la varianza deyjit, una observacin individual. Sin embargo, se ha realizado un
anlisis de varianza de lospmmedios de las celdas, y como la varianza del promedio de la celda >-sima es
el cuadrado medio del error que se usa en realidad en el anlisis de varianza deber ser una estima
cin de la varianza promedio de las y,y, por ejemplo
E S - /,
.=1
Utilizando MS^ de la ecuacin 14-12 para estimar

en la ecuacin 14-13, se obtiene

1.1 ,.i

",

(14-14)

como el cuadrado medio del error (con n -a b grados de libertad) que se usar en el anlisis de varianza.
El mtodo de las medias no ponderadas es un procedimiento aproximado porque las sumas de cua
drados de los renglones, las columnas y la interaccin no se distribuyen como una variable aleatoria
ji-cuadrada. La ventaja principal del mtodo parece ser la simplicidad de los clculos. Cuando las ,j no di
fieren de manera radical, el mtodo de las medias no ponderadas funciona con frecuencia razonablemen
te bien.
Una tcnica relacionada es el mtodo de los cuadrados ponderados de las medias, propuesto tam
bin por Yates [113a]. Esta tcnica se basa tambin en las sumas de cuadrados de las medias de las celdas,
pero los trminos de las sumas de cuadrados se ponderan en proporcin inversa a sus varianzas. Para ma
yores detalles de este procedimiento, ver Searie [99a] y Speed, as como Hocking y Hackney [106].

604
14-2.3

CAPTULO 14 OTROS TPICOS DE DISEO Y ANLISIS

M todo exacto

En situaciones en que los mtodos aproximados no son apropiados, como cuando ocurren celdas vacas
(algunas nj = 0) o cuando las n presentan diferencias radicales, el experimentador debe usar un anlisis
exacto. El enfoque utilizado para desarrollar las sumas de cuadrados para probar los efectos principales y
las interacciones consiste en representar el modelo del anlisis de varianza como un modelo de regresin,
ajustar ese modelo a los datos y usar el enfoque de la prueba general de significacin de la regresin. Sin
embargo, existen varias formas en que puede hacerse esto, y estos mtodos pueden producir valores dife
rentes para las sumas de cuadrados. Adems, las hiptesis que se estn probando no siempre son anlo
gos directos de las del caso balanceado, y su interpretacin tampoco es siempre sencilla. Para mayor
informacin al respecto, ver el material suplementario del texto de ste captulo. Otras buenas referen
cias son Searle [99a]; Speed y Hocking [105]; Hocking y Speed [58]; Hocking, Hackney y Speed [57];
Speed, Hocking y Hackney [106]; Searle, Speed y Henderson [102]; Searle [99c]; y Milliken y Johnson
[79], El software de estadstica SAS proporciona un excelente enfoque del anlisis de datos no balancea
dos a travs del procedimiento PROC GLM.

14-3

A N LISIS D E C O V A R IA N Z A

En los captulos 2 y 4 se introdujo el uso del principio de la formacin de bloques para mejorar la preci
sin con la que se hacen comparaciones entre tratamientos. La prueba t pareada fue el procedimiento
ilustrado en el captulo 2, mientras que en el captulo 4 se present el diseo de bloques aleatorizados. En
general, el principio de la formacin de bloques puede usarse para eliminar el efecto de los factores per
turbadores controlables. El anlisis de covarianza es otra tcnica que en ocasiones es til para mejorar la
precisin de un experimento. Suponga que en un experimento con una variable de respuesta^ existe otra
variable, por ejemplos, y que y se relaciona linealmente conjc. Adems, suponga que a: no puede ser con
trolada por el experimentador, pero puede observarse junto cony. A la variable^c se le llama variable con
comitante o covariable. El anUsis de covarianza implica ajustar la variable de respuesta observada para
el efecto de la variable concomitante. Si no se hace este ajuste, la variable concomitante podra inflar el
cuadrado medio del error y hacer que sean ms difciles de detectar las verdaderas diferencias en la res
puesta debidas a los tratamientos. Por lo tanto, el anlisis de covarianza es un mtodo de ajuste para los
efectos de una variable perturbadora no controlable. Como se ver, el procedimiento es una combinacin
del anlisis de varianza y del anlisis de regresin.
Como un ejemplo de un experimento en el que puede emplearse el anlisis de covarianza, considere
el estudio realizado para determinar si existe una diferencia en la resistencia de una fibra de monofilaDatos de la resistencia a la ruptura (y = resistencia en libras
y X= dimetro en 10~^ pulgadas)____ ______________
Mquina 1______
Mquina 2___________ Mquina 3

Tabla 14-8

y
36
41
39
42
49
207

20
25
24
25
32
126

40
48
39
45
44
216

22
28
22
30
28
130

y
35
37
42
34
32
180

21
23
26
21
15
106

14'3 ANLISIS DE COVARIANZA

605

50

45

2'
I 40
E
35

30

10

_L
20

_L

30

40

Dimetro, x

Figura 14-3 Resistencia a la ruptura (y ) contra el dimetro


de la fibra (x).

ment producida por tres mquinas diferentes. Los datos de este experimento se muestran en la tabla
14-8. En la figura 14-3 se presenta un diagrama de dispersin de la resistencia (y) contra el dimetro (o
grosor) de la muestra. Evidentemente, la resistencia de la fibra tambin se afecta por su grosor; por consi
guiente, una fibra ms gruesa ser por lo general ms resistente que una delgada. El anlisis de covarianza
podra usarse para eliminar el efecto del grosor (x) sobre la resistencia (y) cuando se prueban las diferen
cias en la resistencia entre las mquinas.

14 '3 .1

D escripcin del procedim iento

A continuacin se describe el procedimiento bsico para el anlisis de covarianza, ilustrndolo para un


experimento de un solo factor con una covariable. Suponiendo que existe una relacin lineal entre la res
puesta y la covariable, un modelo estadstico apropiado es
(14-15)
donde>',j es la observaciny-sima de la variable de respuesta tom ada bajo el tratam iento o nivel /-simo del nico factor, j:,yes la medicin hecha de la covariable o variable concomitante correspondiente a_y,j
(es decir, la corrida zy-sima), x es la media de los valores x, n es la media global, t, es el efecto del trata
miento -simo, es el coeficiente de regresin lineal que indica la dependencia de de y ej es un com
ponente del error aleatorio. Se supone que los errores ej son NID(0, o^), que la pendiente ^ ^ O y que la
verdadera relacin entre),y yx es hneal, que los coeficientes de regresin de cada tratamiento son idnti
cos, que la suma de los efectos de los tratamientos es cero ( 2 _i t , = 0 ) y que la variable concomitante a:,y
no se afecta por los tratamientos.
Observe, por la ecuacin 14-15, que el modelo del anlisis de covarianza es una combinacin de los
modelos lineales empleados en el anlisis de varianza y regresin. Es decir, se tienen efectos de los tra
tamientos {r,}, como en un anUsis de varianza de un solo factor, y un coeficiente de regresin /3, como
en una ecuacin de regresin. La variable concomitante de la ecuacin 14-15 se expresa ccmo (xj-x )

606

CAPTULO 14 OTROS TPICOS DE DISEO Y ANLISIS

en lugar dex,j, para que el parm etro n se preserve como la media global. El modelo pudo haberse escri
to como
a6)
donde yw' es una constante diferente de la media global, que para este modelo e s/' + /S . Es ms comn
encontrar la ecuacin 14-15 en la literatura sobre el tema.
Para describir el anlisis, se introduce la siguiente notacin:

(14-17)
i~ i

y=i

(2

(=1 y=i
a

(14-18)
(14-19)
1=1 y=i

>=i

*
(14-20)

2
(14-21)
(14-22)

1=1

1=1
(14-23)

=i j=i
(14-24)
;-i

(14-25)
;=i /-i
Observe que, en general, S = T + E, donde los smbolos S , T y E s e usan para denotar las sumas de cuadra
dos y los productos cruzados del total, los tratamientos y el error, respectivamente. Las sumas de cuadrados
e x yy deben ser no negativas; sin embargo, las sumas de los productos cruzados (xy) pueden ser negativas.
A continuacin se indica la forma en que el anlisis de covarianza ajusta la variable de respuesta para
el efecto de la covariable. Considere el modelo completo (ecuacin 14-15). Los estimadores de mnimos
cuadrados de
t y son /t = y , = y_ - y - ^{x - x ) ,y
(14-26)
La suma de cuadrados del error en este modelo es
SS, = E ^ - { E ^ f l E ^
con a(n - 1) - 1 grados de libertad. La varianza del error experimental se estima con
SS e
M S ,=
fl( -l) 1

(14-27)

14-3 ANLISIS DE CX3VARIANZA

607

Suponga ahora que no hay ningn efecto de los tratamientos. El modelo (ecuacin 14-15) sera entonces
X; = /+/3(JC^ ~ x )+,.
y puede demostrarse que los estimadores de mnimos cuadrados de
de cuadrados del error en este modelo reducido es

(14-28)
y ^ son ^ = y y

SS',=S^~(S^y/S^

= S^S . La suma

(14-29)

con a n - 2 grados de libertad. En la ecuacin 14-29, la cantidad (5^)V5 es la reduccin de la suma de cua
drados de_y obtenida a travs de la regresin lineal de_y sobre at. Adems, observe que SS^ es menor que
[ya que el modelo (ecuacin 14-15) contiene los parmetros adicionales {r,}] y que la cantidad
SS e es una reduccin en la suma de cuadrados debida a las {r,}. Por lo tanto, la diferencia entre
y SS e,
es decir, SS^ - SS^, proporciona una suma de cuadrados con a - 1 grados de libertad para probar la hip
tesis de que no hay ningn efecto de los tratamientos. Por consiguiente, para probar
= O, se calcula
^

(55;-55^)/(fl-l)

que, si la hiptesis nula es verdadera, se distribuye como F, . i, . i,. Por lo tanto, //oT, = Ose rechaza si
^0 >
- 1. u(n - 1) ^ 1- Tambin podra usarse el enfoque del valor P.
Es instructivo examinar la presentacin de la tabla 14-9. En ella el anlisis de covarianza se ha presen
tado como un anlisis de varianza ajustado. En la columna de la fuente de variacin, la variabilidad to
tal se mide por 5^, con an - 1 grados de libertad. La fuente de variacin regresin tiene la suma de
cuadrados (S^)VS con un grado de libertad. Si no hubiera ninguna variable concomitante, se tendra 5^
= S = E ^ = E = 0. Entonces la suma de cuadrados del error sera simplemente
y la suma de cuadra
dos de los tratamientos sera 5^^
= 7^. Sin embargo, debido a la presencia de la variable concomitan
te, Syy y Eyy deben ajustarse para la regresin dej/ sobre x, como se muestra en la tabla 14-9. La suma de
cuadrados del error ajustada tiene a{n - 1 ) - 1 grados de libertad en lugar de a{n 4 1) grados de libertad
debido a que se ajusta un parmetro adicional (la pendiente 8) a los datos. '
Los clculos suelen presentarse en una tabla del anlisis de covarianza como la tabla 14-10. Se em
plea esta presentacin porque resume de manera conveniente todas las sumas de cuadrados y los produc
tos cruzados requeridos, as como las sumas de cuadrados para probar las hiptesis acerca de los efectos
de los tratamientos. Adems de utilizarla para probar la hiptesis de que no hay diferencias en los efectos
de los tratamientos, con frecuencia esta tabla se encuentra til en la interpretacin de los datos para pre
sentar las medias de los tratamientos ajustadas. Estas medias ajustadas se calculan de acuerdo con
X, ajustada = y, - ^ ( , ~ x j

i = 1,2,...,a

(14-31)

donde /?= E ^ l E ^ , Esta media de los tratamientos ajustada es el estimador de mnimos cuadrados de
fi + T, i = 1,2,..., a, en el modelo (ecuacin 14-15). El error estndar de cualquier media ajustada de los
tratamientos es

>..ajustada

M Se

E,

(14-32)

4^

Si
I

srI

I'

fa
>^
i1

I
.

ti)
II

sT
1

sT

cco
=1

to

o
o

ty

CO

Q
0
1
(U
-T
3
O
G
y

ttj

Tc3d
i
!

S?

(U

o
*a
c
^ts3
cS

0
ja
1
608

B
'D
S 'l

c(U

'O

g?

-a

13
i-t

id
c3

eS

14-3 ANLISIS DE COVARIANZA

609

Por ltimo, cabe recordar que se ha supuesto que el coeficiente de regresin y3 del modelo (ecuacin
14-15) es diferente de cero. La hiptesis
= 0 puede probarse utilizando el estadstico de prueba

que bajo la hiptesis nula se distribuye como F,

_ i- Por lo tanto,

= O se rechaza si

a(n - 1) -!

EJEMPLO 1 4 '4 .........................................................................................................................................


Considere el experimento descrito al principio de la seccin 14-3. Ttes mquinas producen una fibra de
monofilamento en una fbrica textil. El ingeniero del proceso tiene inters en determinar si existe alguna
diferencia en la resistencia a la ruptura de la fibra producida por las tres mquinas. Sin embargo, la resis
tencia de una fibra se relaciona con su dimetro, con las fibras ms gruesas, siendo stas, en general, ms
resistentes que las ms delgadas. Se selecciona una muestra aleatoria de cinco ejemplares de prueba de fi
bra de cada mquina. En la tabla 14-8 se muestra la resistencia de la fibra (y) y el dimetro correspondien
te (a:) de cada ejemplar.
El diagrama de dispersin de la resistencia a la ruptura contra el dimetro de la fibra (figura 14-3) in
dica una clara tendencia a una relacin lineal entre la resistencia a la ruptura y el dimetro, y parece apro
piado eliminar el efecto del dimetro sobre la resistencia mediante un anlisis de covarianza. Suponiendo
que la relacin lineal entre la resistencia a la ruptura y el dimetro es apropiada, el modelo es
= 1,2,3
.7 = 1,2,..., 5
Utilizando las ecuaciones 14-17 a 14-25, pueden calcularse
=2 2

= (36)^ +(41)^ + - -h(32)^

346.40

=a

= (20)' +(25)^ + - +(15)^

261.73

^ , > - , - ^ ^ 4 ^ = (20)(36)-H(25)(41)+...-^(15)(32)
/=l 7=1
(362)(603)

r.

= T [(207)' +(216) +(180) 1 - 7^

x l - = ^ [ ( 1 2 6 ) +(130)- +(106) l - ^ | - = 66.13


1an
*11,

= -[(126)(207)-H(130)(216)-l-(106)(184)]
J

610

CAPTULO 14

OTROSTPICOSDEDISEOYANLISIS

E ^ = S ^ - T ^ = 346.40-140.40 = 206.00
= S - r = 261.73-66.13= 195.60
E ^ = S ^ - T ^ = 2 8 1 6 0 - 96.00 = 186.60
Por la ecuacin 14-29 se encuentra

= 346.40-(186.60)^ / 261.73
= 41.27
con a n - 2 = (3)(5) - 2 = 13 grados de libertad; y por la ecuacin 14-27 se encuentra
SS , = E - { E ^ f l E ^
= 206.00-(186.60)" /195.60
= 27.99
con a(n - 1) - 1 = 3(5 - 1) - 1 = 11 grados de libertad.
La suma de cuadrados para probar
= Tj = 13 = O es
55; - 5 5 ^ = 41.27 - 27.99
= 13:28
c o n a - l = 3 - l = 2 grados de libertad. Estos clculos se resumen en la tabla 14-11.
Para probar la hiptesis de que las mquinas difieren en la resistencia a la ruptura de la fibra produci
da, es decir,
= O, por la ecuacin 14-30 el estadstico de la prueba se calcula como
_ (^5;-g5^)/(g-l)

SS,/[a(n-l)-l]
1128/2
27.99/11

6.64
= 2.61
2.54

Al comparar este valor con ^ 0.10,z, 11 2.86, se encuentra que no puede rechazarse la hiptesis nula. El va
lor P de este estadstico de la pnieba es P = 0.1181. Por lo tanto, no hay evidencia slida de que las fibras
producidas por las tres mquinas difieran en la resistencia a la ruptura.
La estimacin del coeficiente de regresin se calcula con la ecuacin 14-26 como

^
La hiptesis

195.60

= O puede probarse usando la ecuacin 14-33. El estadstico de prueba es


. _
"

f ! E ^ _ (186.60)" /195.60 _
2.54

y puesto que /"o oi, 1,11 = 9.65, se rechaza la hiptesis de que ^ = 0. Por lo tanto, existe una relacin lineal
entre la resistencia a la ruptura y el dimetro, y el ajuste proporcionado por el anlisis de covarianza fiie
necesario.

-H

00

T(
O
1
vo
H

O
c
"O
Eb
tfd

11
(

lo

-o

o -
a
4i
0o0 2 iS
cd O
On

C/5

ov r^
(S -rt 1(

to

&
d
TO
3
1^
Qn
>l
V
3
O
u
cd

O v \ 6
^ o ^
^ fS en

o o
g 'O ^

CJ
u

TJ

fo S P
uS i-H
\l CT\ iC
'O "-I es

O-a

sI

cdo ^5
c
<

j :)

t3

l 'S
e >

lll

c/a
c
T3
co
cO
:3
cd
V5
Cd

S A eS S

611

612

CAPTULO 14 OTROS TPICOS DE DISEO Y ANLISIS

Las medias de los tratamientos ajustadas pueden calcularse con la ecuacin 14-31. Estas medias ajus
tadas son
ajustada =

= 41.40- (0.9540)(25.20 - 24.13) = 40.38


j), ajustada =

- x )

= 43.20- (0.9540)(26.00- 24.13) = 41.42

y
y ajustada = y, -

- x )

= 3 6 .0 0 -(0.9540)(21.20 - 24.13)= 38.80


Al comparar las medias ajustadas con las medias no ajustadas de los tratamientos (lasy, ), se observa que
las medias ajustadas se encuentran mucho ms prximas entre s, una indicacin ms de que el anlisis de
covarianza fue necesario.
Un supuesto bsico en el anlisis de covarianza es que los tratamientos no influyen en la covariabjex,
ya que la tcnica elimina el efecto de las variaciones en las x ,. Sin embargo, si la variabilidad en las j:, se
debe en parte a los tratamientos, entonces el anlisis de covarianza elimina parte del efecto de los trata
mientos, Por lo tanto, deber tenerse una seguridad razonable de que los tratamientos no afectan los va
lores a:,y. En algunos experimentos esto puede ser obvio a partir de la naturaleza de la covariable, mientras
que en otros puede ser ms dudoso. En el ejemplo tratado aqu puede haber una diferencia en el dimetro
de la fibra (x^) entre las tres mquinas. En tales casos, Cochran y Cox [26] sugieren la posible utihdad de
un anlisis de varianza de los valores JCypara determinar la vahdez de este supuesto. Para el problema tra
tado aqu, con este procedimiento se obtiene
p
66.13/2 _ 3 a 0 7
" 195.60/12 16.30

102,12= 2.81, por lo que no hay razn para creer que las mquinas producen fibras con

que es menor quefo. ,


dimetros diferentes.

La verificacin del diagnstico del modelo de covarianza se basa en el anlisis residual. Para el mode
lo de covarianza, los residuales son
donde los valores ajustados son
- x ) = y. +[y, - y, - ^ ( , ~ , .)]

Por lo tanto,

Para ilustrar el uso de la ecuacin 14-34, el residual de la primera observacin de la primera mquina
del ejemplo 14-4 es
= y n - X, - k x n ~ ^ , ) = 3 6 - 4 1 .4 - (0.9540)(20-25.2)
= 36-36.4392 = -0.4392

14'3 ANLISIS DE COVARIANZA

613

En la tabla siguiente se presenta una lista completa de las observaciones, los valores ajustados y los
residuales:
Valor observado y,y
36
41
39
42
49
40
48
39
45
44
35
37
42
34
32

Valor ajustado
36.4392
41.2092
40.2552
41.2092
47,8871
39.3840
45.1079
39.3840
47.0159
45.1079
35.8092
37.7171
40.5791
35.8092
30.0852

Residual e =y
-0.4392
-0.2092
-1.2552
0.7908
1.1129
0.6160
2.8921
-0.3840
-2.0159
-1.1079
-0.8092
-0.7171
1.4209
-1.8092
1.9148

Los residuales se grafican contra los valores ajustados en la figura 14-4, contra la covariablejc^y en la fi
gura 14-5 y contra las mquinas en la figura 14-6. En la figura 14-7 se muestra la grfica de probabilidad
normal de los residuales. Estas grficas no revelan ninguna desviacin importante de los supuestos, por lo
que se concluye que el modelo de covarianza (ecuacin 14-15) es apropiado para los datos de la resisten
cia a la ruptura.
Es interesante observar lo que habra ocurrido en este experimento si no se hubiera realizado el an
lisis de covarianza, es decir, si los datos de la resistencia a la ruptura (y) se hubieran anahzado como un ex
perimento de un solo factor en el que se ignorara la covariable j:. En la tabla 14-12 se muestra el anlisis de
varianza de los datos de la resistencia a la ruptura. Se concluira, con base en este anlisis, que las mqui
nas difieren significativamente en la resistencia de la fibra producida. Es exactamente la conclusin
+4

+2

-2

25

30

35

40

45

50

Figura 14-4 Grfica de los residuales contra los valores ajus


tados del ejemplo 14-4.

614

CAPTULO 14 OTROS TPICOS DE DISEO Y ANLISIS

I -

10

20

30

40

5C

Figura 14-S Grfica de los residuales contra el dimetro x de


la fibra en el ejemplo 14-4,

opuesta del anlisis de covarianza. Si se sospechara que las mquinas difieren significativamente en su
efecto sobre la resistencia de la fibra, entonces se intentara igualar la resistencia producida por las tres
mquinas. Sin embargo, en este problema las mquinas no difieren en la resistencia de la fibra producida
despus de que se elimina el efecto lineal del dimetro. Sera conveniente reducir la variabilidad del di
metro de la fibra dentro de las mquinas, ya que con esto probablemente se reducira la variabilidad de la
resistencia de la fibra.

14-3.2

Solucin por computadora

Se cuenta con varios paquetes de software que pueden realizar el anlisis de covarianza. En la tabla 14-13
se muestra la salida del procedimiento General Linear Models (modelos lineales generales) de Minitab

I-

3
Mquina

Figura 14-6 Grfica de los residuales contra las


mquinas.

14-3 ANLISIS DE COVARIANZA

615

Residuales,

Figura 14-7 Grfica de probabilidad normal de los residuales del ejemplo 14-4.

para los datos del ejemplo 14-4. Esta salida es muy similar a las que se presentaron anteriormente. En la
seccin de la salida bajo el encabezado Anlisis de varianza (Analysis of variance), SS Seq corres
ponde a la particin secuencial de la suma de cuadrados del modelo global, es decir,
SS (Modelo) = SS (Dimetro) -I- 55(Mquina | Dimetro)
= 305.13+13.28
= 318.41
mientras que SS ajustada corresponde a la suma de cuadrados extra para cada factor, es decir,
55(Mquina| Dimetro) = 13.28

y
55(Dimetro Mquina) = 178.01
Observe que 55(Mquina | Dimetro) es la suma de cuadrados que deber usarse para probar que no hay
ningn efecto de la mquina, y que 55(Dimetro | Mquina) es la suma de cuadrados corregida que debe
r usarse para probar la hiptesis de que ^ = 0. Los estadsticos de la prueba de la tabla 14-13 difieren li
geramente de los que se calcularon manualmente debido al redondeo.

Tabla 14-12 Anlisis incorrecto de los datos de la resistencia a la ruptura como un experimento de un solo factor
Fuente de
Grados de
variacin
Suma de cuadrados
libertad
Cuadrado medio
ValorP
Fo
Mquinas
140.40
2
70.20
4.09
0.0442
Error
206.00
12
17.17
Tbtal
346.40
14

616

CAPTULO 14 OTROS TPICOS DE DISEO Y ANLISIS

Tabla 14-13 Salida de Minitab (anlisis de covarianza) del ejemplo 14-4


M o d e lo lin ea l general

Factor
Machine
AnaLysis
Source
Di a m e t e r
Machine
Error
Total
Te rm
Constant
D i a me t e r
M a c h i ne
1
2
Means

for

Type
fixed
of

Levels Vales
3 1 2 3

Variance

for

using

Adj SS
178.01
13 . 2 8
27 . 9 9

Seq SS
305 . 1 3
13.28
27.99
346.40

DF
1
2
11
14

Adjusted
A d j MS
178.01
6.64
2.54

Coef
17.177
0.9540

StDev
2.783
0.1140

I
6.17
8.36

P
0.000
0.000

0.1824
1 .2192

0.5950
0.6201

0.31
1 .97

0.765
0.075

SS f o r
F
69.97
2.61

Tests
P
0.000
0.118

Covari ates
StDev
4.324

Cova r i a t e
Diameter

Mean
24.13

Least

Mea ns f o r

Squares

Machine
1
2
3

Strength,

Mean
40.38
41.42
38.80

Strength

StDev
0.7236
0.7444
0.7879

El programa calcula tambin las medias de los tratamientos ajustadas con la ecuacin 14-31 (Minitab
hace referencia a stas como las medias de mnimos cuadrados en la salida muestral) y los errores estn
dar. El programa comparar asimismo todos los pares de medias de tratamientos utilizando los procedi
mientos de comparacin mltiple por pares estudiados en el captulo 3.

14-3.3

Desarrollo mediante la prueba general de signifcacin de la regresin

Es posible desarrollar formalmente el procedimiento para probar

= Oen el modelo de covarianza

utilizando la prueba general de signifcacin de la regresin. Considere la estimacin de los parmetros


del modelo (ecuacin 14-15) por mnimos cuadrados. La funcin de mnimos cuadrados es

.=1 i^i

14'3 ANLISIS DE COVARIANZA

y a partir de dLldn - dLldz = dL/d^ = O, se obtienen las ecuaciones normales


a
fi-.a n fl+ n ^
=y

617

(14-37a)

1=1
TI

T .: n fi+ n t.+ ^ '^ ( x , j - x )= y,


a

i = l,2 ,...,a

(14-37b)

2^, 2
1=1

(^, - )+ pS^ =

(14-37C)

;=1

Al sumar las a ecuaciones de la ecuacin 14-37b, se obtiene la ecuacin 14-37a porque


(x x ) = O, por lo que existe una dependencia lineal en las ecuaciones normales. Por lo tanto, es necesario au
mentar las ecuaciones 14-37 con una ecuacin linealmente independiente para obtener una solucin.
Una condicin lgica es
i = 0.
Al utilizar esta condicin, de la ecuacin 14-37a se obtiene
=y

(14-38a)

y de la ecuacin 14-37b
= h - y.. ~ k ^ i. ~

(14-38b)

La ecuacin 14-37c puede reescribirse como


(?,. - X.
i^ij - X . . ) - ( , -
1^1
y=i
1=1
despus de sustituir para

y=i

(x.j - X ) + f i S ^ =

Pero se observa que


.-=1

y-i

.=1

j=i

Por lo tanto, la solucin de la ecuacin 14-37c es


SX
- T ,xc
que fue el resultado dado anteriormente en la seccin 14-3.1 en la ecuacin 14-26.
La reduccin en la suma de cuadrados total debida al ajuste del modelo (ecuacin 14-15) puede ex
presarse como
a
R(H, r, ^) = w . -t-J]
i=l

=(y.. )y. + E [X. - y. - (E^ /

)(x, - X, )]>, +{E^ / )S^

i=l

= y ^!a n + %

= y^,lan+Tl-{E^E^){T^-S^)
= f,lan+T^+{E^flE^

{x ,~ x ,)y ,^ { E ^ t E^)S^

618

CAPTULO 14 OTROS TPICOS DE DISEO Y ANLISIS

Esta suma de cuadrados tiene a + 1 grados de libertad porque el rango de las ecuaciones normales es
a + 1. La suma de cuadrados del error de este modelo es
^5^ = S E
1=1 j=i

-E E

y-y^lan~T^-(E^yiE

con a n - { a + V)= a(n - 1 ) - 1 grados de libertad. Esta cantidad se obtuvo anteriormente como la ecua
cin 14-27.
Considere ahora el modelo restringido a la hiptesis nula, es decir, a / q:Tj = Tj = ... =
= 0. Este
modelo reducido es
y,=M+^{x,-xJ+,
Se trata de un modelo de regresin lineal simple, y las ecuaciones normales de mnimos cuadrados para
este modelo son
an/ ~ y

^5^=5^
Las soluciones de estas ecuaciones son fj. = y

(14-41a)
(14-41b)

= S J S ^, y la reduccin en la suma de cuadrados total

debida al ajuste del model reducido es


R{li,

=
= (X. )y.

= y^_ l a n + { S ^ y ! S ^
Esta suma de cuadrados tiene dos grados de libertad.
La suma de cuadrados apropiada para probar / q-^i =
R{x\n,

= =

(14^42)

= Opuede encontrarse como

T, ^ y R { n , /3)
=
!an+ T^ + {E ^ f I E ^ - yl / a n - { S ^ f / 5^
-S^-{S^flS^~{E^-{E^flE^]

(14-43)

utilizando T^ = S^-Eyy. Observe que R (t |/i, tiene a + l - 2 = a ~ l grados de libertad y que es idntica
a la suma de cuadrados dada por 55- SS^ en la seccin 14-3.1. Por lo tanto, el estadstico de prueba para
Ha-ti = O es
^ R{ t\ h ,
^ (SS',~SS,)/(a-l)
55^/[a(n-l)-l]
S5^/[ ( -!)-1 ]
expresin que se dio anteriormente como la ecuacin 14-30. Por lo tanto, utilizando la prueba general de
significacin de la regresin, se ha justificado el desarrollo heurstico del anlisis de covarianza de la sec
cin 14-3.1.

14'3 ANLISIS DE COVARJANZA

14'3.4

619

Experimentos factoriales con covariables

El anlisis de covarianza puede aplicarse a estructuras de tratamientos ms complejas, como los diseos
factoriales. Siempre que existan datos suficientes para cada combinacin de tratamientos, prcticamente
cualquier estructura de tratamientos compleja puede analizarse mediante el enfoque del anlisis de cova
rianza. A continuacin se indica cmo podra usarse el anlisis de covarianza en la familia ms comn de
diseos factoriales utilizados en la experimentacin industrial, los factoriales 2*.
Al establecer el supuesto de que la covariable afecta a la variable de respuesta de manera idntica
para todas las combinaciones de tratamientos, podra construirse una tabla del anlisis de covarianza si
milar al procedimiento dado en la seccin 14-3.1. La nica diferencia sera la suma de cuadrados de los
tratamientos. Para un factorial 2^ con n rplicas, la suma de cuadrados de los tratamientos
sera (l/)
SLi 2
- y'^ /(2)(2)/i. Esta cantidad es la suma de las sumas de cuadrados de los factores^, B y la interaccin^B. Entonces podra hacerse la particin de la suma de cuadrados ajustada de los tratamientos
en componentes de los efectos individuales, es decir, la suma de cuadrados de los efectos principales ajus
tados SSji y SSg, y una suma de cuadrados de la interaccin, 5 5 ^ .
El nmero de rplicas es un aspecto clave cuando se ampla la estructura de los tratamientos del dise
o. Considere un arreglo factorial 2^. Se necesita un mnimo de dos rplicas para evaluar todas las combi
naciones de tratamientos con una covariable separada para cada combinacin de tratamientos, (una
covariable por interaccin de tratamientos). Esto es equivalente a ajustar un modelo de regresin simple
a cada combinacin de tratamientos o celda del diseo. Con dos observaciones por celda, un grado de li
bertad se usa para estimar la ordenada al origen (el efecto del tratamiento), y el otro se usa para estimar la
pendiente (el efecto de la covariable). Con este modelo saturado, no se cuenta con ningn grado de liber
tad para estimar el error. Por lo tanto, se necesitan al menos tres rplicas para un anlisis de covarianza
completo, suponiendo el caso ms general. Este problema se agudiza cuando se incrementa el nmero de
celdas distintas del diseo (combinaciones de tratamientos) y las covariables.
Si el nmero de rplicas est limitado, pueden hacerse varios supuestos para permitir un anlisis til.
El supuesto ms simple (y tpicamente el peor) que puede hacerse es que la covariable no tiene ningn
efecto. Si la covariable, incorrectamente, deja de tomarse en consideracin, el anlisis completo y las con
clusiones subsecuentes podran tener graves errores. Otra eleccin es suponer que no hay ningn trata
miento por interaccin de la covariable. Aun cuando este supuesto sea incorrecto, el efecto promedio de
la covariable en todos los tratamientos seguir incrementando la precisin de la estimacin y la prueba de
los efectos de los tratamientos. Una desventaja de este supuesto es que si varios niveles de los tratamien
tos interactan con la covariable, los diferentes trminos pueden cancelarse entre s y el trmino de la covariable, si se estima solo sin ninguna interaccin, puede resultar no significativo. Una tercera eleccin
sera suponer que algunos de los factores (como algunas interacciones de dos factores y de rdenes supe
riores) no son significativos. Esto permite usar parte de los grados de libertad para estimar el error. Sin
embargo, este curso de accin deber emprenderse con cuidado, y los modelos subsecuentes debern
evaluarse a profundidad, ya que la estimacin del error ser relativamente imprecisa a menos que se le
asignen suficientes grados de libertad. Con dos rplicas, cada uno de estos supuestos liberar algunos gra
dos de libertad para estimar el error y permitir realizar pruebas de hiptesis tiles. El supuesto que se es
tablecer deber ser dictado por la situacin experimental y por el riesgo que el experimentador est
dispuesto a correr. Cabe hacer notar que en la estrategia de construccin del modelo de los efectos, si se
elimina el factor de uno de los tratamientos, entonces las dos rplicas resultantes de cada factorial 2^
original no son en realidad rphcas. Estas rplicas ocultas hberan grados de libertad para la estimacin
de parmetros, pero no debern usarse como rplicas para estimar el error puro porque la ejecucin del
diseo original quiz no se haya aleatorizado para ello.

620

CAPTULO 14 OTROS TPICOS DE DISEO Y ANLISIS

Datos de la respuesta y la covariable para un diseo V con

Tabla 14-14

1
1

1
1

1
1

1
1

1
1

1
1

1
1

1
1

C
-1
-1
-1
-1
1
1
1
1
-1
-1
-1
-1
1
1
1
1

4.05
0.36
5.03
1.96
5.38
8.63
4.10
11.44
3.58
1.06
15.53
2.92
2.48
13.64
-0.67
5.13

y
-30,73
9.07
39.72
16.30
-26.39
54.58
44.54
66.20
-26.46
10,94
103.01
20.44
-8.94
73.72
15.89
38.57

Para ilustrar algunas de estas ideas, considere el diseo factorial 2^ con dos rplicas y una covariable
que se muestra en la tabla 14-14. Si la variable de respuesta^ se analiza sin tomar en cuenta la covariable,
resulta el siguiente modelo:
y = 25.03+11.20^+18.05B + 7.24C - 1 8 .9 M S +14.80^C
El modelo global es significativo en el nivel de a = 0.01 con = 0.786 y
= 470.82. El anlisis residual
no indica problemas con este modelo, excepto porque la observacin con y = 103.01 es inusual.
Si se elige el segundo supuesto, que las pendientes son comunes con ningn tratamiento por interac
cin de la covariable, pueden estimarse el modelo de los efectos completo y el efecto de la covariable. La
salida de Minitab (de la rutina General Linear Models) se muestra en la tabla 14-15. Observe que MS^ se
ha reducido considerablemente al tomar en consideracin la covariable. El anlisis final resultante des
pus de eliminar de manera secuendal cada interaccin no significativa y el efecto principal C se muestra
en la tabla 14-16. Este modelo reducido proporciona un MS e todava menor que el modelo completo con
la covariable de la tabla 14-15.
Por ltimo, podra considerarse un tercer curso de accin, suponiendo que ciertos trminos de in
teraccin son insignificantes. Se considera el modelo completo que permite pendientes diferentes entre
los tratamientos y la interaccin tratam iento por covariable. Se supone que no son significativas las in
teracciones de tres factores (tanto
comoABCx) y se usan los grados de libertad asociados con ellas
para estimar el error en el modelo de los efectos ms general que pueda ajustarse. ste es con frecuencia
un supuesto prctico. Las interacciones de tres factores son por lo general insignificantes en la mayora de
los ambientes experimentales. La versin actual de Minitab no puede modelar covariables que interactan con los tratamientos, por lo que se usa PROC GLM de SAS. Las sumas de cuadrados tipo III son las
sumas de cuadrados ajustadas que se necesitan. En la tabla 14-17 se presentan los resultados de SAS para
este modelo.
Con un modelo casi saturado, la estimacin del error ser bastante imprecisa. Incluso cuando unos
cuantos trminos son individualmente significativos en el nivel a 0.05, el sentido general es que este
modelo es mejor que los dos escenarios previos (basados en y el cuadrado medio del error). Debido a
que el aspecto de los efectos de los tratamientos del modelo es de mayor inters, se eliminan de manera
secuencial trminos de la porcin de la covariable del modelo a fin de agregar grados de libertad para esti-

14-3 ANLISIS DE COVARIANZA

621

Tabla 14-15 Anlisis de covarianza de Minitab para el experimento de la tabla 14-14, suponiendo una
pendiente comn
Modelo lineal general
Factor
A
B
C
AnaLysis

Type
fixed
fixed
fixed
of

Variance
DF
1
1
1
1
1
1
1
1
7
15

Source
X

A
B
C
A* B
A* C
B*C
A*B*C
Error
Total
Te r m
Constant

Levels
2
2
2

for

y,

using

Seq SS
12155.9
1320.7
3997.6
52.7
3788.3
10.2
5.2
33.2
628.1
21992.0

Coef
-1.016
4.9245

Vales
-1
1
-1
1
- 1 1
Adjusted

Adj SS
2521 . 6
1403.8
4066.2
82.3
3641.0
1 .1
8.4
33.2
628.1

StDev
5.454
0.9290

T
-0.19
5.30

SS f o r

A d j MS
2521.6
1403.8
4066.2
82.3
3641.0
1 .1
8.4
33.2
89.7

Tests
F
28.10
15.64
45.31
0.92
4 0 . 58
0.01
0.09
0.37

P
0.001
0.005
0.000
0.370
0.000
0.913
0.769
0.562

P
0.858
0.001

mar el error. Si se elimina secuencialmente el trmino>1Ca: seguido de BCx, el MS^ decrece a 0.7336 y va
rios trminos no son significativos. En la tabla 14-18 se muestra el modelo final despus de eliminar
secuencialmente C x,A C y BC.
Este ejemplo destaca la necesidad de contar con grados de libertad para estimar el error experimen
tal a fin de incrementar la precisin de las pruebas de hiptesis asociadas con los trminos individuales
del modelo. Este proceso deber hacerse de manera secuencial para evitar la eliminacin de trminos sig
nificativos enmascarados por una estimacin pobre del error.
Tabla 14-16 Anlisis de covarianza de Minitab, modelo reducido para el experimento de la tabla 14-14
Modelo lineal general
Factor
A
B
Analysis
Sou r ce
X

A
B
A* B
Error
Tota L
Ter m
Constant
X

Type
fixed
fixed
of

Levels

Vales
1
2 -1
1

2 -1

Variance
DF
1
1
1
1
11
15

for

y,

Seq SS
12155.9
1320.7
3997.6
3754. 5
763.3
21992.0

Coef
-1 .8 78
5. 0876

StDev
3.225
0.4655

using

Adjusted

Adj SS
8287.9
1404.7
4097.7
3754.5
763.3

T
-0.58
10.93

SS f o r

A d j MS
8287.9
1404.7
4097.7
3754.5
69.4

P
0.572
0.000

Tests

F
119.43
20.24
59.05
54.10

P
0.000
0.001
0.000
0.000

U . OO

o. o

c^

.o^h-oot-o'^roorooot-'oo

2:
qy
OD
CNJ
O
>-
lA
(M

A O O ^ o ^ -o ro < M ^ o ^ -o ^ O ^ * '^
c o o o o ^ ^ o o o o r^ o o ^ o o

o ^( N J h -r o T - o h - a ^ ^0 ' 4 ^ Mr ^

Q .O O O O C 3 0 0 0 0 0 0 0 0

a )0 > ji-r~ 0 (N J (M 'i'6 0 -0 'U ^ O iri

4) tn

3MK)OvfsJOrO<-T-rOOMOO
nl^o9>*4'C\JOOu^'a'K>oOOO
>
\J fO<Mo ' t

3 't
>o

>o

OJ

UJ

c V 'O ro
<0 c_m o
(0 h- rsi
3 h- O

*st
<MOO
Oto
-

O'-^ 't

V)
^ f

2
C!

'-0 ''-m fv j'a -r' 0 0 '')i^ '0

(Oh-

i.O'-O'MN-r^ooooO'eoN.O'eo
( O ' 0 r o 0 '' 0 ' t 't r \ j f \ i ' 'r ^ '0 0 r ^
30mr^t0r-i^i-'4'h-K><NJO<M

o-O' fN O O -t^rO '(M '4-oororvi^( O i A i r iO O r g '^ f ^ O l^ lM I ^ O 'O


O O O -O '-rM O 'h -T -O 'O O

nj-J-KliAh-OOO'KluiO'OOQ
W

-fO t-

'4'iO O '

>o

v>'a-0''4'iriiM'a'r-00O'''Or^'O
O
> fM toO'T-o^mh-h-ooooovooh-Otoo
'OroO'O''fMr^j'h-'OO'to

00
^ 00 -4* cu
^ O i-i0vinh-Kir-h-**'i^r0<MOfM
6 <0 o o V*
>-iO'('Joor-rO
'jf\i-j-o o K ifM r^
3 3 (\J 00 o
i-iirvi/^OOM'th-OI^CJ^-O'O
/ O*

4^ V) CO*<0

o 0 r o to

</>Os <NJfNJ
00

' 0 0 0 * 0 ' MW'l^ 0 ' 0 0


Q.'*' K i u ^ r - o o o f o i r i o ' o o o

> t- r o -

Cc3

i
U. t*0 CJ lA

4) (M
t-

00
3
ITo
ra

CO oI

Of o

u
S

CL,

(0

4^
O

o
0)

>
l>
1-H

-o
c
0)

J3 a
)
I A

622

(O

(O

o ^ fi- 4)
u 0) o C3 *0 c- tO o C- o
co E lU

0)
u
3

(n ^ u>

X XX

xxxco<.>o

co<a)ci<< a ix< flD o < < O D

C^

<QO'
o>oo
Cf\j

Q. O

>-

<n

LL.oOfNJ^^ r ^ ^ ^

-0 0 0 0 0 0 0

a o o o o o o o o

OOOOOOOO

Q. O O o o o o o o

<NJ

4,rO ->a-oocO orooo


3 ^ 9 ^ ' < ^ ^ O OO I AQO

<u T

3 'O

00 O ^O0 0 't hO (NJ (A m nO


c. 4 ) O OO tO 0 0 (M
O 4 -* O r- ^
^ h- <0
n fo ^ N.
E >0 f\4 Ht <N) h- 0 0
-4 - K> fNJ fO ^
O M

lA ^ m
N
lA 0 0 O

O IS- <M

>o Ni ro
- 'O rf\J r - ^

lA i n lA fO lA f - - ^ ^

-M
-M JO O O O O O O O O
</>

tOfO'O'OON-h-COOO

> (M s t0 0 r o o 0 0 r^ N 0
fNj rsj Nj 'O 'O

u- K>

^COOd
tr-^^
O t- O O O O O O O

ooooooooo
yj vT

V>
C

o
^ o
o OV
o *

oe, O

r- O
so eo 00 m
-. m Os sO 9^ fsj nO> 0 't
<0 ^ st >o O tn m lA O
in lA so ' t o c o
3 h0-0^ T- ro ro M ro lO 'O
</) m fO ^ O h - o lA 00
o ru K oo ro t- ro

o o o o o o o o o
o o o o o o o o o

0) 0 0

fOOvOOPt^OrOOM

4-roioro>troiA'4'
<NJ

O fsj 4A lA

t.
o.

0 ^ ^ i A r > o ^ h - u ^ > o

o II r-OOOOOsCNJNJOOOO
X ^
a

0)O O ^^sO sO r^>O sO iA

o 0>

H- v> '4o 0> r c. 'O


e flS fO
3 3 ro
V) 0*
C/) 'O
oo

O
nO ro
lA rsj
^
O

lA (Ni
Ov

04

> t SO
<-> NlA

ro

NJ

</> 00 SO 00 00
co A
so
X'4* SO O
r - lA lA
l-l
i o ro ro
I-i LA lO - so
T o f\J N.

41 ^
Q-Os OO f\l ro ro ro
M

\f\

TO
so SO '4lA lA Os
O 00
ro ro O
Os lA
fO
ro
a
o ro O fM
S4' ro LA '*
fVi fNi LA LA
lA
>o
(M
N00

t, ^
< 0 hD^
70^
00 o.

M- B
C8
I- to
Q.

dj000sf\j0h-0h-0^

M roror^NOiArO'J-t>f\j
<OOrOAJOOOQOO<>OJ

Eooo^o^-rO (M
-f-roiAO^soroN-rosfl^^
V'.00iAlA>O'4''OlOrO
r g r^ s O N tr o o O O O
UJ .................................................... .......
orvjroiArofMfNJforo
^

1
0 O
<0

01
TJ
C
a
O

4)
u w
4
3 "O
O O
</> E

O
4>

c O
LU

4)
O
C
3
X
O
GD
X X CD
c/) < fiO O < X < fiO <

4- 0)
o

E c.

(O 0>
- M

(0 c
m
X X m
.*-h < C Q O < X < C Q <

623

624

CAPTULO 14 OTROS TPICOS DE DISEO Y ANLISIS

Al revisar los resultados obtenidos de los tres enfoques, se observa que cada mtodo mejora de mane
ra sucesiva el ajuste del modelo en este ejemplo. Si hay una razn fundada para creer que la covariable no
interacta con los factores, quiz sea mejor establecer ese supuesto desde el principio del anlisis. Esta
opcin tambin puede ser dictada por el software. Aun cuando los paquetes de software para diseos ex
perimentales quiz slo tengan capacidad para modelar covariables que no interactan con los trata
mientos, el analista puede tener una oportunidad razonable de identificar los factores principales que
influyen en el proceso, incluso si hay alguna covariable por interaccin de tratamientos. Se observa asi
mismo que las pruebas usuales de la adecuacin del modelo siguen siendo apropiadas y se recomiendan
enrgicamente como parte del proceso de construccin del modelo del anlisis de covarianza ANCOVA.

14-4

M EDICIONES REPETIDAS

En el trabajo experimental de las ciencias sociales y el comportamiento, as como en algunos aspectos de


la ingeniera y las ciencias fsicas, las unidades experimentales son con frecuencia personas. Debido a las
discrepancias en experiencia, capacitacin o formacin, en algunas situaciones experimentales las dife
rencias en las respuestas de distintas personas al mismo tratamiento pueden ser muy grandes. A menos
que est controlada, esta variabilidad entre las personas se convertir en parte del error experimental, y
en algunos casos inflar significativamente el cuadrado medio del error, haciendo ms difcil detectar las
diferencias reales entre los tratamientos.
Es posible controlar esta variabilidad entre las personas utilizando un diseo en el que cada uno de
los a tratamientos se usa en cada persona (o sujeto). A ste se le llama diseo de mediciones repetidas.
En esta seccin se ofrece una breve introduccin a los experimentos de mediciones repetidas con un solo
factor.
Suponga que un experimento incluye a tratamientos y que cada tratamiento se va a usar exactamente
una sola vez en cada uno de n sujetos. Los datos apareceran como en la tabla 14-19. Vea que la observa
cin y,^ representa la respuesta del sujeto j al tratamiento i y que slo se usan n sujetos. El modelo que se
utiliza para este diseo es
y , j =/ i +T, +f i j +e, .

(14-45)

donde t, es el efecto del tratamiento i-simo y e s un parmetro asociado con el sujetoj-simo. Se supone
que los tratamientos son fijos (de donde
= 0) y que los sujetos empleados son una muestra aleato
ria de alguna poblacin ms grande de individuos potenciales. Por lo tanto, colectivamente los sujetos re
presentan un efecto aleatorio, por lo que se supone que la media de es cero y que la varianza de eso
Puesto que el trm inop es comn a todas las a mediciones del mismo sujeto, la covarianza &ntTeyjyy,j no

Tabla 14-19 Datos de un diseo de mediciones repetidas con un solo factor


Sujeto__________ Totales de
n
2
1
Uratamiento

los tratamientos

1
2

yn
yii

>l2

Yb.

y22

y^

yi.
y?-

y,i
y.i

y,2
y.2

yan

ya.

y.n

y..

Ibtales de los sujetos

625

14'4 MEDICIONES REPETIDAS

es, en general, cero. Se acostumbra suponer que la covarianza e n tr e y yy, es constante a lo largo de todos
los tratamientos y los sujetos.
Considere una particin en el anlisis de varianza de la suma de cuadrados total, por ejemplo
X (>'-y
i=i j=i

0. - y . )' + S E
1=1

)' =

(>'.J - y-i y

(14-46)

El primer trmino del miembro derecho de la ecuacin 14-46 puede considerarse como una suma de cua
drados que resulta de las diferencias entre los sujetos, y el segundo trmino es una suma de cuadrados de
las diferencias dentro de los sujetos. Es decir,
~

Las sumas de cuadrados


de libertad

Entre los sujetos

Dentro de los sujetos

iossujetos YS^Dentrodeiossujetos son estadsticamente independientes, con grados


an- = (n-)+n(a-l)

Las diferencias dentro de los sujetos dependen tanto de las diferencias en los efectos de los trata
mientos como de la variabilidad no controlada (ruido o error). Por lo tanto, la suma de cuadrados resul
tante de las diferencias dentro de los sujetos puede descomponerse de la siguiente manera:
' Z ' Z (yj - y j y = " 2 ( - y . )' + 2 S (>'// - 3^-. - y.j + y y
i=i y=i
=i
i-i i-i

(14-47)

El primer trmino del miembro derecho de la ecuacin 14-47 mide la contribucin de la diferencia entre
las medias de los tratamientos a
y el segundo trmino es la variacin residual debida al
error. Ambos componentes de
son independientes. Por lo tanto.
Dentro de los sujetos

^ ^Tratamientos

con los grados de libertad dados por

(a -l) = (a -l) -l-(a -l) (/z -l)


respectivamente.
Para probar la hiptesis de que no hay ningn efecto de los tratamientos, es decir,
= t ^ = ... = r , = 0
//p Al menos una t ^ O
se usara el cociente
c

_
-

1)
iS W ( -l)(" -l)

^ ^Tratamientos ^ ( ^

^Tratamientos

MS,

Si los errores del modelo siguen una distribucin normal, entonces bajo la hiptesis nula, H q-, t, = O, el es
tadstico F sigue una distribucin . i,
La hiptesis nula se rechazara si Fq >
- 1,(a- i)c- 1)En la tabla 14-20 se resume el procedimiento del anlisis de varianza, donde se presentan tambin
frmulas convenientes de clculo para las sumas de cuadrados. El lector deber identificar el anlisis de
varianza de un diseo de un solo factor con mediciones repetidas como el equivalente del anlisis de un
diseo de bloques completos aleatorizados, donde los sujetos se consideran como los bloques.

I
I

I
a

OJ
-o
-O

I
s

II

TI
I

I
3

(D

Vi
" i
1
"=nI

i"

<1^

S :| C
1
">;l ==
-=C^l =[X)a.
1

o. :| *
11

O
"B
g'
S
0

I Q1
626

C
'O
1ed
hV
3
C3/D

g
13
eS

14-5 PROBLEMAS

14-5

627

PROBLEMAS -------- -----------------------------------------------------------------------

14-1. Considere nuevamente el problema 5-22. Usar el procedimiento de Box-Coxpara determinar si es apropiada
(o til) una transformacin de la respuesta para analizar los datos de este experimento.
14-2. En el ejemplo 6-3 se seleccion una transformacin logartmica para la respuesta velocidad de avance de una
perforadora. Usar el procedimiento de Box-Cox para demostrar que se trata de una transformacin de datos
apropiada.
14-3. Considere de nuevo el experimento del proceso de fundicin del problema 8-23, donde se us un diseo fac
torial fraccionado 2- para estudiar el peso del material de empaque que se adhiere a nodos de carbono
despus de la coccin. Se hicieron tres rplicas de las ocho corridas del diseo, y el peso promedio y el rango
de los pesos de cada combinacin de prueba se trataron como las variables de respuesta, Existe algn indi
cio de que se necesite una transformacin para cualquiera de las dos respuestas?
14-4. En el problema 8-24 se us un diseo factorial fraccionado con rplicas para estudiar el abombamiento o
combadura del sustrato en la fabricacin de semiconductores. Se usaron como variables de respuesta tanto la
media como la desviacin estndar de las mediciones de la combadura. Existe algn indicio de que se nece
site una transformacin para cualquiera de las dos respuestas?
14-5. Considere nuevamente el experimento del recubrimiento fotoprotector del problema 8-25. Usar la varianza
del espesor del recubrimiento en cada combinacin de prueba como la variable de respuesta. Existe algn
indicio de que se necesite una transformacin?
14-6. En el experimento defectos en la rejilla del problema 8-29 se emple una variante de la transformacin de la
raz cuadrada en el anlisis de los datos. Usar el mtodo de Box-Cox para determinar si sta es la transforma
cin apropiada.
14-7. En el diseo central compuesto del problema 11-14 se obtuvieron dos respuestas, la media y la varianza del
espesor del xido. Usar el mtodo de Box-Cox para investigar la utilidad potencial de una transformacin
para estas dos respuestas. Es apropiada la transformacin logartmica sugerida en el inciso c de ese proble
ma?
14-8. En el diseo factorial 3^ del problema 11-33, una de las respuestas es la desviacin estndar. Usar el mtodo
de Box-Cox para investigar la utilidad de las transformaciones para esta respuesta. Cambiara su contesta
cin si se usara la varianza como la respuesta?
14-9. En el problema 11-34 se sugiere usar ln(5^) como la respuesta (referirse al inciso b). El mtodo de Box-Cox
indica que es apropiada una transformacin?
14-10. Un distribuidor de bebidas gaseosas est estudiando la efectividad de los mtodos de descarga. Se han desa
rrollado tres tipos diferentes de carretillas, y se lleva a cabo un experimento en el laboratorio de ingeniera de
mtodos de la compaa. La variable de inters es el tiempo de descarga en minutos (y); sin embargo, el tiem
po de descarga tambin guarda una estrecha relacin con el volumen de las cajas descargadas (jc). Cada ca
rretilla se us cuatro veces y se obtuvieron los datos siguientes. Analizar estos datos y sacar las conclusiones
apropiadas. Utilizar a = 0.05.
Tipo de carretilla
2

y
27
44
33
41

24
40
35
40

y
25
35
46
26

26
32
42
25

y
40
22
53
18

38
26
50
20

14-11. Calcular las medias ajustadas de los tratamientos y los errores estndar de stas para los datos del problema
14*10.
14-12. A continuacin se presentan las sumas de cuadrados y los productos de un anlisis de covarianza de un solo
factor. Tferminar el anlisis y sacar las conclusiones apropiadas. Utilizar a = 0.05.

632

BIBLIOGRAFA

Conover, W J. y R.L. Imn. [30b.] Rank Tiansformations as a Bridge Between Parametric and Nonparametric Statistics (con comentarios), en The American Statistician, vol. 35, pp. 124-133.
Conover, WJ., M.E. Johnson y M.M, Johnson. [31.] A Comparative Study of Tests for Homogeneity of
Variances, with Applications to the Outer Continental Shelf Bidding Data, en Technometrics, vol. 23, pp.
351-361.
Cook, D.R. [32a.] Detection of Influential Observations in Linear Regression, en Technometrics, vol.
19, pp. 15-18.
Cook, D.R. [32b.] Influential Observations in Linear Regression, &a. Journal o f the American Statistical
Association, vol. 74, pp, 169-174.
Cornell, J.A. [33.] Experiments with Mixtures: Designs, Models, and theAnafysis o f Mixture Data. 2a. edi
cin, Wiley, Nueva York,
Cornfeld, J. y J.W. Tukey, [34.] Average Valu of Mean Squares in Factorials, enAnnals o f Mathematical Statistics, vol. 27, pp. 907-949.
Daniel, C. [35a.] Use of Half-Normal Plots in Interpreting Factorial Ttvo Level Experiments, en Tech
nometrics, vol. 1, pp. 311-342.
Daniel, C. [35b.] Applications o f Statistics to Industrial Experimentation. Wiley, Nueva York.
Davies, O.L. [36.]Design andAnalysis o f Industrial Experiments. 2a. edicin, Hafner Publishing Company,
Nueva York.
Derringer, G. y R. Suich. [37.] Simuhaneous Optimization of Several Response Variables, en Journal o f
Quality Technology, vol. 12, pp. 214-219.
Dolby, J.L. [38.] A Quick Method for Choosing a Transformation, en Technometrics, vol. 5, pp. 317-326.
Draper, N.R. y W.G. Hunter. [39.] Transformations: Some Examples Revisited, en Technometrics, vol.
11, pp. 23-40.
Duncan, A.J. [40.] Quality Control and Industrial Statistics. 5a. edicin, Richard D. Irwin, Homewood, 111.
Duncan, D.B. [41.] Mltiple Range and Mltiple F Ifests, en Biometrics, vol. 11, pp. 1-42,
Dunnett, C.W, [42.] New Tibies for Mltiple Comparisons with a Control, en Biometrics, vol, 20, pp,
482-491.
Eisenhart, C. [43.] The Assumptions Underlying the Analysis of Variance, en Biometrics, vol. 3,
pp, 1-21.
Fisher, R.A. [44a.] Statistical Methods for Research Workers. 13ava edicin, Oliver & Boyd, Edimburgo.
Fisher, R.A. [44b.] The Design o f Experiments. 8a. edicin, Hafner Publishing Company, Nueva York.
Fisher, R,A. y F. Yates. [45,] Statistical Tables for Biological, Agricultural, and Medical Research. 4a, edi
cin, Oliver & Boyd, Edimburgo.
Fres, A. y W.G. Hunter. [46.] Minimum Aberration 2*'^ Designs, en Technometrics, vol. 22, pp. 601-608.
Gaylor, D.W. y T.D. Hartwell, [47.] Expected Mean Squares for Nested Classifications, en Biometrics,
vol. 25, pp. 427-430.
Gaylor, D.W. y F.N. Hopper. [48.] Estimating the Degrees of Freedom for Linear Combinations of Mean
Squares by Satterthwaites Formula, en Technometrics, vol. 11, no. 4, pp, 699-706.
Graybill, FA, y D.L. Weeks. [49,] Combining Interblock and Intrablock Information in Balanced Incomplete Blocks, enAnnals o f Mathematical Statistics, vol. 30, pp. 799-805.
Graybill, F.A. [50.] A n Introduction to Linear Statistical Models. Vol. 1, McGraw-Hill, Nueva York.

BIBLIOGRAFA

633

Graybill, F.A. y C.M. Wang. [51.] Confidence Intervals on Nonnegative Linear Combinations of Variances, en Journal o f the American Statistical Association, vol. 75, pp. 869-873.
Ramada, M. y N. Balakrishnan. [52.] Analyzing Unreplicated Factorial Experments: A Review with
Some New Proposals (con comentarios), en Statistica Snica, vol. 8, pp. 1-41,
Hamada, M. y C.F.J. Wu. [53.] Analysis of Designed Experiments with Complex Aliasing, en Journal o f
Quality Technology, vol. 24, no, 3, pp. 130-137.
Hill, W,G. y W.G. Hunter. [54.] A Review of Response Surface Methodology: A Literature Survey, en
Technometrics, vol, 8, pp. 571-590.
Hies, W.W. y D.C. Montgomeiy. [55.] Probability and Statistics in Engineering and Management Science.
3a. edicin, Wiley, Nueva York.
Hocking, R.R. [56.] A Discussion of the IVvo-Way Mixed Model, en The American Statistician, vol. 27,
no. 4, pp. 148-152.
Hocking, R,R., O.E Hackney y F.M. Speed. [57.] The Analysis of Linear Models with Unbalanced D ata,
en Contributions to Survey Sampling and Applied Statistics, H.A. David (ed.), Academic Press, Nueva
York.
Hocking, R.R. y F.M, Speed. [58.] A Full Rank Analysis of Some Linear Model Problems,
the American Statistical Association, vol. 70, pp. 706-712.

Journal o f

Hunter, J.S. [59a.] Statistical Design Applied to Product Design, en Journal o f Quality Technology, vol.
17, pp, 210-221.
Hunter, J.S. [59b.] Lets All Beware the Latin Square, en Quality Engineering, vol. 1, pp. 453-465.
John, J,A. y P. Prescott. [60.] Critical Vales of a Tfest to Detect Outliers in Factorial Experiments, en
Applied Statistics, vol. 24, pp. 56-59.
John, P.W.M, [61a.] The Three-Quarter Replicates of 2^ and 2^ Designs, en Biometrics, vol. 17, pp.
319-321.
John, P.W.M. [61b.] Three-Quarter Replicates of 2" Designs, en Biometrics, vol. 18, pp. 171-184.
John, P.W.M. [61c.] Blocking a 3(2" *") Design, en Technometrics, vol. 6, pp. 371-376.
John, P,W,M. [61d.] Statistical Design and Analysis o f Experiments. Macmillan, Nueva York.
Kackar, R,N. [62.] Off-Line Quality Control, Parameter Design, and the Tkguchi Method, en Journal o f
Quality Technology, vol. 17, pp, 176-188.
Kempthorne, O. [63.] The Design and Analysis o f Experiments. Wiley, Nueva York.
Keuls, M, [64.] The Use of the Studentized Range in Connection with an Analysis of Variance, en Euphytica, vol. 1, pp. 112-122.
Kiefer, J. [65a,] Optimum Experimental Designs, en Journal ofthe Royal Statistical Society B, vol. 21, pp.
272-304.
Kiefer, J. [65b.] Optimum Designs in Regression Problems, enAnnals o f Mathematical Statistics, vol. 32,
pp. 298-325.
Kiefer, J. y J. Wolfowitz. [66.] Optimum Designs in Regression Problems, enAnnals o f Mathematical
Statistics, vol, 30, pp. 271-294,
Khuri, A.I, y J,A, Cornell. [67,] Response Surfaces: Designs andAnalyses. 2a. edicin, Dekker, Nueva York,
Kruskal, W.H, y WA. WalUs. [68,] Use of Ranks on One Criterion Variance Analysis, en Journal ofthe
American StatisticalAssociation,vo\. 47, pp. 583-621 (las correcciones aparecen en el vol. 48, pp. 907-911),

634

BIBLIOGRAFA

Lamtz, K. y P. Whitcomb. [69.] Use of Replication in Almost Unreplicated Factorials, ponencia presen
tada en la Conferencia Tcnica de Otoo, Corning, N.Y,
Lenth, R.V [70.] Quick and Easy Analysis of Unreplicated Factorials, en Technometrics, vol. 31, pp.
469-473.
Len, R.V, A.C. Shoemaker y R.N. Kackar. [71.] Performance Measures Independent of Adjustment,
en Technometrics, vol. 29, pp. 253-265.
Levene, H. [72.] Robust Ifests for Equality of Variance, en Contributions toProbabity and Statistics, Z.
Olkin, ed., Stanford University Press, Palo Alto, CA, pp. 278-292.
Loughin, T.M. [73.] Calibration of the Lenth Ifest for Unreplicated Factorial Designs, en Journal of
Quality Technology, vol. 30, pp. 171-175.
Loughin, T.M. y W. Noble. [74.] A Permutation Test for Effects in an Unreplicated Factorial Design, en
Technometrics, vol. 39, pp. 180-190.
Margolin, B.H. [75a.] Systematic Methods of Analyzing 2"3'" Factorial Experiments with Applications,
en Technometrics, vol. 9, pp. 245-260.
Margolin, B.H. [75b.] Results on Factorial Designs of Resolution IV for the 2" and 2"3'" Series, en Tech
nometrics, vol. 11, pp. 431-444.
McCullagh, P. y J.A. Nelder. [76.] Generalized Linear Models. 2a. edicin, Chapman & Hall, Nueva York.
Miller, R.G. [77.] Simultaneous Statistical Inference. Springer-Veriag, Nueva York.
Miller, R.G., Jr. [78.] Developments in Mltiple Comparisons, 1966-1976,
Statistical Association, vol. 72, pp. 779-788.

Journal o f the American

Milliken, G.A. y D.E. Johnson. \19.]Analysis ofMessyData, Vol. 1. Van Nostrand Reinhold, Nueva York.
Montgomery, D.C. [80a.] Introduction to Statistical Quality Control. 3a. edicin, Wiley, Nueva York.
Montgomery, D.C. [80b.] Experimental Design for Product and Process Design and Development, en
Journal o f the Royal Statistical Society, D, vol. 48, pp. 159-177.
Montgomery, D.C., C.M. Borror y J.D. Stanley. [81.] Some Cautions in the U se ofPlackett-Burman D e
signs, en Quality Engineering, vol. 10, pp. 371-381.
Montgomery, D.C. y E.A. Peck. [82.] Introduction to Linear Regression Analysis. 2a. edicin, Wiley, Nueva
York.
Montgomery, D.C. y G.C. Runger. [83a.] Gauge Capability Analysis and Designed Experiments. Part I:
Basic Methods, en Quality Engineering, vol. 6, pp. 115-135.
Montgomeiy, D.C. y G.C. Runger. [83b.] Gauge Capabihty Analysis and Designed Experiments. Part II;
Experimental Design Models and Variance Component Estimation, en Quality Engineering, vol. 6, pp.
289-305.
Montgomeiy, D.C. y G.C. Runger. [83c.] Foldovers of
Resolution IV Designs, tn Journal o f Quality
Technology, vol. 24, pp. 446-450.
Montgomery, D.C. y G.C. Runger. [83d.] Probabilidad y estadstica aplicadas para ingenieros. 2a. edicin,
Limusa-Wiley, Mxico.
Myers, R.H. [84,] Classical and Modern Regression with Applications. 2a. edicin, PNS-Kent, Boston.
Myers, R.H. y D.C. Montgomery. [85a.] Response Surface Methodology: Process and Product Optimization
Using Designed Experiments, Wey, Nueva York.
Myers, R.H. y D.C. Montgomery. [85b.] ATtorial on Generalized Linear Models, en Journal o f Quality
Technology, vol. 29, pp. 274-291.

BIBLIOGRAFA

635

Nair, V.N. et a l (eds.) [86.] Tkguchis Parameter Design: A Panel Discussion, en Technometrics, vol. 34,
pp. 127-161.
Nelder, J.A. y R.W.M. Wedderbum. [87.] Generalized Linear Models, en Journal ofthe Royal Statistical
Society, A , vol. 135, pp. 370-384.
Nelson, L.S. [88a.] Using Nested Designs I: Estimation of Standard Deviations, en Journal o f Quality
Technology, vol. 27, no. 2, pp. 169-171.
Nelson, L.S. [88b.] Using Nested Designs II: Confidence Limits for Standard Deviations, tn Journal o f
Quality Technology, vol. 27, no. 3, pp. 265-267.
Nelson, L.S. [88c.] Variance Estimation Using Staggered, Nested Designs, enJoum alof Quality Techno
logy, vol. 15, pp, 195-198.
Nelson, P.R. [89.] Mltiple Comparison of Means Using Simultaneous Confidence Intervals, en Journal
o f Quality Technology, vol. 21, No, 4, pp. 232-241.
Newman, D, [90.] The Distribution of the Range in Samples from a Normal Population, Expressed in
Terms of an Independent Estmate of Standard Deviation, en Biometrika, vol. 31, pp. 20-30.
ONeill, R, y G.B. Wetherill, [91.] The Present State of Mltiple Comparison Methods, cnJoumal ofthe
Royal Statistical Society, B, vol. 33, pp, 218-241.
Ostle, B. [92,] Statistics in Research. 2a. edicin, lowa State Press, Ames, lowa.
Pearson, E.S. y H.O. Hartley. [93a.] Biometrika Tablesfor Statisticians. Vol. 1 ,3a. edicin, Cambridge University Press, Cambridge.
Pearson, E.S. y H.O. Hartley. [93b.] Biometrika Tables for Statisticians. Vol. 2, Cambridge University
Press, Cambridge.
Pignatiello, J.J., Jr. y J.S. Ramberg. [94.] Tbp Ifcn THumphs and Tragedies of Genichi Thguchi, en Qua
lity Engineering, vol. 4, pp. 211-225.
Plackett, R.L. y J.P. Burman. [95.] The Design of Optimum Multifactorial Experiments, en Biometrika,
vol. 33, pp. 305-325.
Quenouille, M.H. [96.] The Design andAnalysis o f Experiments. Charles Griffin & Company, Londres.
Satterthwaite, EE. [97.] An Approximate Distribution of Estimates of Variance Components, en Biometrics B ull, vol. 2, pp. 110-112.
Scheff, H. [98a.] A Method for Judging All Contrasts in the Analysis of Variance, en Biometrika, vol.
40, pp. 87-104.
Scheff, H. [98b.] A Mixed Model for the Analysis of Variance, tnA n n als o f Mathematical Statistics,
vol. 27, pp. 23-36.
Scheff, H. [98c.] Altemative Models for the Analysis of Variance, enAnnals o f Mathematical Statistics,
vol. 27, pp. 251-271,
Scheff, H. [98d.] The Analysis o f Variance. Wiley, Nueva York.
Searle, S.R. [99a.] Linear Models. Wiley, Nueva York.
Searle, S.R. [99b.] Tbpics in Variance Component Estimation, en Biometrics, vol. 27, pp. 1-76.
Searle, S.R. [99c.] Linear M odeb for Unbalanced Data. Wiley, Nueva York.
Searle, S.R., G. Casella y G.E. McCulloch. [100.] Variance Components. Wiley, Nueva York.
Searie, S.R. y R.E Fawcett. [101.] Expected Mean Squares in Variance Component Models Having Finite Populations, en Biometrics, vol. 26, pp. 243-254.

636

BIBLIOGRAFA

Searle, S.R., F.M. Speed y H .V Henderson. [102.] Some Computational and Model Equivalences in
Analyses of Variance of Unequal-Subclass-Numbers Data, en The American Statistician, vol. 35, pp.
16-33.
Smith, H.F. [103.] Interpretations of Adjusted Tteatment Means and Regressions in Analysis of Covariance, en Biometrics, vol. 13, No. 3, pp, 282-308.
Smith, J.R. y J.M. Beverly, [104.] The Use and Analysis of Staggered Nested Factorial Designs, en Jour
nal o f Quality Technology, vol. 13, pp. 166-173.
Speed, F.M. y R.R. Hocking. [105.] The Use of the R{ )-Notation with Unbalanced Data, en The Ameri
can Statistician, vol. 30, pp. 30-33.
Speed, F.M., R.R. Hocking y O.P. Hackney. [106.] Methods of Analysis of Linear Models with Unbalan
ced Data, en Journal o f the American Statistical Association, vol. 73, pp. 105-112.
Stefansky, W. [107.] Rejecting Outliers in Factorial Designs, en Technometrics, vol. 14, pp. 469-479.
Taguchi, G. [108a.] System o f Experimental Design: Engineering Methods to Optimize Quality and Minimize
Cost. UNIPUB, White Plains, Nueva York.
Ihguchi, G. [108b.] Introduction to Quality Engineering. Asian Productivity Organization, UNIPUB, Whi
te Plains, Nueva York.
Tkguchi, G. y Y. Wu. [109.] Introduction to Off-Line Quality Control. Central Japan Quality Control Asso
ciation, Nagoya, Japn.
Ting, N., R.K. Burdick, F.A. Graybill, S. Jeyaratnam y X-F C. Lu. [110.] Confidence Intervals on Linear
Combinations of Variance Components That Are Unrestricted in Sign, en Journal o f Statistical Computation and Simulation, vol. 35, pp. 135-143.
Tukey, J.W. [I lla .] One Degree of Freedom for Non-Additivity, en Biometrics, vol. 5, pp. 232-242.
Tukey, J.W. [111b.] Comparing Individual Means in the Analysis of Variance, en Biometrics, vol. 5, pp.
99-114.
Tukey, J.W. [lile .] Quick and Dirty Methods in Statistics, Part II, Simple Analysis for Standard D e
signs, enProceedings ofthe FifthAnnual Convention, American Society for Quality Control, pp. 189-197.
Tbkey, J.W. [11 Id.] The Problem of Mltiple Comparisons, notas inditas, Princeton University.
Winer, B.J. [112,] Statistical Principies inEjq>erimental Design. 2a. edicin, McGraw-Hill, Nueva York.
Yates, F. [113a.] The Analysis of Mltiple Classifications with Unequal Numbers in the DrEferent Classes, en Journal o f the American Statistical Association, vol. 29, pp. 52-66.
Yates, F. [113b.] Design and Analysis o f Factorial Experiments. Comunicado tcnico No. 35, Imperial Bu
rean of Soil Sciences, Londres.
Yates, F. [113c.] The Recovery of Interblock Information in Balanced Incomplete Block Designs, en
Annals o f Eugenias, vol. 10, pp. 317-325.
Ye, K. y M. Hamada. [114.] Critical Vales of the Lenth Method for Unrephcated Factorial Designs, en
Journal o f Quality Technology, vol. 32, pp. 57-66.

Apndice

I Distribucin normal estndar acumulada


n

Puntos porcentuales de la distribucin t

i n Puntos porcentuales de la distribucin


IV
V

Puntos porcentuales de la distribucin F


Curvas de operacin caracterstica para el anlisis de varianza del modelo con efectos fijos

VI Curvas de operacin caracterstica para el anlisis de varianza del modelo con efectos aleatorios
VII Rangos significativos para la prueba del rango mltiple de Duncan

Vin Puntos porcentuales del estadstico del rango studentizado


IX Valores crticos para la prueba de Dunnett para comparar tratamientos con un control
X Coeficientes de polinomios ortogonales
XI Nmeros aleatorios
Xn

Relaciones de alias para diseos factoriales fraccionados 2*"' ^ con

15 y w < 64

Xin Glosario para el uso de Design Expert

637

638

APNDICE

Distribucin nonnal estndar acumulada"

.00

.01

.02

.03

.04

.51197
.55172
.59095
.62930
.66640

.51595
.55567
.59483
.63307
.67003

0
.1
.2
.3
.4

.0
.1
.2
.3
.4

.50000
.53983
.57926
.61791
.65542

.50399
.54379
.58317
,62172
.65910

.50798
.54776
.58706
,62551
.66276

.5
.6
.7
.8
.9

.69146
.72575
.75803
.78814
.81594

.69497
.72907
.76115
.79103
.81859

.69847
.73237
.76424
.79389
.82121

.70194
.73565
.76730
.79673
.82381

.70540
.73891
.77035
.79954
.82639

.5
.6
.7
.8
.9

1.0
1.1
1.2
1.3
1.4

.84134
.86433
.88493
.90320
.91924

.84375
.86650
.88686
.90490
.92073

.84613
,86864
.88877
.90658
.92219

.84849
.87076
.89065
.90824
.92364

.85083
.87285
.89251
.90988
.92506

1.0
1.1
1.2
1.3
1.4

1.5
1.6
1.7
1.8
1.9

.93319
.94520
.95543
.96407
.97128

.93448
.94630
.95637
.96485
.97193

.93574
.94738
.95728
.96562
.97257

.93699
.94845
.95818
.96637
.97320

.93822
.94950
.95907
.96711
.97381

1.5
1.6
1.7
1.8
1.9

2.0
2.1
2.2
2.3
2.4

.97725
.98214
.98610
.98928
.99180

.97778
.98257
.98645
.98956
.99202

.97831
.98300
.98679
.98983
.99224

.97882
.98341
.98713
.99010
.99245

.97932
.93882
.98745
.99036
.99266

2.0
2.1
2.2
2.3
2.4

2.5
2.6
2.7
2.8
2.9

.99379
.99534
.99653
.99744
.99813

.99396
.99547
.99664
.99752
.99819

.99413
.99560
.99674
.99760
.99825

.99430
.99573
.99683
.99767
.99831

.99446
.99585
.99693
.99774
.99836

2.5
2.6
2.7
2.8
2.9

3.0
3.1
3.2
3.3
3.4

.99865
.99903
.99931
.99952
.99966
99977

.99869
.99906
.99934
.99953
.99968

.99874
.99910
.99936
.99955
.99969

.99878
.99913
.99938
.99957
.99970

.99882
.99916
.99940
.99958
.99971

3.0
3.1
3.2
3.3
3.4

.99978
.99985
.99990
.99993
.99995

.99978
.99985
.99990
.99993
.99996

.99979
.99986
.99990
.99994
.99996

.99980
,99986
.99991
.99994
.99996

3.5
3.6
3.7
3.8
3.9

3.5
3.6
3.7
3.8
3.9

.99984
.99989
.99993
.99995

ed.,W.W,
Hies y D.C. Montgomery, Wiley, Nueva York

APNDICE

Distribucin normal estndar acumulada (continuadn)

*(?)

1
= . VTir

.05

.06

.07

.08

.09

.0
.1
.2
.3
.4

.51994
.55962
.59871
.63683
.67364

.52392
.56356
.60257
.64058
.67724

.52790
.56749
.60642
.64431
.68082

.53188
.57142
.61026
.64803
.68438

.53586
.57534
.61409
.65173
.68793

.0
.1
.2
.3
.4

.5
.6
.7
.8
.9

.70884
.74215
.77337
.80234
.82894

.71226
.74537
.77637
.80510
.83147

.71566
.74857
.77935
.80785
.83397

.71904
.75175
.78230
.81057
.83646

.72240
.75490
.78523
.81327
.83891

.5
.6
.7
.8
.9

1.0

.85314
.87493
.89435
.91149
.92647

.85543
.87697
.89616
.91308
.92785

.85769
.87900
.89796
.91465
.92922

.85993
.88100
.89973
.91621
.93056

.86214
.88297
.90147
.91773
.93189

.93943
.95053
.95994
.96784
.97441

.90462
.95154
.96080
.96856
.97500

.94179
.95254
.96164
.96926
.97558

.94295
.95352
.96246
.%995
.97615

.94408
.95448
.%327
.97062
.97670

.97982
.98422
.98778
.99061
.99286

.98030
.98461
.98809
.99086
.99305

.98077
.98500
.98840
.99111
.99324

.98124
.98537
.98870
.99134
.99343

.98169
.98574
.98899
.99158
.99361

2.0
2.1
2.2
2.3
2.4

.99477
.99609
.99711
.99788
.99846

.99492
.99621
.99720
.99795
.99851

.99506
-9%32
.99728
.99801
.99856

.99520
.99643
.99736
.99807
.99861

2.5
2.6
2.7

2.9

.99461
.99598
.99702
.99781
.99841

3.0
3.1
3.2
3.3
3.4

.99886
.99918
.99942
.99960
.99972

.99889
.99921
.99944
.99961
.99973

.99893
.99924
.99946
.99962
.99974

.99897
.99926
.99948
.99964
.99975

.99900
.99929
.99950
.99965
.99976

3.0
3.1
3.2
3.3
3.4

3.5
3.6
3.7
3.8

.99981
.99987
.99991
.99994

3.9

.99996

.99981
.99987
.99992
.99994
.99996

.99982
.99988
.99992
.99995
.99996

.99983
.99988
.99992
.99995
.99997

.99983
.99989
.99992
.99995
.99997

3.5
3.6
3.7
3.8
3.9

1.1
1.2

1.3
1.4
1.5
1.6

1.7
1.8

1.9
2.0
2.1
2.2

2.3
2.4
2.5
2.6

2.7
2.8

1.0
1.1

1.2

1.3
1.4
1.5
1.6

1.7
1.8

1.9

2.8

2.9

639

640

APENDICE
n.

.40

.25

.10

Puntos porcentuales de la distribucin t

.05

.025

.01

.005

.0025

.001

.0005
636.62
31.598
12.924
8.610

1
2
3
4

.325
.289
.277
.271

1.000
.816
.765
.741

3.078
1.886
1.638
1.533

6.314
2.920
2.353
2.132

12.706
4,303
3.182
2.776

31.821
6.965
4.541
3.747

63.657
9.925
5.841
4.604

127.32
14.089
7.453
5.598

318.31
23.326
10.213
7.173

5
6
7
8
9

.267
.265
.263
.262
.261

.727
.727
.711
.706
.703

1.476
1.440
1.415
1.397
1.383

2.015
1.943
1.895
1.860
1.833

2.571
2.447
2.365
2.306
2.262

3.365
3.143
2.998
2,896
2.821

4.032
3.707
3.499
3.355
3.250

4.773
4,317
4.019
3.833
3.690

5.893
5.208
4.785
4.501
4.297

6.869
5.959
5.408
5,041
4,781

10
11
12
13
14

.260
.260
.259
.259
.258

,700
.697
.695
.694
.692

1.372
1.363
1.356
1.350
1.345

1.812
1.796
1.782
1,771
1.761

2.228
2.201
2.179
2.160
2.145

2.764
2.718
2.681
2.650
2.624

3.169
3.106
3.055
3.012
2.977

3.581
3.497
3.428
3,372
3.326

4,144
4.025
3,930
3,852
3.787

4,587
4.437
4.318
4.221
4.140

15
16
17
18
19

.258
.258
.257
.257
.257

.691
.690
.689
.688
.688

1.341
1,337
1.333
1.330
1.328

1.753
1.746
1.740
1.734
1.729

2.131
2,120
2.110
2.101
2.093

2.602
2.583
2.567
2.552
2.539

2.947
2.921
2.898
2.878
2.861

3.286
3.252
3.222
3.197
3.174

3.733
3.686
3.646
3.610
3.579

4.073
4.015
3,965
3.922
3,883

20
21
22
23
24

.257
.257
.256
.256
.256

.687
.686
.686
.685
,685

1.325
1.323
1.321
1.319
1.318

1.725
1.721
1.717
1,714
1,711

2.086
2.080
2.074
2.069
2.064

2.528
2.518
2,508
2.500
2.492

2.845
2.831
2.819
2.807
2.797

3.153
3.135
3.119
3.104
3.091

3.552
3.527
3.505
3.485
3.467

3.850
3.819
3.792
3,767
3.745

25
26
27
28
29

.256
.256
.256
.256
.256

.684
.684
.684
.683
.683

1.316
1.315
1.314
1.313
1.311

1.708
1.706
1.703
1.701
1.699

2.060
2.056
2.052
2.048
2.045

2.485
2.479
2,473
2.467
2.462

2.787
2.779
2.771
2.763
2.756

3.078
3.067
3.057
3,047
3.038

3.450
3.435
3.421
3.408
3.396

3.725
3.707
3.690
3,674
3,659

30
40
60
120
00

.256
.255
.254
.254
.253

.683
.681
.679
.677
.674

1.310
1,303
1.296
1.289
1.282

1.697
1,684
1.671
1.658
1.645

2.042
2,021
2.000
1.980
1.960

2.457
2.423
2.390
2.358
2.326

2.750
2.704
2.660
2.617
2.576

3.030
2.971
2.915
2,860
2.807

3.385
3.307
3.232
3.160
3.090

3.646
3.551
3.460
3.373
3.291

= grados de libertad.
Adaptada con permiso de Biometrika Tablesfor Statisticians, vol. 1 ,3a. ed E.S. Pearson y H.O. Hartley,
Cambridge University Press, Cambridge
V

APNDICE
HL

Puntos porcentuales de la distribucin

.995

.990

.975

.950

.500

.050

.025

.0 1 0

.005

0.00 +
0.01
0.07
0.21
0.41

0.00 +
0.02
0.11
0.30
0.55

0.00 +
0.05
0.22
0.48
0.83

0.00 +
0.10
0.35
0.71
1.15

0.45
1.39
2.37
3.36
4.35

3.84
5.99
7,81
9.49
11.07

5.02
7.38
9.35
11.14
12.38

6.63
9.21
11.34
13.28
15.09

7.88
10.60
12.84
14.86
16.75

6
7
8
9
10

0.68
0.99
1.34
1.73
2.16

0.87
1.24
1.65
2.09
2.56

1.24
1.69
2.18
2.70
3.25

1.64
2.17
2.73
3.33
3.94

5.35
6.35
7.34
8.34
9.34

12.59
14.07
15.51
16.92
18.31

14.45
16.01
17.53
19.02
20.48

16.81
18.48
20.09
21.67
23.21

18.55
20.28
21.96
23.59
25.19

11
12
13
14
15

2.60
3.07
3.57
4.07
4.60

3.05
3.57
4.11
4.66
5.23

3.82
4.40
5.01
5.63
6.27

4.57
5.23
5.89
6.57
7.26

10.34
11.34
12,34
13,34
14.34

19.68
2i;03
22.36
23,68
25.00

21.92
23.34
24.74
26.12
27.49

24.72
26.22
27.69
29.14
30.58

26.76
28.30
29.82
31.32
32.80

16
17
18
19
20

5.14
5.70
6.26
6.84
7.43

5.81
6.41
7.01
7.63
8.26

6.91
7.56
8.23
8.91
9,59

7.96
8.67
9.39
10.12
10.85

15.34
16.34
17.34
18.34
19.34

26,30
27.59
28.87
30,14
31.41

28.85
30.19
31.53
32.85
34.17

32.00
33.41
34.81
36.19
37.57

34.27
35.72
37.16
38.58
40.00

25
30
40
50
60

10.52
13.79
20.71
27.99
35.53

11.52
14.95
22.16
29.71
37.48

13.12
16,79
24.43
32.36
40.48

14.61
18.49
26.51
34.76
43.19

24.34
29.34
39.34
49.33
59.33

37.65
43.77
55.76
67.50
79.08

40.65
46.98
59.34
71.42
83.30

44.31
50.89
63.69
76.15
88.38

46.93
53.67
66.77
79.49
91,95

70
80
90
100

43.28
51.17
59.20
67.33

45.44
53.54
61.75
70.06

48.76
57.15
65.65
74.22

51.74
60.39
69.13
77.93

69.33
79.33
89.33
99.33

90.53
101.88
113.14
124.34

95.02
106.63
118.14
129.56

100.42
112.33
124,12
135.81

104.22
116.32
128.30
140,17

1
2
3
4
5

V = grados de libertad
Adaptada con permiso s Biometrika Tabks for Statisticiajis, vol. 1, 3a, ed,, E.S. Pearson y H.O. Hartiey,
Cambridge University Press, Cambridge

641

g->ocr^flp

r-Tru-ioof#'.

Or^p^oo
oo-^-^Q

p^-^u^oom

' C' ^r ^oo


r ^ f Tr c : :

oor-^' -r.

u-, r^flo
r^ -f
p

(x> n ^ 0\ ^ r ^ v ^ f S
60
VO
lA
^ ^

>o

oq r - o

o o ' i ^ O Q o ^

osooocr^'c

0 \ s p * %- ^ 0 v

r^'O'^^-d

oovoooo
t^r^NfMfs

r > j r 4 f Mf Sf ^

Or-'^CHQ

>^ \r ^ in f s ^ o Q O s
r*. t r i f Sm p^<r ) S * So4

oooof ^t - ^NC
( N c^ n c S s

Qoor'NOr;

^r^fsr^

aQo^ov

O^oor^'iO

^j r ^r ' , r^r*^

cn o o

r*%

r*, r<*-. f<j f*n r^i

00

00 tr>
-)spq'

o o - O r ^ >0
tSO>.
oo-or^
QO>or^ 'O't
o o r ^ ^ 0 ' 0 ^>
no tSfihr^O'T' ^

oor-'O^'O

^ t ^r - j oo

>or^O'Cr

o v f ^ >w^ # f % ( s - ^ ^ o
O^ o^ c c a o r ^
ir-.rn r**, r^ r^ f**i r^ r*^
ri r^} r-l f'i

T- . op Tj r n

a ^

r*, ^ t r i o o

MSr*jMCi rifSfSM.

f^ro'Ooo

A -t
rn N r4

ly',

> m

(n O

c^. ol 0^

r*^ cr r*'. t^. r*^.

fS ^

o o v %( Na ' > o

o4 r- r l "

ao

SSrSrl*-^

(t

g
t>l o

tN

PTI fr; (K| (S( 61

I
s

JO

T3

tf

^r**, ^ O

osf^egrioo
oo r ' ' . 5 ' r i

tsac^oo
T. ff-, - ^ o

Oy ^ ^ r^ ^
qcK'O'O'/^

lAr^Qc^D
i/ ^ v>! 7 > ' ^ ' ^

OQ

Tj- r^, rj

0 \ r'p ^ 0
r^f^fnton

'>wi n ' ^ ' ^

o^^^a^oo
^rimrrir;,

r't^'C'^w^

^ (N fN

i / ^c^Ooov^
r^r'jmfSo

cd

tt .

O
pL,

fSm '^p
o\ m <N fs

ost^ornch

Sr^'C in
-^

>Of*-.

ONi Ti - ^oo

on

' O *^^o^co

-^q

' O' o- ^c^ c^

S ^ O Q O '

^r^rS N

oo(7^r^<j'B

O
fno
fn ^Q

accp^r
^ o o^^'
o ^O'QC tfn-<^r jrv *^ v0^ 3- V t^so'o-^i
C
^ ^ ^ ' < 1;'^^

-f;

ap
in o c r c n O
C h
f ^ C'
- ^i qo
p o o p ^ f ^ s
p'O

opp^'C ^-^

oet^f-t^\>
r r^rnr^f T^f ri

C*^ fl fTl

ovoe>o>ooi>

rn on f^,

r'.

c^i

g
ai

0<7'0>(^(10

3 C d C ^

r^f^r^fTjr^

u
cjop-^Cr

f H 5 ^ p

''1
^
00 ff

o "T (N

OOP- ^P^ S nO W^ nv^w^v>

o v o o f - o o

f'i r j <^

o\f^n^

^ r ^ f * ^ r ^ p r j

f)

E^

r-i H

ggfspss

SKSKS

S S S S S

S K S R K

3^-525
S

S3g^

$SKSj;
S

< <s fn ^t

i'
642

0 - 2 2 3

22::22
S SS S S
(/t) jopuiujouap pp pBWsqnap sopEirj

S S8

2pi!?i:s

*^<^mo-c4

g& ^ffig
<s

;s f ; $ 3
w,-:-:

sfgovmro
? 2 " e^fSfSSS
q p ^ S i s ; cn
? m s^ s^a s i c p $
3 p a S

3 S 5 3 5

5 6 ! 3

H^S5

asS^S

SS5?

S5525

s-iaag

s^ s^s ^s ^s imi i s s K ; ^
2 2 3 2

! S n

s g s s i:

3 2 S 3 3

S5353

B35

i ^ ^ ^ s s s ! a ^ ^i s !

? B? 5 5 5 2 2 g ! ! B

^ ? 5 5 5 2

S
2 3 S
SS^S <
S si n^<g^S -S:
?a\uiwi
mr^tMMM

a S S S S

SfSSSP

a^SES ^E^ SS S 3 ^ 2 S p
- t Ki f l n mpj i Nr< ( Ni ^Hpj

SSS^S
~
^ ^

3 S S S K i S p ^ E p; s s K ^
^ ^ ^ ^ ^ ^ ^ ^ ^ ^

;g<5Nv^<^
=5f 3S rRo cgs ^Sf JSH fS' H f2' M2 f Ss i

Ssss

g 5s s K

PPSSS

s 3 3 H

u.

I5

I.

s? sss!

Sia222

H?H

s ^ p ; s 5 Hno^ms
g s s s q s s s s s
gsa^Dfn
omscSS
si

^ s^ s^i s^ s^

sseses

SSSSS

SSSSS

s s s s s

a s s a s

JS i.

fof SCMtNrj

rir^lcesri

5R?S5i
g\
3! on ir> fTi fn

O.

s R s

jooiinm

SNSfM3s Sts2(S 2 s H
S ^S rS rSj
fs fJ fs <

K^ss;;;

^ s s a s

i s H i hmm

s 2 2 s s

5 ^
^ ^ ^ ^ ^ 5s s s

r4H(\if'irj ricsri

S 2 S S
<N
S of'e 00 f' r^
_

ggf^S ^ S S S

o^t>r5^ r^n^c^MM iNrir^e^c^ <MSrr4r^ wf^ ^r r

a : 2 2 = :: ^ s s s s

s s s s a ^ Si Si S E:
wriHr

s a s s

s ^ a s s

22 = 2

S S S S S B S^Sl ' S
PMMfMfvj r H
w

s a s = S : 2 S S $ S ^ S S ? a Sa;;;3JS S S p j ? ;
mo^lo

rJrJ

e : ; 22 3S 3 S S
ri Hr- i ^ C4C4 CN M ^

Ksas; s a ^ g
cnCT'tn^

R s s s $:??! s^ r s s
r4(NrsrsfM Mcsr4(Nc^ SMrisrj

s?;ss
r^^irircs

9 = SP3

K; s

s s s

r^o^io^t r^rrjcsri<N csrMrr> f^fsf'itsr

r 4 p r j r j rJi'irMr

S22 S

M H ri (S

SSW
a s s s p R S 3 S 3 KSSK5
^ 0\ v^ Tf mcnf^p^ro mcsc^nH ^c4ri<ss H ^ i c s r i s

3 1g^
v fn
m <
O
f!S{?;gK O
^s ^
n
Ncj<Mr4. rj fs
H <s ri rJ

SKSS

SSSSS
S g: P p
cioi^^r S
M n <N ri (S

^ 00 Vi ^

? i 2 2t*iS

rr, pr\ rn <*\ r*\ r*^

S
SS3S: &S S S S
(7^f*%fncnM r4ri(Srir4

0 - 2 2 2 2 - 1 - 2

s s a s

ssRgsa

s t s g s

(
!
^
i
i
)JOpEunuonoppp pEU3<li|apsopero

643

o o
Fj o. c^
r*S fo tn <s
^

if xn r*
- . <> 00 n

'O

os od 4A

: F: S

-t rr

t r^

S S

s :q

ffi

fn ci

S S S : S

= S S S
cjr-f^ri-^

H S s H r j

rJI

g s s s

'B
t/3
C
fl
^

S S i S S S
-J

P ! = P ? : S

! S ? :F :p ;

gPl fS?; 2 ^ = S o S S S S gSSSS


rst-SrMc'l r^r-irjtMri rjri - _ _

S S 5 2 5 f=SSS; S S S 2 : E 2 2 S S S
Tf f*S rS rS r j rirrir'itN rjricjr>(S ciesc^csc

Ov 5

S S ? ?

p g S S S

S2;02 =
HfNr-iiNf^

SSK^K
_

sSSiqS
r^c<i(S(Nr n

?5? ? ^ 2 2

: :' Z ; S : J S

fsiMC'iHci f'iriMCSfs r4(S<Ncs^j Hcs ri csr i

o<

S S S S

g g s s

pK H

S S S S S fC

(N(N

3i ?

t*^

00

00
ml IT
ml
W

OS Pi
0'
m
es

5 ?q
r

ONQv ac s r-^
od <0 ^ ^ ff f^

oo n ( C>

\d

s s p s s
sf^^f^cs

5 ; ? ! S 5 S
rir< s fs (s

s s r
s ^
s r ^ s n c s

s g g ; : 3
pKrir4r4r4

vMc^c^ri

S S S f : ^
^riSrir^i

c ic s rS r

^ - - ^ n \ 0
^ O O ^ o o f'

- N ' . o . ^ o e ^
>^B>ctn r>

n m c m <h

<n

a s ; s s s
rifsH<Nfsj

c^ n o i

csirjr>i^<S

s s s s s
tst^tN fSfs

o?

n M o\
3 2Os o

O'

\C1 <N

00 ov
^ r^_ Ti
A o 0^ SD

in

MO s O C ' W" ,
r ^ o o o s o o

ov^o'^r^l >t *^t *v. ' o' ^

p^wnf Ti

r^ r^ r

cf<rScr4 (Soir4<N(S MC'Sri<>i (Mcc^rin

S5 S ^

s a ^ s s
(Tr^r^r^ri

risriciN

? ; S g 3 2
<s<scSfS<Ni

OO'O'OoO^
<frjfe^r

'> ^ O r ^ Q
^OOOSCK
fi^rn<scir'i

C^^tNOOO
oooioooor^
H csrJrJr-

*^

r^ fi C>

O'. Os es n
\o Oj /^
;

so^i/ip^O
^t^TfTr-<t

^O'O

csr'p^

v^NOr-vooos

S ^j

' osO nv^' O

cc

ci C ci oi "
R
^ ? q
r i r i r i r i cs

\r> o 0^ ^
f'*. ts ts
N H S ts

tn ^
H c H H

sO ^
o

l>

S ri c^

o
i>

c4 M ts H (S

oocnOsAM

tfS wS >A

sr-j

<7- Os <7i

00

. o s o o o e r -

R 2

<n

o q o o > " ^

sd

r^r^csriH r>f^'r^<NN c4es^ f^c f^HHc^r'

0T\i <^ r- 00

0-1 CM (N

ri H f^ rs (S

r<\ rfi tT. <Ti f^.

nfsooovc

'^m ^ooo
T T - t ^ ^ ' ^

f'i r j (s (N
(^t) ro p E u raio u g p p p p w o q n 3P sopEJO

644

........................................... , , .

T3

1
5

Ph

. . .

2S. g s : s ? 5 : $

SfSK $SsRS
Hr'icirif'i r H S Sri

12 i
1 e
i S
=
S O'
T3

; ^ 5 ! S g SS2 !C = ^ S ? p S
a S 3M; sNri
ri rj (Sr4r4r4r4 f'ir-ir(S--<

- :S 3 P E S
O O o <S
3;
^ ^

t-'^'cc^oc
fnr*^CjOO^O^oo
f sr ir ir ics
^

- ^
T TT

s a s
tT

QQ ^iT'
S
vO ^^r^r^i

Tt5(7>Oir
r']^Nr' ^^i^^

oooSNQ*
^pSp^rirJ

fs'ov^octri
SC
^ r*

o o tn < N - ^
fr-; c^^ (si M

fM\noor^r^

2 o r * ^ 3 i A

^ ' p r CM N N

::i

\ \

rf^ t^.

r*.

\ v%

<r.

rn

fO tN N M

riri^irifs

k::5S

^ ^ ^ 'S Z
p*^

N rs

T r<
rvS -^' Tf f*']

w-i*^
rK

v-

-t f^!

O 0^ o

^ 0

o\
00

^ ^ ^ ^ ^

t No o- ^ qc

^ o^o oo^

o C ^ Q ^
<^<Nfv^^

?7:9s r
s N sHri

as?3s22
rNrirri

" s s s s s s ? s ?
r4cNr4r4c^ ri-^
:

<N(N<NriS

^ ^ S ^ r J
ririfNrirj

2 2 l S
r i <s<N<Nr vi

S ^ o o S t
<n <

^ P J 2 ; :

csrifN(N<S ririr4r4ri rirrcNr


-

rirrifsfs

^S?^5 3??S2^
sc sa< Ns( fN :( N?i N; <SN3< ^Sr vKi r S
f*'!fnmrnfn
*n

NiNrincs

S
S^ ^^ S
\
NOQO^.

OO S
0 (N
^ aO
>c
-O kS w- Tf \ f

n M M N

^ ^ ^
^ n ^ ^
r4r44fMfSs ^^mcnncs

r 4 S < M' f S r 4

tr-.

^ o t-'f^ ^

N p
rjrifS S ri

<N<NMr 4( N

' >f\ Tr ^

o o r-tn ^ c ^

M<N<Ncs<s

^ 2 .
fn <N S

'^
^ 0

^ ^ Z

3S3S?:
<n r^i
;^SS5S2

(NrtSS

r^f-ir^f^<T

s <N
g; g
ri

m fn f

m f n r r r

<sr<Nr*r*

v^' O 0 \ 0 \
OO'Sw^rOfS
pfnrnrnc

OtN'fi^'P
*% <%<^fnr<

Osopoftoor-;

r ^ ^ 00
ritSririrJ

^^n*-0^^-'
r^r-^r^'A'A
r4(Sr4r4r4

u^co QO^
<Sriri<N<N

On c s ^ C O o
--
r ^ I p * Sf * ^ ' r n r ^

" C - m p r '
^c^O' Ooq
n rirS cs

ioc^poo^
oooo^-r^
stN r^H S

i nts
r^i^irjfors
ric^f^f^r4

" o S S S

S SS S S

SSES^

^ 5 5 ( 5

o ^ r ^ v o t n

i r j f n < Os r ^

w^^r>^^c^

p
^

S
P
PSSS
ri
r ^ r r i r r i

rr

oe
B v>
t ff^

^o O;
^ ^
M 00
M 00 ^

ooO'^ootn

S S S R R cSs iBn cSMSS KS R^KPJ


q
s c m o c s m

dsinsootn

r^ vS wS Tf Tf

Q n ' 0

o q t - ^ o ' ^ i n
fO

3?:R!iK
7;?!:S
H r4rr4< S
rirJirifNN

co-^-^oo

<S<SCS<S N

fn

PO

rircjcsr4

mo(7>r'i>

nSf^rrr

C^ P^

CpO Tt o
r ' ci vS wS wS

S gpS S

S S S P P ! $ $ 2 3 S ^i aEi
n^f^r^nr^ n^nfO*^*

? ?? ?; S ;:

=$SS

SflS

NO >0 wS

2S3!S$

o=;;;gpi o S K 3 P ? 5 ; s R ^ s s s ; s s s s p ? $ S 3 K c s a s s
dodt^t*^ \0^0'0'c>v0 O'O'OOO %wStfSr>(o v>wSS0 '^ rioioS'O
='' 2 = " 2 2

2SG 22

SSR???i S t $ 8

(^,i) Jo p E u iu jo u ap p p pEw aqil 3p sopEJO

645

Qsor'O
r^^^-n^Q^m
o iT g a00o o>o oo O^m o r^'Ti'TP^os
ooi^'oio^
C5p
S
O ^ 'P
^ ^
nfrf^m Mr4<^r4r riri rHc^ fN m S cs fS
so
r^ O
n(S {> >c v^ 'f
s $ 9 $

*3p:gK SSs;
NMMCHri riri<s<^<s

smnchn

g f s s s s gas3P
s s a s s
nmrnp^rr e^r^r^rH rrcir4c4

g 3: 9

2^s3;s S S S S ?
gi 2 3: 2 R <cocntnc^, r^r^^rc^N
c st st scs s
<7v *A W
S

I^g^ss!

S S RKS ! 2 g a s ? S p ! g S
^'rnrnf^fn fSr<irSfsr4 c c s Hr i H fs r-i n

n (n

SRSSR
stsc"^

^SK^;? SSK
!? S S S P S S f 5 5
pi. \ v\ t ^^n^nSrS m^i^cncs s<N<NiNr^ csr^srts
?
s 3 ? 2 S $ S
'^*tfnfTS <irSr^e<^ri <N
O
Ti

a s 3

g S ^ S S S3Sc^^P
^ [S^ so vi Tf Tf'^tT'Crifn rt e^ rt] fT) r*^ i^msr4es t s s HHr J
[i,
:SSSg
e 9 S R g F ! E = p
S; j 2 0\ C^ >.0 un iri - T ^ T t r / i m

tn (*i t*\ r^ in

? : ; S S

fi
*mtC
-a
;3

? s K
a F; 2

e*SpKr<^, T;

a Si s 2 S P S i s s s a s
s 3 <5 >0 wS /S

Sfs?g$ ;Sgi^
c*SrorS<ic*^

t
O
Cl.

8 S ? : = S

QoOXiC 0
-O
gp
m \o ^

S! 2

r35b'*^<M

p
\affi S 12 2O

<r> aQ
b s^as:?
^

z
tr/^ iS^ ^

s
rJ <> ?O?O:2
*0 -N
r <7%t*' e*-

SS^rSS
inioviwSi^

ON \o 'O
^ ^ ^ $ s5 oi 0'i*
6 r*
| -g a ^
s s ^ s
S
o o 00
o^ o\ <%
Tf

es

mt t * ^ f r c n

ESSSPS

^ Pi
X, WT w^ - ^
^
s ^ o o

r f s - j q ^

\ 0 ' O ' O ' O n

!?R!8?!S

f ^ s < NCSM

<N r1 2 2 2 ^ 5 3

tg-r^S'OS
fj oqoqr^r^

' q\0'nq^A

t r j pOf S' C

r^fn*Q<S

nnio'o'ov^

v^in-v>n

(jeFt-;^^)

!; ? i g
rS r p^ fs ri

n t" S
to ^
p
S S 3 ^ ? ? R op^ ^
f^
cfn<*i*%m f#>

S fn
00 vQq oO r<
n
*i rH <

Tf Tf

r%

^
00 00 0r^\ so
^
r^ ^
vi
'A

Qp (n m

i?i r<^ p 00 sc

3
0 Q

K r^

*n VOr- 00 Q
N 0
(Zi) jopEoniiongp pp pEWaqn3p sopjq

646

SSfS^

0 -"r>-^SQ MONSOcnO E S S g r:
en ri
fs c

^ s?s:3cs
Tr^ H f ^ r i

o ir
tj viwSnv^uS

p^f^i\\o

so
fs t" id
-^
^ cs M
^ \ (

2 ? s s s

tr> <T>

S R2 s ^

vo

o 00

pnpriffprf

^
2
SSaSS s
H r4 ri es
riHrrjcM

'> vo

APNDICE

Curvas de operacin caracterstica para el anlisis de varianza del modelo con efectos fljos
1.00

(p a ra a ^ .0 1 )

>

u, = grados de libertad dal numerador, v. =grados de libertad del denominador.

Adaptada con permiso de Biometrika Tables for Statisticians, vol. 2, E.S. Pearson y H.O. Hartley, Cambridge
University Press, Cambridge

647

648

APENDICE
V.

1.00

<l)(parao(= .01)

Curvas de operacin caracterstica para el anlisis de varianza


del modelo con efectos fijos (continuacin)

APENDICE
V

1.00

4>(para a - .01)

Curvas de operacin caracterstica para el anlisis de varianza


del modelo con efectos fijos (continuacin)

649

650

APENDICE
V.

Curvas de operacin caracterstica para el anlisis de varianza


del modelo con efectos fijos (amtinuacin)

I (para a = .O I)-

APNDICE
V I.

Curvas de operacin caracterstica para el anlisis de varianza


del modelo con efectos aleatorios"

X(paraa= .01) ^ 1 0

30

70

50

90

110

130

150

170

190

1.00

1
3
A,(paraa= .01)^

11
7

13
9

15
11

17
13

19
15

21
17

23 - - X ( p a r a a =.05)
19
21
23
25

Reproducida con permiso de Engineering Statistics, 2a. ed A.H. Bowker y G.J. Uebennan, Prentice-Hall
Ioc Englewood Cliffs, NJ.

651

652

APENDICE
V I.

Curvas de operacin caracterstica para el anlisis de varianza del


modelo con efectos aleatorios (continuacin)

APNDICE
V I.

Curvas de operacin caracterstica para el anlisis de varianza del


modelo con efectos aleatorios (continuacin)

1.00

1.00

2
3
4
5
X ( p a r a a = .0 1 ) - * - 1

6
2

7 - * X.(paraa=.05)
3
4
5
6

10

653

654

APENDICE
V I.

Curvas de operacin caracterstica para el anlisis de varianza del


modelo con efectos aleatorios (continuacin)

2
3
4
X (paraa= .01)

1.00

2
3
4
X(paraa= ,05) -

. ^ (p araa= .01)
3
4
5

APNDICE

VIL

Rangos significativos para la prueba del rango mltiple de Duncan


To.qi(P<f)
10

20

50

90.0
14.0
9.0
7.2
6.44

90.0
14.0
9.0
7.3
6.5

90.0
14.0
9.3
7.5

90.0
14.0
9.3
7.5

8
90.0
14.0
8.26
6.51

90.0
14.0
8.5

6.8

90.0
14.0

g.6

90.0
14.0
8.7
7.0
6.18

90.0
14.0

90.0
14.0

8.8

8.9

7.1
6.26

7.1
6.33

90.0
14.0
8.9
7.2
6.40

100
90.0
14.0
9.3
7.5

5.70

5.96

6.9
6.11

6.8

6.8

6.8

5,24

5.73
5.45
5.23
5.08
4.96

5.81
5.53
5.32
5.17
5.06

5.88
5.61
5.40
5.25
5.13

5.95
5.69
5.47
5.32
5.20

6.0

6.3

4.95
4,74
4.60
4.48

5.65
5.37
5.14
4.99
4.88

6.00

5.51
5.22
5.00
4.86
4.73

6.3

5.73
5.51
5.36
5.24

5.8
5.5
5.4
5.28

6.0

6.3
6.0

5.8
5.7
5.55

5,8
5.7
5,55

5.8
5.7
5.55

4.39
4.32
4.26
4.21
4.17

4.63
4.55
4.48
4,42
4.37

4.77
4,68
4.62
4,55
4,50

4,86
4.76
4.69
4.63
4.58

4.94
4.84
4.74
4,70
4.64

5.01
4.92
4.84
4.78
4.72

5.06
4.9e
4.88
4.83
4.77

5.12
5.02
4,94
4.87
4.81

5.15
4.98
4.91
4.84

5.39
5.26
5.15
5.07
5.00

5.39
5,26
5,15
5.07
5.00

5.39
5.26
5.15
5.07
5.00

4.13
4.10
4.07
4.05
4.02

4.34
4,30
4,27
4.24
4.22

4.45
4.41
4.38
4.35
4.33

4.54
4,50
4.46
4.43
4.40

4.60
4.56
4.53
4.50
4.47

4.67
4.59
4.56
4.53

4.72
4,68
4.64
4,61
4.58

4.76
4.73
4.68
4.64
4.61

4.79
4.75
4.71
4.67
4.65

4.94
4.89
4.85
4.82
4.79

4.94
4.89
4.85
4.82
4.79

4.94
4.89
4.85
4.82
4.79

3.89
3.82
3.76
3.71
3.64

4.06
3.99
3.92
3.86
3.80

4.16
4.10
4.03
3,98
3.90

4.22
4.17
4.12
4.06
3.98

4.32
4.24
4.17
4.11
4.04

4.36
4.30
4.23
4.17
4.09

4.41
4.34
4.27
4.21
4.14

4.45
4.37
4.31
4.25
4.17

4.48
4.41
4.34
4.29
4.20

4,65
4.59
4.53
4.48
4.41

4.71
4.69
4.66
4.64
4.60

4.71
4.69
4.66
4.65
4.68

8
9

10
11
12
13
14
15
16
17
18
19

20
30
40
60

100

4.63

5.07

6.0

/ = grados de libertad
Reproducida con permiso de Mltiple Range and Mltiple F Tfests D.B. Duncan, Biometrics,
vol. 1, no. 1, pp. 1-42

_____

^0.05(Pi /)
2

10

20

50

100

1
2
3
4
5

18.0
6.09
4.50
3,93
3.64

18.0
6.09
4.50
4.01
3.74

18.0
6.09
4 J0
4.02
3.79

18.0
6.09
4.50
4.02
3,83

18.0
6.09
4.50
4.02
3.83

18.0
6.09
4.50
4.02
3.83

18.0
6.09
4 J0
4.02
3.83

18.0
6.09
430
4.02
3.83

18.0
6.09
4.50
4.02
3.83

18.0
6X
4.50
4.02
3.83

18.0
6.09
4.50
4.02
3.83

18.0
6.09
430
4.02
3.83

6
7
8
9
10

3.46
3.35
3.26
3.20
3.15

3 J8
3,47
3.39
3.34
3.30

3.64
334
3.47
3.41
3.37

3.68
3 J8
3.52
3.47
3.43

3.68
3.60
3.55
3.50
3.46

3.68
3.61
3.56
3.52
3.47

3.68
3.61
3.56
3.52
3/47

3.68
3.61
3.56
3.52
3.47

3.68
3.61
3 J6
3.52
3.47

3.68
3.61
3.56
332
3.4S

3.68
3.61
3.56
332
3.48

3.68
3.61
3.56
332
3.48

11
12
13
14
15

3.11
3.08
3.06
3.03
3.01

3.27
3.23
3.21
3.18
3.16

3.35
3.33
3.30
3.27
3.25

3.39
3.36
3.35
3.33
3.31

3.43
3.40
3.38
3.37
3.36

3.44
3.42
3.41
3.39
3.38

3.45
3.44
3.42
3.41
3.40

3.46
3.44
3.44
3.42
3.42

3.46
3.46
3.45
3.44
3.43

3.48
3.48
3.47
3.47
3.47

3>t8
3.48
3.47
3.47
3.47

3.48
3>t8
3.47
3.47
3.47

16
17
18
19
20

3.00
2.98
2.97
2.96
2.95

3.15
3.13
3.12
3.11
3.10

3.23
3.22
3.21
3.19
3.18

3.30
3.28
3.27
3.26
3.25

3.34
3.33
3.32
3.31
3.30

3.37
3.36
3.35
3.35
3.34

3.39
3.38
3.37
3.37
3.36

3.41
3.40
3.39
3.39
3.38

3.43
3.42
3.41
3.41
3.40

3.47
3.47
3.47
3.47
3.47

3.47
3.47
3.47
3.47
3.47

3.47
3.47
3.47
3.47
3.47

30
40
60
100

2.89
2.86
2.83
2.80
2.77

3.0*
3.01
2.98
2.95
2.92

3.12
3.10
3.08
3.05
3,02

3.20
3.17
3.14
3.12

3.25
3.22
3.20
3.18
3.15

3.29
3.27
3.24
3,22
3,19

3.32
3.30
3.28
3.26
3.23

3,35
3.33
3.31
3.29
3.26

3.37
3.35
3.33
3.32
3.29

3.47
3.47
3.47
3.47
3.47

3.47
3.47
3.48
3.53
3.61

347
3.47
3.48
3.53
3.67

655

^ OO^ O)

00 r-^
Ov fO
<s

'T
t
ov

^ ^

^ ^ ^

in rj es 00

es

as

<n i- ^

S sd 00

00
es

^ oJ en
rro
' ^>T} en
; ON i>
p cn 00 00
r*^

rn cs ^

> 00 t>

00 ^:t O

en

Ti-

00 S rn p
Tf. 00 rS
es
r - ro
es
'r ON
^
\o m

c*^

I-* S s
ov
v N \

l>

\o vo

r- a^ <N

p
r - r*^

o 0 00 c*^

sD vo

'C r- 00 ^ ^

m -I' On
'O
sO \d
iri >/^ VI

s \ \ in i/ wS

so r- ov
*^5 ^ es p 00 f-; n

-s \ 'O 'O

>^0 so

\3 m

cf 'O
^ o^
O
S a^
m O
es oes 00
^
on O
00 es so O
/%
\ ^

^,Q v iri vS

\p \

o
00 fS CO 2; ^ a;
\ 0 'O O' v% fn <N m
es
in
. NO ^t
'O *o
/^ rn ^ p O^ 00
^ xn y~i ce 1
<? ^O /S
ir vS
"O \0 \ \ ' \
os ^ o 00 r^ K r*^ r^

es

T-( -H <s m
S O 00 '.D

-iCTssr^''
00 n t s
r - r-^
r^

W ^

00
^ ^ - _
o s <q <s

^ no n <N
es i n 00 e^ ^
Ti '
'

'O

os <s
00. QO.
\o \b

O
0OONOT
0 ^ 0 0 0; c<^ es
r- r-

<5no o6 oo

es

p 00

s ^

tn
^ ^ gs ^
Tj-0^^-;

^ n 'O S a \
cSf<>[^nON
O ooooS

lO ^
\>
O
00 c^ ^

CTv ^O

o \ c^ ^n c^
r- r- r-

o 0^ 00 00 00

r-^
s f<-> T-f ^

o en

n 'C p n S
O o a> 00 od

oo

^ tn m

so
^
vp 0
0-i 'n

00 ^
r-; 'O
W
^0 es

1-H o Ti- ^ -H

oo o ^ p
O o 00 od i>

so \d vo NO \o

S S
55 S
o 00 00 r^ r-^ r^

I ::
o

r00 ^
so

o en 'O Q
os r-^ O
>/S o

\o sb in

so
o m r^ 0 \
so in un 't en ^ o 00 so
so 'O so so so so so wS wn

<o

en

es

o
oqr-;

Tt

ir> sfi Q

r^
es p os r-;
so
I>
'O so so

o r
n ^ H o
so
fTl

so
00
v% ^

Os

^ m OI
\p \ \ \^ \0

es

S3 00 1' VI Os
0\ sO
oo
er 'O
0 e<5 en
s5 v*^ ^ m en es
p
^ ^
vo '*P r f oen
so <0 vo s so
c^
so
'b
s
^o
O

od
00
S
oi
es O
^ 1-H i-N
qs ^

t-- <S os Os

en m ^

<s

Os

Os ri

es es ^ ^

Os

es

en
os

so es sq os
es ^o o o
O es
es

^ ^

VI O

O
rn es es

^
p

sO so so so so

VI so
Os V
mI en
00 es
en
oes 00
\d vS v^ vS 'O v^
so O VI O so
so
en
VS V- vS V) v^ vS

o o - ^ ' ? O S ^
O.OGNoooq

0 s ^ 0 ^ v ^ e S 0 s
\0inen<S-H0s

s o o s ^ ^ o o

r ^ ^ ^ s o s o
'Ov'jencS'-;

en S

^ in O <N tn p 00
00t es
^s es
00
os vn
00 Os e<> ^
T
en ON 00
p O
s v vo so vS wn vS un v^ v iri v^ vi vi vS '*

oor^r^Ksd

es

C' p
so 00 v^
!-
es
^
<s

s ? a

qO
es ^ ^ f-- en ^ ^ fS v^ 00 e l C- < w- o \0
r- 7
i>
00

1 00
so en o 00 so n 't fn es ^ p P Os 00 SO v^ en es p
vS vHi vS v^ v^
00 od o r^ r- so '<0 so so sO so s so so v^
1( ^ r ^ e n r ^

irj se
r^

r-.

o^ ^
<N Os oq sq v%
OS o K K r*^ s so sO so

r*;
en
- s eS
en ' >"

on f-

^ ON i>
so \r
wS in w-j

00

S; P;

3 os G
C-! s

^jso'o'oso

v^ O
en es
^ 00
Os 00
00 O
00
nO

so 'O

so so vS wn v^

so'OvnvSvS

trjvSvS'Tiv*!^

OJ \>qo o
V-l ^
s q wn v-j

f- ^

vn * 0 v^ v^ v^

vi iri vi Tj* Tj- t

rn es

t> so

00 r^

m oc
es r^-^ osq
os T
ent en
00 en
os r-.
^ en sfn
'O -t
en en
v*^ ^-j ^fOs 00

. o os
so es so o^ so
rn eS
ob r q v^
so so sd o n un v^ 1/^ n vS vi v^ wn wi vi tT Tt ^ ^

t-; rnos

<?nO 00

-O

^ es
tr, IN

3 a
q
m

en

<>

Os O

-'

S &
00 SO

2 2 S S S
t^\dvdvii<i

uSwSiHiriiri

^ S $ 5

_ __ .
\Dirioi/Svi

so
o
O O es vn r-* S i S ^ S ^
g ^ o so vi l O ' t ' t - T ' t
'J 5 t-o o o o

656

__ *

.^

__. -k

_______

s;gR$S?
-t-Tr-^Tt-'-'-

S ; ^ G
__

,_ ^

2 2 S S S
-ir't-r-r'r

)E;2S2S

-rt"

T+

^+-

^ "

v e p a s s 9!::s5;
Si ' r - f - v o i o ^ d

jK qsq

^ s s s s :

i/iviwSwSS i/S

q ^ ^ s s
g ^ O ^ 00

s s s s s

vo o wS

?;; $ ! s s s ^ s s s s !
nnw^vSio H/Str/iri^

^ S ! 2 5
<^'fl '' 0' J

2SS?3gS
\ej\ i /i ini r

P $ 3 K ; ^ ?E<: = g g
iniriiri/Su^ uSi nvi w i ' ^'

r^'340'0vc

SS!S?p
vovilouSvi

S 3 K ? j v ? f^fs S o \ S
SiHuSioiri i o S u S i ' ^ 'r

'O r n o v v f j S S

'O 'O vo

iri lo "i ?!

, S p ;

2|G^?5q

^ 22**''

S S ^ 2 S
*^''>'>'0

g g p S K
wSwiiHwSui

^ S X i g S S S
i/iirtiriwSiH uSuSin-"'^'^

^S:SP 5!
n 2 ' '

vovovevoiri

5 P S ;S ?
viiowSifiuS

5?!I!P?S 2 ^ 3 g f S $
v S in i o i /S i

cvics^ jp !

g ; g 2 g s

^osoor^

vOvOvOuSi S

it wS o k

SuiiriiriuS

:s a
so

so
9
wS lo vS

! 2 * * ^

J ?
1 -

7;sgs^^

* 5 ^ O' 00 c~-t^'0'0'fi> vo'O'OwStH

r^SSS;
o2S*^

'C

S S ic ; ;
iriwSuSiriiii ir>iriwSwivK^

iovovovSin

cd

00
o vi

JO
S s
< vS vS vi

S?^9 S ^ J - S g g

iHirKiHwS

irtiriuSirivi ir)wSw-iiri'^'<t

2 S ^ S f::S
S kS

fo
vS
S s
vi vS

vS \n

<N
S f : g
NO
wS vS n

in
m
fn s 2
g
wS VI vi vi vS

CN
<T> o
s Tf fn
NO o wS
vi

es *n
q
vS vS V-)

v iri'T 't'^ '

2; PM
O g ^
v* Vi vS iS tri vi

en
r^ 3
'

v^ 3 s
vS vS vi v^ vS

S S3 ? s

s S:
vi

oo p s
't

't

VI

Q
C
7

CU

o
r frj

en
so
00 00 os

<N
<^
00
00
00
a
s s 00 00 r^ ?
vS O n
vS vS
't
VI
(N t-H <s
<r>
q O) oo
w% <n o

00
o *0 i?

fn
00
vS /S ^
O
fn <s c<^
Os $ o

*n Tf

r-

1* 00
3; m <N
'*t

s S

00 <N
fo O
3 C
O?n 00 00 E=
r^
rn <ri rS f* pn en rn
VO
en es
fn
\o

00 o> O

00
pn
q S O q
ri rS
fO en
rJ

2; v^
T-^

s O00s fn

(S
v^

o>
i? en en
rf

Tf

es
v^ v^

$ 3

00
SO s

CO

t^

NO
en

t-Tf

o m so O
OI
s
't
00
>o
s Os s 00
rn pn en

Tf os
00 r^ ? $ s
en en en
en en

Vi N
00 c^
so <N
VO
Vi v^
pn en
p^ r*i rn
<T en m en en en
rV) es 0\ so en
S g ON os Os Os 00
00 00 S f=
r CN <N (S H H oi oi rs (N oi
r - 00 Os o
o Q Q Q
<N <N fn
r 8

657

658

APNDICE

IX.

Valores crticos para la prueba de Dunnett para comparar tratamientos con un control"

do,o5(-l./)

Comparaciones de dos colas

_______________

a - \ nmero de medias de tratamientos (sin incluir el control)


1

5
6
7
8
9

2.57
2.45
2.36
2.31
2.26

3.03
2.86
2.75
2.67
2.61

3.29
3.10
2.97
2.88
2.81

3.48
3.26
3.12
3.02
2.95

3.62
3.39
3.24
3.13
3.05

3.73
3.49
3.33
3.22
3.14

3.82
3.57
3.41
3.29
3.20

3.90
3.64
3.47
3.35
3.26

3.97
3.71
3.53
3.41
3.32

10
11
12
13
14

2.23
2.20
2.18
2.16
2.14

2.57
2.53
2,50
2.48
2.46

2.76
2.72
2.68
2.65
2.63

2.89
2.84
2.81
2,78
2.75

2.99
2.94
2,90
2,87
2.84

3.07
3.02
2,98
2.94
2.91

3.14
3.08
3.04
3.00
2.97

3.19
3.14
3.09
3.06
3.02

3.24
3.19
3.14
3.10
3.07

15
16
17
18
19

2.13
2,12
2.11
2.10
2,09

2.44
2.42
2.41
2.40
2.39

2.61
2.59
2.58
2.56
2.55

2.73
2.71
2.69
2.68
2.66

2.82
2.80
2,78
2.76
2.75

2.89
2.87
2,85
2.83
2.81

2.95
2.92
2.90
2.89
2.87

3.00
2.97
2.95
2.94
2.92

3.04
3.02
3.00
2.98
2.96

20
24
30
40
60

2.09
2.06
2.04
2.02
2.00

2.38
2.35
2.32
2.29
2.27

2.54
2.51
2.47
2.44
2.41

2,65
2,61
2,58
2.54
2.51

2.73
2.70
2,66
2.62
2.58

2.80
2.76
2.72
2,68
2,64

2.86
2.81
2.77
2.73
2.69

2.90
2.86
2.82
2.77
2.73

2.95
2.90
2.86
2.81
2.77

120
00

1.98
1.96

2.24
2.21

2.38
2.35

2.47
2.44

2,55
2.51

2,60
2.57

2.65
2.61

2.69
2.65

2.73
2.69

f grados de libertad
Reproducida con permiso de C.W. Dmmett, New Tkbles for Mltiple Comparison with a Control.
Biometrics, vol. 20, no. 3, y de C.W. Dunnett, A Mltiple Comparison Procedure for Comparmg Several
Treatments with a Control, Journal ofthe American StatisticalAssociaton, vol. 50

APNDICE
IX.

Valores crticos para la prueba de Dunnett para comparar tratamientos con un control"

do,01(a -1. /)
Comparaciones de dos colas (continuacin)
a - 1 = nmero de medias de tratamientos (sin incluir el control)

l
4.03
3.71
3.50
3.36
3.2S

4.63
4.21
3.95
3.77
3.63

5,22
4,71
4.39
4.17
4.01

5.41
4.87
4.53
4.29
4.12

5.56
5.00
4.64
4.40
4,22

5.69
5.10
4.74
4.48
4.30

5.80
5.20
4.82
4.56
4,37

5.89
5.28
4,89
4,62
4.43

3.17
3.11
3.05
3.01
2.98

3.53
3.45

3.29

3.88
3.79
3.71
3.65
3.59

3.99
3.89
3.81
3.74
3.69

4.08
3.98
3,89
3,82
3,76

4.16
4.05
3,96
3,89
3,83

4.22
4.11
4.02
3.94
3,88

4.28
4.16
4,07
3,99
3,93

3,25
3.22
3.19
3.17
3.15

3J5
3.51
3.47
3.44
3.42

3.64
3.60
3.56
3.53
3.50

3.71
3.67
3.63
3.60
3.57

3.78
3.73
3.69
3,66
3.63

3.83
3.78
3,74
3.71
3.68

3.88
3.83
3.79
3.75
3.72

3.40
3.32
3.25
3.19
3.12

3.48
3.40
3.33
326
3.19

3.55
3.47
3.39
3.32
3.25

3.60
3 J2
3.44
3.37
3.29

3.65
3,57
3.49
3.41
3,33

3.69
3,61
3.52
3.44
3.37

3.06
3.00

3.12
3.06

3,18
3.11

3,22
3.15

3.26
3.19

3,29
3.22

2.95
2.92
2.90
2.88

2.86

20

3.33

60

2.66

3.13
3.07
3.01
2.95
2.90

120

2.62
2.58

2.85
2.79

24
30
40

93

2-85
2.80
2.75
2.70

3.39

^o.os( 1./)
Comparaciones de una cola
a - l = nmero de medias de tratamientos (sin incluir el control)
1

5
6
7
8
9

2.02
1.94
1.89
1.86
1.83

2.44
2.34
2.27
2.22
2.18

2.68
2.56
2.48
2.42
2.37

2.85
2.71
2.62
2.55
2.S0

2.98
2.83
2.73
2.66
2.60

3.08
2.92
2.82
2.74
2.68

3,16
3.00
2.89
2.81
2.75

3.24
3.07
2.95
2.87
2.81

3 J0
3.12
3,01
2.92
2.86

10
11
12
13
14

1,81
1.80
1.78
1.77
1.76

2.15
2.13
2.11
2,09
2,08

2.34
2.31
2.29
2.27
2.25

2,47
2.44
2.41
2,39
2,37

2.56
2 J3
2.50
2.48
2.46

2,64
,2.60
2,58
2.55
2,53

2,70
2.67
2.64
2.61
2.59

2,76
2.72
2,69
2.66
2.64

2.81
2.77
2.74
2.71
2.69

15
16
17
18
19

1.75
1.75
1.74
1.73
1,73

2.07
2.06
2.05
2,04
2,03

2,24
2.23
2.22
2.21
2.20

2.36
2.34
2.33
2,32
2.31

2.44
2.43
2.42
2.41
2.40

2.51
2.50
2,49
2.48
2.47

2.57
2.56
2,54
Z53
2 J2

2.62
2,61
2,59
2.58
2.S7

2.67
2,65
2.64
2.62
2.61

20
24
30
40

1.72
1,71
1.70
1,68
1.67

2.03
2.01
1.99
1.97
1.95

2.19
2.17
2.15
2.13
2.10

2.30
2,28
2.25
2.23

2.46
2.43
2.40
2.37

2,51
2.48
2.45
2.42

2,56
2.53
2.50
2.47

2.60
2.57
2.54
2.51

2.21

2.39
2.36
2.33
2.31
2.28

2.35

139

2.44

2,48

1.66
1.64

1.93
1.92

2.08
2.06

2.18
2.16

2.26
2.23

232
2,29

2.37
2.34

2.41
2.38

2.45
2.42

60
120

659

660

APNDICE

IX.

Valores crticos para la prueba de Dunnett para comparar tratamientos con un control

/)
Comparaciones de una cola (continuacin)
a - 1 = nmero de medias de tratamientos (sin incluir el control)
1

5
6
7
8
9

3.37
3.14
3.00
2.90
2.82

3.90
3.61
3.42
3.29
3.19

4.21
3.88
3.66
3.51
3.40

4.43
4.07
3.83
3.67
3.55

4.60
4.21
3.96
3.79
3.66

4.73
4.33
4.07
3.88
3.75

4.85
4.43
4.15
3.96
3.82

4.94
4.51
4.23
4.03
3.89

5.03
4.59
4.30
4.09
3.94

10
11
12
13
14

2.76
2.72
2.68
2.65
2.62

3.11
3.06
3.01
2.97
2.94

3.31
3.25
3.19
3.15
3.11

3.45
3.38
3.32
3.27
3.23

3.56
3.48
3.42
3.37
3.32

3.64
3.56
3.50
3.44
3.40

3.71
3.63
3.56
3.51
3.46

3.78
3.69
3.62
3.56
3.51

3.83
3.74
3.67
3.61
3.56

15
16
17
18
19

2.60
2.58
2.57
2.55
2.54

2.91
2.88
2.86
2.84
2.83

3.08
3.05
3.03
3.01
2.99

3.20
3.17
3.14
3.12
3.10

3.29
3.26
3.23
3.21
3.18

3.36
3.33
3.30
3.27
3.25

3.42
3.39
3.36
3.33
3.31

3.47
3.44
3.41
3.38
3.36

3.52
3.48
3.45
3.42
3.40

20
24
30
40
60

2.53
2.49
2.46
2.42
2.39

2.81
2.77
2.72
2.68
2.64

2.97
2.92
2.87
2.82
2.78

3.08
3.03
2.97
2,92
2.87

3.17
3.11
3.05
2.99
2.94

3.23
3.17
3.11
3.05
3.00

3.29
3.22
3.16
3.10
3.04

3.34
3.27
3.21
3.14
3.08

3,38
3.31
3.24
3.18
3.12

120
00

2.36
2.33

2.60
2.56

2.73
2.68

2.82
2.77

2.89
2.84

2.94
2.89

2.99
2.93

3.03
2.97

3.06
3,00

^ NO o ^ jn

m
ON

-i
m O 'c o o o o 'O O '-ifO
W

7 -

t^l!^

II

" 7

' O - - - i v o v e - "

\P

vn o

I
O

fn

<S

-i

I
^

I 7

'tvD

ao(Nr--'^ooocirnr-'CSoo
fS ^
wm ^
^ es 11

o n

II

II

-1 2

-l

00

t3
C
Xi

12

es

<n

l i l i l

es es ro

H!^

^r-S
0es* ^ es
s r
-(^
es
I

<sO
o

O
00
v>
00

(N

es

I -

~\'0

00

=IS

0^

c
p

a
C

Io

i
c

krj -N
i

n m
I
1

Tf 1I wn
I
I

r-

' S o
I

s i:

-Iti

1 <>i

I I

I I

ffi
d
K

1 7 1 -

o o r - oI o
r - o(Nr - o oIr ^ o o(S

fS -H
I

<N

'

<s -N fs N
I
I
I

r<

SS

i/j

'

^mes^-io-^esfo^
l i l i

<S c> fS
I

II

ti

I I

s
t

ts

"

r - . v i r n ^ r^w^rI

<s <Ti ^ n nO r-

HtJ

I I I

1 ) 1 )
-N O
I

r^mm^^ene^r^
71
17

=18

-^ e s e < ^ T fto ^ r -o o ^ O

<

=H ^
661

662

APENDICE

XL

Nmeros aleatorios"

85393
97265
61680
16656

87647
30995
76393
07856
06121

91646
89198
64809
16376
91782

69179
27982
15179
39440
60468

14194
53402
24830
53537
81305

62590
93965
49340
71341
49684

11008
56420
05463
63661
53342

42751
69994
07972
10281
53988

27756
98872
18876
17453
53060

53498
31016
20922
18103
59533

18602
71194
94595
57740
38867

70659
18738
56869
84378
62300

90655
44013
69014
25331
08158

69578
40961
93969
61129
97336

88231
48235
52636
87529
71048

33276
03427
92737
85689
08178

70997
4%26
88974
48237
77233

79936
69445
33488
52267
13976

56865
18663
36320
67689
47564

05859
72695
17617
93394
81056

90106
52180
30015
01511
97735

52162
07056

12765
21382
54092
53916
97628

51821
52404
33362
46369
33787

51259
60268
94904
58586
09998

77452
89368
31273
23216
42698

16308
19885
04146
14513
06691

60756
55322
18594
83149
76988

92144
44819
29852
98736
13602

49442
01188
71585
23495
51851

48663
54164
32639
29334
02488

91245
58492
32363
27001
33062

85828
22421
05597
87637
28834

14346
74103
24200
87308
07351

09172
47070
13363
58731
19731

30168
25306
38005
00256
92420

90229
76468
94342
45834
60952

04734
26384
28728
15398
61280

59193
58151
35806
46557
50001

81525
29676
00742
05366
91921

72295
20591
57392
04213
26418

04839
68086
39064
25669
64117

96423
26432
66432
26422
94305

24878
46901
84673
44407
26766

82651
20849
40027
44048
25940

66566
89768
32832
37937
39972

14778
81536
61362
63904
22209

76797
86645
98947
45766
71500

00582
00725
69011
25976
09763

04711
69884
65795
57948
83473

87917
62797
95876
29888
73577

77341
56170
55293
88604
12908

42206
86324
18988
67917
30883

35126
88072
27354
48708
18317

74087
76222
26575
18912
28290

99547
36086
08625
82271
35797

81817
84637
40801
65424
05998

91567
17955
46503
92157
14577

42595
56349
18584
89634
62765

27958
90999
18845
94824
35605

30134
49127
49618
78171
81263

04024
20044
02304
84610
39667

86385
59931
51038
82834
47358

29880
06115
20655
09922
56873

99730
20542
58727
25417
56307

55536
18059
28168
44137
67607

10480
22368
24130
42167
37570

15011
46573
48360
93093
39975

01536
25595
22527
06243
81837

02011

77921
99562
96301
89579
85475

06907
72905
91977
14342
36857

28918
63553
09429
10365
07119
51085
02368

01011

Reproducida con permiso de Probability and Statistics in Engneeng and Management Science, 3a ed W.W.
Hies y D.C. Mntgomery, Wiley, Nueva York

APNDICE

663

Diseos con 3 factores


a) 2^'; fraccin 1/2 de
3 factores en 4 corridas

b) 2^; fraccin 1/2 de


4 factores en 8 corridas

c) 2^^; fraccin 1/4 de


5 factores en 8 corridas

d) 2*-'; fraccin 1/2 de


5 factores en 16 corridas

Resolucin III
Generadores del diseo
C=^AB
Relacin de definicin: I = ABC
Alias
A=BC
B=AC
C=AB
Diseos con 4 factores
Resolucin IV
Generadores del diseo
D = ABC
Relacin de definicin: I = ABCD
Alias
A =BCD
B=ACD
C=ABD
D=ABC
AB = CD
AC = BD
AD=BC
Diseos con 5 faaores
Resolucin m
Generadores del diseo
D = AB E = AC
Relacin de definicin: / = ABD = ACE = BCDE
Alias
A = BD = CE
B = AD = CDE
C = AE = BDE
D = AB = BCE
E = AC = BCD
BC = DE = ACD = ABE
CD = BE = ABC = ADE
Resolucin V
Generadores del diseo
E = ABCD
Relacin de definicin: / = ABCDE
Alias
Cada efecto principal es alias de nna sola interaccin de 4 factores
AB = CDE BD = ACE
AC = BDE BE = ACD
AD = BCE CD = ABE
AE = BCD CE = ABD
BC = ADE DE = ABC
2 bloques de 8:

IOQ
&

II II
tt Ct3tq cl U Q t ti *0
IIIIIIIIIIIIIIII

g*

^CQUQttJfc,QQ 3
-

664

i
II

i
II

CA

te ,

ttjC,Cl
qS u
joQoa

Tf

M -8
e

^8^

^ su
n

II II II II II

p:
<J c

11Lt,

uC; Q
OQ U

u
a
c
'O

II II II

II

4J

II

g.

"

^11

s &S8 ^
aqoqoQOia) g

II

4>
O
3

II

II II II

1'Q

II

II II II

a .

ti3QC
II II II II

II

'^C iafeQ U
a

sb ^ s

II II II II

S ts
t

C>S

2 'S

II
i
U

II II II II
^oqq

II

*
O

'O
'U
S
\a
(D
O
4>
O
C
<5

1
II

665

OQcqtiJ
II II II

y Qti,
Q U
II II II
II II II II II II

II

PP^

bss

VI

........

vn
VI

II

88
II II
O ,

O O te ,
II II II

II

<^5

II II

........
UQQ
II II II

II

C| II

it,
PQ OQ

II II II II

(joatti5

8 ^ ^

II II II II

i ?

88^
X5

II

4)
T3

II u

8 ^ ra bjtc,e)
ct, ^
05 II
li) U
5 i;
%
" fe
II II
QOCJ
" -8
O)

II II II II II II

8&8SSS

II

II

III
........

CA

S3 II .
^ "ct,[*,C3Qhq[i,
~quqS

X)

II II II II II

b, u
3

05^03 Q?^G

II II
ti) q

8^

e;

Q
II

5
II

II

to, k, U Q bq
S quqq

-
va
O

II II II II II II

gO
S

CQCqeqOQCQ
g

a*
0

X>
01
iJ

gS2 sss
GG

a
0

II II II II II II II

1
II II II II

o
T3
9

T-H

^OJUCI
^

l{

666

cq U Q t ii, ej

_C3 TIca
2l

<b \D

8
<1 es

i s

? .g

Ii
SSSSgg
I
II
II
II
II
II
II
I

.. I-iu
P P
I

I
I

8SgS8

I
II
II
II
II
II
II
I

feS&S8

I
II
II
II
II
II
II
I

i
fe K.
-S

^ >s y fe,

i-S .5^
J
9 5c
0^ -j2 c ea g"
1

I "I
a

a; II
CA
(U
%
s
00
a
8

.......I I
II
II
I

J | i &
I
1
I

-S

73 II II II
o
09
J II II II II II II II II II

CO 8 ^II
II II II II II II II II ^
^II 3te.
fe. u O)

1
U
Q

.
u o i

Q I
I I
I

g <M g
q^O
C i "0
" O
o"
Q a BS

"i

bQ1 X

2 ..

rl -S -9

^3

l
l
'I
II
II
II
II
II
II
I 3

I
II
II
II
II
II
II
II
I

I
II
II
II
II
II
II
I

II II II II II II II II
X)OQCtik,a5

I
&

i i

i8

* vo
CN e

667

I
i

05
II

8
VI
R
>m

gil
II II

6 5 8
U U oq
II

VI

II

................ II
tq II
(D

|S

II II II II II II II II

C/5

S S S S g S ||8

=?

Tf

!ii

e>

Se II II li, a: ) tq II )

IIO
3

II

S^88^^
II II II II II II II II II
y

0C3
d
'O
u

T3
P

S00
O

TJ
se

th ^

668

C: <o
h

II I I .....................

fe,u,h,0

Ucooq

UQ

oqg

I
II
I"

tcCtwO a

I030Q g"

II II II II II II II II II II II

OQu Q ttj til !i; ^ ^

II

1
3

^ S fS a; a; k,
I! I! II II II II II II II II II

a; SBt a: f*. e> lE

te

^^888SbSb&8

II

Crt

II

fe

BO

II II II II II II II II II II II

& S S g S g 8 & S ||
II
fia
II d

-'e

I "
X '
II II II II

II II II II II II

g88&8SSSSS

T3
a
o
G
<d

I
I
II

rn
TD

O"
O
es
3

Cj OQ CQ cq 5 O) f i q X ' T "T
II II II II II II II II II II II

O
s

669

0
a

a iK

u
3

H?5
s
VI

' "S e
SS^[3
^ fe S " R

e
\T\
VI

^ II

II

II

II

4.

*a

<13 d

si^II

Q X

"

iiS^iiS

II

'O

4
A

1a
u

670

II II II II II II II
.
II II II II II II II

.!S

a; c; t; ; c
oi Q 5 i3 [ g

II II il

IIIM III I III IIII IIII IIII IIII IIII IIII IIII IIII IIII IIII IIII >II1 '?
t
5

II

II

alS?8S|S !ss
II II II II 'I II II II II

i'^Q dqU

I
II
II
II
II
II
II
II
II
II
I

I
IQ ^
QS I
It
I
II
II
I

II II II II II II II II II II

II II ^ II II II II II II II

(
I I
I

V n l

I
II
II
II
I
Ck,

o
*0
d

II

"BI o
3
5S8ii
^aq^oqtdfe,
I
II
II
II
IQ I
I
h , 4 , t * . l l

gO
Xi

I
II
II
II
II
II
II
II
II
II
II
I

09

'T>

<N g

671

I
II

I
II

VI

>

VI

II

Jd

8III^^II
II II II

II

II II II II II

II

II II

II

[S
ajEiO
II II

II II

II

II M II II

O ' t;-

fe,

QQ

II

Sai

Sil
II

TD
s

II

Q
II

........................... IIII IIII IIII IIII .... ........... .

43

X)

?5

II

i
-o

II

&

II II II II II II II II II II II II II II II II II II II II II
-
G

o
*S
'O

o
u
o
S
^o ^2
'O 3

* p^
"
P
rj S

672

II

CA

i i
G

^8H8SS&
II II II II II II

-
iiR^i^

II

sSS?S5iSe
II II II II II II

II

I,

S^SSSggg I
II II ............

tb "1^ "^1
y II "

II II II

II II II II II II II II

I
3

5 U C| ta] fe, O

II

II II II II II II II II

3
CA

l oil

e
te
O
O
-
u

fH

fl

<N 4>

673

3 3

11^

II II 3 5
II

11^
G O &fe

II

I ^'-*;.

II II II II II II II II II II II II II II II

SSSS58e&8S

" "E
Q Cl I MI
II II IJfe,

is& ee

=sg|

II II II II

s?8 r
-8

is|
." II II II II

I
S
S
-g

MS

674

q g Q ( j ' ^ ' ^ ^ > ' J 3oq>>5


II II II II II II II II II II II II II II II

5[ 5t 3 E 3 Q Q Q u ^ ^ i i o c i 3*>
II II II II II II II II II II II II II II II II

^g

1
e

II 5

W tt,
Q
II II

s; 5

a illo s

SaSsas

" ................

8 ^
1^ ^ II

lil
^ S
II

II

.............

S
Q

sS S
II II II
II II II II II II

II " I
te, Q oq

ficj

c
'O
%

d>

ag8
<

T3

CA

S
O
3

g
sllll U , OQ09'i;
&8S8S^Sb^3?88a^fe8 I
a
II II II

II II II II II II

8 ' ^ II
H II ^

U Q OQ

S88feBS08SSS||a3||ig i

II II II II II

"

II II II

64

(i>

T3

(T

3
cr
o
3

a;Ucjoa8uo5

CN

II II II II II II II II II II II II II II II II II II II II II

13
<U
na

c
'O

^ Cfl
ca
'O *2

II
3

es <t>

675

I ft|
M" i
G

p ?iS

s:

^ WliliSiS

V!
c

-|l8i.i|lt
a . ^ 8 ^ ^ S " 3 8 3 |

5 a 3 ? " ^ 3 u ^ g sw

\r
VI

S S

tN=

'^g!i:?5:5e)
o? fc, Q OQ c3 tq

II II II II II II II

^8S8Sfe&
o

II II II II II II II

es
G
O

II II II II II II II

cQ
4=J

s
II

II

CQ

13

C
o

00
u

II II II II II II II II Tt/i3

CA
''B

II " S s II

II 11:^8 i i ^

u cq id II ^ ,11 fiS .^ II : c 3 S . j t c 3 S

o
O

C/5

aJ
a
Q

'O
3

t s

i'I
cd o
* o
Es u

676

o
T3
'

II II II II II II II II
c2c3
II II II II II II II II
'lCQUQttiitii;

I
o

<N

co

SE
II II

SggJl

fe

II II II

II O

ttjQ

ii i

.ilii!

II ^

"

II ^

II

si

II II

SS5J

II II II

" H

II II II
u

l^g^sSA
*s
"gs

5S3^

??is

oo|lg^
a
Q

^ nq (J q tiq fe, e) H *~. 1^ ^


II

-I
D
TjC e^

'O -O

I
C

teu
T3
S

II

II II II II II

' 0 0^ ^ Q

ts

0=1Oq
K - ,^

II

II II

II II

cB 5

Q^e

^g

, S

1 ^
M

1>

PC

677

678

APNDICE
X n.

Relaciones de alias para diseos factoriales fraccionados

con ?c <

15

yn <

Diseos con 12 factores

64

(cmtinuadn)

________
Resolucin III

w) 2^^; fraccin 1/256 de 12 factores


en 16 corridas

Generadores del diseo


E = A B C F = ABD G = A C D H = BCD
J ^ A B C D K = AB L = A C M = A D
Alias
A = m = B K ^ C L = DM
B = GJ = A K = EL = FM
C = FJ = E K = A L ^ G M
b = EJ = FK = GL = A M
E = DJ = C K = BL = HM
F = a = D K = HL = BM
G ^ B J = H K = D L = CM
H = A J = G K = F L = EM
J ^ D E ^ C F = BG = A H
K = AB = CE = DF = GH
L = A C = BE = D G = FH
M = A D = BF = CG = EH
A E = BC = FG = D H = K L = J M
A F = BD = E G = C H ^ J L = KM
A G = EF = CD = B H = J K ^ L M
2 bloques de 8: A E = B C = FG D H KL = JM
Diseos con 13 factores
X) 2^-^-, fraccin 1/512 de 13 factores
en 16 corridas

Resolucin IH
Generadores del diseo

E = ABC F = ABD G = ACD H BCD


J^A B C D K = A B L = AC M = AD N = BC
Alias
A
B
C
D
E
F
G
H
J
K
L
M
N

= HJ = B K = CL = D M ^ E N
= GJ = A K = EL = FM = CN
= FJ = E K = A L = GM = BN
= EJ = F K = G L ^ A M = H N
= DJ = C K = B L = HM = A N
= a = D K = HL = BM = G N
= BJ = H K = D L = CM = FN
= A J = G K = F L = EM = D N
= D E = CF = B G ^ A H = M N
= A B ^ C E = DF = G H ^ L N
= A C = B E ^ D G = FH = K N
= A D = BF = C G ^ E H = JN
= B C ^ A E = FG = D H = K L = JM
A F = BD = EG = CH ^ J L = KM
A G = EF = CD = B H ^ J K = L M
1 bloques de 8; AF = BD = EG = CH J L = KM_______ ________________ __

APENDICE

XIL

679

Relaciones de alias para diseos factoriales fraccionados 2'^ con le < 15 y n 64 (continuacin)
Diseos con 14 factores

y) 21- '; fraccin 1/1024 de 14


factores en 16 corridas

Resolucin III

Generadores del diseflo


E = A B C F = ABD G = A C D H = BCD J = ABCD
K = A B L = A C M = A D N = BC 0 = BD
Alas

A = HJ = BK-- = CL = DM = E N = F0
B = GJ = AK - = EL = FM = CN = D 0
C = FJ = E K - AL = GM = B N = HO
D = EJ = F K - GL = AM = H N = BO
E = DJ=CK~- -BL = HM = A N = GO
F = CJ = DK-- --HL = BM = G N = A O
G = BJ^HK-- -D L = CM = FN-^= EO
H = AJ = G K - = FL = EM = DN = CO
J = DE ^ C F ----BG--AH = M N = LO
K = AB = C E ----DF = GH = L N
^MO
L ^ A C = BE- = DG = FH = K N = JO
M = AD = BF-- = C G ^ E H ^JN == KO
N ^ B C ^ A E - = FG = DH = KL = JM
O = BD^AF = EG = CH = JL = KM
A G = E F = C D -- -B H ^JK -- - L M = NO
2 bloques de 8:A G = EF = CD = B H = JK = L M = NO
Diseos con 15 factores
z) 21"- ; fraccin 1/2048 de 15
factores en 16 corridas

Resolucin III

Generadores del diseo


E = A B C F = ABD G = A C D H = BCD J = ABCD
K = A B L = A C M = A D N = BC 0 = BD P = CD
Alias

A = HJ = BK --CL = DM-- E N = FO = GP
B = GJ = AK = EL = F M - CN = D O = HP
C = FJ = EK-- AL = GM-- B N = H O = D P
D = EJ = FK- GL = AM -- H N = BO = CP
E = DJ = C K - -BL = HM- A N = GO = FP
F = a - - = DK- -HL = BM-- :G N = A O = EP
G = BJ- = HK --DL = CM-~ EN = E O = A P
H = AJ = G K =FL = EM-- d n = c o = b p
J = DE ^CF- BG = AH M N = L O = KP
K = AB = CE- - D F ^ G H -- L N = M O = JP
L = AC = BE - D G = FH K N ^ JO = M P
M ^ A D = BF -CG = EH JN = KO = L P
N = BC = A E -FG = DH K L = J M = OF
0 = BD = AF ^EG = CH JL = K M = NP
P = CD = E F - AG=BH J K = L M = NO

680

APENDICE

Tabla XIII.

G lo sario p a ra el uso d e Design Expert

Actual valu
Adeq precisin
A dj M S (adjusted mean square)
A dj R-squared
A dj SS (adjusted sum o f squares)
Analysis o f variance
Coejficient estimate
C .V (coejficient o f variation)
CI (confidence interval)
Cooks distance
Cor total (corrected total)

DF (degrees offreedom)
DDF (denominator degrees offreedom)
Diagnostic case statistics
Error term
Estimated mean
Expected mean square
Lack o ffit
Least squares means for strength
Leverage

Mean
Mean difference
Mean square
Means for covariates
NDF (numerator degrees offreedom)
Operator fixed
Operator random
Outlier t
Pred R-squared
Predicted valu
PRESS (Prediction error sum o f squares)
Pur error
R-squared
Root M SE (root mean square error)
Seq SS (sequential sum o f squares)
Std. Dev. (standard deviation)
Standard error (SE)
SE o f difference (standard error o f difference)
Std, error o f estimation
SE mean (standard error o f the mean)
Standard order
Student residual
Sum o f squares
Variance corhponent

Valor real
Precisin adecuada
Cuadrado medio ajustado
R cuadrada ajustada
Suma de cuadrados ajustada (SS ajustada)
Anlisis de varianza
Estimacin del coeficiente
Coeficiente de variacin
Intervalo de confianza
Distancia de Cook
Tbtal corregido. Suma de los valores de
respuesta corregidos por la media. Se llama
comnmente suma de cuadrados totales
Grados de libertad
Grados de libertad del denominador
Estadsticos de diagnstico del caso
Trmino del error
Media estimada
Cuadrado medio esperado
Falta de ajuste
Medias de mnimos cuadrados de la
resistencia
Accin de palanca. Potencial de un punto del
diseo para influir en los coeficientes del
ajuste del modelo. Deben evitarse valores
cercanos a uno
Media
Diferencia media
Cuadrado medio
Medias de las covariables
Grados de libertad del numerador
Operador fijo
Operador aleatorio
Punto atpico t
R cuadrada predicha
Valor predicho
Suma de cuadrados del error de prediccin
Error puro
R cuadrada
Raz cuadrada del cuadrado medio del error
Suma de cuadrados secuencial
Desviacin estndar
Error estndar
Error estndard de la diferencia
Error estndar de la estimacin
Error estndar de la media
Orden estndar
Residual de Student
Suma de cuadrados
Componente de la varianza

Indice

Aberracin, 326
Aditividad del m odelo de bloques aleatorizados, 136. Ver
tambin Prueba de interacciones (no aditividad)
Aleatorizacin, 12, 13, 61, 126, 148
Algoritmo de anlisis para el diseo 2*, 242
Algoritmo de intercambio, 469
Aas, 304
Alias parciales, 344, 380, 383
Anlisis cannico del modelo de superficie de respuesta de
segundo orden, 440
Anlisis de covarianza, 15, 126, 604
Anlisis de residuales, 76, 79, 185, 224, 400, 416, 563
Anlisis de varianza, 60, 63, 66
Anlisis de varianza de dos factores, 177
Anlisis de varianza de un solo factor, 64
Anlisis de varianza simple o de una variable, 64
Anlisis interbloques, 161
Anlisis intrabloques, 161
Arreglo exterior, 491
Arreglo interior, 491
Ascenso ms pronunciado, 227, 430, 435
Aumento del diseo, 409.
tambin Separacin de alias
en las interacciones y Contraccin de diseos facto
riales fraccionados

Bloque principal, 291, 297, 373


Bloques completos, 127
Bloques incompletos, 154

Clculos en el anlisis de varianza, 70, 72


Cambio en el efecto de la media en una operacin evoluti
va (EVO P), 484, 488
Carcter iterativo de la experimentacin, 17, 20. Ver tam
bin Experimentacin secuencial
Ciclo en 1^ operacin evolutiva (EVOP), 484
Codificacin de los datos en un anlisis de varianza, 72
Coeficiente de confianza, 42
Coeficiente de variacin, 104
Coeficientes de regresin parcial, 393
Combinacin de fracciones para estimar efectos, 303, 306,
315, 339, 347, 348

Combinacin de informacin interbloques e intrabloques,


162
Combinacin de los cuadrados medios para estimar el
error, 535
Comparacin de medias por pares, 96-104
Comparacin de todos los contrastes, 95
Comparacin de tratamientos con un control, 103
Comparacin grfica de medias, 89
Comparaciones mltiples, 88, 133, 182
Componente / de una interaccin, 366
Componente J de una interaccin, 366
Componente W de una interaccin, 372
Componente X de una interaccin, 372
Componente Y de una interaccin, 372
Componente Z de una interaccin, 372
Componentes de la varianza, 65, 511, 512, 518, 565
Componentes de una interaccin, 204, 366
Condiciones ptimas, 427, 429, 430, 436
Conexin entre anlisis de varianza y regresin, 112
Confusin completa, 299
Confusin en el diseo 2*, 288
cuatro bloques, 296
dos bloques, 289
ms de cuatro bloques, 297
Confusin en el diseo 3*, 373
ms de nueve bloques, 378
nueve bloques, 377
tres bloques, 373
Confusin parcial, 299
Construccin de diseos factoriales fraccionados, 307, 318,
337, 379-381
Contraccin completa, 340
Contraccin parcial, 349
Contraste estandarizado, 92
Contraste ortogonal, 93, 221, 231
Contrastes, 90, 93, 221, 231, 290
Cordillera creciente, 448
Cordillera estacionaria, 448
Corridas axiales, 274, 365, 478
Covariable, 604
Covarianza, 26
Criterio de prediccin adecuada, 104
Criterio para seleccionar un diseo, 455

681

682

INDICE

Criterios de diseo, 455


Cuadrado latino estndar, 148
Cuadrados latinos ortogonales, 151, 365
Cuadrados medios, 68, 179
Cubo con centros en las caras, 459
Curioseo o sondeo de datos, 94
Curva de operacin caracterstica, 40, 107, 139, 189, 529
Curva OC, Ver Curva de operacin caracterstica
Curvatura, 174, 272, 432
D de Cook, 420
Datos no balanceados en el anlisis de varianza, 75, 600
Datos proporcionales en un diseo factorial no balanceado,
600
Definicin de contrastes, 290, 296, 373
Desviacin estndar muestral, 27
Determinacin analtica de una transformacin, 590
Determinacin del tamao de la muestra, 40, 107-110, 139,
189, 529
Diagrama de caja, 23, 62
Diagrama de dispersin, 662
Diagrama de puntos, 21, 22
Direccin del ascenso ms pronunciado. Ver Ascenso ms
pronunciado
Diseo anidado de dos etapas, 557
Diseo anidado de m etapas, 566
Diseo anidado de tres etapas, 566
D iseo balanceado, 154, 558, 600
Diseo bsico, 307, 317, 381
Diseo central compuesto, 11, 274, 275, 365, 441, 456
Diseo de aberracin mnima, 326
Diseo de arreglo combinado, 492, 494
Diseo de arreglo cruzado, 491
D iseo de bloques aleatorizados, 50, 126, 207
bloques completos, 127
bloques incompletos, 154
Diseo de Box-Behnken, 458
D iseo de comparaciones pareadas, 47, 50
D iseo del cuadrado latino, 144, 148, 209, 365
Diseo en parcelas subdivididas, 557, 573, 578
Diseo en parcelas subdivididas en franjas, 583
Diseo experimental completamente aleatorizado, 33, 64,
176, 207
Diseo experimental y diseo de productos, 8, 11
Diseo factorial 2 \ 5, 219
Diseo factorial 2^, 6, 228
Diseo factorial 2'*, 7, 246
Diseo factorial 2*, 7, 218, 242
Diseo factorial anidado, 569
Diseo factorial no balanceado, 600
Diseo hexagonal, 461
Diseo jerrquico. Ver Diseos anidados
Diseo no balanceado, 75, 144, 600
D iseo no replicado. Ver Rplica nica
Diseo optimal A , 468
D iseo optimal D , 468

Diseo
Diseo
Diseo
Diseo

optimal G , 468
optimal V, 468
pentagonal, 461
robusto, 488. Ver tambin Estudios de robustez de

procesos
Diseo rotable, 457
Diseo smplex para el modelo de primer orden, 456
Diseos 2-, 304-317
Diseos 2*^-2, 317
Diseos 2*', 326
Diseos 3*, 363, 372
Diseo 3*-*, 379
Diseos 3''*, 382
Diseos alternados o entrecruzados, 150
Diseos anidados, 557-568
Diseos anidados por etapas escalonados, 566
Diseos centrales compuestos pequeos, 461
Diseos cuboidales, 450
Diseos de bloques incompletos balanceados, 154
Diseos de cuadrados grecolatinos, 151, 383
Diseos de puntos frontera, 478
Diseos de resolucin III, 306, 337
Diseos de resolucin l y 306, 347
Diseos de resolucin V, 307, 347
Diseos de segundo orden, 456
Diseos de superficie de respuesta, 11, 364, 429
Diseos en parcelas con doble subdivisin, 580
Diseos equirradiales, 461
Diseos esfricos, 457
Diseos generados por computadora, 409, 466, 479
Diseos hbridos, 461
Diseos mnimos de resolucin IV, 347
Diseos no geomtricos, 343
Diseos optimales, 468
Diseos optimales alfabticos, 468-469
Diseos ortogonales, 231, 404, 455
Diseos para modelos de primer orden, 455
Diseos Plackett-Burman, 343-347
Diseos saturados, 337
Diseos simtricos, 155
Diseos smplex de centroide para mezclas, 475
Diseos smplex de retcula para mezclas, 474
Distribucin de muestreo, 29
Distribucin de probabilidad, 23
Distribucin de probabilidad continua, 24
Distribucin de probabilidad discreta, 24
Distribucin de referencia, 35
Distribucin F, 32
Distribucin ji-cuadrada, 30
Distribucin normal, 29
Distribucin normal estndar, 29
Distribucin sesgada, 30
Distribucin t, 31
D oblez de diseos factoriales fraccionados, 339, 340, 347,
348. Ver tambin Separacin de alias en las interac
ciones

NDICE
Ecuaciones nonnales de mnimos cuadrados, 112, 151, 159,
186-187, 395
Ecuaciones nonnales. Ver Ecuaciones normales de mnimos
cuadrados
Efecto del tratamiento, 64
Efecto principal, 5, 170, 220
Efecto total de un factor, 22J
Efectos cuadrticos, 88, 204, 432
Efectos cbicos, 88
Efectos de dispersin, 110, 241, 260, 264, 323
Efectos de localizacin, 111, 260, 323
Efectos de los factores, 5, 6, 220
Efectos de los tratamientos ajustados, 157, 161
Efectos ortogonales, 221, 231
Efectos residuales de tratamientos, 150
Eficiencia relativa de los diseos factoriales, 174
Eigenvalores (valores propios), 440
Eigenvectores (vectores propios), 446
Elemento identidad, 231
Enfoque de grupo en el diseo de experimentos, 14
Enfoque de la mejor conjetura para la experimentacin, 3
Enfoque no paramtrico del anlisis de varianza, 116
Error, 22
Error de la parcela completa, 575, 579, 584
Error de la subparcela, 575, 579, 584
Error estadstico, 22, 64, 412
Error estndar de los efectos en un diseo 2, 241
Error estndar de un coeficiente de regresin, 239, 412
Error experimental, 11, 12, 34, 64
Error intrabloques, 163
Error puro, 239
Escala codificada, 172
Espacio inferencial de un experimento, 511
Estadstico del rango studentizado, 97. 102
Estadstico
ajustada, 104, 411. Ver tambin
Estimacin, 27
Estimacin de los componentes de la varianza, 513
mxima verosimilitud, 547
mtodo de mxima verosimilitud con restricciones, 549
mtodo del anlisis de varianza, 513, 518, 524
Estimacin de los parmetros del modelo en el anlisis de
varianza, 74, 112, 185
Estimacin de mxima verosimilitud, 547, 549, 595
Estimacin de mnimos cuadrados de parmetros, 88, 112,
141, 159, 186, 394
Estimacin de valores faltantes, 139, 148, 602
Estimaciones de efectos, 220
magnitud y direccin, 221
Estimador, 27
Estimador de la varianza mnima, 27
Estimador de momentos, 547
Estimador insesgado, 27
Estrategia de experimentacin, 1, 3
Estudios de capacidad o aptitud de los instrumentos de
medicin, 519, 524
Estudios de robustez de procesos, 1, 127, 176, 488

683

Experimentacin secuencial, 10, 17, 18, 20, 303, 315, 365,


429, 456
Experimentador, 2
Experimento aleatorizado. Ver Diseo experimental comple
tamente aleatorizado
Experimento comparativo, 21
Experimento con mediciones repetidas, 624
Experimento de caracterizacin, 8. Ver tambin Experimen
to de tamizado
Experimento de tamizado, 9, 15, 218, 303
Experimento factorial, 4, 170, 218
en bloques, 207, 287
en parcelas subdivididas, 578
Experimento factorial fraccionado, 7, 303, 379
Experimentos con un factor a la vez, 4
Experimentos de mezclas, 472
Experimentos de seguimiento. Ver Pruebas de confirmacin
Experimentos industriales y experimentos agrcolas, 18
Experimentos no planeados, 392
Factor cruzado, 170. Ver tambin Experimento factorial
Factores, 1, 2, 3, 5, 14, 21, 60
Factores controlables, 2, 14, 15, 489, 493
Factores cualitativos, 86, 201, 275, 368
Factores cuantitativos, 86, 171, 201, 272, 363, 368, 511
Factores de ruido. Ver Factores no controlables
Factores no controlables, 2, 15, 489
Factores que se mantienen constantes, 14
FaJta de ajuste, 239, 272, 431
Familia de potencias de transformaciones, 84, 591
Familia exponencial de distribuciones, 594
R m ilia factorial fraccionada, 306
Fse en una operacin evolutiva (EVOP), 484
Forma no restringida del m odelo mixto, 526, 540, 573
Forma restringida del modelo mixto, 523, 531, 539, 559,
569
Formacin de bloques, 12, 13, 15, 50, 126, 127, 130, 207,
209, 287, 289, 296, 298, 315, 331, 373, 462, 574, 576,
579, 580, 604
Formacin de bloques de diseos de superficie de respues
ta, 462-466
Fraccin alterna, 305, 319
Fraccin complementaria. Ver Fraccin alterna
Fraccin irregular, 346
Fraccin principal, 305
Fraccin un medio, 7, 304
Fuerza de una transformacin, 84
Funcin de enlace, 595
Funciones con condicin de deseables, 451-454
Funciones estimables, 113, 114, 188, 189
Generador de diseos. Ver Generador de diseos factoria
les fraccionados
Generador de diseos factoriales fraccionados, 304, 318
Grados de libertad, 29, 30, 31
Grfica de contorno, 10, 204

6 84 _

INDICE

Grfica de cubo, 242, 262


Grfica de inferencia condicional para diseos factoriales
no replicados, 253
Grfica de probabilidad normal de los efectos, 246, 264
Graficacin de residuales, 76-86
Grficas de probabilidad normal, 38, 72
Herencia de la agricultura, 17, 18
Hipercuadrados, 154
Hiptesis alternativa, 34
Hiptesis alternativa de dos colas, 34
Hiptesis alternativa de una cola, 35
Hiptesis nula, 34
Histograma, 23
Importancia de los conocimientos no estadsticos, 19
ndice de error en el modo del experimento, 75
Influencia y accin de palanca, 419, 420
Informacin relativa para efectos confundidos, 300
Interaccin, 4, 137, 171, 174
Interaccin entre tratamientos y bloques, 137
Interaccin generalizada, 296, 299, 377
Intervalo de confianza, 42
Intervalo de confianza para la media de un tratamiento, 74,
75, 100
Intervalo de confianza para la respuesta promedio en el
m odelo de regresin, 416
Intervalo de confianza simultneo, 75
Intervalo de prediccin, 416
Intervalos de confianza aproximados para los componentes
de la varianza, 543
Intervalos de confianza para los componentes de la varian
za, 516, 491
intervalos aproximados tipo Satterthwaite, 543
intervalos exactos, 516, 543
m todo de grandes muestras modificado, 545
procedimientos de mxima verosimilitud, 552
Intervalos de confianza simultneos, 75, 95
Intervalos de confianza uno a la vez, 75
Jerarqua del m odelo, 203, 286
Lmites de confianza, 42
Localizacin, como en la tendencia central, 22
Matriz de covarianza, 397
Matriz del diseo, 228
Matriz gorro, 417
Media, 12, 25
Media global, 64
Media muestral, 12, 26, 27
Medias ajustadas de los tratamientos en anlisis de cova
rianza, 607
M ediciones duplicadas en la respuesta, 265
M todo de Bonferroni de intervalos de confianza simult
neos, 75

M todo de Box-Cox, 590


M todo de grandes muestras modificado, 545
M todo de la diferencia significativa mnima (LSD) para
comparar medias, 99
M todo de Lenth para diseos sin rplicas, 254
Mtodo de los cuadrados de las medias ponderados, 603
M todo de medias no ponderadas, 603
M todo de mnimos cuadrados. Ver Estimacin de mnimos
cuadrados de parmetros
M todo de momentos, 547
M todo de Satterthwaite. Ver Pruebas F aproximadas
M todo del ascenso ms pronunciado. Ver Ascenso ms
pronunciado
M etodologa de superficies de respuesta (M SR), 11, 427
M todos de medias no ponderadas en el anlisis de varian
za, 603
Mezclado lineal, 476
Mezclado sinrgico en mezclas, 476
Mezclas antagnicas en mezclas, 476
Mezclas binarias, 472
Mezclas de verificacin, 478
Mezclas puras, 474
Mnimos cuadrados esperados, 68, 179
reglas para, 531
Mnimos cuadrados ponderados, 595
Mitad de grfica normal de los efectos, 253
M odelo completo, 115, 116, 142, 413
M odelo con efectos aleatorios, 65, 511, 512, 557
Modelo con efectos fijos, 65, 511
M odelo de la respuesta o de reaccin de un diseo robus
to, 492
M odelo de las medias, 64, 128, 177
M odelo de los efectos, 64, 128, 145, 177
M odelo de primer orden, 226, 427, 455
M odelo de regresin, 87, 172, 177, 201, 204, 223, 235, 364,
392, 604
M odelo de regresin lineal miltiple, 393
Modelo de superficie de respuesta de segundo orden, 429
Modelo emprico, 17, 87, 392
M odelo estadstico, 34, 48, 64, 87, 128, 155, 177, 190, 191,
194, 207, 210, 393, 427, 429, 436, 476, 492, 493, 512,
517, 522, 526, 558, 567, 569, 575, 576, 578, 581, 584,
594, 605, 624
M odelo factorial sin interacciones, 190
M odelo jerrquico, 203, 286
M odelo lineal, 64. Ver tambin M odelo estadstico
M odelo lineal generalizado, 594
M odelo mixto, 522, 559, 569
error estndar de la media con efectos fijos, 524
estimacin de los componentes de la varianza, 524
formas alternativas, 526
modelo con restricciones, 523
modelo sin restricciones, 526
M odelo reducido, 116, 143, 413, 520
M odelos aditivos, 135, 145, 432
M odelos con mezclas, 476

NDICE
Muestreo aleatorio, 26
Navaja de Ockham, 310
Nivel de significacin, 34, 37
Niveles de los factores, 14, 21, 60, 245
Niveles de los factores naturales, 224, 226, 431
Niveles imprecisos de los factores del diseo, 405
Niveles mixtos de los factores en un diseo factorial, 383
Notacin geomtrica para experimentos factoriales, 228
Observaciones fallantes en un diseo de bloques aleatorizados, 139
Observaciones fallantes en un diseo de cuadrado latino
148
Observaciones fallantes en un diseo factorial 2, 404
Operacin evolutiva (EVOP), 484-488
Operador de la varianza, 25
Operador dcl valor esperado, 25
Optimizacin de un proceso, 9, 427
Orden de Yates. Ver Orden estndar
Orden estndar, 223, 228, 242
Ortogonalidad, 93, 22], 231
Palabras en la relacin de definicin, 318
Parcelas completas, 574, 579, 583
Pautas generales para el diseo de experimentos, 13
Pendiente de la superficie de respuesta, 493
Planeacin previa al experimento, 14, 16
Potencia, 34
Prediclor lineal, 594
PRESS (Prediction Error Sum o f Squares, Prediccin de
suma de cuadrados de error), 104
Principio de efectos esparcidos, 245, 303
Principio jerrquico en la construccin de modelos 203
2S6
Procesos robustos, 1. Ver tambin Estudios de robustez de
procesos
Programacin no lineal, 451
Propagacin del error, 495
Propiedad de reduccin de ruido con la formacin de blo
ques, 51, 132-133
Propiedades de los estimadores de mnimos cuadrados, 397
Proyeccin de diseos factoriales, 246, 303, 307, 331
Proyeccin del diseo, 247, 303, 310
Proyectividad, 345
Prueba de Bartlett para la igualdad de varianzas, 81
Prueba de Dunnett, 103
Prueba de hiptesis, 21, 33, 409
Prueba de interacciones (no aditividad), 192
Prueba de Kruskal-Wallis, 116
Prueba de Levene modificada. Ver Prueba de Levene
Prueba de Levene para la igualdad de la varianza, 82
Prueba d Newman-Keuls, 102
Prueba de Scheff, 95
Prueba de significacin. Ver Prueba de hiptesis
Prueba de significacin de una regresin, 409

685

Prueba de lUkcy, 96
Prueba del rango mltiple de Duncan, 100
Prueba F parcial, 413
Prueba general de la significacin de la regresin, 114 141
626
Prueba t combinada. Ver Prueba t de dos muestras
Prueba t de dos muestras, 35
varianzas diferentes, 44
Prueba t pareada, 49
Pruebas de aleatorizacin, 40, 73
Pruebas de confirmacin, 17, 317
Pruebas F aproximadas, 535, 539, 540
Pseudocomponentes, 479
Pseudopruebas F. Ver Pruebas F aproximadas
Punto de respuesta mxima, 436, 437
Punto de respuesta mnima, 436, 438
Punto estacionario, 436, 440
Punto silla, 436, 439
Puntos atpleos, 78, 417
Puntos centrales, 271, 365, 431, 458, 461
Puntos de accin de palanca, 420. Ver tambin Influencia y
accin de palanca

R^, 104, 411. Ver tambin Estadstico


ajustada
para prediccin, 104, 419
Realizacin de rphcas, 5, 12, 16, 60, 247
Regin crtica, 34
Regin de rechazo. Ver Regin crtica
Reglas para expectativas, 26
Reglas para los cuadrados medios esperados, 531
Relacin de definicin para un diseo factorial fraccionado,
304, 318, 379
Relacin generadora, 318
Relacin seal a ruido, 491
Repetibilidad, 519
Rplica oculta, 247, 619
Rplica nica, 191, 244. Ver tambin Una observacin por
celda
Rplicas de cuadrados latinos, 148
Reproducibilidad, 519
Residuales escalados, 417
Residuales estandarizados, 78, 417
Residuales PRESS, 418
Residuales studentizados, 418
Resolucin del diseo, 308
Resolucin de un diseo factorial fraccionado. Ver Resolu
cin del diseo
Respuestas mltiples, 448
Restriccin sobre la aleatorizacin, 130, 145, 207, 209
Restriccin sobre la aleatorizacin. Ver Restriccin sobre la
aleatorizacin; ver tambin Formacin de bloques
.R-Student, 419

Seleccin emprica de una transformacin, 81, 84

686

INDICE

Separacin de alias en las interacciones, 306, 315, 339, 348,


407. Ver tambin Doblez de diseos factoriales frac
cionados
Significacin prctica vs significacin estadstica, 19
Sistemas de cordilleras, 447
Submuestreo, 578
Subparcelas, 574, 579
Suma de cuadrados corregida, 28
Suma de cuadrados de los residuales, 397
Sumas de cuadrados extras, 412
Sumas de cuadrados tipo III, 620
Superficie de respuesta, 10, 173, 201, 204, 225, 235, 364,
393, 427
Supuesto de desigualdad de la varlanza, 80
Supuesto de independencia en la prueba t y el anlisis de
varianza, 38-40, 79
Supuesto de normalidad en las pruebas / y el anlisis de
varianza, 38, 77
Tendencia central, 22
Teorema de Cochran, 69
Teorema del lmite central, 30
Tbtales de los tratamientos ajustados, 157
Transformacin de datos, 40, 81, 84-86, 257
Ti-ansformacin de rangos, 117, 118
Tiransformacin para corregir la violacin de los supuestos,
40, 81, 84-86, 257, 590
Transformaciones para estabilizar la varianza, 81, 84-86,
257
Transmisin del error, 493, 495
Tratamiento de control, 103
Itatam ientos, 21, 60

Tiratamientos ortogonales a los bloques, 139


Ti:ayectoria del ascenso ms pronunciado. Ver Ascenso ms
pronunciado
U na observacin por celda, 191
Unidad experimental, 13, 64, 126
Valor esperado, 25
Valores P, 37
Variabilidad, 22, 323
Variabilidad dentro de un tratamiento, 66
Variabilidad entre los tratamientos, 66
Variable aleatoria, 22
Variable aleatoria continua, 22
Variable aleatoria discreta, 22
Variable aleatoria F no central, 107
Variable concomitante, 604
Variable de regresin, 392
Variable de respuesta, 1, 2, 14, 15, 392
Variable dependiente, 392
Variable independiente, 392
Variable perturbadora, 13, 126
Variables aleatorias independientes, 26
Variables codificadas, 172, 223, 431
Variables indicadoras, 203
Varianza, 25
Varianza de la prediccin como criterio de diseo, 455,
457, 468
Varianza muestral, 26, 27
Varianza no constante, 38, 44, 79, 80
Verificacin de supuestos, 38, 76-86, 135, 185, 224, 242,
251, 258, 261, 416

ERRNVPHGLFRVRUJ
L a e d ic i n , c o m p o s ic i n , d is e o e im p re s i n d e e s ta o b r a f u e r o n r e a liz a d o s
BAJO LA SUPERVISIN DE GRUPO MORIEGA EDITORSB a l d e r a s 95, C o l . C e n t r o . M x ic o , D.F. C .P . 06040

2225750000704658D P 9233I

o
Cmo rM lIzar una xperirriHitacln ifidustral ptima.
Esta obra para inganeros, centifcos y expertos en
probabilidad proporciona el ertioque ms eficaz para
aprender a disear, conducir y analizar expenmentos
que optn^cen la calidad y el desempef^o de productos
y p r^ e s o . En esta nueva edta6n completamente
revisada y actualizada, e autor trata con mayor detnlmiento ios diseftos factonales y factonates fraccio
nados. y presenta nuevas tcnicas de anlisis como
el modelo hriea) generalizado. Asimismo, ofrece un
estudio ms amplio de los expenmentes con factores
alatenos, la metodologa de superficies de respuesta
los experHTientos con mezdas y los mtodos para es
tudios de robustez de procesos.
E) libro tambin ilustra dos de las h e rra m ^ta s de
software ma$ poderosas hoy en dta para el disete ex*
penmental. Design Expert* y Mnitab^. A lo largo del
texto se Incluyen salidas de estos programas, junto
con una exptcdcin detallada de la forma en que se
estn usando las computadoras para el anlisis y el
diseo de experimentos
* El sitio del hbro en la
ofrece recursos adiciona
les para estudiantes y profesores.

J B "N

> e-maii: l i m i t e nonega.com.mx


X ' ' www.noriegacom^mx

You might also like