Universidad Privada Boliviana

DETERMINACIN DEL TAMAO MUESTRAL MEDIANTE EL USO DE RBOLES DE DECISIN
Carlos Eduardo Valdivieso Taborga, Roberto Valdivieso Castelln, Oscar lvaro Valdivieso Taborga
Universidad Privada Boliviana
cvaldivieso@upb.edu
RESUMEN
La determinacin del tamao muestral en una investigacin es de vital importancia, tanto para
caracterizar la distribucin de la variable, como para fijar el grado de precisin del estudio. El
propsito de este artculo es ofrecer ayuda en el clculo del tamao muestral cuando se efecta un
estudio de carcter cuantitativo (limitado al uso de un muestreo aleatorio simple, unietpico y fijo), en
el cual se utilizan mtodos estadsticos inferenciales como medios para el anlisis, como ser la
estimacin estadstica, las pruebas de hiptesis y el anlisis de experimentos, que requieren de
informacin precisa sobre las variables consideradas, y que es obtenida a partir de la muestra
representativa de la respectiva poblacin.
El artculo presenta varias ecuaciones para la determinacin del tamao muestral, agrupadas en 6
figuras, usando la ayuda didctica de los rboles de decisin, que facilitan su eleccin. Con el fin de
ejemplificar la manera de utilizar los rboles de decisin para la eleccin de la ecuacin adecuada en el
clculo del tamao muestral, se muestra un ejemplo de investigacin, que es desarrollado
completamente, desde la concepcin del problema hasta las conclusiones finales. Por otro lado, se
exponen algunas bases tericas y empricas que ayuden a utilizar de la mejor manera posible las
distintas ecuaciones que permiten el clculo del tamao muestral.
Palabras Clave: Clculo del Tamao Muestral, rboles de Decisin, Estadstica Educacional.
1. INTRODUCCIN
1.1. Importancia de la determinacin del tamao muestral
Varios autores coinciden en que una decisin importante en cualquier investigacin es la seleccin adecuada
del tamao muestral (Montgomery [29], Gutirrez y de la Vara [13]). Marrugat et al. [42] sostiene que la
estimacin del tamao muestral puede considerarse un instrumento del que dispone el investigador para evaluar
la factibilidad y la necesidad de recursos de su proyecto. Sin embargo, la utilizacin de hiptesis verosmiles
deber prevalecer sobre otros intereses como las posibilidades econmicas, la disponibilidad de recursos u
otros. No es tico realizar un estudio con un tamao de muestra que no ofrezca un poder estadstico suficiente,
ya que, desde el punto de vista de la metodologa cientfica, el diseo no es adecuado. Kerlinger y Lee [37] y
Camacho-Sandoval [38], afirman que para aquellos investigadores que llevan a cabo grandes investigaciones
donde el costo de la recoleccin de datos es alto, la determinacin del tamao de muestra resulta crtica, ya que
el inters radica en conseguir la mejor informacin al menor costo:
Un tamao de muestra demasiado grande representa un desperdicio de recursos, tanto materiales como
humanos (Fuentelsaz [40]). Adems la calidad del estudio, dado dicho incremento, puede verse afectada en
sentido negativo (Fernndez [39]).
Un tamao demasiado pequeo es un desperdicio de esfuerzo, pues no podr detectar un efecto significativo
o se tendrn menos probabilidades de hacerlo.
Kerlinger y Lee [37] manifiestan que aunque la mayora de los investigadores tratan de simplificar los
conceptos y procedimientos implicados, el proceso de determinacin del tamao muestral para estudios de
investigacin no resulta trivial ni sencillo. De hecho afirman que es uno de los problemas ms difciles en la
estadstica aplicada.
Namakforoosh [34], Kerlinger y Lee [37] y otros autores, mencionan el uso de mtodos con reglas intuitivas
sin justificacin alguna. Uno de ellos es calcular el tamao muestral con base en una proporcin del tamao de
la poblacin (2%), otra es asignar arbitrariamente un valor grande (2000). Ninguna de estas opiniones es vlida.
148
UPB - INVESTIGACIN & DESARROLLO 11: 148 176 (2011)
DETERMINACIN DEL TAMAO MUESTRAL
1.2. Factores que afectan al clculo del tamao muestral

Gutirrez y de la Vara [13], Namakforoosh [34], y Camacho-Sandoval [38], entre otros, indican que la decisin
para la determinacin del tamao muestral depender de varios factores, segn los objetivos de la
investigacin:
La magnitud de las diferencias que se quiere detectar en la investigacin, es decir, la importancia de la
decisin a tomar. Si son pequeas mayor ser el tamao muestral y viceversa.
La variacin esperada en los datos, debido a fuentes de variacin no controladas. A mayor variacin ser
necesario un tamao muestral mayor.
El nmero de tratamientos (o muestras) que se desea comparar. A mayor nmero de ellos, menor tamao
muestral.
Riesgo que est dispuesto a tomar el investigador. A menor riesgo, el tamao deber ser mayor. Aqu est
incluida la potencia de la prueba que se desea.
La complejidad de los anlisis estadsticos. Cuanto ms complejos el tamao deber ser ms grande.
El nmero de variables o factores de estudio. Cuanto ms numerosas, ms grande tendr que ser la muestra.
El tamao de la poblacin. Para poblaciones finitas, el tamao de muestra ser menor que para poblaciones
infinitas, pero la relacin no es lineal (Mateu y Casal [41]).
1.3. Deficiencia de informacin en textos de consulta generales actuales
La mayor parte de los libros de Estadstica, no importa cul sea su nfasis, sean de estadstica matemtica o
terica (Mood/Graybill [8], Maisel [9], Hays y Winkler [10], Batattacharyya y Johnson [17], Larson [21],
Giardina [22], Muxica [23], Hoel [24]), elemental o intermedia (Freund y Simon [4], Lobez y Casa [11],
Yamane [19]), aplicada a distintos campos (Berenson, Levine y Krehbiel [1], Levin y Rubin [2], Mason y Lind
[3], Miller, Freund y Jonson [5], Mendenhall [6], Garca [7], Programa Ford-Itesm [14], Merril y Fox [18]);
libros de investigacin de mercados (Kinnear y Taylor [31], Aaker y Day [32], Kotler [33]), metodologa de
investigacin (Namakforoos [34], Sampieri, Collado y Lucio [35], Briones [36]), control estadstico de calidad
(Montgomery [12], Juran y Gryna [15], Duncan [16]), o econometra (Novales [20]), otorgan prcticamente
una o dos opciones para el clculo del tamao muestral representativo para llevar a cabo una investigacin
cuantitativa; es decir, aquella que realizar anlisis estadsticos inferenciales a los datos recopilados, con el
propsito de alcanzar sus objetivos. Estas ecuaciones slo sirven para realizar estimaciones acerca de la media
de una poblacin o de la proporcin poblacional, usando intervalos de confianza y con la posibilidad de
cometer un error tipo I.
Por otro lado, la mayora de los libros de anlisis y diseo de experimentos (Gutirrez y de la Vara [13],
Martnez [26], Myers [27]) solo presentan el clculo del nmero de rplicas de un diseo experimental de una
variable de entrada. Montgomery [29] es el nico que presenta una gua bastante exhaustiva para el clculo del
nmero de rplicas cuando se usan distintos modelos, tanto para efectos fijos como aleatorios.
La razn que sustenta esta falencia puede ser la que comentan Gutirrez y de la Vara [13]: Aunque existen
varios mtodos para estimar el tamao muestral, muchos tienen poca aplicabilidad, porque requieren cierto
conocimiento previo sobre la varianza del error experimental; o la que sostienen Kerlinger y Lee [37]: La
respuesta dada por estos mtodos no es completamente precisa y slo debe utilizarse como una gua para
ayudar a tomar decisiones inteligentes acerca de la conducta del estudio.
En muchos casos no se quiere estimar la media o proporcin poblacionales, sino la varianza poblacional, la
diferencia de medias, de proporciones o el cociente de varianzas. Por otro lado, algunas veces se quiere probar
conjeturas de estos parmetros poblacionales o de su comparacin. Para este tipo de casos, se deben usar otras
frmulas de clculo del tamao muestral que no han sido difundidas adecuadamente, y que es necesario
tomarlas en cuenta, en las cuales estn incluidas la proteccin contra los dos tipos de errores, tipo I y II.
Al respecto, algunos artculos (Camacho-Sandoval [38], Fernndez [39], Fuentelsaz [40], Mateu y Casal [41],
Marrugat et al. [42], entre otros) muestran las ecuaciones para la determinacin del tamao muestral cuando se
usan pruebas de hiptesis de la diferencia de medias o proporciones. Solamente StatPoint Inc. [25] muestra las
ecuaciones para el clculo del tamao muestral para una prueba de hiptesis y estimacin de varianzas y
cociente de varianzas.
149
C. VALDIVIESO, R. VALDIVIESO Y O. VALDIVIESO
1.4. Propsito del artculo

El propsito de este artculo es proporcionar una gua prctica para el clculo del tamao muestral
representativo en investigaciones donde se usen tcnicas estadsticas como la estimacin estadstica, las
pruebas de hiptesis paramtricas, o los diseos experimentales, para lograr obtener el objetivo pretendido, en
el marco del muestreo aleatorio simple, unietpico y fijo (no secuencial).
En este sentido, se utilizar la ayuda didctica de los rboles de decisin, muy adecuada cuando se tienen que
elegir una opcin de entre muchas, que difieren entre s por caractersticas similares (como ejemplo ver
Valdivieso, Valdivieso y Valdivieso [30]).
2. RBOLES DE DECISIN PARA LA ELECCIN DEL TAMAO MUESTRAL
El rbol de decisin es una excelente ayuda para la eleccin entre varios cursos de accin, ya que proveen una
estructura efectiva dentro de la cual estimar cuales son las opciones ms adecuadas.
Se han configurado 6 rboles de decisin para elegir de manera sencilla y sin ambigedades el tamao muestral
adecuado y representativo para llevar a cabo investigaciones de carcter cuantitativo. A continuacin se describe
el contenido de cada una de ellas.
Figura 1: rbol de decisin general para el clculo del tamao muestral. Es el primer rbol al que se debe acudir;
en l se encuentran todas las opciones que tiene el investigador en cuanto a parmetros poblacionales a estimar o
probar en su estudio. Dependiendo de la eleccin, el investigador deber remitirse a la Figura 2 hasta la Figura 6.
Figura 2: rbol de decisin para el clculo del tamao muestral en la estimacin de parmetros poblacionales. En
este rbol se encuentran los tamaos muestrales para la estimacin de la media, proporcin y varianza; es decir
cuando se usa una sola muestra.
Figura 3: rbol de decisin para el clculo del tamao muestral en la estimacin de la comparacin de parmetros
poblacionales. En este rbol se encuentran los tamaos muestrales para la estimacin de la diferencia de medias,
diferencia de proporciones y el cociente de varianzas; es decir cuando se usan dos muestras.
Figura 4: rbol de decisin para el clculo del tamao muestral en la prueba de las conjeturas o hiptesis de
parmetros poblacionales. En este rbol se encuentran los tamaos muestrales para las pruebas de hiptesis de la
media, proporcin y varianza.
Figura 5: rbol de decisin para el clculo del tamao muestral en la prueba de las conjeturas o hiptesis de la
comparacin de parmetros poblacionales. En este rbol se encuentran los tamaos muestrales para las pruebas de
hiptesis de la diferencia de medias, diferencia de proporciones y cociente de varianzas.
Figura 6: rbol de decisin para el clculo del tamao muestral en diseos experimentales. En este rbol se
hallan los tamaos muestrales para el diseo aleatorio simple, bloque aleatorizado y el diseo factorial con
mximo dos factores; es decir para ms de dos muestras.
3. BASES TERICAS Y EMPRICAS PARA LA FOMRULACIN DE TAMAOS MUESTRALES
A continuacin se describen las bases tericas y empricas para la formulacin de ecuaciones para el clculo del
tamao muestral representativo de una investigacin.
3.1. Figura 2. rbol de decisiones para la eleccin del tamao muestral en la estimacin de un parmetro
poblacional
3.1.1. Fundamentos de los riesgos en la estimacin estadstica
El objetivo de la estimacin por intervalos es encontrar un lmite superior e inferior donde se halle el
parmetro poblacional que se desea estimar, con una probabilidad prefijada de antemano por el investigador,
denominada nivel de certeza o confianza, y denotada por
.
Berenson, Levine y Krehbiel [1], sostienen que para determinar el tamao de la muestra, hay que recordar
que la variable tipificada en una distribucin de medias muestrales es:
150
(1)
/ n
donde z es el valor crtico de un rea de cola superior de

de una distribucin normal estndar. Si se
multiplican ambos lados de (1) por (el error estndar), se tiene:
z
/2
El valor z es positivo o negativo, segn sea mayor o menor que . La diferencia entre la media muestral
la media poblacional , denotada por e, se conoce como error de muestreo.
(2)
y
3.1.2. Estimacin de la media poblacional

Si se observa en (2), el error mximo que se puede tolerar en la estimacin de una media poblacional, cuando
se conoce la desviacin poblacional y la poblacin es infinita depende:
Del intervalo de confianza fijado para estimar la media poblacional,
De la desviacin estndar poblacional,
Del tamao muestral,
En la prctica no es fcil determinar estas tres cantidades, y las debe estimar un experto en la materia; es
decir una persona muy familiarizada con las variables que se van a estudiar. 95% es el nivel de confianza
ms comn, pero si se desea un nivel de confianza mayor se usa 99%, y si se desea un nivel menor se usa
90%. En cuanto al error de muestreo, no debe pensarse en qu cantidad de error se desea (en realidad no se
quiere tener errores) sino cunto se puede tolerar para poder proporcionar conclusiones adecuadas al estudio.
Tambin se debe disponer de una estimacin de la desviacin poblacional, que en algunos casos se la realiza
a partir de datos histricos o experiencia del experto, o tambin se puede llevar a cabo un estudio piloto para
estimarla con los datos muestrales.
Despejando
de (2), el mnimo tamao de muestra para no exceder el error mximo, tomando en cuenta
una poblacin infinita viene dado por la expresin:
2
n0
/2
(3)
En todo el artculo la notacin

designa el tamao muestral para poblacin infinita, y , se refiere al
tamao muestral para poblacin finita.
Si la poblacin es finita, se conoce el tamao poblacional N, el error mximo viene dado por:
e
donde la expresin
/2
N n
N 1
(4)
se conoce como el multiplicador de poblacin finita, que es un factor de ajuste, y se
utiliza para rebajar la varianza muestral estimada (Namakforoosh [34]). Despejando n de la ecuacin (4):
n
z2 / 2
z
2
/2
N
e ( N 1)
2
(5)
Siguiendo un procedimiento similar es que se han generado las dems ecuaciones de la Figura 2.
151
Una
No
No
Si
Dos
Figura 3
Una
Figura 4
Dos
Figura 5
No
Si
No
ayor a 2
Si
Figura 6
No
No
Mayor a 2
Remitirse a un libro especfico de

anlisis multivariante o buscar la
ayuda de un estadstico
ANOVA?
Nmero de
poblaciones
involucradas?
Figura 1 - rbol de decisin general para la eleccin del tamao muestral
152
Infinita
Si
No
Finita
Infinita
Finita
Media
Infinita
Si
Finita
Proporcin
No
Infinita
Finita
VarianzaM
Infinita
Parmetro a estimar?
No
Varianza poblacional
conocida?Se usar el
diseo experimental con
np : tamao de la muestra piloto;
Finita
Tamao
poblacional?
: proporcin patrn o norma de la poblacin;
: proporcin de la muestra piloto;
: desviacin estndar de la muestra piloto.
Figura 2 - rbol de decisin para la eleccin del tamao muestral en la estimacin de un parmetro poblacional.
153

No
Si
Si
Si
No
No
No
Medias
No
Si
Si
No
No
No
Proporciones
Si
Si
No
Varianzas
Qu parmetros se desean
comparar mediante la
estimacin?
Si
No
No
No
No
Varianzas
poblacionales
conocidas?
No
No
Los datos son
pareados?
Varianzas
poblacionales
iguales?
, son la desviacin poblacional de la diferencia y la desviacin de la diferencia de la muestra piloto, respectivamente.
es la diferencia entre varianzas que se quiere detectar.
Figura 3 - rbol de decisin para la eleccin del tamao muestral en la estimacin de la comparacin de parmetros poblacionales.
154
Si la poblacin es finita:
Si
No
Media
Si
Proporcin
No
Varianza
Parmetro a probar?
No
conocida?
es la diferencia entre el parmetro poblacional de la hiptesis nula y el estadstico de la muestra.
Figura 4 - rbol de decisin para el clculo del tamao muestral en la prueba de las conjeturas o hiptesis de parmetros poblacionales.
155
Si la poblacin es finita:
Si
No
Medias
Si
Proporciones
No
Varianzas
Qu parmetros se
quieren comparar
mediante hiptesis?
No
conocida?
, es la diferencia de medias que se quiere detectar.
Figura 5 - rbol de decisin para el clculo del tamao muestral en la prueba de las hiptesis de la comparacin de parmetros poblacionales
156
Fijos
ANOVA Simple
No
Si
Uno
Aleatorios
Fijos
ANOVA de Bloque
Aleatorios
A:
B:
Dos
Fijos
AB:
Diseo Factorial
Nmero de factores?
No
A:
Fuentes de variabilidad
extraa?
Aleatorios
B:
Efectos fijos o
aleatorios?
AB:
a es el nmero de tratamientos de A; b el nmero de bloques o tratamientos de B;
variabilidad de los tratamientos; , efectos de los tratamientos; , variabilidad de los tratamientos; ,
mxima diferencia entre medias de tratamientos;
, efectos de interaccin;
, variabilidad de los efectos de interaccin; , grados de libertad de los tratamientos; , grados de libertad
del error.
Figura 6 - rbol de decisin para el clculo del tamao muestral de diseos experimentales usando ANOVA.
157

3.1.3. Estimacin de la proporcin poblacional
Segn Berenson, Levine y Krehbiel [1], los mtodos para la determinacin del tamao muestral de una
proporcin son similares a los empleados para estimar la media poblacional.
El error mximo que se desea tolerar al estimar una proporcin poblacional, cuando se conoce la varianza
poblacional y para poblacin infinita, viene dado por:
(6)
donde es una proporcin patrn de la poblacin. De esa manera, el tamao muestral viene dado por la
expresin:
(7)
Cuando no se tiene conocimiento de o no se puede estimar mediante una muestra piloto, generalmente se usa
el valor de 0,5 ya que este valor dar como resultado el tamao de muestra ms conservador, es decir, el mayor
tamao de muestra.
Si la poblacin es finita, el error mximo viene dado por:
(8)
Si se despeja el tamao muestral, se obtiene:
(9)
Si no se conoce la varianza poblacional y la poblacin es infinita, se sigue un procedimiento similar al anterior
para generar las ecuaciones adecuadas, que se muestran en la Figura 2.
3.1.4. Estimacin de la varianza poblacional
Segn la ayuda que brinda el paquete computacional de estadstica Statgraphics Centurion 15.2 en sus manuales
en lnea, desarrollado por StatPoint Inc. [25], y modificado cuando se usa un estudio piloto, el error mximo al
estimar la varianza poblacional viene dado por:
(10)
Si bien se puede despejar n de las dos ecuaciones simultneas, es mejor calcular el tamao muestral mediante
sucesivas iteraciones. Todos los elementos son conocidos, excepto
, que es valor de la distribucin chicuadrada de cola superior de probabilidad , con
grados de libertad.
3.2. Figura 3. rbol de decisiones para la eleccin del tamao muestral en la estimacin de la comparacin de
parmetros poblacionales
3.2.1. Estimacin de la diferencia de medias poblacionales
El error mximo que se puede tolerar en la estimacin de la diferencia de medias con varianzas poblaciones
conocidas pero distintas, viene dado por:
(11)
Generalmente
158
. Despejando
se tiene:
(12)
Si la poblacin es finita, para cualquier caso de la Figura 3 o de las otras Figuras, se debe calcular el tamao
muestral mediante la siguiente ecuacin (Kerlinger y Lee [37]):
(13)
donde n es el tamao muestral para poblaciones finitas y
el tamao muestral para poblaciones infinitas.
Si por alguna razn no se quiere trabajar con la relacin

muestra 2 en relacin a la muestra 1 en una cantidad distinta al 50%:
, se debe fijar el porcentaje de la

(14)
De la misma manera, se pueden obtener otras ecuaciones similares cuando no se conocen las varianzas
poblacionales y se las debe estimar mediante muestras piloto, Figura 3.
3.2.2. Estimacin de la diferencia de proporciones poblacionales
El error mximo que se puede tolerar al estimar una diferencia de proporciones poblacionales con varianzas
poblacionales conocidas e iguales, y poblaciones infinitas, viene dado por:
(15)
Si se despeja el tamao muestral suponiendo que las dos muestras tienen el mismo tamao:
(16)
Asimismo se pueden obtener otras ecuaciones para el tamao muestral cuando no se conocen las varianzas
poblacionales, usando el muestreo piloto, Figura 3.
3.2.3. Estimacin del cociente de varianzas poblacionales
Segn StatPoint Inc. [25], el error mximo al estimar el cociente de varianzas poblacionales es:
y
(17)
donde es la diferencia de varianzas que se quiere calcular en la estimacin y

, es el valor de la
distribucin F de Fisher de cola superior de probabilidad
con
grados de libertad del numerador y
grados de libertad del denominador.
Al igual que en el caso de la estimacin para la varianza poblacional, es mejor calcular el tamao muestral
realizando iteraciones, en vez de despejarlo.
3.3. Figura 4. rbol de decisin para el clculo del tamao muestral en la prueba de las conjeturas o
hiptesis de parmetros poblacionales
3.3.1. Fundamentos de los riesgos al usar las pruebas de hiptesis
Segn Martnez [26], uno de los objetivos fundamentales de toda investigacin cientfica es la prueba de
hiptesis. Para tal propsito, se plantea una hiptesis, que puede ser cierta o falsa. El problema que se tiene
entonces, es definir una regla de decisin que permita, en los trminos de sus observaciones experimentales,
inclinarse por una u otra posibilidad.
159

Segn Berenson, Levine y Krehbiel [1], al usar un estadstico muestral para tomar decisiones respecto a un
parmetro poblacional, existe el riesgo de llegar a una conclusin incorrecta, pudiendo ocurrir dos tipos de
errores: Tipo I y II.
Ocurre un error tipo I si se rechaza la hiptesis nula
cuando en realidad es verdadera y no debe
rechazarse. La probabilidad de que ocurra este error es .
Ocurre un erro tipo II si se acepta la hiptesis nula
cuando en realidad es falsa y debe rechazarse. La
probabilidad de que ocurra este error es .
Gutirrez y de la Vara [13] declaran que se conoce como el nivel de significancia dado de la prueba y es la
probabilidad de la regin de rechazo; su valor se especifica en la etapa de planeacin. Generalmente, se
utilizan los valores de 0,05 o 0,01. Mientras ms pequeo es el valor de se requiere ms evidencia en los
datos para rechazar . En la prctica, la eleccin de depende del costo de cometer un error tipo I:
Si la accin a tomar despus de rechazar
implica una inversin fuerte, se recomienda usar 0,01 para
tener mayor confianza de que la decisin ser la adecuada.
Si la decisin no implica una fuerte inversin, es suficiente trabajar con 0,05.
No necesariamente un valor de ms pequeo es mejor, ya que si se admite poco riesgo se est truncando la
posibilidad de implementar muchos cambios que podran ser positivos.
Segn Gutirrez y de la Vara [13], es el riesgo del consumidor, que a diferencia del error tipo I, que se
controla con la seleccin de , la probabilidad de cometer un error tipo II depende de la diferencia entre el
valor hipottico y el valor real del parmetro poblacional. Por lo general, se disea la prueba de modo que el
valor de sea pequeo, que se puede controlar con el tamao muestral. A
se le llama poder o potencia
de la prueba y es la probabilidad de rechazar
cuando es falsa. En otras palabras, cuanto mayor es el
tamao muestral mayor ser la potencia de la prueba. Se recomiendan valores de de 0,1 o un poder de
prueba de 0,9. La Tabla 2 muestra el balance entre los riesgos y la toma de decisiones luego de una prueba de
hiptesis.
TABLA 1 - RIESGOS EN LAS PRUEBAS DE HIPTESIS
Decisin Estadstica
Se acepta
Situacin Real
es cierta
es falsa
Decisin correcta
Error tipo II
Error tipo I
Se rechaza
Decisin correcta
Fuente: Berenson, Levine y Krehbiel [1]
En la prctica, suele ser ms delicado cometer un error tipo I que un error tipo II. Sin embargo, al disminuir
aumentar para un tamao muestral dado.
Segn Kerlinger y Lee [37], en la mayor parte de los casos se tiende a establecer un criterio muy riguroso del
error tipo I, y existe una menor probabilidad de cometerlo. Sin embargo, como existe una relacin entre los
errores tipo I y tipo II, sta debe considerarse antes de realizar la decisin. La Figura 7 muestra esta relacin.
Punto crtico de
decisin
Probabilidad de
error tipo II ( )
Ho es
verdadera
(
)
H1 es
verdadera
(
)
Probabilidad de
error tipo I ( )
Fuente: Kerlinger y Lee [37]
Figura 7 - Relacin entre los errores tipo I y II.
160

3.3.2. Prueba de hiptesis para la media poblacional
Segn StatPoint Inc. [25] y Kerlinger y Lee [37], el tamao muestral representativo para probar una media
poblacional, con varianza conocida y poblacin infinita viene dado por:
(18)
donde , es la diferencia de la media muestral con la media de la hiptesis nula, que se desea detectar en la
prueba; , es la distancia del valor crtico a la media en H0, en unidades de desviacin estndar; , es la
distancia del valor crtico a la media en H1, en unidades de desviacin estndar.
A continuacin, se describe cmo se forma el estadstico de prueba que se usa para la tcnica (Marrugat et al.
[42]). En la Figura 8, se puede ver una generalizacin del fundamento de la estimacin del tamao de la
muestra en un contraste bilateral. En ella se aprecia el punto Mc, correspondiente a la media del grupo de
referencia (hiptesis nula), Me correspondiente a la media de un grupo con una intervencin alternativa y el
punto X representa el valor de la distribucin normal correspondiente al riesgo
aceptado en el contraste
de hiptesis bilateral en la distribucin de media Mc, y que define el riesgo en la distribucin
hipotticamente distinta de media Me. La zona sombreada es la del riesgo y la sin sombrear la del riesgo
. Cuando Me > Mc se tienen la distancia
H1
Me
X
Fuente: Marrugat et al. [42]
, y la distancia
H0
Mc
H1
Me
Figura 8 - Distribucin de los valores de una variable continua segn la hiptesis

nula y alternativa en un contraste bilateral.
donde
es el valor de la distribucin normal correspondiente al punto X en la distribucin de referencia de
media Mc y en la distribucin de media Me. Obsrvese que al tratarse siempre de un contraste unilateral en
la correspondiente a la hiptesis alternativa, se toma la distancia (Me - X) para poder tomar el valor
positivo; de otro modo, cuando es menor que 0,50, debera tomar valores negativos. Igualando para X se
obtiene:
(19)
de donde se obtiene la ecuacin 18 anterior, en la cual
Todas las dems ecuaciones de la Figura 4 presentan el mismo fundamento. Si se realiza una prueba de una
cola (superior o inferior) se debe cambiar en (18) y (19), en lugar de
.
Fernndez [39] afirma que antes de realizar una prueba de hiptesis se debe definir si va a ser unilateral o
bilateral:
Bilateral: Cualquiera de los dos parmetros a comparar (medias o proporciones) puede ser mayor o menor
que el otro. No se establece direccin.
Unilateral: Cuando se considera que uno de los parmetros debe ser mayor que el otro, indicando por tanto
una direccin de las diferencias.
161

La hiptesis bilateral es una hiptesis ms conservadora y disminuye el riesgo de cometer un error de tipo I
(rechazar la H0 cuando en realidad es verdadera). El contraste unilateral debera reservarse exclusivamente
para aquellas circunstancias en que una diferencia en un sentido llevara a la misma accin que la inexistencia
de diferencias (Marrugat et al. [42]).
Tambin se puede deducir el tamao muestral para la prueba de hiptesis de una media poblacional cuando no
se conoce la varianza poblacional, mediante una muestra piloto.
3.3.3. Prueba de hiptesis para la proporcin poblacional
Presenta el mismo fundamento que para una prueba de hiptesis para la media poblacional, siendo conocida o
no la varianza poblacional, sabiendo que la varianza de una proporcin es:
.
3.3.4. Prueba de hiptesis para la varianza poblacional
StatPoint Inc. [25], encuentra el valor ms pequeo de n tal que:
(20)
donde
es la diferencia de la varianza de la muestra con la de la hiptesis nula.
3.4. Figura 5. rbol de decisin para el clculo del tamao muestral en la prueba de hiptesis de la
comparacin de parmetros poblacionales
Las ecuaciones para el clculo del tamao muestral para una prueba de hiptesis de comparacin de parmetros
poblacionales presenta el mismo fundamento que el mostrado en la Figura 4.
3.4.1. Prueba de hiptesis para la diferencia de medias poblacionales
Para el caso de la determinacin del tamao muestral de la prueba de hiptesis de la diferencia de medias, sea
Mc, la primera media poblacional y Me la segunda, X el punto de decisin en una escala de diferencias entre
medias, , el valor de la distribucin normal correspondiente al valor del error aceptado en una prueba
bilateral; , el correspondiente al error aceptado; se asumen que las desviaciones poblacionales son iguales
para simplificar. La especificacin del error correspondiente a la hiptesis alternativa
lleva a:
(21)
De forma similar, la especificacin del riesgo
conduce a:
(22)
igualando para X y despejando n, (suponiendo que nc = ne) se tiene el tamao muestral:

(23)
donde todos los trminos son conocidos excepto , que es la mxima diferencia de medias que se quiere
calcular en la prueba
.
3.4.2. Prueba de hiptesis de la diferencia de proporciones poblacionales
Segn Marrugat et al. [42], aplicando la aproximacin normal a la distribucin binomial, se puede llegar a las
ecuaciones que se describen a continuacin.
162

Llamando P a la proporcin media de la proporcin de acontecimientos de inters del grupo control c y del
grupo tratado e, Pc a la proporcin de acontecimientos de inters en el grupo control, Pe a la proporcin en el
grupo expuesto, y utilizando el resto de notaciones igual que en apartados anteriores, de forma similar se
puede llegar a la siguiente expresin:
(24)
Una alternativa a la ecuacin anterior es la aproximacin sinusoidal inversa al clculo de la probabilidad
exacta de Fisher. Esta aproximacin est basada en el hecho de que cuando la proporcin Pc < 0,5, el
, y el
. El arcoseno se expresa en radianes. La transformacin de P es la
siguiente:
, cuyo valor oscila entre 0 y , posee la propiedad de que su desviacin
estndar es: , y es independiente de P. Esta transformacin permite llegar a la expresin siguiente:
(25)
StatPoint Inc. [25], realizando algunas otras transformaciones similares se llega a:
(26)
donde es la diferencia
dispuesta como norma.
que se quiere detectar, y
es la proporcin patrn poblacional aproximada o
3.4.3. Prueba de hiptesis del cociente de varianzas poblacionales

StatPoint Inc. [25] establece que el tamao muestral para una prueba de hiptesis del cociente de varianzas es:
(27)
donde
es la diferencia de varianzas que se quiere detectar en la prueba.
3.5. Figura 6. rbol de decisin para el clculo del tamao muestral de diseos experimentales usando
ANOVA
Segn Montgomery [29], una curva caracterstica de operacin es una grfica de la probabilidad del error tipo II
de una prueba de inferencia estadstica, para un tamao de muestra particular, contra el parmetro que refleja la
extensin en la cual la hiptesis nula es falsa. Estas curvas son una gua para seleccionar el tamao muestral
para que el diseo sea sensible a diferencias potenciales entre tratamientos.
El modelo experimental es de efectos fijos cuando los tratamientos del diseo experimental son fijados
especficamente por el investigador. Ser de efectos aleatorios cuando los tratamientos han sido seleccionados
aleatoriamente de una poblacin.
3.5.1. Modelo de efectos fijos para un diseo completamente aleatorizado (ANOVA simple)
El modelo de un experimento de comparacin simple con una variable de entrada (un factor), ya sea de
efectos fijos o aleatorios, tiene el siguiente modelo estadstico:
(28)
donde , es el efecto medio global;
es el efecto del tratamiento i;
, es el componente del error aleatorio.

163

La probabilidad del error tipo II es:
Para evaluar esta probabilidad, se requiere conocer la distribucin del estadstico F0 si la hiptesis nula es
falsa. Si eso ocurre F0 tiene distribucin F no centrada, con a-1 y N-a grados de libertad y un parmetro de
descentralizacin . Si
, la distribucin se transforma en la F centrada (a es el nmero de tratamientos
del diseo y N es el nmero de datos del diseo experimental).
Las curvas caractersticas de operacin se muestran en las tablas de anexos de varios libros de anlisis y
diseo de experimentos (Martnez [26], Montgomery [29], Myers [27]), que son los que construyeron Pearson
y Hartley en 1951. En ellas se indica la probabilidad del error tipo II en funcin del parmetro
, que segn
Myers [27] es un ratio F basado en la poblacin; es decir, es n veces la varianza entre las medias de los
tratamientos de la poblacin dividida por la varianza del error de la poblacin, dando como resultado:
(29)
est asociado al parmetro de descentralizacin . Hay curvas para
valores de los grados de libertad del numerador y denominador.
, para diversos
Para hallar n0, el investigador debe dar un valor a . Esto es muy difcil de determinar, pero una forma de
hacerlo es elegir los valores de las medias de tratamiento para los cuales se desea rechazar la hiptesis nula
con una probabilidad alta. Si
son las medias de tratamiento propuestas, el valor de (efectos de
los tratamientos) se encuentra usando la anterior ecuacin, donde cada efecto de tratamiento se calcula
mediante:
(30)
Es decir, el promedio de las medias individuales de tratamiento. Tambin es necesaria una estimacin de ,
que se la obtiene por experiencias pasadas, experimentos previos o estimaciones propuestas. Cuando no hay
seguridad en esta estimacin, el tamao de las muestras puede determinarse para un intervalo de valores
posibles y estudiar sus efectos.
Cuando resulta difcil seleccionar el conjunto de medias de tratamiento sobre el cual se basar la decisin, un
enfoque ms sencillo es seleccionar el tamao de muestra de manera que se rechace la hiptesis nula si la
diferencia entre cualquier par de medias de tratamiento (usualmente se toma la mxima diferencia entre
medias) excede un valor especfico D, donde
se obtiene mediante:
(31)
3.5.2. Modelo de efectos aleatorios para un diseo completamente aleatorizado (ANOVA simple)
Montgomery [29] afirma que la probabilidad del error tipo II para este modelo es:
Es posible demostrar que si H1 es verdadera (

) F0 tiene una distribucin F centrada, con a-1 y N-a
grados de libertad ( es la variabilidad de los efectos de los tratamientos).
En las curvas caractersticas para este modelo (Montgomery [29]) se grafica la probabilidad del error tipo II
contra el parmetro , siguiendo la relacin:
(32)
164

Si se tiene una idea de cuanta variabilidad es importante detectar en la poblacin de tratamientos, puede
estimarse . Mediante experiencias anteriores se puede estimar . Para definir
a veces es til usar la
relacin
3.5.3. Diseo de Bloques Aleatorios (ANOVA de Bloques)

El modelo de un experimento de comparacin simple con una variable de entrada (un factor), y una variable
de bloque, ya sea de efectos fijos o aleatorios, tiene el siguiente modelo estadstico:
(33)
componente del error aleatorio.
es el efecto del tratamiento i;
, es el efecto del bloque j,
, es el
En un diseo aleatorizado por bloques, es importante determinar el nmero de bloques (b). En el caso del
modelo de efectos fijos, se deben usar las curvas caractersticas de operacin (CCO) con el parmetro
dado por:
(34)
(35)
donde a-1 son los grados de libertad de numerador y (a-1)(b-1) los del denominador (b es el nmero de
bloques del diseo experimental).
Si el modelo es de efectos aleatorios, se usan las CCO con la relacin:
(36)
donde los grados de libertad son los mismos que para el modelo de efectos fijos.
3.5.4. Diseo Factorial
El modelo factorial de dos factores tiene el siguiente modelo estadstico:
(37)

simo nivel del factor columna B;
del error aleatorio.
es el efecto del i-simo nivel del factor rengln A; , es el efecto del j, es el efecto de la interaccin entre y ,
, es el componente
En la Tabla 3, se presenta el valor apropiado del parmetro

, as como los grados de libertad del numerador
y denominador, para el modelo de efectos fijos. Una forma muy eficiente de usar estas curvas es determinar
el valor mnimo de , que corresponde a una diferencia especificada entre dos medias de tratamiento. Si la
diferencia entre dos medias de rengln o columna, o efectos de interaccin es D, entonces se tienen los
valores mnimos mostrados en la Tabla 3.
165

TABLA 2 - ECUACIONES PARA EL CLCULO DEL TAMAO MUESTRAL PARA DISEO
FACTORIAL DE DOS FACTORES (A Y B)
Grados de
libertad del
numerador
a 1
Grados de
libertad de
denominador
ab(n0-1)
b1
ab(n0-1)
AB
(a-1)(b-1)
ab(n0-1)
Valor mnimo de
Factor
Fuente: Montgomery [29].
Las curvas caractersticas de operacin, permiten determinar el tamao muestral aproximado para obtener un
poder de prueba especfico en el diseo de efectos aleatorios. Las condiciones se muestran en la Tabla 4.
TABLA 3 - ECUACIONES PARA EL CLCULO DEL TAMAO MUESTRAL
PARA MODELO DE EFECTOS ALEATORIOS
Factor
A
a1
(a 1)(b 1)
b1
(a 1)(b 1)
AB
(a 1)(b 1)
ab(n0 - 1)
Fuente: Montgomery [29]
3.5.5. Tamao Muestral para las Pruebas de Rangos Mltiples

Despus de realizar el ANOVA de efectos fijos para detectar si existe algn tratamiento diferente, si se
rechaza la hiptesis nula, se debe realizar una prueba de rangos mltiples para comprobar la igualdad o
diferencia de medias de los pares de tratamientos que se puedan conformar y obtener el tratamiento ganador.
Hay numerosas pruebas de rangos mltiples. Montgomery [29] y StatPoint Inc. [25] indican algunas de ellas:
1) Mnima diferencia significativa (LSD = Least significant difference), 2) Intervalos mltiples de Duncan, 3)
Prueba de Newman-Keuls, 4) Prueba de Tukey, 5) Prueba de Dunnett (cuando existe un tratamiento de
control), 6) Bonferroni, y 7) Scheff.
Segn Montgomery [29] no es claro cul de estos mtodos es el mejor o ms til. Sin embargo, Carmer y
Swanson (1973), tras haber realizado estudios de simulacin Montecarlo, concluyeron que el mtodo LSD es
una prueba muy eficiente para detectar diferencias verdaderas en las medias si se aplica hasta despus que la
prueba F del ANOVA ha sido significativa en un 5%. As, en este artculo, se har uso de este mtodo.
El error mximo que se puede cometer en la estimacin de la media para la diferencia entre dos tratamientos
(cuando el diseo es balanceado), usando el mtodo LSD es:
(38)
donde f son los grados de libertad del error (N-a en un ANOVA simple, (a-1)(b-1) en un ANOVA de bloques,
ab(n-1) en un ANOVA para diseo factorial de dos factores), donde a es el nmero de tratamientos del primer
factor, b el nmero de bloques o el nmero de tratamientos del segundo factor.
166

Observando la ecuacin, se concluye que este error depende del nivel de confianza fijado, la varianza del
error aleatorio y del tamao muestral. Entonces, el mnimo tamao de muestra para no exceder un error
fijado, vendr dado por:
(39)
Como ejemplo, si se considera que un ingeniero quiere probar si los porcentajes de algodn influyen en la
resistencia a la tensin de las telas para la confeccin de camisas para varn, y quiere que la diferencia entre
cualquiera de dos tratamientos no sobrepase de 5 psi, con una confianza del 95%, y que una estimacin a
priori de la varianza del error es de 9, el tamao de la muestra para cada tratamiento debe ser de:
n = 4 es el tamao mnimo de la muestra que conducira a la precisin deseada de

realiza mediante aproximaciones, ya que el valor de t depende del valor de n.
5 psi. El clculo se
4. EJEMPLO DEL CLCULO DEL TAMAO MUESTRAL PARA UNA INVESTIGACIN

La problemtica industrial de este ejemplo de investigacin ha sido tomada de Heizer y Render [28], pero ha sido
modificada para el propsito de este artculo, de modo de lograr didctica y contundencia en la ejemplificacin del
clculo del tamao muestral.
4.1. Antecedentes de la Investigacin
Jorge, el dueo de una empresa que fabrica mesas de roble, desea realizar un estudio de eficiencia acerca de la
asignacin ptima de sus operarios en las etapas de su proceso productivo. El proceso de fabricacin consiste en
cuatro pasos: preparacin, montaje, acabado y empaquetado. Cada paso lo realiza una persona. Adems de
supervisar toda la operacin, Jorge hace todo el acabado. Toms realiza la operacin de preparacin, que implica
cortar y darle forma a los componentes bsicos de las mesas. Len est encargado del montaje y Katy realiza el
empaquetado. Aunque cada persona es responsable de slo una etapa, todos pueden realizar cualquiera de ellas.
Segn la poltica de Jorge, ocasionalmente cada uno puede completar varias mesas por su cuenta sin ninguna
ayuda o asistencia. Se realiza una pequea competicin para ver quin puede terminar una mesa entera en menos
tiempo. Jorge guarda los tiempos de terminacin de cada proceso para cada empleado. Los datos se muestran en la
Tabla 5.
TABLA 5 - TIEMPO DE FABRICACIN DE MESAS EN MINUTOS
0
Preparacin
100
Montaje
160
Acabado
250
Empaquetado
275
Toms
0
80
Preparacin
Preparacin
Preparacin
160
Montaje
110
120
Fuente: Heizer y Render [28]
Montaje
Montaje
220
Acabado
Jorge
200
Len
190
Acabado
Acabado
230
Empaquetado
280
290
Empaquetado
Empaquetado
290
315
Katy
A Katy le lleva ms tiempo construir una mesa de roble que a los otros. Adems de ser ms lenta que los otros
empleados, Katy est descontenta con su actual responsabilidad de empaquetado, que la tiene parada la mayor
parte del da. Su primera preferencia es el acabado y la segunda, la preparacin. Len tiene muchos problemas en
167

la etapa de montaje, y su primera eleccin de cambio es ir a preparacin. Adems de la calidad, Jorge est
interesado en los costos y la eficiencia. Cuando uno de los empleados falta un da, esto provoca importantes
problemas de programacin. Las horas extras son caras, y esperar a que el empleado vuelva al trabajo provoca
retrasos y, a veces, detiene todo el proceso de fabricacin.
Para superar algunos de estos problemas, se contrat a Randy. Las principales obligaciones de Randy son las de
realizar trabajos variados y echar una mano si alguno de los empleados no est. Jorge ha preparado a Randy en
todas las fases del proceso de fabricacin, y est contento con la rapidez con la que Randy ha sido capaz de
aprender a montar completamente las mesas. Los tiempos de finalizacin totales e intermedios de Randy se dan
en la Tabla 6.
TABLA 6 - TIEMPO DE FABRICACIN EN MINUTOS PARA RANDY
0
110
Preparacin
190
Montaje
290
Acabado
300
Empaquetado
Fuente: Heizer y Render [28]
4.2. Objetivos de la investigacin

Jorge quiere llevar a cabo una investigacin a fin de conocer algunos aspectos especficos
productividad de sus operarios, para luego tomar decisiones ptimas de asignacin de personal.
llevar a cabo esta investigacin con una precisin deseada, y realizar un tratamiento estadstico de
recopilar, un paso primordial ser el clculo del tamao muestral sujeto a los siguientes
investigacin:
acerca de la
Como quiere
los datos que
objetivos de
1. Jorge cree que la operacin de montaje es la ms crtica del proceso. A cul de sus operarios asignara para
minimizar el tiempo de esa etapa (sin incluir a Randy)? Jorge quiere detectar una diferencia mxima entre
medias de tratamientos de 15 minutos.
2. Como Katy no se siente bien realizando el empaquetado, Jorge quiere entrenarla mejor para que disminuya su
actual tiempo de la operacin de acabado y transferirla a esa etapa. La va a someter a un entrenamiento que
dura un mes. Los resultados despus del periodo de entrenamiento dirn si Jorge podr pasar a Katy a la
operacin de acabado. Jorge solo tolerar un error mximo en la estimacin de medias de 6 minutos.
3. Por otro lado Jorge quiere conocer si Len es mejor o peor que l en la etapa de preparacin. Para averiguarlo
primero quiere determinar si la variabilidad del tiempo de Len difiere con la suya. Posteriormente, y tomando
en cuenta este aspecto, necesita saber si asigna a Len la etapa de preparacin o lo cambia a acabado, que es
donde Jorge sabe que se desempea bien. Cul debe ser la decisin? Jorge quiere detectar una diferencia de
varianzas de 4, y una diferencia de medias de 10.
4. El problema con Katy es bastante complejo. Se sabe que su tiempo es mucho mayor al de Randy en la etapa de
empaquetado. Sin embargo, Jorge medir su rendimiento, no tomando en cuenta el tiempo, sino el nmero de
empaquetados que cumplen las exigencias de calidad. Para ello deber realizar un muestreo del nmero de
mesas mal empaquetadas por los dos. Si Katy tiene mayor nmero de paquetes defectuosos que Randy, Jorge
deber asignar a Katy el trabajo de Randy, es decir, de hacer trabajos variados y sustituir a algn empleado
que falte Cul deber ser la decisin? Jorge estima que la proporcin de mesas mal empaquetadas no debera
sobrepasar del 25% y desea detectar una diferencia de proporciones del 30%.
5. Una vez analizado todo el proceso, Jorge quiere saber cules seran las ubicaciones que debera otorgar a sus
empleados, para obtener un tiempo de fabricacin de mesas ptimo. Quiere llenar los cuadros siguientes con
los nombres adecuados.
Preparacin
Montaje
Acabado
Empaquetado
6. Por ltimo Jorge desea estimar la dispersin de tiempo de todas las etapas con respecto a los operarios en sus
puestos de trabajo asignados ptimamente. Si la dispersin para cualquier etapa rebasa los 5 minutos, entonces
someter al operario respectivo a un periodo de entrenamiento. Quines entrarn a ese programa? El mximo
error que se quiere cometer al estimar la varianza es de 2.
168

7. La pregunta que se hace Jorge antes de comenzar con su investigacin es: Cul es el tamao muestral ptimo
para realizar esta investigacin, si por experiencia sabe que la desviacin de cualquier operacin es de 5
minutos?
Para todas las pruebas Jorge ha elegido un nivel de significancia de 0,05, ya que la implementacin de sus
decisiones no involucra fuertes inversiones; y quiere obtener un poder de prueba del 90%.
4.3. Clculo del tamao muestral para la investigacin
Para el clculo del tamao muestral ptimo a fin de llevar a cabo esta investigacin, primero se debern definir los
anlisis estadsticos que se realizarn para responder a cada pregunta planteada.
1. Diseo de experimentos. Como existe una variable de entrada, con 4 niveles (los cuatro operarios), se opta por
el ANOVA simple, completamente aleatorizado, sin ninguna variable de bloque.
2. Se quiere comparar el tiempo que hace Katy en la etapa de acabado antes y despus de un programa de
entrenamiento. El anlisis estadstico debe ser un intervalo de confianza para la diferencia de medias.
3. Aqu se deben realizar dos anlisis. El primero es la prueba de hiptesis del cociente de varianzas, y el segundo
la prueba de hiptesis de la diferencia de medias.
4. Se quiere comparar el nmero de mesas mal empaquetas de Katy y Randy con respecto al nmero total de
mesas empaquetadas. Para ello se realizar un intervalo de confianza para la diferencia de proporciones.
6. Como se quiere estimar la dispersin del tiempo de cada etapa, se usar un intervalo de confianza para estimar
la varianza.
Para la eleccin y posterior clculo del tamao muestral para cada pregunta, se har uso de los 6 rboles de
decisin desarrollados en el presente artculo. Luego, se debern recopilar algunos datos del proceso de
fabricacin que permitan resolver cada objetivo de investigacin y tomar las decisiones ms adecuadas. Si bien
usando las diferentes tablas existentes en cualquier libro de Estadstica se pueden encontrar los valores crticos
para las diferentes ecuaciones del tamao muestral, en la Tabla 7 se resumen los valores ms usados de z.
TABLA 7 - VALORES DE
PARA DISTINTOS NIVELES DE SIGNIFICANCIA Y POTENCIA

ESTADSTICA
Prueba 1 Cola
Prueba 2 Colas
Potencia
(
)
0,800
0,010
2,326
2,576
0,900
1,282
0,050
1,645
1,960
0,950
1,645
0,100
1,282
1,645
0,990
2,326
Significancia
( )
Valor de
Valor de
0,842
Fuente: Camacho-Sandoval [38]
1. Clculo del tamao muestral para el ANOVA simple

Usando la Figura 1, se realiza la siguiente decisin:
Se usar la estimacin estadstica? No.
Se usar el mtodo de pruebas de hiptesis? No.
Se usar el diseo experimental con ANOVA? Si.
Nmero de poblaciones involucradas? Mayor a dos.
Remitindose a la Figura 6, se decide de la siguiente manera:
Nmero de factores? Uno.
Fuentes de variabilidad extraa? No, ANOVA simple.
Efectos fijos o aleatorios? Fijos, ya que los operarios han sido previamente elegidos por el investigador,
en este caso por Jorge.
La ecuacin del tamao muestral es la siguiente:
169

Los datos que se necesitan son los siguientes:
Se elabora una tabla para el clculo de para distintos tamaos muestrales y se determina en las curvas
caractersticas de operacin (Montgomery [29], pp. 548, Martnez [26], pp. 714) el valor de , para luego
calcular el poder de prueba
, hasta que el valor llegue o sobrepase 0,9, que es el poder adecuado para la
mayora de los experimentos, Tabla 8.
TABLA 8 - CLCULO DEL TAMAO MUESTRAL PARA EL DISEO
COMPLETAMENTE ALEATORIZADO
3
4
5
1,84
2,12
2,37
3
3
3
8
12
16
0,32
0,14
0,05
0,68
0,86
0,95
Con cinco rplicas en el experimento se logra obtener un poder de prueba del 95%.
2. Clculo del tamao muestral para el intervalo de confianza para la diferencia de medias.
Se usar la estimacin estadstica? Si.
Se usar el diseo experimental con ANOVA? No.
Nmero de poblaciones involucradas? Dos.
Qu parmetros se desean estimar mediante la comparacin? Medias.
Varianzas poblacionales conocidas? Si. Por dato histrico la varianza es de 25.
Los datos son pareados? No.
Las varianzas de las poblaciones son iguales? Si.
La ecuacin para el tamao muestral para la diferencia de medias es la siguiente:
Si Jorge slo tolera un error mximo en la estimacin de medias de 6 minutos, el tamao muestral es:
Berenson, Levine y Krehbiel [1] afirman que la regla general es redondear hacia arriba.
3. a) Clculo del tamao muestral de la prueba de hiptesis para el cociente de varianzas.

Se usar el mtodo de pruebas de hiptesis? Si.
Qu parmetros se quieren probar mediante hiptesis? Varianzas.
Varianza poblacional conocida? No.
170

El tamao muestral adecuado es el siguiente:
El clculo es el siguiente, sabiendo que se quiere detectar una diferencia de varianzas de 4, y lograr una
potencia de prueba del 90%:
3. b) Clculo del tamao muestral de la prueba de hiptesis para la diferencia de medias.

Qu parmetros se quieren probar mediante hiptesis? Medias.
Varianza poblacional conocida? Si.
El tamao muestral adecuado es el siguiente:
Para detectar una diferencia de medias de 10 y lograr un poder de prueba del 90%, el tamao muestral ser:
4. Clculo del tamao muestral para la prueba de hiptesis de la diferencia de proporciones.

Qu parmetros se quieren probar mediante hiptesis? Proporciones.
Varianza poblacional conocida? Si.
La ecuacin para el tamao muestral es la siguiente:
Si
y si quiere un poder de prueba del 90%, el valor del tamao muestral es:
171
6. Clculo del tamao muestral para la estimacin de la varianza poblacional

Se usar la estimacin estadstica? Si.
Nmero de poblaciones involucradas? Una.
Parmetro a estimar? Varianza.
Varianza poblacional conocida? No.
Poblacin finita o infinita? Infinita.
El clculo del tamao muestral viene dado por las siguientes ecuaciones:
El mximo error que se quiere cometer al estimar la varianza es de 2. Jorge elige no realizar una muestra
piloto, sino confiar en que la desviacin de cada etapa es de 5. Se realiza un clculo iterativo, dando como
resultado la Tabla 9 o la Figura 9. Se observa que para un tamao de 25 las dos diferencias del error (e) con el
error calculado (e-e1 y e-e2) por las dos ecuaciones anteriores son positivas y la ltima lo ms cercana a cero.
TABLA 9 - CLCULO DEL TAMAO MUESTRAL DEL INTERVALO DE CONFIANZA PARA LA
VARIANZA
e
n
Iteracin 1
2
24
Iteracin 2
2
25
Iteracin 3
2
26
38,076
39,364
40,646
11,689
1,114
2,014
0,886
-0,014
12,401
1,096
1,956
0,904
0,044
13,120
1,079
1,902
0,921
0,098
e1
e2
e-e1
e-e2
1
0.5
0
-0.5
10
15
20
25
30
35
-1
Figura 9 Solucin grfica del tamao muestral del intervalo de confianza para la varianza.
4.4. Recopilacin de Datos
172

Para el anlisis de las tres primeras preguntas, Jorge decide tomar un tamao muestral de 6, ya que es el valor
que se repite en la mayora. Para la pregunta 4, optar por el valor de 40 y para la 6 por el valor de 25. Los
datos recopilados se presentan en las Tablas 10 13.
TABLA 4 - DATOS RECOPILADOS PARA LA PREGUNTA 1
Tiempo en la etapa de montaje (min)
Operario
1
2
3
4
5
6
Toms
60
58
64
55
65
60
Jorge
81
78
80
80
82
79
Len
90
93
91
92
88
89
Katy
70
74
71
73
67
69
Tiempo de Katy en la etapa de acabado (min)
Entrenamiento
1
2
3
4
5
6
Antes
100
104
98
105
99
97
Despus
98
101
98
103
98
99
Tiempo en la etapa de preparacin (min)
Operario
1
2
3
4
5
6
Len
110 108 111 112 109 110
Jorge
80
75
85
80
88
75
Nmero de mesas
Nmero de mesas mal
empaquetadas
empaquetadas
Katy
40
17
Randy
40
8
4.5. Anlisis Estadstico
Para generar todos los anlisis estadsticos se utilizar el paquete de estadstica Statgraphics Centurion 15.2.
(1) ANOVA Simple, Tabla 14.
TABLA 6 - ANOVA SIMPLE
Origen de las
variaciones
Entre grupos
Dentro de los grupos
Total
Suma de
cuadrados
2991,458
130,167
3121,625
Grados de
libertad
3
20
23
Promedio de los
cuadrados
997,153
6,508
Probabilidad
153,21
5,8E-14
Valor crtico
para F
3,10
Observando la tabla ANOVA, se concluye que existe diferencia significativa en la etapa de montaje entre los
distintos operarios. Por lo tanto, se deber realizar una prueba LSD, mostrada en las Tablas 15 y 16.
TABLA 7 - DIFERENCIA DE MEDIAS POR EL MTODO LSD
Contraste
Jorge - Katy
Jorge - Len
Jorge Toms
Katy - Len
Katy - Toms
Len - Toms
Sig.
*
*
*
*
*
*
Diferencia
9,3333
-10,5
19,6667
-19,8333
10,3333
30,1667
+/- Lmites
3,0724
3,0724
3,0724
3,0724
3,0724
3,0724
173

TABLA 8 - RESULTADOS DE LA COMPARACIN DE MEDIAS POR LSD
Operario
Toms
Katy
Jorge
Len
Casos
Media
6
6
6
6
60,3333
70,6667
80,0
90,5
Grupos
Homogneos
X
X
X
X
Mediante la prueba LSD se constata que cada operario tiene tiempos diferentes para la operacin de montaje,
siendo el ms rpido Toms.
(2) Intervalo de confianza de la diferencia de medias
Los datos muestrales se ven en la Tabla 17.
TABLA 9 - RESUMEN ESTADSTICO PARA LA PREGUNTA 2
Resumen estadstico
Recuento
Promedio
Varianza
Desviacin estndar
Coeficiente de variacin
Antes
6
100,5
10,7
3,2711
3,25%
Despus
6
99,5
4,3
2,0736
2,08%
Intervalos de confianza del 95,0% para la diferencia de medias suponiendo varianzas iguales: 1,0 +/- 3,5230
[-2,5230; 4,5230]. Como el intervalo contiene el cero, no hay diferencia significativa entre el tiempo de Katy
en la etapa de acabado antes y despus del programa de entrenamiento.
(3) Cociente de varianzas y diferencia de medias
Los estadsticos muestrales se ven en el Tabla 18.
Resumen estadstico
Recuento
Promedio
Varianza
Desviacin estndar
Coeficiente de variacin
Len
6
110,0
2,0
1,414
1,28%
Jorge
6
80,5
27,5
5,244
6,51%
Prueba-F para comparar desviaciones estndar

Hiptesis Nula:
; Hiptesis Alternativa:
F = 0,07273 valor-P = 0,012072
Se rechaza la hiptesis nula para
. Las varianzas de los tiempos en la etapa de preparacin entre
Len y Jorge son distintas.
Prueba t para comparar medias
Hiptesis nula:
; Hiptesis Alternativa:
sin suponer varianzas iguales: t = 13,3041 valor-P = 0,00001603
Se rechaza la hiptesis nula para
. Los tiempos promedios en la etapa de preparacin entre Len y
Jorge son distintos, siendo Jorge el ms rpido.
4. Prueba de hiptesis de la diferencia de proporciones
Proporciones muestrales = 0,425 y 0,2; Tamaos de muestra = 40 y 40
174

Hiptesis Nula:
; Alternativa:
Estadstico z calculado = 2,170882, Valor-P = 0,02994
Rechazar la hiptesis nula para alfa = 0,05. Se concluye que existe diferencia significativa entre la proporcin
de mesas mal empaquetadas entre Katy y Randy, donde el ltimo hace mejor este trabajo.
4.6. Resultados
Con los resultados de las pruebas inferenciales llevadas a cabo, Jorge puede realizar una asignacin ptima de
sus operarios a cada etapa de fabricacin, de la siguiente manera:
Antes:
Despus:
Preparacin
Montaje
Acabado
Empaquetado
Toms
Len
Jorge
Katy
Preparacin
Montaje
Acabado
Empaquetado
Jorge
Toms
Len
Randy
Katy se ocupar de la suplencia.

Luego de su investigacin, podr recopilar datos para su ltima pregunta de investigacin.
Intervalo de confianza para la varianza del tiempo en cada etapa con asignacin ptima.
A partir de los datos recopilados, Jorge gener la siguiente informacin, Tabla 19.
Estadsticos
n
Media
Varianza
Desviacin estndar
Jorge
(Preparacin)
25
80,5000
27,5000
5,2440
Len
(Acabado)
25
85,1667
46,5667
6,8240
Toms
(Montaje)
25
60,3333
13,8667
3,7238
Randy
(Empaquetado)
25
24,5000
2,3000
1,5166
Los intervalos de confianza para cada operario son los siguientes: Jorge: [4,0947; 7,2952]; Len: [5,3284;
9,4932]; Toms: [2,9076; 5,1804]; Randy: [1,1842; 2,1098].
Len ser el nico que deber someterse a un periodo de entrenamiento para disminuir su variabilidad, ya que
el valor de la desviacin 5 cae fuera del intervalo.
5. CONCLUSIONES
El proceso para la determinacin del tamao muestral en una investigacin de carcter cuantitativo, se concreta en la
eleccin de la ecuacin adecuada para cada objetivo y se simplifica mucho recurriendo a la ayuda de los rboles de
decisiones presentado en este artculo.
La determinacin de los parmetros de los que dependen las distintas ecuaciones para calcular el tamao muestral, es
tarea de los expertos en el tema que se quiere investigar (error de muestreo, varianza poblacional, errores tipo I y II,
mximas diferencias a detectar, etc.), y debe ser realizada siempre con una actitud conservadora, sino se consiguen
datos histricos o estimaciones fidedignas para respaldarlos.
Se debe tener en cuenta que los valores hallados con las ecuaciones especficas a la tcnica estadstica usada, son una
gua o una estimacin del nmero de unidades que deber muestrear para cumplir con sus objetivos y lograr la
precisin deseada.
Lo expuesto en este artculo debera permitir concretizar uno de los primeros pasos que se debe resolver en el difcil
proceso de realizacin de un estudio cuantitativo.
175

6. REFERENCIAS
[1]
[2]
[3]
[4]
[5]
[6]
[7]
[8]
[9]
[10]
[11]
[12]
[13]
[14]
[15]
[16]
[17]
[18]
[19]
[20]
[21]
[22]
[23]
[24]
[25]
[26]
[27]
[28]
[29]
[30]
[31]
[32]
[33]
[34]
[35]
[36]
[37]
[38]
[39]
[40]
[41]
[42]
176
Berenson, Levine y Krehbiel, Estadstica para Administracin, Pearson Educacin, 2a Ed., Mxico, 2001.
Levin y Rubin, Estadstica para Administradores, Prentice Hall S.A., 6a Ed., Mxico, 1996.
Mason y Lind, Estadstica para Administracin y Economa, Alfaomega, Sptima Edicin, Mxico, 1995.
Freund y Simon, Estadstica Elemental, Prentice Hall, Octava Edicin, Mxico, 1994.
Miller, Freund y Jonson, Probabilidad y Estadstica para Ingenieros, Prentice Hall S.A., 4a Ed., Mxico,
1992.
Mendenhall W., Estadstica para Administradores, Grupo Editorial Iberoamrica, 2a Ed., Mxico, 1990.
Garca M., Socioestadstica, Alianza Editorial, Madrid-Espaa, 1985.
Mood/Graybill, Introduccin a la Teora Estadstica, Editorial Aguilar, 4a Ed., Madrid-Espaa, 1976.
Maisel L., Probabilidad y Estadstica, Fondo Educativo Interamericano, Colombia, 1973.
Hays Y Winkler, Statistics: Probability, Inference and Decision, Holt, Rinehart and Winston Inc., 1971.
Lobez y Casa, Estadstica Intermedia, Editorial Vicens-Vives, 1a Ed., Espaa, 1967.
Montgomery D. C., Control Estadstico de la Calidad, Grupo Editorial Iberoamrica, S.A., Mxico, 1994.
Gutierrez y De La Vara, Anlisis y Diseo de Experimentos, McGraw-Hill Interamericana, 1a Ed., Mxico,
2004.
Programa Ford-Itesm, Inferencia Estadstica, Mdulo 7, Mxico, 1989.
Juran y Gryna, Manual de Control de Calidad, Volumen II, McGraw-Hill, Cuarta Edicin, Espaa, 1993.
Duncan A., Control de Calidad y Estadstica Industrial, Editorial Alfaomega, Mxico, 1989.
Batattacharyya y Johnson, Statistical, Concepts and Methods, John Wiley & Sons, United States of
America, 1977.
Merril y Fox, Introduccin a la Estadstica Econmica, Amorrortu Editores, Argentina, 1969.
Yamane T., Estadstica, Editorial Harla, Mxico, 1974.
Novales A., Estadstica y Econometra, McGraw-Hill Interamericana, Espaa, 1997.
Larson H., Introduction to Probability Theory and Statistical Inference, 2a Ed., Wiley International Edition,
1974.
Giardina B., Manual de Estadstica, Compaa Editorial Continental, Mxico, 1968.
Muxica L., Introduccin a la Estadstica Matemtica, Univ. de Concepcin, Publicaciones Docentes, Chile,
1966.
Hoel P., Introduccin a la Estadstica Matemtica, Biblioteca Interamericana de Estadstica Terica y
Aplicada, Argentina, 1955.
Statpoint Inc., Determinacin del Tamao de Muestra, Manuales en Lnea del Paquete de Computacin
Estadstico Statgraphics Centurion 15.2, 2007.
Martinez A., Diseos Experimentales, Universidad Autnoma de Chapingo, Editorial Trillas, Mxico, 1988.
Myers J., Fundamentals of Experimental Design, University of Massachusetts, Allyn And Bacon, Inc.,
Boston, 1966.
Heizer y Render, Direccin de la Produccin. Decisiones Estratgicas, Cuarta Edicin, Prentice Hall, 1998.
Montgomery D.C., Diseo y Anlisis de Experimentos, Grupo Editorial Iberoamrica, S.A., Mxico, 1991.
Valdivieso C., Valdivieso R. Y Valdivieso O., Uso de rboles de Decisin para la Estimacin Estadstica,
UPB Revista Investigacin y Desarrollo, 10: 105-123, 2010.
Kinnear y Taylor, Investigacin de Mercados: Un Enfoque Aplicado, McGraw Hill, 1994.
Aaker y Day, Investigacin de Mercados, McGraw Hill, Mxico, 1990.
Kotler P., Direccin de Mercadotecnia: Anlisis, Planificacin y Control, Ed. Diana, Mxico, 1985.
Namakforoosh M. N., Metodologa de la Investigacin, Ed. Limusa S.A, Grupo Noriega Ed., Mxico, 1995.
Sampieri, Collado y Lucio, Metodologa de la Investigacin, McGraw Hill, Mxico, 1998.
Briones G., Mtodos y Tcnicas de Investigacin para las Ciencias Sociales, Ed. Trillas, Mxico, 2003.
Kerlinger y Lee, Investigacin del Comportamiento, Cuarta Edicin, McGraw Hill, Mxico, 2002.
Camacho-Sandoval J., Tamao de Muestra en Estudios Clnicos, Acta Mdica Costarricense (AMC), Vol.
50 (1), 2008.
Fernndez P., Determinacin del Tamao Muestral, Cad. Aten Primaria 1996; 3: 138-14, 2001.
Fuentelsaz C., Clculo del Tamao de la Muestra, Matronas Profesin, Vol. 5, N 18, 2004.
Mateu y Casal, Tamao de la Muestra, Rev. Epidem. Med. Prev. , 1: 8-14, 2003.
Marrugat, Vila, Pavesi y Sanz, Estimacin del Tamao de la Muestra en la Investigacin Clnica y
Epidemiolgica, Unidad de Lpidos y Epidemiologa Cardiovascular. Unidad de Informtica Mdica.
Instituto Municipal de Investigacin Mdica (IMIM), Med Clin (Barc), 1998; 111: 267-276.

Universidad Privada Boliviana

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Universidad Privada Boliviana

Uploaded by

Copyright:

Available Formats

DETERMINACIN DEL TAMAO MUESTRAL MEDIANTE EL USO DE RBOLES DE DECISIN

UPB - INVESTIGACIN & DESARROLLO 11: 148 176 (2011)

DETERMINACIN DEL TAMAO MUESTRAL

1.2. Factores que afectan al clculo del tamao muestral

C. VALDIVIESO, R. VALDIVIESO Y O. VALDIVIESO

1.4. Propsito del artculo

UPB - INVESTIGACIN & DESARROLLO 11: 148 176 (2011)

DETERMINACIN DEL TAMAO MUESTRAL

donde z es el valor crtico de un rea de cola superior de

3.1.2. Estimacin de la media poblacional

En todo el artculo la notacin

se conoce como el multiplicador de poblacin finita, que es un factor de ajuste, y se

UPB - INVESTIGACIN & DESARROLLO 11: 148 176 (2011)

C. VALDIVIESO, R. VALDIVIESO Y O. VALDIVIESO

Remitirse a un libro especfico de

Figura 1 - rbol de decisin general para la eleccin del tamao muestral

UPB - INVESTIGACIN & DESARROLLO 11: 148 176 (2011)

DETERMINACIN DEL TAMAO MUESTRAL

np : tamao de la muestra piloto;

: proporcin patrn o norma de la poblacin;

: proporcin de la muestra piloto;

: desviacin estndar de la muestra piloto.

UPB - INVESTIGACIN & DESARROLLO 11: 148 176 (2011)

C. VALDIVIESO, R. VALDIVIESO Y O. VALDIVIESO

, son la desviacin poblacional de la diferencia y la desviacin de la diferencia de la muestra piloto, respectivamente.

es la diferencia entre varianzas que se quiere detectar.

UPB - INVESTIGACIN & DESARROLLO 11: 148 176 (2011)

DETERMINACIN DEL TAMAO MUESTRAL

UPB - INVESTIGACIN & DESARROLLO 11: 148 176 (2011)

C. VALDIVIESO, R. VALDIVIESO Y O. VALDIVIESO

, es la diferencia de medias que se quiere detectar.

UPB - INVESTIGACIN & DESARROLLO 11: 148 176 (2011)

DETERMINACIN DEL TAMAO MUESTRAL

C. VALDIVIESO, R. VALDIVIESO Y O. VALDIVIESO

DETERMINACIN DEL TAMAO MUESTRAL

el tamao muestral para poblaciones infinitas.

Si por alguna razn no se quiere trabajar con la relacin

, se debe fijar el porcentaje de la

donde es la diferencia de varianzas que se quiere calcular en la estimacin y

UPB - INVESTIGACIN & DESARROLLO 11: 148 176 (2011)

C. VALDIVIESO, R. VALDIVIESO Y O. VALDIVIESO

Fuente: Berenson, Levine y Krehbiel [1]

Fuente: Kerlinger y Lee [37]

Figura 7 - Relacin entre los errores tipo I y II.

UPB - INVESTIGACIN & DESARROLLO 11: 148 176 (2011)

DETERMINACIN DEL TAMAO MUESTRAL

Figura 8 - Distribucin de los valores de una variable continua segn la hiptesis

UPB - INVESTIGACIN & DESARROLLO 11: 148 176 (2011)

C. VALDIVIESO, R. VALDIVIESO Y O. VALDIVIESO

es la diferencia de la varianza de la muestra con la de la hiptesis nula.

igualando para X y despejando n, (suponiendo que nc = ne) se tiene el tamao muestral:

UPB - INVESTIGACIN & DESARROLLO 11: 148 176 (2011)

DETERMINACIN DEL TAMAO MUESTRAL

que se quiere detectar, y

es la proporcin patrn poblacional aproximada o

3.4.3. Prueba de hiptesis del cociente de varianzas poblacionales

es la diferencia de varianzas que se quiere detectar en la prueba.

es el efecto del tratamiento i;

UPB - INVESTIGACIN & DESARROLLO 11: 148 176 (2011)

, es el componente del error aleatorio.

C. VALDIVIESO, R. VALDIVIESO Y O. VALDIVIESO

Es posible demostrar que si H1 es verdadera (

UPB - INVESTIGACIN & DESARROLLO 11: 148 176 (2011)