You are on page 1of 75

INSTITUTO TECNOLGICO

SUPERIOR DE MISANTLA
MAESTRA EN INGENIERA INDUSTRIAL

ESTADISTICA

CATEDRTICO:

DR. GREGORIO FERNANDEZ LAMBERT


PRESENTACIN

El presente documento se integra como apoyo


didctico a la materia de Estadstica en la Maestra en
Ingeniera Industrial del Instituto Tecnolgico
Superior de Misantla.

Este material de apoyo pretende complementar las


notas de apoyo de los estudiantes, quienes deben
cuidar siempre recoger la informacin suficiente que
deje claro la aplicacin de la estadstica en el quehacer
profesional; en la industria de bienes, como en la
industria de servicios.

Los temas aqu documentados integran el


contenido temtico de la asignatura, y son fortalecidos
con una serie de ejercicios que persiguen demostrar el
uso adecuado de la estadstica.

Es importante que el estudiante complemente su


conocimiento a partir de la generacin de casos
particulares que pudieran profundizar en la aplicacin
de esta materia.

1
**** CONCEPTOS BASICOS DE ESTADISTICA ****

ESTADISTICA: Se le considera como una ciencia y como un arte.


Una ciencia, por que esta basada en el mtodo cientfico; y un arte por que
depende de las habilidades del experto para emplearla.

ESTADISTICA DESCRIPTIVA: Es la interpretacin de la informacin


mediante grficos, tablas, etc. Y se utiliza generalmente cuando se trabaja con
mucha informacin.

ESTADISTICA INFERENCIAL: Se utiliza para manejar la informacin, se


apoya en diferentes mtodos y tcnicas para hacer conclusiones y poder tomar
decisiones.

DISTRIBUCION DE PROBABILIDAD O FUNCION DE DENSIDAD:


Es una curva que se ajusta a una distribucin de frecuencia. Es decir se le
considera tambin, como la distribucin de probabilidad que se refiere a la
forma como se distribuye una variable aleatoria.

DISTRIBUCION DE FRECUENCIA: Son los valores que puede adoptar


una variable aleatoria.

ALEATORIDAD: Todos los elementos tienen la misma posibilidad de ser


seleccionados.

POBLACIN: es un conjunto de elementos que tienen caractersticas


iguales.

MUESTRA: es una parte representativa de una poblacin.

MUESTRA ALEATORIA: Es aquella en que a cada uno de los miembros de


la poblacin se le da igual oportunidad de ser escogido para la muestra.

2
**** CARACTERSTICAS DE LA MUESTRA: ****

CONFIABLE: la muestra debe pertenecer al mismo grupo de elementos.

SUFICIENTE: la muestra debe ser representativa.

ALEATORIA: todos los elementos de la muestra tienen la misma


probabilidad de ser seleccionados.

PARMETRO: se considera como la medida numrica de una muestra.

ESTADSTICO: una medida numrica de una muestra, llamado estadstico


muestral.

ESTIMADOR: es un valor, un dato que nos lleva a un resultado.

**** CARACTERSTICAS DE LOS ESTIMADORES: ****

INSESGADO: si su valor esperado es igual al parmetro de la poblacin.

EFICIENTE: si tiene una varianza relativamente pequea.

CONSISTENTE: si su probabilidad de acercarse al parmetro que estima, se


incrementa al crecer el tamao de la muestra.

SUFICIENTE: si contiene toda la informacin acerca del parmetro que se


estima.

MUESTREO: forma sistemtica para la recoleccin de informacin.

DISTRIBUCIN MUESTRAL: todos los posibles valores que la variable


puede adoptar, en un determinado tamao de muestra.

DESVIACIN ESTNDAR: es la desviacin promedio de los valores hacia


su propia media.

3
ERROR TIPO 1 ( ): es la probabilidad de rechazar una hiptesis nula
verdadera.

ERROR TIPO 2 ( ): es la probabilidad de acepar una hiptesis nula


falsa.

MEDIA MUESTRALX: Representa el valor promedio de todas las


observaciones en la muestra.

MEDIA : Es el calculo del valor promedio de todas las observaciones en


una poblacin se denota por la letra griega (mu).

DESVIACION ESTANDAR : Se define como la raz cuadrada positiva


de la varianza y se denota por medio donde:

=
2

DESVIACION ESTANDAR s: Es la raz cuadrada de su varianza.


2
VARIANZA POBLACIONAL : Es la cantidad que mide la dispersin
de los valores que recorre una variable aleatoria.

VARIANZA MUESTRAL S2: Representa el promedio de las desviaciones


observadas en una muestra aleatoria, elevadas al cuadrado a partir de la media.

**** CARACTERISTICAS IMPORTANTES DE CUALQUIER


DISTRIBUCION NORMAL****

1 Desviacin estndar = 68 %
2 Desviacin estndar 2 = 95 %
3 Desviacin estndar 3 = 99 %

4
I: DISTRIBUCIONES

DISTRIBUCIONES CONTINUAS

Una variable continua, debido a que los resultados incluyen valores


enteros y no enteros, no se puede manejar en forma adecuada mediante una
distribucin discreta.

A continuacin se comentaran dos distribuciones continuas


probabilsticas: la distribucin normal y la distribucin exponencial.

DISTRIBUCION NORMAL.

La distribucin normal de probabilidad es una distribucin continua de


probabilidad que es, simtrica.Con frecuencia se describe a la curva de
probabilidad que representa a la distribucin normal como una campana, tal
como se muestra en la curva de probabilidad:

f(x)

Las distribuciones normales son muy importantes en la estadstica


terica y aplicada, por varias razones. Una es que suelen coincidir muy
cercanamente con las distribuciones de frecuencia de muchas mediciones
naturales y fsicas. Otra razn es que se pueden utilizar para aproximar
probabilidades binomiales cuando n es grande, pero lo ms importante es que
las distribuciones de medias maestrales y proporciones de grandes muestras
tienen a distribuirse normalmente, lo que es de gran importancia en el
muestreo.

5
Las distribuciones normales presentan las siguientes caractersticas:

1. La curva normal tiene forma de campana.


2. Es simtrica con respecto a la media de la distribucin.
3. Se extiende de - a +.
4. Cada distribucin normal es completamente especificada por su media
y desviacin estndar, existe una distribucin normal diferente para
cada combinacin de media () y desviacin estndar ( )
5. El rea total bajo la curva normal se considera el 100%.
6. La probabilidad de que una variable aleatoria tenga un valor entre dos
puntos cualesquiera es igual al rea bajo la curva normal entre esos dos
puntos.
7. Dado que existe un numero ilimitado de valores en el intervalo de que -
a +, las probabilidades de las variables aleatorias siempre sern
para un intervalo de valores.
8. El rea bajo la curva entre la media y cualquier otro punto es una
funcin del numero de desviacin estndar que el punto dista de la
media.

Si una variable esta distribuida normalmente, entonces alrededor del


68% de sus valores quedaran dentro de una desviacin estndar de la media; el
95.5% caern dentro de dos desviaciones estndares de la media; y casi el
99.7% quedaran dentro de tres desviaciones estndares de la media. Adems,
esto es cierto independientemente de que la media y la desviacin estndar
presenten una determinada distribucin normal: esto se cumple en el caso de
todas las distribuciones normales.

FORMULA DE LA DISTRIBUCIN NORMAL.


]2]
f(x) = 1 e [(1/2)][(x-)/
2

Para resumir el procedimiento que se efecta con la formula es posible


hacerlo de la siguiente manera:
Para convertir la diferencia real entre la media y algn otro valor de
distribucin a una diferencia relativa, expresando dicha diferencia en el
nmero de desviaciones de la media, se utiliza la siguiente formula:

6
Z=x-

DONDE:
Z = No. de desviaciones estndar a partir de la media.
x = Valores de inters.
= Media de una distribucin normal.
= Desviacin estndar.
Cabe mencionar que con el uso de esta formula se usan tablas donde se
muestra el rea o porcentaje bajo la curva que es el valor de Z, dicha rea o
porcentaje viene dado desde - a +.

NOTA: en esta ocasin dentro de este trabajo no se encuentran las


tablas de donde dicho valor de Z es obtenido.

7
FUNCION DE DENSIDAD

REPRESENTACIN GRFICA DE ESTA FUNCIN DE DENSIDAD

La distribucin normal queda definida por dos parmetros, su media y


su desviacin tpica y la representamos as :

8
EJEMPLOS PARA CALCULO DE Z

1.- P ( 0 < Z < Z0 ) = 0.3849

0.3849 Z = 1.2

Z0
Z
0

INTERPRETACION: Podemos observar que la distancia que se aleja la


variable de su media es de 1.2 desviaciones estndar.

2.- P ( Z0 < Z < 0 ) = 0.2518


Z = 0.5-0.2518=0.2482
Z = -0.67

Z0 Z

INTERPRETACION: La probabilidad de que la variable se aleje por debajo


de su media es de 0.67.

9
DISTRIBUCIN EXPONENCIAL

Esta distribucin comprende probabilidades a cerca de la longitud de


tiempo o distancia entre ocurrencias con respecto a un intervalo continuo.
Se utiliza para representar o modelar el tiempo entre fallos o equipo elctrico,
el tiempo entre llegadas de clientes a un supermercado, el tiempo entre
llamadas para servicio etc.

Se expresan en trminos del tiempo o distancia hasta que un evento u


ocurrencia no tiene lugar.

FORMULA DE LA DISTRIBUCIN EXPONENCIAL

P (T > t) = e- t
P (T< t) = 1- e- t

EJEMPLO:

En promedio, cada dos das llega un barco a determinado muelle. Cul


es la probabilidad de que, despus de la salida e un barco, pasen cuatro das
antes de la llegada del siguiente?

Promedio por dos das = 10


Promedio por da = 0.5
= el promedio de periodo de cuatro das = (4) (0.5) = 20

P (T > 4) = e- t = e -2.0 = 0.13534

10
DISTRIBUCIONES DISCONTINUAS.

Las distribuciones probabilsticas discontinuas comprenden variables


aleatorias para el conteo de datos, como el nmero de acaecimientos por
muestra o la cantidad de ocurrencias por unidad con respecto a un intervalo de
tiempo, rea o distancia. A continuacin se mencionarn algunas de las
distribuciones discontinuas, como son, la Binomial, la de Poisson e
Hipergeomtrica.

DISTRIBUCION BINOMIAL

El termino binomial se utiliza para designar situaciones en las que los


resultados de una variable aleatoria se puede agrupar en dos clases o
categoras. Las categoras deben ser mutuamente excluyentes, de manera que
es evidente a que clase pertenece una observacin en particular, y las clases
deben ser colectivamente exhaustivas, por lo que no es posible obtener ningn
otro resultado.

Para utilizar la distribucin binomial es necesario satisfacer ciertos


supuestos, los cuales de dan a conocer a continuacin:

1. Existen n observaciones o ensayos idnticos.


2. Cada ensayo tiene dos posibles resultados, uno denominado xito y el
otro fracaso.
3. Las probabilidades de xito p y de fracaso 1 p se mantienen
constantes para todos los ensayos.
4. Los resultados de los ensayos son independientes entre s.

Hay muchos ejemplos de variables aleatorias que se pueden clasificar


como binomiales: respuesta a un examen de verdadero-falso, respuestas
afirmativas o negativas a un cuestionario, productos manufacturados
clasificados como defectuosos o satisfactorios, entre otros.

Existen dos mtodos para obtener las probabilidades de una variable


aleatoria que estn distribuidas binomialmente. Uno de ellos consiste en
utilizar la formula binomial, y el otro en consultar una tabla de probabilidades
binomiales. En esta ocasin solo utilizaremos la formula para su calculo.

11
FORMULA DE LA DISTRIBUCIN BINOMIAL

b(x; n, p) = nCxpxqn-1

b(x; n, p)= n! p x . qn-x


x!(n-x)!

DONDE:
n = No. total de pruebas.
x = No. total de xitos observados.
p = Probabilidad del xito.
q = Probabilidad del fracaso.

EJEMPLO:

La probabilidad de que en un prospecto de ventas elegido al azar


realice una compra es de 0.20. Si un vendedor visita a seis prospectos, la
probabilidad de que realice exactamente cuatro ventas se determina de la
siguiente manera:

b(x; n, p)= n! p x . qn-x


x!(n-x)!

b(x; n, p) = nCxpxqn-1

b(x=4 ;n=6,p=0.20)= 6C4(0.20)4(0.80)2

= 6! (0.20)4 (0.80)2
4!(2)!

= 6x5x4x3x2 (0.0016)(0.64) = 0.01536 0.015


(4x3x2) (2)

12
DISTRIBUCION HIPERGEOMETRICA

La forma mas simple de percatarse de la diferencia entre la distribucin


binomial y la distribucin hipergeometrica, es conociendo la manera como se
lleva a cabo el muestreo. Los tipos de aplicaciones de la distribucin
hipergeometrica son muy similares a aquellos de la binomial. El inters se
centra en el clculo de las probabilidades para el nmero de observaciones que
caen en cada categora particular. Solo que en el caso de la binomial, se
requiere la independencia entre intentos. Como resultado, si la distribucin
binomial se aplica en muestreo de un lote de artculos (paquete de cartas, una
cantidad de artculos de una lnea de produccin), el muestreo debe realizarse
con reemplazo de cada artculo despus de observarse. Por el otro lado, la
distribucin hipergeometrica no requiere independencia y se basa en el
muestreo llevado a cabo sin reemplazo.

Las aplicaciones de la distribucin hipergeometrica se encuentran en


muchas reas, con un uso considerable en el muestreo de aceptacin, las
pruebas electrnicas y el aseguramiento de la calidad. Es obvio que en muchos
de estos campos la prueba se realiza a expensas de la pieza que se esta
probando. sta se destruye y por lo tanto no puede reemplazarse en la
muestra. Entonces, es necesario el muestreo sin reemplazo.

Un experimento hipergeomtrico es aquel que posee las dos


propiedades siguientes:

1. Una muestra aleatoria de tamao n se selecciona sin reemplazo de un


total de N resultados o artculos totales.
2. k resultados o artculos del total N pueden clasificarse como xitos y N-
k como fracasos.

El numero X de xitos en un experimento hipergeometrico recibe el


nombre de variable aleatoria hipergeometrica. De acuerdo con esto, la
distribucin de probabilidad de la variable hipergeometrica se llama
distribucin hipergeometrica y sus valores son representados por h(x; N, n, k),
dado que depende del numero de xitos k en el conjunto N del cual se
seleccionan n resultados o artculos.

13
FORMULA DE LA DISTRIBUCIN HIPERGEOMETRICA

K N-K
x n-x
h(x;N,n,k) =
N
n x = 0, 1, 2, , n

DONDE:
N = No. total de elementos del universo.
K = No. de xitos en el universo.
n = Tamao de la muestra.
x = No. de xitos que ocurren en la muestra.

EJEMPLO:

De seis empleados, tres han estado con la compaa durante 5 aos o


ms, si se eligen cuatro empleados al azar de ese grupo la probabilidad de que
exactamente dos de ellos tengan una antigedad de cinco aos o mas es:

6 3 3 3 3 3! 3!


P X 2 6, T 3, n 4
N
4
6
2 2 2 2 2!1! 2!1! (3)(3) 0.60
6 6! 15

4 4 4!2!

14
DISTRIBUCION DE POISSON
Es aquella probabilidad del nmero de acontecimientos con respecto a
un campo o intervalo continuo o el nmero de resultados que ocurren en un
intervalo de tiempo dado o en una regin especifica indicada.

Puede utilizarse la distribucin Poisson para determinar la probabilidad


de que ocurra un nmero designado de eventos, cuando estos ocurren en un
continuo de tiempo o espacio. A un proceso como este se le denomina proceso
Poisson; es similar al proceso Bernoulli excepto en que los eventos ocurren en
un continuo (por ejemplo, en un intervalo de tiempo) en vez de ocurrir en
ensayos u observaciones fijas y debe suponerse que los eventos son
independientes y que el proceso es estacionario.

Algunos de los ejemplos en las cuales podemos aplicar esta distribucin


es en: las llamadas telefnicas por minuto, cabezas de ganado por hectrea etc.

Solo se requiere un valor para determinar la probabilidad de que ocurra


un nmero designado de eventos en un proceso de Poisson: el nmero
promedio a largo plazo de eventos para el tiempo o dimensin especifico de
inters. Por lo general esta media se representa mediante (la letra griega
lambda) o, es posible mediante .

FORMULA DE LA DISTRIBUCIN DE POISSON


- x
P(X)= e ()
X!

DONDE:
= Promedio de xitos que ocurren en el intervalo de tiempo
= t = donde:
= Razn media por unidad
t = Numero de unidades del espacio

15
EJEMPLO:

Un departamento de reparacin de maquinaria recibe en promedio de


cinco solicitudes de servicio por hora. La probabilidad de que se reciban
exactamente tres solicitudes en una hora seleccionada al azar es;

(5)3 5 (125)(0.00674)
P( X 3 / 5.0) 0.1404
3! 6

En forma alternativa, puede utilizarse una tabla de probabilidades


Poisson.

16
**** PRUEBA CHI-CUADRADA PARA LA BONDAD DEL
AJUSTE ****
Se utiliza cuando se desee conocer la variacin en las muestras con
respecto a otra, evala a la distribucin.
La importancia de la distribucin ji-cuadrada es cuando se desea hacer una
inferencia con respecto a la varianza 2 de la poblacin basada en una
muestra aleatoria x1, x2,xn tomada de una poblacin.

A lo largo de este curso nos ocupamos de la prueba de hiptesis


estadsticas acerca de parmetros de una poblacin como y P. Ahora se
considera una prueba para determinar si una poblacin tiene una distribucin
terica especfica. La prueba se basa en qu tan buen ajuste se tiene entre la
frecuencia de ocurrencia de las observaciones en una muestra observada y las
frecuencias esperadas que se obtienen a partir de la distribucin hipottica.

A diferencia de la distribucin normal y la t-student, la distribucin


Ji- cuadrada no es simtrica, tampoco o es negativa.

FUNCIN DE LA DISTRIBUCIN JI - CUADRADA

f(x)
X2 n - 1

X2 n - 1

NOTA.- Se lee de derecha a izquierda

17
EJERCICIO: PARA CALCULO CHI CUADRADA

1.- P ( X2 > X20 ) = 0.05 ; d.f. = 10

X2 0.05 d.f = 10

= 18.307

2.- P ( X2 < X2 ) = 0.05 ; d.f = 10

X2 0.95,10 = 3.94

18
**** DISTRIBUCIN DE t STUDENT ****

Si x es la media de una muestra aleatoria de tamao n tomada de una


poblacin normal con media y varianza 2, entonces:

t= x-
S/ n

A medida que los grados de libertad se incrementan la varianza de t se


aproxima a 1.00 que es la varianza.

FUNCIN DE LA DISTRIBUCIN DE T STUDENT

Distribucin t

/2 /2

La distribucin t tiene madia cero, pero su varianza depende del


parmetro V, llamado NUMERO DE GRADO DE LIBERTAD. Se puede
demostrar que la distribucin t con v grados de libertad se aproxima a la
distribucin normal tipificada cuando V .

La distribucin normal tipificada nos da una distribucin t para


muestras de tamao 30 o ms.

19
EJERCICIO: PARA CLCULO t student t

Pb 1.-

P ( t > t0 ) = 0.95 g .l = 6

= 0.05
95%

5%

T0.05,6 = - 1.943

Pb 2.-

P ( t < t0 ) = 0.95 g .l = 4

= 0.05

95%

5%

T0.05, 4 = 2.132

20
**** DISTRIBUCIN FISHER F ****

La distribucin f se utiliza para comparar las varianzas de dos


poblaciones.

Definicin de la distribucin f : la distribucin f es definida como


el radio de dos distribuciones ji-cuadrada que son independientes, cada una de
las cuales es dividida por sus propios grados de libertad.

Una variable aleatoria f con v1 y v2 grados de libertad se define como :

X 2v1
F (v1 v2) = X 2v
2

v = grados de libertad del numerador.


v = grados de libertad del denominador

CARACTERISTICAS Y GRAFICA DE LA DISTRIBUCION


F.

La distribucin F no es asimtrica, su forma es parecida a la


distribucin ji-cuadrada.

F ,v1 ,v2


1-

21
EJERCICIO: PARA CALCULO FISHER F

Pb 1.-
P ( F > F0 )= 0.10
V1 = 5
V2 = 7

0.10
F

F0.10,5,7 = 2.88

F0 = 0.10

Pb 2.-

P ( F < F0 )= 0.10
V1 = 5
V2 = 7

F0.10,5,7 = 1 = 1
F0.10, 5,7 3.37
F0 = 0.90

F0.10,5,7 = 0.297

22
**** TIPOS DE MUESTREO****

VENTAJAS DEL MTODO DE MUESTREO:

COSTO REDUCIDO: Si los datos se obtienen nicamente de


una pequea fraccin de del total los gatos son menores que los
que se realizaran si se llevara a cabo un censo completo. En
poblaciones muy grandes se pueden obtener resultados lo
suficientemente exactos cuando se analizan muestras que
representa solo una pequea fraccin de la poblacin.

MAYOR RAPIDEZ: Por la misma razn, los datos pueden ser


recolectados y resumidos mas rpidamente con una muestra que
con una enumeracin completa. Esta es una consideracin vital
cuando se necesita la informacin con urgencia.

MS POSIBILIDADES: las encuestas basadas en el muestreo


tienen ms posibilidades y flexibilidad respecto a la informacin
que puede obtenerse. Por otra parte, se desea una informacin
exacta de muchas subdivisiones de la poblacin, el tamao de la
muestra requerida es en ocasiones tan grande que la mejor opcin
es la enumeracin completa.

MAYOR EXACTITUD: debido a que al reducir el volumen de


trabajo se puede emplear personal mas capacitado y someterlo a n
entrenamiento intensivo y debido tambin a que en estas
condiciones ser factible la supervisin cuidadosa del trabajo de
campo y del procesamiento de los resultados, una muestra puede
producir resultados mas exactos que la numeracin completa.

23
MUESTREO IRRESTRICTO ALEATORIO.

DEFINICION: Si un tamao de muestra n es seleccionada de una


poblacin de tamao N de tal manera que cada muestra posible de tamao
n tiene la misma probabilidad de ser seleccionada, el procedimiento de
muestreo se denomina muestreo irrestricto aleatorio. A la muestra as
obtenida se le llama muestra irrestricta aleatoria.

El muestreo irrestricto aleatorio forma la base de la mayora de los


diseos de muestreo, y forma la base de la mayora de las encuestas cientficas
realizadas en la prctica.

COMO SELECCIONAR UNA MUESTRA IRRESTRICTA


ALEATORIA:

Una muestra irrestricta aleatoria puede ser seleccionada usando la tabla


de nmeros aleatorios. Una tabla de nmeros aleatorios es un conjunto de
enteros generado de modo que, comnmente, la tabla contendr todos los diez
nmeros (1,2,,9) en proporciones aproximadas iguales, sin tendencias en el
patrn en que se generaron los dgitos. Por lo tanto, si un nmero es
seleccionadote un punto aleatorio en la tabla, es igualmente probable que sea
cualquiera de los dgitos entre 0 y el 9.

24
EJEMPLO #1: Considrese el siguiente problema. Un auditor federal va a
examinar los registros contables del hospital de una ciudad. Los registros del
hospital, obtenidos de una computadora, muestran un determinado total de
cuentas por cobrar, el auditor debe verificar este total. Si existen 10,000
cuentas abiertas en el hospital, el auditor no tiene el tiempo suficiente para
examinar el registro de cada paciente ni para obtener una cifra total de cuentas
por cobrar. Por lo tanto el auditor debe elegir un algn esquema de muestreo
para obtener una muestra representativa de los registros de los pacientes.
Despus de examinar las cuentas de los pacientes en la muestra, entonces el
auditor puede estimar el total de cuentas por cobrar de todo el hospital. Si la
cifra de la computadora cae dentro de un margen especificado por la
estimacin del auditor, la cifra de la computadora se acepta como vlida. De
otra manera, se debe examinar ms registros del hospital por posibles
discrepancias entre la cifra de la computadora y los datos de la muestra.

Supngase que todas las cuentas de los N = 10,000 pacientes son


registradas en tarjetas de computadora y un tamao de muestra n = 50 ser
seleccionado. La muestra es llamada muestra irrestricta aleatoria, si cada
muestra posible de n = 50 registros tiene la misma probabilidad de ser
seleccionada.
Utilizando la tabla de nmeros aleatorios que se muestra en el apndice
para dar solucin al problema.

En este caso utilizaremos la tercera columna de la tabla no tomando en


cuenta el primer dgito de cada nmero, donde el nmero 00,001 es la primera
cuenta y 0,000 la ultima de las cuentas registradas.

Los nmeros obtenidos se muestran en la siguiente tabla:


1536 8231 5828 7917 8720
5595 8235 2421 2797 9475
2527 2636 5597 5876 6990
6243 7529 7637 9888 0980
1837 1048 8834 3577 3974
1008 1821 4839 7958 3339
6420 2404 8086 0999 1662
5463 3362 9064 8845 3526
3661 6369 5669 4824 0492
3342 3787 4117 5605 4153
Despus de haber seleccionado los nmeros de las cuentas con la tabla
de nmeros aleatorios el investigador procede a realizar la revisin de las
cuentas seleccionadas aleatoria mente.

25
EJEMPLO #2:

Por simplicidad, supngase que existen N = 1000 registros de pacientes,


de los cuales ser seleccionada una muestra irrestricta aleatoria de n = 20.
Sabemos que una muestra irrestricta aleatoria ser obtenida si cada muestra
posible de n = 20 registros tiene la misma probabilidad de ser seleccionada.
Utilizando la tabla de nmeros aleatorios del apndice, determine cuales
registros van a ser incluidos en una muestra pequea de n = 20.

Solucin:

Podemos considerar que las cuentas de nmeros 001,002,, 999,000.


Esto es, tenemos 1000 nmeros de tres dgitos, donde 001 representan el
primer registro, 999 el registro del paciente 999 y 000 el milsimo.

Recurra a la tabla del apndice de nmeros aleatorios y utilice la


primera columna; si no tomamos en cuenta los dos ltimos dgitos de cada
nmero, vemos que el primer nmero formado de tres dgitos es el 104, el
segundo 223, el tercero es el 241, y as sucesivamente. Tomando una muestra
aleatoria de 20 dgitos, obtenemos los nmeros que se muestran en la tabla:

Tabla: registro de pacientes que sern incluidos en la muestra

104 779 289 510


223 995 635 023
241 963 094 010
421 895 103 521
375 854 071 070

Si los registros estn enumerados, solamente seleccionamos los


registros con los nmeros correspondientes, y estos registros representan una
muestra irrestricta aleatoria de n = 20 de N = 1000. Si las cuentas de los
pacientes no estn numeradas, podemos remitirnos a una lista de las cuentas y
numerar de la 1, a la 10, 23, 70, y as sucesivamente, hasta obtener los
nmeros deseados. Si un nmero aleatorio ocurre dos veces, se omite la
segunda ocurrencia y se selecciona otro nmero como su reemplazo.

26
MUESTREO SISTEMATICO.

DEFINICION: Una muestra obtenida al seleccionar aleatoria mente un


elemento de los primeros k elementos en el marco y despus cada k-simo
elementos se denomina muestra sistemtica de 1-en-k.

El muestreo sistemtico proporciona una opcin til para el muestreo


irrestricto aleatorio por las siguientes razones:

1. el muestreo sistemtico es mas fcil de llevar a cabo en el campo, y por


lo tanto, a diferencia de las muestras irrestrictas aleatorias, y las
muestras aleatorias estratificadas, est menos expuesto a los errores de
seleccin que cometen los investigadores.

2. El muestreo sistemtico puede proporcionar mayor informacin que la


que puede proporcionar el muestreo irrestricto aleatorio por unidad de
costo.

En general el muestreo sistemtico involucra la seleccin aleatoria de


un elemento de los primeros k elementos y posteriormente la seleccin de
cada k-simo elemento.

COMO SELECCIONAR UNA MUESTRA SISTEMTICA:

El muestreo sistemtico tiene diversos mtodos para calcular el tamao


de muestra. El investigador puede seleccionar una muestra sistemtica de 1-
en-3, una de 1-en-5 o, en genera, una de 1-en-k.

Quiz se desee saber como seleccionar k en una situacin dada. Si el


tamao de la poblacin N es conocido, podemos determinar un tamao de
muestra n aproximada para la encuesta y luego seleccionar k para obtener el
tamao de muestra. En general, para una muestra sistemtica de n elementos
de una poblacin de tamao N, k debe ser menor o igual que N/n (esto es, k
N/n).
No podemos seleccionar exactamente a k cuando el tamao de la
poblacin es desconocido. Podemos determinar un tamao de muestra n
aproximada, pero debemos suponer el valor de k necesario para obtener un
tamao de muestra n. Si se selecciona un valor de k muy grande, el tamao de
muestra n requerido no se obtendr usando una muestra sistemtica de 1-en-k
de la poblacin.

27
EJEMPLO #1:

Un investigador en medicina est interesado en obtener informacin


acerca del nmero promedio de veces en que 1,000 especialistas recetaron un
cierto medicamento en el ao anterior (N = 1,000). Y deseamos emplear una
muestra de n = 200 especialistas, de acuerdo a lo anterior se tiene que:
N/n=k
1,000 / 200 = 5 por lo tanto k = 5

La muestra sistemtica es de 1-en-5, de la cual supngase que aleatoria


mente se obtuvo de los 5 primeros al nmero 3 y posteriormente se fueron
obteniendo los k-simos nmeros correspondientes como se muestra en la
siguiente tabla de referencia:
ESPECIALISTA ESPECIALISTA
MUESTRADO:
1
2
3 3
4
5

6
7
8 8
9
10
. .
. .
. .
996
997
998 998
999
1000

Como podemos observar se tomo como punto de partida al nmero 3 y


despus se tomaron los k- simos especialistas de la lista es decir; 3 + 5 = 8
por lo tanto k = 8 y as sucesivamente hasta llegar a n = 200, y el ultimo
especialista muestreado es el 998 de N = 1,000.

28
MUESTREO ESTRATIF ICADO.

DEFINICION: Una muestra aleatoria estratificada es la obtenida mediante


la separacin de los elementos de la poblacin e grupos que no presenten
traslapes, llamadas estratos, y la seleccin posterior de una muestra irrestricta
aleatoria simple de cada estrato.

Los motivos principales para utilizar el muestreo estratificado aleatorio


en lugar de muestreo irrestricto aleatorio son los siguientes:

1. La estatificacin puede producir un limite mas pequeo para el error de


estimacin que el que se generara por una muestra irrestricta aleatoria
del mismo tamao. Este resultado es particularmente cierto si las
mediciones dentro de los estratos son homogneas.

2. El costo por observacin en la encuesta puede ser reducido mediante la


estratificacin de los elementos de la poblacin en grupos convenientes.

3. Se pueden obtener estimaciones de parmetros poblacionales para


subgrupos de la poblacin. Los subgrupos deben ser entonces estratos
identificables.

Estos tres principios para la estratificacin deben tenerse presentes


cuando se esta planeando estratificar o no una poblacin o decidiendo
como definir la estratificacin.

29
COMO SELECCIONAR UNA MUESTRA ALEATORIA
ESTRATIFICADA:

El primer paso en la seleccin de una muestra aleatoria estratificada es


especificar claramente los estratos; as cada unidad muestral se ubica en el
estrato apropiado.

Despus que las unidades de muestreo han sido divididas en estratos,


seleccionamos una muestra irrestricta aleatoria de cada estrato, esto se hace
utilizando la tabla de nmeros aleatorios.

MUESTREO EN DOS ETAPAS.

Supongamos que cada unidad de la poblacin se puede dividir en cierto


nmero de unidades ms pequeas o subdivisiones.

Una prctica acostumbrada consiste en seleccionar u medir una muestra


de subdivisiones de alguna unidad elegida. Esta tcnica tambin de llama
submuestreo, dado que la unidad no se mide completamente, sino que a su
ves es objeto de un muestreo. En le muestreo en dos etapas la muestra se
obtiene en dos pasos:

Lo primero que se hace es seleccionar una muestra de unidades, que se


denominan unidades primarias, y despus se selecciona una muestra de
unidades de la segunda etapa o subdivisiones de cada una de las unidades
primarias elegidas

Cada unidad contiene el mismo nmero M de subdivisiones de las


cuales se elegir m al submuestrear cualquier unidad.

La principal ventaja del muestreo en dos etapas es una flexibilidad con


respecto al muestreo de una etapa. Ya tenemos la posibilidad de tomar un
valor ms pequeo que resulta ms eficiente. Lo que se trata es de alcanzar un
cierto equilibrio entre precisin estadstica y costo

30
MUESTREO POR CONGLOMERADOS.
DEFINICION: Una muestra por conglomerados es una muestra
aleatoria en la cual cada unidad de muestreo es una coleccin, o
conglomerados, de elementos.

El muestreo por conglomerados es un diseo efectivo para obtener una


cantidad especificada de informacin al costo mnimo bajo las siguientes
condiciones:

No se encuentra disponible o es muy costoso obtener un buen marco


que liste los elementos de la poblacin, mientras que se puede lograr
fcilmente un marco que liste los conglomerados.

El costo por obtener observaciones se incrementa con la distancia que


separa los elementos.

Los conglomerados deben ser tan homogneos (diferentes) entre ellos


como sea posible.

31
**** INTERVALOS DE CONFIANZA****

ESTIMACION DE INTERVALO: estimacin que incluye un


intervalo de valores posibles en el que se considera que esta comprendido un
parmetro de la poblacin.

INTERVALO DE CONFIANZA: Es el que proporciona un intervalo


de valores, centrados en el valor del estadstico de la muestra, en el cual
supuestamente se ubica el parmetro de la poblacin, con riesgo de error
conocido.

A continuacin se presenta la forma en como se establece el intervalo


de confianza, tomando el valor medio de la muestra como punto medio.

El intervalo de confianza esta centrado respecto al valor medio de la


muestra.

La estimacin del intervalo de la media poblacional se basa en el


supuesto de que la distribucin de muestreo de los valores medios de la
muestra es normal. En el caso de tamaos de muestras considerables, esto no
constituye una gran dificultad, puesto que se aplica el teorema de lmite
central. Sin embargo, para muestras de 30 observaciones o menos, es
importante saber que la poblacin que se muestra esta distribuida
normalmente, o por lo menos, casi normalmente. De otra manera, no pueden
utilizarse estas tcnicas.

A continuacin se muestran los factores que influyen en la amplitud de


un intervalo de confianza.

1.- coeficiente de confianza con tamao de muestra igual

Efecto del Confianza. Z Amplitud del intervalo.


coeficiente 68% 1.00
95% 1.96
de confianza
99%
2.58

En lo anterior es posible observar que el aumentar el grado de confianza


da como resultado una ampliacin del intervalo.

32
2.- Tamao de muestra:

Efecto del Tamao de Amplitud de intervalo


tamao de muestra.
muestra 8
16
32
64

Lo anterior indica que un aumento en el tamao de la muestra provocar


que se reduzca el intervalo.

3.- Dispersin de la poblacin.

Efecto de la x Amplitud de intervalo


dispersin de 5
la poblacin 10
15
20

Como se ilustra en al figura anterior como la dispersin puede alterar el


intervalo a mayor dispersin mayor intervalo.

La estructura de un intervalo de confianza es la siguiente:


Limite suprior de riesgo
Amplitud
Intervalo de confianza

33
INTERVALOS DE CONFIANZA PARA LA DESVIACION

2 2
X X 2 Z
2 n1 n2

Ejercicio:

Un productor de municiones esta investigando la velocidad de 2 tipos


de municiones para rifles. El productor asume que la velocidad esta distribuida
normalmente y que las desviaciones estndares para las municiones tipo 1 y
m m
tipo 2 son 1.10 y 1.5 respectivamente. Una muestra aleatoria de 10
seg seg
municiones tipo 1 y 20 municiones del tipo 2 se disparan en orden aleatorio
m m
las medias obtenidas son para el tipo 1,500 y del tipo 2 son 494 .
seg seg
Defina un intervalo de confianza para la diferencia entre medias e interpretelo.

Datos:
m
1.10
seg
m
1.5
= .05

seg /2= .05


n1 10 /2= .05
n1 20 90%
m
X =500 1.64
seg -1.64
m
X 2 =494 .
seg
(1- )=90%

=10%

=5%
2

34
Procedimiento:

2 2
X X 2 Z
2 n1 n2

1.12 1.52
500 494 X 2 1.64
10 202

6 0.7949

5.2052< 1 2 z 6.7948

Definir una deferencia de medias ( 1 2 ) al 90%.


Interpretacin:
La evidencia nos demuestra con una confianza del 90%, que la media
de la velocidad de la municin tipo 1, excede a la del tipo 2, en un valor que
m
va desde 5.2052 hasta 6.7948 .
seg

Interpretacin:
Conclusin:
Accin:

35
INTERVALOS DE CONFIANZA (1- ) PARA CON
2 DESCONOCIDAS.

X t ,n 1
2
S
n 30
n

X Z ,
2 n
S
n 30

Ejercicio:
Un fabricante de plvora desarrollo una nueva formula que se probo en
8 granadas. Las velocidades iniciales resultantes en ft/seg fueron 3005, 2995,
2995, 2925, 3005, 2935, 2937, 2965,2905.
Apartir de esta informacin defina un intervalo de confianza para el
media real de las velocidades para granadas de este tipo, con un coeficiente de
confianza del 0.95. Considere el hecho de que las velocidades iniciales tienen
aproximadamente una distribucin normal.

Datos:
n1 8 /2=0.025
/2= 0.025

X =2959 95% 05
(1- )=95%
=5% -2.365 3.365

=2.5%
2
S = 39.09
Procedimiento:

_

X t ,n 1
S
2 , S ( x x) 2 S = 36.56
n 8
39.09
2959 2.365
8
2959 32.68.

2926.36<x<2991.68
Interpretacin: Mediante la evidencia se puede afirmar con una confianza
del 95% que las medias de las velocidades de las 8 granadas que se tomaron
de muestra se encuentran en el intervalo 2926.36-2991.68.
Conclusin: Accin:

36
INTERVALOS DE CONFIANZA PARA LA DIFERENCIA DE
MEDIAS CON VARIANZAS DESCONOCIDAS.

2 S22
X X , v S
n1 n2

2
S2 S2
v = 1 2 2
n1 n2

S S
1
2 2 2 2
2

n1 1 n2 1

Ejercicio:
Un proceso qumico se esta estudiando para incrementar la produccin
en litros de una sustancia llamada x, y, z. En la actualidad se utiliza un
compuesto A y se ha sido autorizado para ser utilizado en el proceso.
Se realiza durante un turno una prueba piloto en 8 pruebas utilizando el
compuesto A y en 8 pruebas el compuesto B. Los resultados en litros de
produccin son: promedio con el compuesto A 91.73 lts. Con una varianza de
3.89 lts 2 y del compuesto B, un promedio de 93.75 lts con una varianza de
4.02 lts 2.
Defina un intervalo de confianza 98% para la diferencia entre medias
asumiendo varianzas iguales.

FORMULA: DIFERENCIA ENTRE MEDIAS Y VARIANZAS


IGUALES:


x1 x2 t , n1 n2 2, S
1 1

2 n1 n2

S 2=
n1 1S12 n2 1S22
n1 n2 2

Procedimiento:

37
Datos:

S12 3.89lt 2
S22 4.02lt 2
/2= .01
n1 8 /2= .01
n1 8 98%

X =91.73 lt

X 2 =93.75 lt -1.64
2.624
(1- )=98%

=2%

=.01%
2

Aplicacin de la formula:

S2=
n1 1S12 n2 1S22
n1 n2 2

S2=
8 13.89 8 14.02
882

27.23 28.14
S2=
14

S2= 1.989


x1 x2 t , n1 n2 2, S
1 1

2 n1 n2
1 1
91.73 93.75 2.624 /(1.989) -2.02 2.61
8 8
-4.63< A B 0.59

Interpretacin:
Debido a los clculos realizados se toma la decisin con el actual
producto por que son iguales.
Conclusin: y Accin:

38
INTERVALOS DE CONFIANZA PARA UNA VARIANZA DE UNA
POBLACION NORMAL.

Se afirma de las rezas de un motor de un automvil producida por


una compaa, una varianza del dimetro no mayor que 2 diezmilsimas de
pulg., una muestra aleatoria de 10 partes revelo una varianza muestral de 3
diezmilsimas de pulg.
Pruebe si esta compaa tiene razn en lo que afirma usese un nivel de
significancia del 5%.

Formula:
n 1S 2 2
n 1S 2
x2 n 1 x2 n 1
2, 2,

Datos:
2 =0.0002
n1=10
n2=10 /2= 0.025
/2= 0.025
S 0.0003
1
2

(1- )=95% 95%

=5% 2.70 19.02



=0.025%
2 X = 13.5
13.5

Interpretacin:
Conclusin:
Accin:

39
**** PRUEBA DE HIPOTESIS ****

Una hiptesis estadstica es una afirmacin con respecto a alguna


caracterstica de inters, la esencia de probar una hiptesis, es decir, si la
afirmacin se encuentra apoya da por la evidencia experimental que se obtiene
a travs de una muestra aleatoria.

Antes de empezar un experimento el investigador selecciona dos


hiptesis: la hiptesis nula que se denota por H0 y la hiptesis alterna que se
denota por H1.

La hiptesis nula especifica valores hipotticos para uno o mas


parmetros de la poblacin, debe considerarse como verdadera a menos que
exista suficiente evidencia en su contra. Esta hiptesis puede ser: hiptesis
sencilla o simple e hiptesis compuesta.

La Hiptesis sencilla o simple es cuando se refiere aun solo valor en


especfico.

La hiptesis compuesta es cuando se refiere a mas de un valor en


general.

La hiptesis alterna afirma que el parmetro de la poblacin es un


valor diferente al de la hiptesis nula, esta hiptesis a su vez puede ser:
hiptesis direccional o unidireccional e hiptesis direccional o bilateral.

La hiptesis direccional o unilateral adems de afirmar que el parmetro


de la poblacin es diferente al hipottico, se especifica la direccin de esa
diferencia.

La hiptesis no direccional o bilateral es cuando H1 afirma que el


parmetro de la poblacin es diferente al hipottico.

Un anlisis estadstico de la lgica de la inferencia estadstica, revela


que la hiptesis nula nunca puede comprobarse, pero si podemos afirmar,
sin embargo, que no existen bases para rechazarla.

40
PRUEBA DE HIPOTESIS PARA MEDIAS CON VARIANZA
CONOCIDAS.
Ejercicio:
Una compaa ha desarrollado un hilo para caa de pescar, que segn
ellos tiene una media de fuerza al rompimiento de 8 Kg., con una
desviacin estndar poblacional de 0.5 Kg.
se toma una muestra de 50 hilos y se obtiene la media de fuerza de
ruptura de 7.8 Kg. Haga una prueba de hiptesis par verificar si la media
de la fuerza de ruptura es diferente a 8 Kg. Use un 0.1.

Datos:
8 Kg .
0.5 Kg .
n 50hilos

X 7.8 Kg
0.01
0.005
2
S2 0.0707
n

X
Z

Planteamiento y Solucin:

Planteamiento:
H0: =8
H0: El promedio de la resistencia al romper el hilo es igual a 8 Kg.
H1: 8
H1: El promedio de la resistencia del hilo al romperse del hilo.

41
Estadstico de prueba:

7.8 8
Z=
0.0707

Z=-2.828

/2= 0.005 /2= 0.005


Regin de rechazo Regin de rechazo
Regin de
Aceptacin

-2.575 2.575

Decisin:
Se rechaza H0.

Conclusin:
Los datos demuestran la suficiente evidencia par inducir que la
media de la fuerza de ruptura del hilo es diferente a 8 Kg., la probabilidad
de equivocarnos en esta afirmacin es del 1%.

Accin:

42
PRUEBA DE HIPOTESIS PARA MEDIAS CON VARIANZAS
DESCONOCIDAS.

Ejercicio:
Un foco fabricado por una compaa afirma que se tiene una duracin
promedio de vida del foco es menor a lo que dice la compaa.
El competidor toma una muestra aleatoria de 21 focos y demuestra que
el promedio de tiempo de vida es de 64.2 hrs., con una desviacin estndar de
3hrs.
Con un 0.01, Determine si existe evidencia suficiente para concluir
que la afirmacin de la fabrica es falsa.

Datos:
65hrs.
n 21

X 64.2hrs.
S 3hrs.
0.01
t0.01, 20 2.528

Formula: Aplicando la formula:



X 0 64.2 65
t t 1.2220
S 3
n 21

Estadstico de prueba:
Puesto que no se conoce la 2
de la poblacin y
adems n<30

43
= 0.01
Regin de rechazo Regin de
Aceptacin

99%
-2.528 -1.2220

Planteamiento:

H0: 65
H1: 65hrs.

Decisin:
Se acepta H0.

Conclusin:

La evidencia demuestra que el promedio de vida de los focos es de


65hrs. Con una confianza del 99%.

Accin:

44
PRUEBA DE HIPOTESIS PARA LA DIFERENCIA DE MEDIAS CON
VARIANZAS DESCONOCIDAS E IGUALES.

Ejercicio:
Un experimento se llevo a cabo para comparar la dureza de dos
materiales laminados. 12 pieza del material 1, fueron probados al igual que
las 10 piezas del material 2. En cada registro la dureza, mediante un cdigo
especial, teniendo como resultado lo siguiente:

n1=12 X1=85 S 1=4


n2=10 X2=81 S 2=5

Prueba de de hiptesis de que los 2 tipos de material, tienen la misma dureza


en contra de la alternativa que son diferentes. Use un =0.1 y asuma que las
poblaciones se distribuyen normalmente con varianzas iguales.

Datos:
n1=12 n2=10
X1=85 X2=81
S1=4 S2=5
=0.1

Planteamiento:

H0: 1= 2
H1: 1 2

El estadstico de prueba los constituyen la distribucin y las condiciones de


prueba.

45
Formula: Aplicando la formula:

t
( X 1 X 2 )d 0
t
(85 81) 0
S 2=
12 1(4)2 10 1(5)2
S 4.47 10 10 2
1 / n1 1 / n2 1 / 12 1 / 10

= 0.05 = 0.05
Regin de rechazo Regin de Regin de rechazo
Aceptacin

95%
-1.725 1.725

Decisin:
Se rechaza H0.

Conclusin:

La evidencia demuestra que la dureza de los materiales laminados son


diferentes. Con una confianza del 95%.

Accin:

46
POTENCIA DE UNA PRUEBA DE HIPTESIS

Hasta ahora se ha controlado y fijado el error tipo I ().

Las razones para controlar el error tipo I ms el error tipo II pudiramos


resumirlos en lo siguiente:

1.- El error tipo 1 es mucho mas grave que le error tipo II. Por esta razn se le
asigna el error tipo I una probabilidad muy baja.

El clculo de la probabilidad del error tipo II es complicado, y que este


depende del verdadero valor del parmetro as como tambin el tamao de la
muestra.

Ejemplo de los errores:

Suponga que se tiene la siguiente hiptesis:

H0: = 60

H1: = 65 (hiptesis muy simple no usual y solo lo usaremos para conocer el


error tipo I y el error tipo II)

Datos adicionales tipo de pruebe: cola superior


n = 100 = 20 = .05

Decisiones a tomar:

1.- se acepta que la media poblacional es 60.


2.- se acepta que la media poblacional es 65.

Solucin: (entendiendo el error tipo I).

Para explicar los errores es conveniente considerar en al escala original, no en


Z.

47
Estimacin de la regin de rechazo:

= .05

C = 63.29
= 60

Z .05 = 1.645


Punto critico (c) = 0 + 1.65 = 63.29
n

NOTA: la probabilidad de que x carga en la regin de rechazo (a la derecha de


c), cuando la media poblacional es realmente 60 es igual a 0.05 ().

ENTENDIENDO EL ERROR TIPO II:

NOTA: los posibles estados de naturaleza solo pueden ser 2; que para nuestra
ejemplo, sera:

1.- La media poblacional es 60 (H0).


2.- La media poblacional es 65 (H1).

CUANDO OCURRE EL ERROR TIPO II:

El error tipo II se da cuando el estadstico muestral X cae a la izquierda


de c, cuando realmente la media poblacional es 65, es decir, se capta una
hiptesis nula falsa

48
CALCULANDO EL ERROR TIPO II

PROBABILIDAD DEL ERROR TIPO I


= P (X > C \ = 0 )

PROBABILIDAD DEL ERROR TIPO II


= P (X < C \ = 1)

EL PODER DE UNA PRUEBA DE HIPOTESIS

Es la probabilidad de rechazar la hiptesis nula cuando la hiptesis nula


es falsa.

Poder = 1 -

Una prueba es poderosa si de una alta probabilidad de rechazar una


hiptesis nula falsa.

LA FUNCION DE PODER O CURVA DE PODER

Esto es conocido tambin como curva caracterstica de operacin.


Cuando se lleven a cabo pruebas de hiptesis, la probabilidad del error tipo I
es seleccionado por el analista. Hemos mencionado que depende del
verdadero parmetro poblacional y el tamao de muestra.

Existen curvas de operacin caractersticas para evaluar el valor de ,


las cuales constan de 2 ejes estos son:
y d,

En lo general las curvas OC envuelven 3 parmetros. Para el caso de


madias : , d, n. Dados 2 de estos parmetros 3 parmetros, el valor del
tercero puede ser determinado.

49
APLICACIONES DE LA CURVA OC

1.- Para n y d dados, encuentre :


Este caso sucede cuando el analista quiere conocer la sensibilidad de un
experimento que ya se realiza, o cuando el tamao de muestra se restringe por
razones econmicas o de tiempo.

2.- Para y d dados; encuentre n:


Este caso se presenta cuando el analista tiene la oportunidad de
seleccin el tamao de la muestra para ser desarrollado se experimento,
estudio o anlisis.

Ejercicio 1
La tasa en que se quema cierto combustible se especifica como 40 cm.,
se sabe que el valor de la varianza es 4. El analista especifica con un de
0.05 con un tamao de muestra de 25. La hiptesis que se probara es: H 0: =
40 cm./seg. y la alterna H1: 41 cm./seg.

Datos:
2
=4 H0: = 40 cm./seg.
= 0.05 H1: 41 cm./seg.
n = 25

d = [ - 0] = [40 - 41] = 1 = 0.05


2 2

De tablas:
d = 0.5 = 0.03
n = 25

50
PRUEBAS ADICIONALES DE X2

(PRUEBAS DE BONDAD DE AJUSTE)

Las pruebas de bondad de ajuste son practicadas a fin de evaluar si la


informacin proporcionada en el estudio obedece a un tipo de distribucin en
particular para este caso se estar siendo uso del estadstico X2 (ji - cuadrada)
en el que se estar midiendo la diferencia de los valores observados (valores
reales o datos reales) y los esperados (aquellos que se ajustan al tipo de
distribucin en la que se infieren se estn distribuyendo los valores reales
observados).

ESTADISTICO DE PRUEBA

X2 = k (0i Ei)2
i =1 Ei

TABLAS DE CONTINGENCIA
(DEPENDENCIA)
Un problema en el anlisis de datos se refiere a la independencia de
datos de mtodo de clasificacin de eventos observados. En este tema se
investigara la dependencia por contingencia entre 2 que puede contener varios
renglones y columnas. Los renglones corresponden a un mtodo de
clasificacin; las columnas al otro.

El tamao total de la muestra es n el total del numero de elementos en


la celda (i, j). Esto es la celda en el rengln i, columna j es 0ij. El total
para el rengln i es Ri y el total para la columna j es Cj.

51
TABLA PARA ANALIZAR SI LAS VARIABLES SON
DEPENDIENTES E INDEPENDIENTES
2da. 1er categora
Categora 1 2 3 . C TOTAL

1 011 012 013 . 01c R1

2 021 022 . 02c R2

. . . .
. . . . .
. . . .
. Rr
r 0r1 .
.
TOTAL C1 C2 Cc n

HIPOTESIS:

H0: Las dos variables de clasificacin son diferentes.


H1: Las dos variables de clasificacin no son independientes o son
dependientes.

ESTADISTICO DE PRUEBA

nr
X = ( 0ij Eij )2
2

i=1 j=1 Eij

GRADOS DE LIBERTAD

g.l = (r - 1) (c - 1)

52
Ejercicio.-

Se clasifican los defectos encontrados en los muebles producidos en un


carpintero, de acuerdo a lo siguiente:

1.- Tipo de defecto


2.- Turno de operacin

Se detectan 4 tipos de defectos y estos son registrados en cada turno.


Los defectos son: A, B, C, y D y la empresa trabaja 3 turnos. Ellos se resumen
en la siguiente tabla.

Pruebe la hiptesis de que el tipo de defecto es independiente del


tiempo de produccin utilice un de 0.05

TIPO DE DEFECTO
TURNO
A B C D TOTAL

1 16 21 45 13 94

2 26 31 34 5 96

3 33 17 49 20 119

TOTAL 74 69 128 38 309

H0= El tipo de defectos es independiente del turno.


H1= El tipo de defecto no es independiente del turno.

Eij = ri cj
nij

E1A = (Total de defectos) (Total de defectos del A en los 3 elementos)


(Total de defectos en los 3 turnos)

53
E1A= (94) (74) = 22.5 E3A= (119) (74) = 28.49
309 309
E1B= (94) (69) = 20.9 E3B= (119) (69) = 26.57
309 309
E1C= (94) (128) = 38.9 E3C= (119) (128) = 49.29
309 309
E1D= (94) (38) = 11.55 E 3D= (119) (38) = 14.63
309 309

E2A= (96) (79) = 22.99


309
E2B= (96) (69) = 21.43
309
E2C= (96) (128) = 39.76
309
E2D= (96) (38) = 11.80
309
ESTADISTICO:

X2 =19.17
X20.05, 6= 12.60

DECISIN:
Se rechaza H0

19.17

12.6

Interpretacin:
Conclusin:
Accin:

54
PRUEBA DE VARIAS PROPORCIONES BINOMIALES.

La prueba de homegenidad se puede extender para probar la hiptesis


de que k parmetros binomiales tienen el mismo valor. La hiptesis nula es:

H0: P1 = P2 = P3 = = PK ; en contra de:


H1: No todas las proporciones poblacionales, son iguales

Para realizar esta prueba, se observan muestreos de tamaos diferentes


o simplemente muestreos aleatorios independientes de tamao n1, n2,
n3,nk; de los k poblaciones y se arreglan los datos en una tabla (2)(k)

Muestras
1 2 k
xito X1 X2 XK
fracaso n1- x1 n2- x2 nk - xk

Las frecuencias de z esperadas, son calculadas como ya se explica


anteriormente y junto con las frecuencias observadas se sustituyen en el
estadstico x2 el cual tendr los siguientes grados de libertad. r = (2-1) (k-1).
V = k 1 g.l.

La regin de rechazo, ser: x2>x 2

55
EJERCICIOS DE APLICACIN

En un taller de produccin se realiza un estudio para determinar si la


proporcin de defectuosos producidos por los trabajadores en las misma en los
3 turnos con que normalmente labora la empresa. Los siguientes datos fueron
recolectados, para que con un alfa de 0.025 se determine si la proporcin de
defectuosos en la misma para los 3 turnos de produccin.

Turno de produccin
1 2 3 Totales.
Defectuosos 45 55 70 170
Aceptables 905 890 870 2665
Totales 950 945 940 2835

ESTADISTICO DE PRUEBA

n k
X = (0ij Eij)2
2

i=1 j=1 Eij

Regin de rechazo: x 2 ,(k-2) = x20.025,2 = 7.38

H0: P1 = P2 = P3 = = PK; en contra de:


H1: No todas las proporciones son iguales.

R. A
0.025

6.48 X2 =7.38

56
(45 57) 2 (55 57) 2 (70 56) 2 (905 893) 2 (890 888) (870 884) 2
X 02.025, 2
57 57 56 893 888 884
X 02.025, 2 6.48

Decisin:
Se acepta H0.

Conclusin:
La proporcin de productos defectuosos es la misma en los 3 turnos.

Accin:

57
ESTADISTICA NO PARAMETRICA

LA PRUEBA DE SIGNOS

Anteriormente ya se estudiaron mtodos estadsticos para comparar la


media de dos poblaciones. Una de la pruebas us el estadstico t, que requiere
la suposicin que las poblaciones se distribuyen normalmente con varianzas
iguales.

En muchas situaciones, una o dos de estas suposiciones no se cumplen,


por lo que una buena alternativa es la prueba de los signos.

La prueba de signos es til para probar como es la media de una


poblacin x con respecto a la media de una poblacin y, a partir de una
muestra apareada (pares de datos que muestran cierta dependencia).

Los datos consisten de n observaciones de una muestra aleatoria


apareada (x1, y1), (x2, y2), (xn, yn). Debe de existir alguna base natural para
formar los pares de observaciones, de otra manera, las x y las y son
independientes y se usan otras pruebas para analizarlos.

CLASIFICACION: Dentro de cada por (xi,yi) se hace una comparacin, y


el par es clasificado de la siguiente forma:

a) -, si xi < yi
b) +, si xi > yi
c) 0, si xi = yi

HIPOTESIS:

1) PRUEBA DE DOS COLAS: H0: 1 = 2 , H1: 1 2


2) PRUEBA DE UNA COLA (SUPERIOR): H0: 1 = 2 , H1: 1 > 2
3) PRUEBA DE UNA COLA (INFERIOR): H0: 1 = 2 , H1: 1 < 2

58
ESTADISTICO DE PRUEBA:
Sea:

R+ = No. De signos positivos.


R- = No. De signos negativos.
R = El valor mnimo entre (R+, R-)
n = No. Total de positivos y negativos. Descarte cuando x i = yi. (#R++ #R-)
= Nivel de significancia deseada.

REGION CRTICA:

Use la tabla 10 pag. 662 del libro Montgomery. Especifique los valores
de n y alfa ( ) y encuentre el valor critico (R*). La tabla 10 se aplica al
caso de dos colas. El nivel de significancia para la prueba de una cola es la
mitad del valor que aparece en la tabla 10.

EJERCICIOS DE APLICACIN:

1.- se esta probando dos tipos de gasolina. Las dos gasolinas se prueban en 12
coches. Primero se le pone la gasolina tipo 1 a los 12 carros, se corren, se les
acaba y entonces se les pone a los mismos autos la gasolina tipo 2,
volvindose a correr con el mismo chofer.
Los Km/lt. se presentan en la siguiente tabla. Existe diferencia en el Km/lt
de los 2 tipos de gasolina? Para la prueba use un alfa de 0.05

Automvil Gasolina 1 Gasolina 2 Signo


1 17.6 16.8 +
2 19.4 20.0 -
3 19.5 18.2 +
4 17.1 16.4 +
5 15.3 16.0 -
6 15.9 15.4 +
7 16.3 16.5 -
8 18.4 18.0 +
9 17.3 16.4 +
10 19.1 20.1 -
11 17.8 16.7 +
12 18.2 17.9 +

59
HIPOTESIS:
H0: 1 = 2
H1: 1 2

R+ = 8 n = 12
R- = 4
R =4 R * =2
= .05

DECISION DE PRUEBA: Rechazar H0: si R< R*

4 2, no se rechaza H0.
R

CONCLUSION: No existe evidencia para decir que una gasolina aporta


mayor Km/lt que la otra. Todo esto con un marco de confianza del 95%

Accin:

60
61
PRUEBAS DE WILCOXON DE SUMA DE RANGOS PARA DOS
MUESTRAS INDEPENDIENTES.

Esta prueba se usa para verificar la igualdad de dos medias


poblacionales. Esta prueba es una excelente alternativa para la prueba t de dos
medias cuando la suposicin de que las poblaciones siguen la distribucin
normal no se cumple. Esta prueba se enuncia de la siguiente forma:

Se tienen dos muestras independientes que no tienen una distribucin


normal y que pueden diferir solo en sus medias 1 y 2. en este tipo de prueba
se desea:

H0: 1 = 2
H1: 1 2

PROCEDIMIENTO:

1. Se toma una muestra aleatoria n1 de la poblacin 1.


2. Se toma una muestra aleatoria n2 de la poblacin 2.
3. Ordene todos los n1 ms n2 observaciones en orden ascendente y
asigneles rangos.

NOTAS:

1. Asuma que n1 es menor o igual que n2.


2. Si dos o mas observaciones son idnticas, use la media de los rangos.
Ejemplo, si a 3 observaciones idnticas les corresponden los rangos
4,5,6; asignele a cada observacin el rango de 5 (4+5+6)/3= 5

62
ESTADISTICO DE LA PRUEBA:

Sea R1 la suma de los rangos de la muestra mas pequea (1), defina:

* R2; en donde R2 se estima de la siguiente forma:

R2 = n1(n1 + n2+1)-R1; Si n1n2


R2 = ((n1 + n2/2) ( n1 + n2+1)) R1; Si n1 n2

R2; es la suma de los rangos de la muestra 2.

Si las medias maestrales no difieren, se espera que la suma de los


rangos sea casi igual.

Si las sumas de los rangos difieren grandemente puede concluirse que


las medias no son iguales.

REGION DE RECHAZO:

Use la tabla 9 del libro mongomerit, Pg. 619 y 620 para encontrar los
valores crticos para de 0.05 y 0.01. Entre la tabla especificando los
valores n1 y n2 y halle el valor critico (R *).

Para las pruebas de una cola, los valores de en la tabla 9 se reducen a


la mitad, es decir, en lugar de ser 0.05 y 0.01, realmente son 0.025 y 0.005.

a) Prueba de dos colas:


H0: 1 = 2
H1: 1 2

R= mnima (R1, R2).


Rechazar. H0; Si R < R*

63
b) Prueba de una cola derecha:

Rechazar H0; Si R2H<0:R* 1 = 2


H1: 1 > 2
c) Prueba de una cola izquierda.

H0: 1 = 2
H1: 1 < 2

Rechazar H0; Si R1 < R*

MUESTRA GRANDES

Cuando los tamaos de muestras son grandes (n1 , n2 ), la distribucin


muestral de R1 se aproxima a la distribucin normal con media:
(n1>10 y n2 >10).

R= n1 (n1 + n2+1)/2

2
R = n1 n2 (n1 + n2+1) / 12

ESTADSTICO DE PRUEBA:

Z0 = R1 - R / R

REGION DE RECHAZO:

a) Para dos colas => / Z0 / > Z/2


1 2

b) Para una cola superior => Z0 > Z


1 > 2

c) Para una cola inferior => Z0 < - Z


1 < 2

64
Una compaa Mexicana quiere enviar a sus ejecutivos a Alemania.
Para esto, se necesita que ellos aprendan el alemn.
Se selecciona 2 mtodos pura ensearles el idioma alemn: Lc y Es. Dos
grupos de 15 ejecutivos se seleccionan aleatoria mente y se registran sus
calificaciones finales una vez que ellos han concluido el curso sea por un
mtodo a sea por el otro. Hay evidencia que el mtodo Lc sea mejor? Use
para esta prueba un de 0.05

Lc Pob 1 1 Ho : 1 = 2
Ec Pob 2 2 H1 : 1 > 2

REGION DE RECHAZO:

Z0.05 = 1.645

Es : 43,39,50,59,57,62,65,60,69,70,72,74,80,83,88
Lc : 75,60,62,73,72,88,87,88,85,90,89,92,96,93,98

Rechazar Ho; si Z0 > Z

65
ORDENAR EN FORMA ASCEDENTE: CALCULO DE R1 Y R2

Es Rango Lc Rango
39 1
43 2
50 3
57 4
59 5
60 6.5 60 6.5
62 8.5 62 8.5
65 10
69 11
70 12
72 13.5 72 13.5
73 15
74 16
75 17
80 18
83 19
85 20
87 21
88 23 88 23
88 23
89 25
90 26
92 27
93 28
96 29
98 30
Suma: Suma:
R1 = 152.5 R 2 = 312.5
R2 =312.5

66
R= n1 (n1 + n2+1) R = 15 (15 + 15+1) R = 232.5
2 2

2
R = n1 n2 (n1 + n2+1) 2
R = (15) (15) (15 + 15+1) 2
R =581.25
12 12

Z0 = R1 - R Z0 = 312.5 232.5 = Z0 = 80
R 581.25 22.76

Z0 = 3.51

DECISIN:
Rechazar H0

CONCLUSION:
De acuerdo con los datos obtenidos podemos decir que el
mtodo Lc es mejor que el mtodo Es esto se puede afirmar con una
confianza del 95 %.

Accin:

67
PRUEBA DE HOMOGENEIDAD
Otro tipo de prueba para la cual X2, tambin se aplica es aquel en el que
los totales de los renglones a columnas, son predeterminados.
EJERCICIO:
Suponga que se decide por adelantar selecciones de 200 demcratas y
150 republicanos.
Adems de 150 independientes de los votantes de un estado y s e
registran si estn de acuerdo, en contra o son indiferentes ante una propuesta
de ley que trata de legalizar el aborto. Las respuestas observadas, se
encuentran registradas en la siguiente tabla:

Ley de Afiliacin poltica


aborto Demcrata Republicano Independiente Totales
86 64 64
A favor 82 70 82 214
89 67 67
Encontra 93 63 67 222
26 19 19
Indecisin 25 18 21 64
Totales 200 150 150 500

Se probar la hiptesis que las proporciones poblaciones dentro de cada


rengln son iguales (prueba homogeneidad) esto es, se analizara si la
proporcin de los demcratas, republicanos e independientes que s i estn a
favor de la ley de aborto, y si es la misma; la proporcin de cada afiliacin
jurdica en contra de la ley es la misma, a si la proporcin de cada afiliacin
poltica no ha decidido estar de acuerdo.

Cij= ri cj
nij

E1A= (214) (200) = 22.5 E 2A= (222)(200) = 89


500 500
E1B= (214) (150) = 20.9 E 2B= (222) (157) = 67
500 500
E1C= (214) (150) = 38.9 E 2C= (222) (200) = 67
500 500

E3A= (64) (200) = 26


309
E3B= (64) (150) = 19
500

68
E3C= (64) (150) = 19
500

ESTADISTICO DE PRUEBA

n k
X = (0ij Eij)2
2

i=1 j=1 Eij

(85 89)2 (70 64)2 (62 64)2 (63 67)2 (67 67)2 (25 26)2 (18 19)2 (21 19)
X2
86 64 64 67 67 26 19 19
X 1.5312
2

H0: La proporcin de demcratas, republicanos e inpedendientes es la misma


con respecto a la ley del aborto.
H1: La proporcin de demcratas, republicanos e independientes es diferente
con respecto a la ley del aborto.

H0; P1= P2= P3


H1; Cuando menos una proporcin no es igual a los restantes
H1; No todos los proporciones son iguales.

g.l = (3-1) (3-1 )


g.l= 4

69
1.52 X2 0.05,4 =9.49
DECISIN:
Se acepta H0
CONCLUSION:
La proporcin de demcratas, republicanos e independiente,
es la misma con respecto a la ley del aborto.

70
DIFERENCIA ENTRE PRUEBAS DE INDEPENDENCIA Y PRUEBA
DE HOMOGENEIDAD.

En la prueba de homogeneidad, primero se identifican las poblaciones


de inters antes del muestreo y despus se muestrea directamente de estas
poblaciones.

En las pruebas de de independencia se muestrea de una poblacin y se


clasifican los datos obtenidos dentro de una tabla que se conoce como de
contingencia y en la que se establece de acuerdo a categoras o calcificacin.

EJERCICO PARA PRUEBA DE WILCONSON PARA PRUEBA DE


RANGOS
Anlisis Por qu se usa esta prueba en el ejercicio anterior?

Se estudian 2 poblaciones cuyas caractersticas son:

el tamao de muestra es igual (esto implica que el tamao de


muestra esta apareada).
Los mtodos utilizados en el estudio son diferentes.
El tamao de muestra es mayor a 10.
Los elementos de la poblacin son diferentes.

EJERCICIO:
12 trabajadores se les registr el nmero de piezas que fabrica durante
la primera hora de su turno. A los mismos trabajadores se les registra tambin
el numero de piezas fabricadas pero ahora en la ultima hora de sus turno. Se
pretende conocer si el nmero de piezas fabricadas por cada trabajador tiene a
disminuir durante la ultima hora con relacin a la primera. Desarrolle una
prueba tal que con una confianza del 95% usted conteste a esta pregunta.

El planteamiento adecuado para esta prueba seria:

H0: 1 = 2
H1: 1 > 2

Para objeto de anlisis iniciaremos haciendo haciendo una prueba en la


que se considera sencillamente. Si el procemiento de piezas fabricadas en la
primera hora es diferente al de la segunda. Es importante entender que este

71
tipo de prueba solo es indicativa de que el procemiento de fabricacin de
piezas es diferente y no nos dice si es mayor o es menor.

Por lo anterior una vez practicada la prueba, y si resultara rechazarse la


H0; procediramos a evaluar la prueba con mayor y corroborar la conclusin
con menor.

Caractersticas de la poblacin.
Dado que son los mismos trabajadores en la primera y ultima hora del
turno, podemos aparear datos por que tienen dependencia.
Por lo anterior practicaremos una prueba de Wilcoxon de rango con
signo.

TABLA DE DATOS
trabajador primer hora Ultima hora (x - y) Rango
1 18 16 2 3.5
2 12 10 2 3.5
3 7 8 -1 1
4 21 23 -2 3.5
5 19 13 6 7.5
6 14 10 4 6
7 8 8 0
8 11 13 -2 3.5
9 19 9 10 10
10 16 8 8 9
11 8 8 0
12 11 5 6 7.5

H0: 1 = 2
H1: 1 2

72
RECHAZAR:
H0;si T T0

T= minima (T-,T+)
T0 Valor critco

T+ =3.5+3.5+7.5+6+10+9+7.5
T+=1+3.5+3.5=8
T=8

n
T0 Unilteral
/2

10
T0 8
0.025

88

DESICION: Rechazar H0
CONCLUSION: No hay evidencia suficientemente de que el promedio de
fabricacin de piezas en la 1a hora es igual a la fabricacin de la ltima hora.

H0: 1 = 2
H1: 1 > 2
(>) Rechazar H0; si T- T0

DECISIN: rechazar H0.


CONCLUSION: Existe suficiente evidencia para plantear que la fabricacin
es mayor en la primera hora que en la segunda.

H0: 1 = 2
H1: 1 < 2
(<) Rechazar H0; si T+ T0
47 8 no es menor o igual que 8

DECISION: Se acepta H0.


CONCLUSION: La fabricacin de la primera hora no es menor a la ltima
hora.

73
BIBLIOGRAFIA

ESTADISTICA PARA ADMINISTRACIN


Y ECONOMIA
WILIAMS STEVENSON

PROBABILIDAD Y ESTADISTICA
MURRAY

ESTADISTICA
ANTONNI HOWARD

APLICACIN DE LA ESTADISTICA
EDWARD WALPONN

LA ESTADISTICA Y SUS APLICACIONES


WILIAM ROWSDON

74

You might also like