Professional Documents
Culture Documents
DE BOLIVIA
CARRERA DE INGENIERÍA DE SISTEMAS
DOSSIER
INFERENCIA PROBABILÍSTICA
Cuarto Semestre
PRACTICAS
Práctica Nº1 Modelo Binomial 95
Práctica Nº2 Modelo Geométrico y Pascal 95
Práctica Nº3 Modelo Multinomial 96
Práctica Nº4 Modelo Hipergeométrico 96
Práctica Nº5 Modelo Multivariado 97
Práctica Nº6 Modelo Poisson 97
Práctica Nº7 Modelo Uniforme 98
Práctica Nº8 Modelo Exponencial 98
Práctica Nº9 Modelo Normal 99
Práctica Nº10 Teorema central del Límite 100
Práctica Nº11 Aproximaciones a la Normal 100
Práctica Nº12 Distribución muestral de la Media 101
Práctica Nº13 Distribución muestral de la Proporción 102
Práctica Nº14 Distribución muestral de la Varianza 102
Práctica Nº15 Distribución T-Student 103
Práctica Nº16 Distribución F-Fisher 103
Práctica Nº17 Estimación puntual 103
Práctica Nº18 Estimación por I.C. 104
Práctica Nº19 Pruebas de Hipótesis sobre la Media y Varianza 107
Práctica Nº20 Pruebas sobre Proporciones 108
BIBLIOGRAFIA 109
GLOSARIO 110
PRESENTACIÓN
El presente Dossier se realizó en coordinación con los docentes de la Materia con el fin de
que cualquier estudiante del cuarto nivel de Ing. de Sistemas, pueda facilitar su proceso de
aprendizaje y enseñanza,de tal manera que :
-Identifique y utilice los modelos probabilísticos en problemas inherentes a variables
aleatorias
-Utilice la Docimasia de Hipótesis para probar,verificar, alguna característica de una
población.
_Utilice correctamente el análisis de regresión en la predicción,mediante el proceso de
aprendizaje cooperativo.
Cabe aclarar que el Dossier ha sido actualizado de acuerdo al formato emanado del Depto
de Planificación.
Es decir al principio de cada unidad, se incorporó las competencias su objetivo,la
descripción específica de la unidad ,las lecturas complementarias, la bibliografía básica y
electrónica .En cuanto a las prácticas se insertó al final del presente conjuntamente las
tablas y el glosario de términos técnicos elementales
La unidad I comprende el desarrollo de los principales modelos probabilísticos más
utilizados en la Ingeniería,
La unidad II trata sobre las distribuciones muestrales o especiales como (t-student,Chi
cuadrado,y la Fisher) más utilizadas en la Inferencia
La Unidad III está abocado a la estimación tanto puntual como por intervalos de confianza
De los principales parámetros de una población
La unidad IV se refiere a la realización de las diferentes pruebas de hipótesis paramétricas
principalmente y no paramétricas
Finalmente la unidad V trata sobre el análisis de la regresión en la predicción,el mismo que
está en power point
Por lo tanto el presente documento está basado en 4 partes:
I la Introducción
II El contenido o cuerpo del dossier
III Prácticas
IV Tablas estadísticas
V Bibliografía
VI Glosario
Esperamos que el presente documento sea de mucha utilidad para los estudiantes por lo que
estamos prestos a recibir sugerencias para que el mismo pueda ser mejorado.
DISTRIBUCIÓN DE PROBABILIDADES
Competencia:
Objetivos.
-Resolver correctamente todo tipo de problema que tengan que ver con la incertidumbre ,
mediante la utilización de los modelos probabilísticos
Referencia electrónica:
http://www.itchihuahua.edu.mx/academic/industrial/sabaticiruta/private/01UNIDAD%20I
V.uhtm
INTRODUCCIÓN
DISTRIBUCIONES DISCRETAS
Son aquellas distribuciones cuya variable aleatoria es discreta
DEFINICIÓN
Se dice que una v. d. X~Bernoulli sii sv Rx= [0,1]; donde la V.A.D. x:” N° de éxitos
obtenidos en un ensayo dicotómico”; cuya
Donde
p = probabilidad del éxito
q = probabilidad del fracaso
de tal manera que p+q=1
ó p = 1-q
ó q = 1-p
cuya distribución de probabilidad y representación gráfica es:
x P(x)
0 q
1 p
P(x)
p
q
x
0 1
F(x) = p (X £ x) = 0 si x<0
q si 0 £ x<1
1 si x³1
CARACTERISTICAS
1) LA MEDIA
x 0 1
E ( x) = m = å xP( x) = p
P ( x) 9 p
E ( x) = m = 0(q ) + 1( p) = p
xP( x) 0 p
d r M x (t )
m'r = por lo tanto debemos antes determinar
dt r t =0
[ ] å
la fgm = M x (t ) = E e tx = etx p x q1- x desarrollando la å
0 1-0 1 1-1
fgm = M x (t ) = e t ( 0)
p q +e t (1)
pq = q+etp
d ' (q + et p )
sabemos que E ( x ) = m = m '1 = t =0
= 0 + pet t =0 pe0 = p
dt '
2) LA VARIANZA
V ( x) = s 2 = E ( x 2 ) - m 2 = åx 2
p x q1- x - p 2
V ( x ) = s 2 = 0 2 p 0 q1-0 + 12 pq 0 - p 2 = p(1 - P) = p.q
mediante la f.g.m. V ( x ) = s = m '2 - m 2 2
donde m ' 2 =
d ' ' M x (t ) d ' q + et p
=
[ ] = pe t = pe 0 =
t =0 t =0 t =0 p
dt ' ' dt '
Þ V ( x ) = p - p = p(1 - p) =
2 p.
n
P(X)= P[X=x]=( x )pxqn-x:Rx0,1,2,3...n
Donde
p = probabilidad de éxito
q = probabilidad de fracaso
n = N° de ensayos Bernoulli
0
x
si x < 0
n
F(x)= P(X £ x) =B(x;np)= å (k ) p q k n-x
si 0 £ x < n
k =0
1 si x > n
CARACTERÍSTICAS
n
1) LA MEDIA E ( x) = m = å xP( x) = å x( x) p
Rx
x
q n- x = np
n
2) LA VARIANZA V ( x) = s 2 = E ( x 2 ) - m 2 = åx 2
( x) p x q n - x - (np) 2 = npq
[ ]
3) LA FGM M x (t ) = E e tx = [1 + p(e t - 1)]n
RESOLUCIÓN DE PROBLEMAS CON MODELOS PROBABILISTICOS
Ejemplo
a) 3 fallen
b) a lo más 2 fallen
c) al menos 3 fallen
d) el promedio y varianza que un ordenador falle
SOLUCIÓN
n
Entonces asumimos que la v.a.d. X~ b(n. p) Þ P(x)=( x )px qn-x Rx =0,1,2....n
æ 10 ö
a) 3 fallen Þ P ( x = 3) = ç 3 ÷(0.01) 3 (0.99) 7 = 0.00011
è ø
2
b) a los más 2 fallen Þ P( x £ 2) = å P( x ) = P(0) + 1P(1) + P(2) = 0.9999
0
10
c) al menos 3 fallen Þ P( x ³ 3) = å P( x) = P(3) + P(4) + ... + P(10)
3
mediante el complemento Þ P( x ³ 3) = 1 - P( x £ 2) = 1 - 0.9999 = 0.00011
USO DE TABLAS
P(x=x)=b(x:n.p)= B(x:n;p)-B((x-1);n.p)
Ejemplo
SOLUCIÓN
4 ëè ø è ø è ø è ø û
DISTRIBUCIÓN GEOMÉTRICA
DEFINICIÓN
q
LA VARIANZA V ( x) = s 2 = E ( x 2 ) - m 2 =
p2
q
LA DESVIACIÓN TÍPICA s = V ( x) =
p2
LA f.g.m M x (t ) = p[q - e t q 2 ] =
-1 p
q - et q 2
PROPIEDADES
1. No tiene memoria
2. Es decreciente, es decir P[x]<P(x-1) "x = 2,3
Ejemplo
a) En el primer intento
b) En el segundo intento
c) En el cuarto intento
d) Cual su esperanza matemática
SOLUCIÓN
Ejemplo
SOLUCIÓN
X~G(p) Þ P(x)= 0.03(0.97x-1 : Rx= 1,2,3,….
å P( x) = 0.03(0.97)
1
0
+ 0.03(0.97)1 + 0.03(0.97) 2 = 0.03 + 0.0291 + 0.02823 = 0.0873
DEFINICIÓN
r = Nº de exactos obtenidos
p = probabilidad del éxito
X:” Nº de veces o intentos que se realiza el experimento Beunoulli hasta obtener r
éxitos” tal que r £ x; Sii
FUNCION DE PROBABILIDAD
æ x - 1ö v x -v
P ( x ) = P[x = x] = çç ÷÷ p q : Px = v, (v - 1) : (v - 2 )...
è v - 1 ø
FUNCION DE DISTRIBUCIÓN F(x)
ì 0 æ k - 1ö r k - r : Si x<r
P ( x £ x ) = íå çç ÷÷ p q
î è r - 1ø : Si x³r
LA MEDIA
æ x - 1ö v x-v v
E ( x) = m = å xçç ÷÷ p q =
è v - 1 ø p
LA VARIANZA
rq
V ( x) = s 2 = E ( x 2 ) - m 2 =
p2
Ejemplo 1
Una maquina se utiliza para fabricar ciertos chips en serie se sabe que la
probabilidad de cada chip sea defectuosos es del 10%. Si se controla la calidad
del CHIP producido sabiendo que la máquina se apaga cuando se producen 4
chips defectuosos; cual es la probabilidad de que la máquina pare en el 10mo
chip producido.
p=10
q =90
v=4
x=10
æ x - 1ö
x ~. P(v, p ) = P( x ) = çç ÷÷(0.1) (0.9 ) : Rx = 4, T ,6...
4 x -4
è 4 - 1ø
x :" N º de chips producidos hasta controlar 4 defectuosos
A :" la maquina pare Þ A = [x = 10]
æ10 - 1ö
Þ P( A) = P[x = 10] = çç ÷÷(0.1) (0.9 ) = 84(0....... = 0.0045
4 10 - 4
è 4 -1 ø
Ejemplo 2
SOLUCION
p =0.40
q =0.60
v =3
x =10
æ x - 1ö v x - v
x ~. P(v, p ) = P( x ) = çç ÷÷ p q : x : v, v + 1, v + 2,...
è v - 1 ø
x :" N º de CPUs exp uestos al virus hasta 10 a sea la 3 a en contraerla
æ 9ö
P[x = 10] = çç ÷÷(0.40) (0.60) = 0.0645
3 7
è 2ø
DISTRIBUCIÓN MULTINOMIAL
Es una generalización de la distribución Binomial, se utiliza cuando se tienen
ensayos o experimentos aleatorios que tienen más de 2 posibles resultados,
donde las probabilidades de los resultados son los mismos en cada ensayo, todos
los ensayos son independientes.
DEFINICIÓN
Rxi=[0,1,2...n];i=1,2,3...k Sii
n! x x x
FUNCIÓN DE PROBABILIDAD P(x1,x2.... xk)= p1 1 p2 2 ... p k k
x1 ! x2 !...x k !
MEDIA E(xi)=npi
Ejemplo
Las probabilidades de que una lamparilla de cierto tipo de proyector de
diapositivas dura
SOLUCION
Sean los eventos
E1:”Duran menos de 40 hrs” Þ P[E1] = 0.30
E2:”Duran entre 40 y 80 hrs” Þ P[E2] = 0.50
E3:”Duran menos de 80 hrs” Þ P[E3] = 0.30
3
Como E i I Ej = f y U = W ademas å P( E1 ) = 1
i =1
Þ xi ~. Multinomial (ni pi )
x :" N º devecesqueocurreeleventoEi (i = 1,2,3)entre 8 lamparillas
x1 = 2
8!
x 2 = 5 Þ P( 2,5,1) = (0.30) 2 (0.50) 5 (0.20)1 = 0.0945
2!5!1!
x3 = 1
Ejemplo
La probabilidades que una declaración de impuestos sea llenado
correctamente es del 60%
que tenga un error favorable del declarante es del 20%
que tenga un error favorable al fisco es del 10%
que tenga ambos tipos de errores es del 10%
SOLUCION
Sean los eventos
E1: “Declaración correcta” Þ P[E1] = 0.60
E2: “Declaración favorable al declarante” Þ P[E2] = 0.20
E3: “Declaración favorable al fisco” Þ P[E3] = 0.10
E4: “Declaración error de ambos tipos” Þ P[E4] = 0.10
Como E i I Ej = f ademas P( E1 ) = 1
UEi = W Þ x1 ~. Multinomial (10, pi )
x :" N º de veces que ocurre el evento Ei (i = 1,2,3,4)entre 10 declaraciones
10!
P(5,3,11) = (0.60) 5 (0.20) 3 (0.10)1 (0.10)1 = 0.0314
5!3!1!1!
DISTRIBUCIÓN HIPERGEOMÈTRICA
N =tamaño de la población
X:”Nº exactos en un m.a. de tamaño n sin reposición
n =tamaño de la m.a. ó Nº de extracciones Rx=[0,1,2..Min (n, M) Sii
M =Nº de elementos exitosos
FUNCION DE PROBABILIDAD
æ M öæ N - M ö
çç ÷÷çç ÷÷
è x øè n - x ø
p ( x ) = P[x = x ] : R c = 0,1,2...Min(n.M )
æNö
çç ÷÷
è nø
FUNCION DE DISTRIBUCIÓN
ì 0 Sii x <0
ï æ M öæ N - M ö
ï x çç ÷÷çç ÷÷
[ ] ï è k øè n - k ø
F ( x ) = P x £ x = íå 0 £ x < Min(n, M )
ïk =0 æNö
çç ÷÷
ï ènø x ³ Min ( n , M 9
ïî 1
Si
MEDIA
éM ù
E ( x) = m = å xP( x) = nêë N úû
VARIANZA
é M ùé M ùé N - n ù
V ( x) = s 2 = n ê ú ê1 - ú ê factor de corrección
ë N ûë N û ë N - 1 úû
Ejemplo
Como parte de un estudio sobre la contaminación del aire un Ing. Geológico
decide examinar la emisión de gases tóxicos de 6 de los 24 camiones de una CIA
si 4 de esos camiones, emiten cantidades de gases tóxicos. Cual es la
probabilidad de que:
a) Ninguno de ellos
b) Mas de 3 emitan gases
SOLUCION
æ 4 öæ 20 ö
çç ÷÷çç ÷
è x øè 6 - x ÷ø
P ( x) = x = 0,1,2,3,4
æ 24 ö
çç ÷÷
è6ø
æ 4 öæ 20 ö
çç ÷÷çç ÷
è 0 øè 6 - 0 ÷ø 38.760
a) P ( x = 0 ) = = = 0.2880
æ 24 ö 134.596
çç ÷÷
è6ø
æ 4 öæ 20 ö æ 24 ö
b) P[x > 3] = å P( x ³ 4) = P(4) = çç ÷÷çç
190
÷÷ çç ÷÷ = = 0.0014
è 4 øè 6 - 4 ø è 6 ø 134596
Ejemplo
En el laboratorio de Sistemas hay 20 CPUs donde existen 6 CPUs con
desperfecto. Si se elige aleatoriamente 4 CPUs para su reparación.
a) cual es la probabilidad de que al menos 1 CPU deba ser reparado
b) cual es el Nº esperado de CPU para ser reparado y su varianza
SOLUCION
Como se trata de control de calidad y se tiene el tamaño de la población
N = 20
n=6
M =4
N-M = 14
X~H(N,nM)
Rx=0,1,2,3,4
æ 6 öæ14 ö
çç ÷÷çç ÷÷
è 0 øè 4 ø
a) P( x ³ 1) = 1 - P( x £ 0) = 1 - = 0.7934
æ 20 ö
çç ÷÷
è4ø
éM ù é6ù
b) E ( x ) = n ê ú = 4ê ú = 1.2
ëN û ë 20 û
é M ù é M ùé N - n ù é 6 ùé 6 ù é 20 - 4 ù
V ( x ) = n ê ú ê1 ú ê ú = 4ê ú ê1 - ú ê ú
ë N û ë N ûë N - 1 û ë 20 û ë 20 û ë 20 - 1 û
æ 24 öæ 14 öæ 16 ö 5.376
V ( x ) = ç ÷ç ÷ç ÷ = = 0.7074
è 20 øè 20 øè 19 ø 7.600
éM ù
E x = m = np » n ê ú
ëNû
LA VARIANZA
é M ùé M ù
V ( x ) = s 2 = npq » n ê ú ê1 - ú
ë N ûë N û
Ejemplo
Una importación de 100 computadoras, de las cuales 25 se sabe que tienen
desperfecto. Se realiza un control de calidad para ello se toman 10 computadoras,
cual es la probabilidad:
a) de que 2 tengan desperfectos
b) cual el Nº esperado de CPUs con desperfecto y para ello utiliza la
verdadera distribución y una aproximación si se puede
SOLUCION
Como se trata de control de calidad
æ M öæ N - M ö
çç ÷÷çç ÷÷
è x øè M - x ø
La verdadera distribución X ~ H(N.n.M) Þ p( x) =
æNö
çç ÷÷
ènø
N = 100
n = 10
M =25
N-M =75
M 25
p= = = 0.25
N 100
M
q = 1- = 075
N
æ10 ö
a) p ( x - 2) = çç ÷÷(0.25) (0.75) = 0.2515
2 8
è2ø
DISTRIBUCIÓN MULTIVARIADA
DEFINICIÓN
Se dice que los vs.as.ds. Xi ~ Multivariante
æ M 1 öæ M 2 ö æ M k ö
çç ÷÷çç ÷÷...çç ÷÷
è x1 øè x 2 ø è x k ø
P(xi,x2... xk: N,n)=
æNö
çn÷
è ø
Ejemplo
En un depósito hay 20 TV de los cuales 10 son de 20’’: 6 de 18’’ ;4 de 15’’, se elige
al azar 10TV. Cual es la probabilidad de que haya 5 de 20’’, 3 de 18’’ y 2 de 15’’.
SOLUCION
Por su aplicación es una de las mas importantes tanto como Proceso Poisson o
como aproximación a la Binomial
DEFINICIÓN
FUNCIÓN DE PROBABILIDAD
P( x ) = P( X = x ) = lt x e - lt : x = 0,1,2,3... e = 2.71828..
donde l t = Nº promedio de ocurrencias de los eventos en las t unidades de
medida
cuando t= fijo Þ l t= a
a x - e -a
P ( x) = P ( x = x ) = : x = 0,1,2,3
x!
FUNCIÓN DE DISTRIBUCIÓN
ì
ï 0 Si x < 0
ïï x a k e -a
F ( x) = P[x £ x ] = í å x³0
ïa = 0 k!
ï
ïî
LA MEDIA E ( x) = m = lt = a
LA VARIANZA V ( x ) = s 2 = lt = a
USO DE TABLAS
F ( x) = P[x £ x] = F ( x : l )
Ejemplo
é 3 0 e - 3 31 e -3 3 2 e -3 3 3 e -3 ù
a) =1- ê + + + ú
ë 0 ! 1 ! 2 ! 3! û
é 3 0 3 9 27 ù
= 1 - e -3 ê + + + ú = 0.3520
ë1 1 2 6û
b) lt = 3 * 2 = 6 Þ P(x ³ 4) = 1 - P( x £ 3) = 1 - F (3) = 1 - 0.151 = 0.849
c) lt = 3( 13 ) = 1 Þ P( x ³ 4) = 1 - P( x £ 3)1 - F (3) = 1 - 0.9801 = 0.019
Donde E ( x) = np = l Þ cte
l t x e - lt æ l ö l e
x -l
P( x) = » bç x i npˆ ÷ = x = 0,1,2
x! è ø x!
l x e -l
FUNCION DE PROBABILIDAD P( x ) = x = 0,1,2,3... l = np = cte
x!
FUNCION DE DISTRIBUCIÓN
ì 0x : Sik x-<l0
ï l e
F ( x ) = P[x £ x ] = íå : x³0
ï k = 0 k !
î
LA MEDIA E ( x) = m = np = l
LA VARIANZA V ( x ) = s 2 = l = np
Ejemplo
n =100
p = 0.05
q = 0.95
æ 100 ö
a) x ~. b(100;0.05) Þ p ( x) = ç x ÷(0.05) (0.95) ; x = 1,2,3...100
x 10 - x
è ø
x =" N º CPUs mal ensambladas entre 500"
æ 100 ö
P( x = 2) = ç 2 ÷(0.05) (0.95)
10 - 2
= 0.0812
2
è ø
b)mediante una aproximación a la POISSON
5 x e -5
l = np = 100(0.05) = 5 Þ P( x) = : x = 0,1,2
x!
5 2 e - 5 25(e -5 )
P( x = 2) = = = 0.0842
2! 2
PROPIEDAD REPRODUCTIVA
n
Si Xi ~ misma distribución Si å x i = Y ~. misma distribución i= 1,2...n
i =1
Si X i ~. P(a i )" i = 1,2,...n
n
ÞY = åx
i =1
i Þ Y ~. P (a = åa i
Ejemplo
Determinar:
SOLUCION
DISTRIBUCIONES CONTINUAS
Los espacios muéstrales continuos y las v.a.c. surgen cuando se trabaja con
cantidades que se miden en una escala continua (velocidad de una CPU; la
cantidad de alcohol en la sangre, la cantidad de nicotina en un cigarrillo, etc.)
DEFINICIÓN
Se dice que una v.a.c. X tiene distribución uniforme o rectangular en el intervalo [a,
b] tal que a< b Sii
ï b - a b-a
ïî 0 ; eoc
a c d b
Para cualquier sub. intervalo [c, d] donde
a £ c £ d £ b Þ P[c £ x £ d ] = òc
d 1
b-a
dx =
1
b-a
[x]
d
c
=
1
b-a
[d - c] = d - c
b-a
además P(x=x) =0
Se dice distribución uniforme porque la P[c £ x £ d ] es la misma para todos los sub
intervalos que tienen la misma longitud.
x-a
F ( x) = P[x £ x] =
x x 1
ò ò
1 F(x)
dx = dx =
µb-a ab-a b-a
ì 0 Si x < a
ïx - a
F ( x) = P[x £ x] = í Si a £ x < b
ï b -1 a Si x ³ ba
î
a b x’
LA MEDIA
a a +b
ò
1
m = E ( x) = x dx =
b b-a 2
LA VARIANZA
b æ a +b ö (b - a ) ó = (a - b )
2 2 2
ò
1
V ( x) = s 2 = x2 dx - ç ÷ =
a b-a è x ø 12 12
Ejemplo 1
SOLUCION
X ~ U[a, b]donde a =1 ; b =4
X: “posición del punto en el intervalo [1,4]”
ì ì0
ï ï Si x < 1
ï1 ï x -1
Þ f ( x) = í ; 1 £ x £ 4; F ( x)í Si 1 £ x < 4
ï 3 ï 4 - 1
Si x ³ 4
ï0 ; eoc
ïî1
î
dx = [x ]3 = (0) = 0
3 1 1 3 1
a) P( x = 3) = ò
3 3 3 3
é3 ù 31 1 3 1é 3ù 1 é3ù 1
b) P ê < x < 3ú = ò3 dx = [x] 3 = ê3 - = =
ë2 û 23 3 2 3ë 2 úû 3 êë 2 úû 2
é3 ù é 3ù æ3ö
P ê < x < 3ú = P[x < 3] - P ê x £ ú = F (3) - F ç ÷
ë2 û ë 2û è2ø
2 2 -1 2 2 3 1
3 1
= - = - = =
3 3 3 3 6 2
Ejemplo 2
Suponga que cierta línea de transporte publico pasa por un determinado paradero
de control o de espera, a un horario estricto con intervalos de 30 minutos durante
el día. Si un pasajero llega a ese paradero en un instante aleatorio durante el día.
Calcular la probabilidad de que tenga que esperar:
a) más de 15 minutos
b) Exactamente 7 minutos
SOLUCION
X ~ U[0.30]donde a = 0 ; b =30
X = “tiempo de espera en minutos del pasajero”
ì ì0
ï ï Si x £ 0
ï1 ï x -0 x
f ( x) = í ; 0 £ x £ 30; F ( x )í = Si 0 £ x < 30
ï 30 ï 30 - 0 30
Si x ³ 30
ïî 0 ; eoc ïî1
[x]15 = = minuto
30
ò
1 1 30 15 1
a) P( x > 15) = dx =
15 30 30 30 2
b) P[x = 7] = 0
Ejemplo 3
Sea la v.a. X...U[0,6] calcular
6
P[ x - m > 2] : sabemos que m=
= 3 reemplazando
2
P[ x - 3 > 2] = 1 - P[ x - 3 £ 2] = 1 - P[-2 £ x - 3 £ 2]
= 1 - P[1 £ x £ 5] = 1 - P[ P( x £ 5) - P( x < 1)] = 1 - F (5) + F (1)
5 1 1
=1- + =
6 6 3
DISTRIBUCIÓN EXPONENCIAL
DEFINICIÓN X ~ EXP (l )
Se dice que una v.a.c. X tiene distribución exponencial con parámetro (l )
F(x)
ìïl - lx
e ;x ³ 0
f ( x) = í l
= 0.368l
ïî0 ; eoc e
FUNCION DE DISTRIBUCIÓN
F(x)
1
ì0 Si x<0
F ( x ) = P[ X £ x] = í
î1 - e
- lx
Si x³0
1
l
x
MEDIA
µ
ò
1
m = E ( x ) = xle - lx dx =
0 l
VARIANZA
x 2 1 1
V ( x ) = s 2 = ò x 2 le -lx dx - m 2 = - 2 = 2
0 l 2
l l
Ejemplo 1
SOLUCION
é 1ù
1 1
ë 6û 0 0
[
= - e -8.4 x= -ée]
1
6
êë
0
6
- e -8.4( 0 ) ù
- 8.4( 1 )
úû
= -[0.2466 - 1] = 0.7534
Ejemplo 2
El tiempo durante el cual una marca de computadora que opera en forma efectiva
antes de su primera reparación, se distribuye exponencialmente con un promedio
de fallas de 360 días
ìï 1 - 360
ìï0 x<0
x
e ;x³0 Si
f ( x) = í 360 ; F ( x) = í
ïî0 ; eoc
- x
ïî1 - e 360 Si x³0
P [x ³ 400 ] p [x ³ ] a
9
- 360x
400
ò 1
400 360
e dx
Ó mediante la acumulada
1 - éê1 - e 360 ùú
- 600
p[x ³ 600] 1 - P[x < 600] 1 - F (600)
- 600 -
5
ë û e 360 - 600 + 400 - 20 =e 9
= = = = 400 = e 360 360
=e 36
= e -0.5556
P[x ³ 400] 1 - P[x < 400] 1 - F (400) é - 400 ù - 360
1 - ê1 - e 360 ú e
ë û
DEFINICIÓN
[ ]
Þ R (t ) = P[T > t ] = 1P[T £ t ] = 1 - 1 - e - lt = e -lt
Ejemplo
SOLUCION
DISTRIBUCIÓN NORMAL
DEFINICIÓN
FUNCION DE PROBABILIDAD
1 F(x)
s 2P
- [( x - m ) / s ]2
1
f ( x) = e 2
;-¥ < x < ¥
s 2P
P = 3.1416...
donde
e = 2.71828
m = Me = Mo
CARACTERÍSTICAS
x
F ( x) = P[ x £ x ] = ò x f ( x)dx
¥
½
LA MEDIA
¥
E ( x) = ò x f ( x)dx = m
-¥
LA VARIANZA
¥
V ( x ) = ò x 2 f ( x )dx - m 2 = s 2
-¥
F(x)
1
DISTRIBUCIÓN NORMAL ESTANDAR s 2P
F(z)
; z....N (0.1)
x -m
Mediante la v.a.e.= z = s
m =0 z m z x
USO DE TABLAS
SOLUCION
x-m
a)P[4<x<7]estandarizando mediante z =
s
donde m = 5;s 2 = 4;s = 2
é 4 - 5 x - m 7 - 5ù
Pê < < = p[- 0.5 < z < 1] = p[z < 1] - P[z £ -0.5] = F (1) - F (-0.5) = 0.8413 - 0.3085 = 0.5328
ë 1 s 2 úû
é x - m 10 - 5 ù
b) P[x > 10] = P ê > = P[z > 2.5] = 1 - p[z £ 2.5] = 1 - F (2.5) = 0.0062
ë s 2 úû
Ejemplo
El tiempo T requerido para contagiarse un computadora por cierto virus es una v.a.
normal con media 31 segundos y desviación estándar 5 segundos.
SOLUCION
T ~ N(31,5)
T: “tiempo requerido para contagiarse una CPU con el virus en segundos”
é T - m 35 - 31ù é 4ù
a) P[T < 35] = P ê < ú = Pê z < = F (0.8) = 0.7881
ë s 5 û ë 5 úû
PROPIEDAD REPRODUCTIVA
åx = Y ~ N m y ;s y donde m y = å m ;s = ås
2 2 2
variables i i y i
i= 1 i= 1 i =1
æ n n ö
Þ Y ~. N ç
ç
è
å m ;s = ås
i=1
i
2
y
i=1
2÷
i ÷
ø
Ejemplo
SOLUCION
( ) (
Como Xi...N m i ; s i 2 =Y...N m y ;s y 2 )
donde
é x + x2 ù1
m y = E ( y) = E ê 1 - x3 ú [E ( x1 ) + E ( x 2 )] - Ex3
ë 2 û2
m y = [20 + 16] - 25 = -7
1
2
æ x + x2 ö 1
s 2y = v( y ) = vç 1 - x3 ÷ = [v (x1 ) + v ( x 2 )] + v( x3 )
è 2 ø 4
s 2y = [5 + 11] + 5 = 9 Þ s y = 3
1
4
Þ Y ~. N (-7;9)
é Y - m y 0 - (-7) ù é 7ù
P[Y > 0] = P ê > ú = P ê z > ú = 1 - F (2.33) = 1 - 0.9901 = 0.0099
ëê s y 3 ûú ë 3û
DEFINICIÓN
å åm
i =1
xi -
i =1
i
åm
Yn - i
Þ La v.a.e. de la variación: 1) Z n = = ; Z n ~. N (0.1)
å
n
s i2 ås 2
i
i =1
CASO ESPECIAL
2) Z n = å x - å m = å x - nm = å x
i i i - nm
ås ns
2 s 2 n
Zn =
å xi
n
- ån
m
=
(x n - m ) n ; Z n ~. N (0.1)
s n s
n
Ejemplo1
SOLUCION
Como X i ~. EXPæç ö÷ donde X: “Duración del i=esima componente” en horas”
1
èl ø
I=1,2,......36
1
Donde E (x)= = 100 Þ l
l
1
V ( x) = = 100 2 ; s = 100; Yn: “tiempo total de duración de los n componentes”
l 2
n=36
n.u = 36(100) Þ Z n = åx i - nm
=
Y 36 - 3600
=
Y 36 - 3600
s n 100 36 600
é 5028 - 3600 ù
P[Y36 < 5028] = estandarizando Þ P ê Z 36 < ú
a) ë 600 û
P[Z 36 < 2.38] = F (2.38) = 0.9913
P[Yn ³ 4.536] = 0.9901 Þ 1 - P[Yn £ 4.536] = 0.9901
P[Yn £ 4.536] = 1 - 0.9901 = 0.0099 estandarizado
é 4.536 - 100n ù
b) P ê Z n £ ú = 0.0099 donde el valor crítico
ë 100 n û
4.536 - 100n
= -2.33 resolviendo la ecuación haciendo X = n
100 n
X = 8.018 Þ n = x 2 = 8.018 2 Þ n = 64.3 » 64
Ejemplo 2
La longitud que se puede estirar sin ruptura un filamento de nylon es una v.a.
exponencial con media de 5000 pies. Cual es la probabilidad aproximadamente
que la longitud media de 100 filamentos este comprendido entre 4750 y 5550 pies.
SOLUCION
é 1 ù
X : ~. EXPê ú
ë 5000 û
X: “longitud de estiramiento sn ruptura del i-esimo filamento” i=1,2....100
1 ( xn - m ) n
E ( x) = = 5000 por Zn = estandarizando
l s
æ1ö
2
é (4570 - 5000) 5550 - 5000 100 ù
V ( x ) = ç ÷ = (5000) 2 P[4750 £ x100 £ 5550] = r ê 100 £ z £ ú
èl ø ë 5000 5000 û
s = 100
P[- 0.5 £ z100 £ 1.1] = F (1) - F (-0.5) = 0.8643 - 0.3085 = 0.5558
Ejemplo 1
1 si la v.a. X....b(20;0.5) calcular la P[x =7]
a) De manera exacta, b)Aproximada
SOLUCION
ænö
Sabemos que P ( x) = çç x ÷÷ p x q n - x ; x = 0.1.2...n
è ø
Donde n=20
p=0.5
q=0.5
a) Exactamente o con la verdadera distribución binomial
æ 20 ö
P ( x = 7) = çç 7 ÷÷(0.5)7 (0.5)13 = 0.0739
è ø
b) Aproximadamente mediante la Normal
P[6.5 £ x £ 7.5]
npq 10(0.5)(0.5) = 2.24 Þ P[6.5 £ x £ 7.5] estandarizando
[
PZ £ 7.5 -10
2.24
] - P[Z £ 6.5 -10
2.24
]
= P[Z £ -1.12] - P[Z £ -1.57]
= F (- 1.12) - F (- 1.57 ) = 0.0732
Ejemplo 2
Suponga que la probabilidad de que cierta marca de CPU, esta en servicio
después de 1 año es 0.80. Si la “U” adquiere 35 de tales CPUs. Cual la
probabilidad de que
SOLUCION
X~b(n,p) Þ X~b(35;0.20)
n = 35; p =0,20; q =0,80
a)
x ± 0.5 - np
P[x = 7] = P[6.5 £ x £ 7.5] donde Z =
npq
é 6.5 - 7 7.5 - 7 ù
Þ Pê £Z£ = P[- 0.2113 £ Z £ 0.2113] = P[Z £ 0.21] - P[Z £ -0.21]
ë 2.3664 2.3664 úû
= F (0.21) - F (-0.21) = 0.1664
b)
P[x ³ 5] = P[x ³ 5 - 0.5] = P[x ³ 4.5] = 1 - P[x < 5]
é 4. 5 - 7 ù
= 1 - P êZ £ = 1 - P[Z < -1.056] = 1 - F ( -1.06) = 0.8554
ë 2.3664 úû
Ejemplo 3
El tiempo que un cajero de un banco emplea para atender a un cliente es una v.a.
con media 3.1 minutos y una desviación estándar de 1.7 minutos. Si se observan
los tiempos y corresponden a 64 clientes ¿Cuál la probabilidad de que el tiempo
promedio de los mismos sea por menos 3.4 minutos?
SOLUCIÓN
Como X ~. P(x)
UNIDAD II
DISTRIBUCIONES MUESTRALES
Competencia:
-El estudiante debe saber utilizar las diferentes distribuciones muestrales ,es decir las
diferentes distribuciones de cualquier estadístico estimado a partir de muestras aleatorias
para realizar eficientemente la Inferencia Estadística
Objetivos.
Referencia electrónica:
http://www.itcomitan.edu.mx/tutoriales/estadística/contenido/unidad_2_4.html
INTRODUCCIÓN
Se llama distribución muestral, cuando la variable resulta ser un estadístico o estadígrafo, calculado en
base a los datos de una m.a.
Estos estadísticos se utilizan para realizar inferencia estadística para la toma de
decisiones, respecto alguna característica de la población ó respecto a la
distribución de la misma.
Para desarrollar las distribuciones muéstrales es necesario recordar algunos
conceptos básicos:
POBLACION f(x);P(x);X,Y
Estadísticamente población es el conjunto de todas las observaciones posibles
que puede tomas una v.a. X. Por lo tanto la distribución de la población es la
distribución de la v.a. X. Las poblaciones de acuerdo a su magnitud pueden ser:
POBLACIONES FINITAS (N)
Son aquellas que están limitadas o acotadas
POBLACIONES INFINITAS
Son aquellas que no están imitadas, estadísticamente las poblaciones muy
grandes se las consideran infinitas.
- El proceso para obtener la información de toda la población es el CENSO
PARÁMETROS
Son todas las medidas descriptivas que caracterizan a la población como por
ejemplo la media = m, la varianza s2 etc. Los parámetros se denotan con las letras
griegas
MUESTRA ALEATORIA
(m.aÞn) una m.a. de tamaño “n” es un subconjunto representativo de la
población, el proceso para obtener la información se llama muestreo
ESTADISTICO,
Son todas las medidas descriptivas que se obtienen a partir de la información de al
m.a. como por ejemplo: la media = x , la varianza= S2 etc. Generalmente se las
denota con las letras castellanas.
DEFINICIÓN DE m.a.
Ejemplo
2
Sea una población X~N (m,s ), se toma un m.a. tamaño n X1, X2,... Xn
sy=10
Y - mY
Mediante el teorema central del limite Þ Z = ;~(0.1)
sY
é 52 - 40 ù
Þ P[Y > 52] = ê Z > = P[Z > 1.2] = 1 - P[Z £ 1.2] = 1 - F (1.2) = 0.1151
ë 10 úû
ÞSe cumple:
a) E ( x ) = m ;
s2
b) V ( x ) =
n
c) Z =
(x - m ) n ; ~N (0.1)
s
Nota
æ s2 ö
1) Cuando n ® ¥ Þ x ~ N çç m j ÷÷ cuando n ³ 30, no importa si la población
è n ø
es discreto o continuo
æ s2 ö
2) Cuando n ³ 2 si X~N(m,s2)Þ x ~ N çç m ÷÷
è n ø
3) Si el muestreo es sin reemplazo de una población finita de tamaño N
s2 æ N -nö
ÞV( x )= s 2 x = ç ÷ factor de corrección
n è N -1 ø
Ejemplo
Suponiendo que una población consta de los siguientes valores
observados:3,4,7,9,12. Calcular
a) La media y Varianza poblacionales
b) Determinar la distribución muestral de la media de la m.a. de tamaño 2
escogidos con reposición
c) Se extrae una m.a de tamaño 36 con reposición cual la P[5 £ x £ 8]
SOLUCIÓN
Como N=5Þ m = å
xi 3 + 4 + 7 + 9 + 12
= =7
N 5
s2 =å
299 54
x 2 P ( x) - m 2 = - 72 = = 10.8 ; s = 3.2863
5 5
x P( x) x P( x) x 2 P( x )
3 4 7 9 12 3 1
25 3
25
9
25
3.5 2
4
x 3 3. 5 5 6 7. 5 2
25
5 25
4 ( 4.3 ) ( 4.4 ) (4.7 ) (4.9 ) ( 4.12 ) 5.5 2
25
x 3.5 4 5.5 6.5 8 6 2
25
x 5 5.5 7 8 9. 5 7
1
25
25
10.5
1
25
12 144
12 25 25
TOTAL 175
25
mx = E ( x ) = å x P ( x ) =
175
=7
25
s x2 = V ( x ) = å x 2 P (x ) - m 2 =
1360
- 7 2 = 5. 4
25
Cuando las m.a, son pequeñas n<30 no se pueden suponer que la distribución
muestral es NORMAL, TAMPOCO SE PUEDE APLICAR EL teorema central del
limite, por lo que se debe recurrir otras distribuciones muéstrales las especiales
que estén relacionadas con la NORMAL;entre estas distribuciones tenemos: la
CHI-cuadrado, la t-Student y la F de Fisher
DEFINICION
Sean r v.a. independientes: Z1,Z2,…Zr tal que Zi~N (0.1)
r
Sumando los cuadrados Z12 + Z 22 + Z r2 = å Zi2 ~ X r2 grados de libertas, Sii
i =1
FUNCIÓN DE DENSIDAD
R=1
ìï 1
f x 2 (x ) = í r
V
-1 - X
X 2 e 2; 0< X <¥
ïî 2 2 h ( 2r )
;esc
CARACTERÍSTICAS
PROPIEDAD REPRODUCTIVA
F(x)
FUNCIÓN DE DISTRIBUCIÓN
[ ] ò
F ( x) = P x £ X a2 =
0
xa2
f ( x )dx = a
a
1-a
[ ] [
Cuando P x > X a2 = 1 - P x £ X a2 = 1 - a ]
USO DE TABLAS
SOLUCIÓN
Como v=26
[ ]
a) P[x £ 17.29] = P x £ X 02.10 = 0.10
[ ]
b) P[x ³ 38.88] = 1 - P[x < 38.88] = 1 - P x < X 02.95 = 1 - 0.95 = 0.05
c)
[ ] [ ]
P[13.84 £ x £ 45.64] = P[x £ 45.64] - P[x £ 13.84] = P x £ X 02.99 - P x £ X 02.025 = 0.99 - 0.025 = 0.965
[ ]
d) P[x £ 40] = P x £ X 02.96 = 0.96 mediante interpolación
38.9 40 41.9
a - 0.95 0.975 - a
¯ ¯ ¯ = Þ a = 0.96
40 - 38.9 41.9 - 40
0.95 a 0.975
Ejemplo 2
c) P( x £ a ) = 0.015 si r = 8
interpolando
2.18 a 1.65
a - 2.18 0.015 - 0.025
¯ ¯ ¯ =
1.65 - 2.18 0.01 - 0.025
0.025 0.015 0.01
a - 2.18 - 0.01
=
- 0.53 - 0.015
Þ a = 2.18 - 0.3533 = 1.8267
DEFINICIÓN
Sea una v.a. ó una población X~N(m,s2) donde m,y s2 son desconocidos, por lo
tanto se toma una m.a. de tamaño n para estimar la media x y la varianza S2 tal
que
2
a) x y S .son dos estadísticos independientes donde S 2
=
å (x - x )
i
2
además la
n
n -1
b) El estadístico
(n - 1)S ~X2(n-1) g.d.l. cuando n ® ¥
ˆ 2
s2
( )
c) E S 2 =
(n - 1)s 2
n
2
nS
d) ~ X2(n-1) g.d.l.
s 2
Ejemplo
Se tiene una población X ~ N(m,s2)del cual se toma una m.a. tamaño 15 y se tiene
S2. Calcular:
é S2 ù
a) P ê0.3107 £ ££ 1.9427ú ;
ë s 2
û
é Sˆ 2 ù
b) P ê0.3329 £ 2 £ 2.0814ú
ëê s ûú
SOLUCION
a)
é ù
S2
[
P ê0.3107 £ 2 £ 1.9427 ú = P 0.3107(0.15) £ X 142 £ 1.9427(15)
s
]
ë û
[ ] [ ] [
Þ P 4.6605 £ X 14 £ 29.1405 = P X 142 £ 29.1405 - P X 142 £ 4.6605 ;
2
]
Þ P[X 2
14 < X 02.99 ] - P[X < X ] = 0.99 - 0.01 = 0.98
2
14
2
0.01
b)
é ù
Sˆ 2
[
P ê0.3329 £ 2 £ 2.0814ú = P 0.3329(14) £ X 142 £ 0.20814(14)
s
]
êë úû
[ ] [
Þ P 4.6606 £ X 142 £ 2.91396 = P X 142 £ 2.91396 - P X 142 £ 4.6606 ] [ ]
= 0.991 - 0.01 = 0.98
Sii
FUNCION DE PROBABILIDAD
h ( r 2+1 )
f (t ) =
rPh ( )
[1 + ]: -¥ < t < ¥
r
t2
r
2
r=5
1) Es simétrica con respecto t=0=m
2) Cuando n o v se hace grande tiende a normalizarse r=3
t=0=m
ESPERANZA MATEMÁTICA
¥
E ( x) = m = E (T ) = ò t f (t )dt = 0; r > 1
-¥
VARIANZA
¥
V (T ) = s 2 = E (t 2 ) - (mt ) =
r
ò t 2 f (t ) dt - 0 2 = ;v > 2
2
-¥ r-2
USO DE TABLAS
Dada la importancia en la Estadística Inferencial y la complejidad de su calculo, se
tiene confeccionado tablas con 2 entradas.
ta
Ejemplo
SOLUCIÓN
EJEMPLO 2
SOLUCIÓN
DISTRIBUCIÓN DE
(x - m ) n
~t(n-1)g.d.l.
S
LA V. A. O ESTADÍSTICO
Ejemplo
DEFINICIÓN
FUNCIÓN DE DENSIDAD
ì
( )
ï v1 +v2 v21 v 221
ïh 2 v1 v 2
f F (Z ) = í ;0 < Z < a
( )( )
ï h 2h 2
v1 v2
ï 0
î
Cuya gráfica nos permite determinar sus características
ff(2)
F(10.2)
1) A medida que aumentan los F(10.2)
grados de libertad tienen a
normalizarse de manera positiva
MEDIA
v2
m (F ) = E(F ) = m = ; v2 > 2
v2 - 2
2) VARIANZA
Zv 22 (v1 + v 2 - 2)
s 2 (F ) = V (F ) = ; v2 > 4
v1 (v 2 - 2) 2 (v 2 - 4)
FUNCIÓN DE DISTRIBUCIÓN O ACUMULADA
F(x)
F ( x ) = P[F £ f a ] = a
a
1- a
fa = v.critico
USO DE TABLAS
Se tiene 3 entradas:
Ejemplo 1
p- p
ÞZ = : Z ~N(0.1)
pq N -n
n N -1
Ejemplo
Suponiendo que un lote de 50 ordenadores hay 10 defectuosos
Cual la probabilidad de que en una m.a. de tamaño n, ordenadores elegidos al
azar
1) Con reposición a)n=5 b)n=60 :i)20%; ii) más de 20% ordenadores sean
defectuosos
2) SIN REPOSICION
SOLUCION
10
1. con reposición :n=5; p = = 20 : q = 0.80
50
a)
i) X~b(5;0.20) donde
X:”Nº de PC ordenadores entre 5 con reposición
æ5ö
P( x ) = ç x ÷(0.20 ) (0.80) 5- x : Rx = 0,1,2...5
x
è ø
x= el 20% de 5=1
æ 5ö
Þ P[ p = 0.20] Þ P( x = 1) = ç1÷(0.20)(0.8) = 0.4096
4
è ø
ii ) P[ p > 0.20] = p[ X > 1] = 1 - P[ X £ 1] = 1 - B(1;5;0.20) = 1 - 0.7373 = 0.2627
b)
i) con n=60 como n>30 podemos aproximar mediante la normal
é11.5 - 12 12.5 - 12 ù
p (x = 12) = P ê £Z£ = P[- 0.16 £ Z £ 0.16]
ë 3.0984 3.0984 úû
P[Z £ 0.16] - P[z £ -0.16] = F (0.16) - F (- 0.16) = F (0.16) - 1 + F (0.16)
= 2 F (0.16) - 1 = 0.1272
æ 60 ö
Mediante la binomial P( x = 12) = ç12 ÷(0.20)12 (0.8)48 = 0.1278
è ø
Aplicando la verdadera distribución de la proporción, mediante
p- p 1
Z= donde el factor de corrección es
pq 2n
n
é 1 1 ù
P( p = 020) Þ P ê0.20 - £ p £ 0.20 + ú
ë 2(60) 2(60) û
P[0.1917 £ p £ 0.2083] ; estandarizado
é ù
0.1917 - 020 0.2083 - 0.20 ú
Pê £Z £ = P[- 0.16 £ Z £ 0.16]
ê (0.20 )(0.80 ) ( 0.20 )(0.80 ) ú
ë 60 60 û
x ± 0.5 - np
Z= Þ 1 - p[x £ 12 + 0.5] = 1 - P[x £ 12.5] donde np=(60)(0.2)=12
npq
é 12.5 - 12 ù
estandarizando 1 - P ê z £ = 1 - P[z £ 0.16] = 1 - F (0.16) = 1 - 0.5636 = 0.4364
ë 3.0984 úû
mediante la distribución de la proporción
p- p
Z= = cuyo factor de corrección es 1
2n
pq
n
é 1 ù
P[ p > 0.20] = 1 - P[ p £ 0.20] = 1 - P ê p £ 0.20 + ú
ë 2(60) û
é ù
0.2083 - 0.20 ú
1 - P[ p > 0.2083]es tan darizando Þ= 1 - P Z £ê
ê ( 0.20 )( 0.80 ) ú
ë 60 û
é 0.0083 ù
= 1 - Pêz £ = 1 - P[Z £ 0.16] = 1 - F (0.16) = 1 - 0.5636 = 0.4364
ë 0.0516 úû
UNIDAD III
UNIDAD III :ESTIMACION PUNTUAL Y POR INTERVALOS
Competencia:
-El estudiante debe saber construir los diferentes Intervalos de Confianza a partir de las
estimaciones puntuales utilizando las diferentes distribuciones de cualquier parámetro ,para
poder realizar Inferencia Estadística
Objetivos.
INTRODUCCIÓN
1. La estimación
2. Las pruebas de hipótesis
3. la teoría de la decisión
ESTIMACIÓN ESTADÍSTICA
PRUEBA DE HIPÓTESIS
MÉTODOS DE ESTIMACIÓN
ESTIMACIÓN PUNTUAL
Se dice que una estimación puntual cuando se obtiene un solo valor para cada
estadístico que nos permite aproximarnos al valor del parámetro en cuestion.
ESTADÍGRAFO
PARÁMETRO j
Es toda medida descriptiva que sintetiza alguna característica de la población cuyo
valor se obtiene de toda la población
j = f ( X 1, X 2 ,...X n ) cuyo valor j = g (x1 , x2 ,...xn )
ESTIMADOR ĵ
Se llama estimador de un parámetro a cualquier estadígrafo: y = g ( x1, x2 ,...xn ) que
nos permite aproximar al valor del parámetro.
- Un mismo parámetro puede tener varios estimadores puntuales, se elegirá
aquel que se aproxime mas al valor del parámetro j
- Para poder elegir el mejor estimador se debe recurrir a:
LAS PROPIEDADES DE UN BUEN ESTIMADOR
Se dice que un estimador es un buen estimador si cumple minimamente los
siguientes requisitos o propiedades.
1. INSESGABILIDAD
Sea un estimador cualquiera ĵ del parámetro j , entonces se dice que es
INSESGADO sii
La E [jˆ ] = j ó E [jˆ - j ] = 0
2. CONSISTENCIA
Se dice que un estimador insesgado es consistente sii
a) Lim E[ĵ ] = j
n ®¥
b) lím V [ĵ ] = 0
n®¥
3. EFICIENCIA
Considerando todos los posibles estimadores insesgados de un
parámetro j , será eficiente aquel que tiene mínima varianza, llamándose
también estimadores de mínima varianza del parámetro j .
Sean dos estimadores insesgados jˆ1 y jˆ 2 de j
V (jˆ1 )
Þ si V (jˆ1 ) < V (jˆ 2 ) ó < 1 Þ el estimador ĵ1 es mas eficiente que ĵ 2
V (jˆ 2 )
4. ERROR CUADRÁTICO MEDIO (MSE) ĵ
Sea un estimador jˆ = G (x1, x2 ...xn ) un jˆ de j
Þ MSE (jˆ ) = E [jˆ - j ] = Var (jˆ ) + [j - E (jˆ )]
2 2
Ejemplo
X1 ~ I (2j , s 2 ) Þ E ( X 1 ) = 2j ;V ( X 1 ) = s 2
X2 ~ I (4j , s 2 ) Þ E ( X 2 ) = 4j ;V ( X 2 ) = s 2
SOLUCIÓN
1) INSESGABILIDAD sabemos que E (jˆ ) = j
Para el 1er estimador ĵ1 Para el 2do estimador ĵ 2
éX X ù 1 éX X ù 1
E = ê 1 + 2 ú = E( X1 ) + E (X 2 ) ; E = ê 1 + 2 ú = E ( X1 ) + E ( X 2 )
1 1
ë 4 8 û 4 8 ë 10 5 û 10 5
1
(2j ) + 1 (4j ) = j Þ jˆ1 es insesgado; 1 (2j ) + 1 (4j ) = j Þ jˆ2 es insesgado
4 8 10 5
EFICIENCIA Será eficiente aquel estimador que tenga mínima varianza
æX X ö æX X ö
V (jˆ1 ) = V ç 1 + 2 ÷ V (jˆ 2 ) = V ç 1 + 2 ÷
è 4 8 ø
; è 10 5 ø
V (jˆ1 ) = V ( X 1 ) + V ( X 2 ) V (jˆ 2 ) = V (X 1 ) + V (X 2 )
1 1 1 1
16 64 100 25
V (jˆ1 ) = s + s = s V (jˆ 2 ) =
1 2 1 2 5 2 5 2
s
16 64 64 100
5 2
s
como 64 = 1.5625 > 1 Þ V (jˆ1 ) > V (jˆ 2 ) Þ El estimador ĵ 2 es mas eficiente que ĵ1
5 2
s
100
dj Sj
Ejemplo
Obtener el estimador de M.V. de lal probabilidad de éxitos “p” para una v.a.
x~Bernoulli, mediante el método de la M.V.
SOLUCIÓN
Sabemos que x~B(1,p) donde
P(x)= p x (1 - p)1- x ; x=0.1 donde 0<p<1
Sea una m.a. tamaño n : X 1 , X 2 ,...X n cuyos valores x1 , x 2 ,...x n donde
1) x~B(1,p) Þ p( xi , p ) = p xi (1 - p )1- x1 ; i = 1,2,...n
é n
ù
3) Þ aplicando logaritmos Þ L = ln V ( p ) = å xi ln p + ên - å X i ú ln (1 - p )
ë i =1 û
dL å xi n - å xi
4) Þ derivando con respecto a p e igualando a cero = + (- 1) = 0
dp p 1- p
5) Resolviendo la ecuación
åx i
=
n - å xi
Þ
1 - p n - å xi 1
= ; -1 =
n
-1
p 1- p p å xi p å xi
Þ
1
=
n
Þ pˆ =
åx i
Þ pˆ = x
p å xi n
2) MÉTODO DE LOS MOMENTOS
Este método consiste en igualar los primeros momentos muestrales originales con
los primeros momentos poblacionales originales m v' = M v'
Donde M v' = E (x r ) = å x r = å x r p(xi , j1, j 2 ...j k ) : v = 1,2,...k
M v' = E (x ) =
r åx v
i
n
m v' = ò x v f ( xi , j1 , j 2 ...j k )dx
Rx
Ejemplo
Sea una m.a. tamaño n : X 1 , X 2 ,...X n de una población X con distribución POISSON
con parámetro l Se pide estimar l .mediante el método de los momentos
SOLUCIÓN
Como solo se debe estimar un solo parámetro l , solo debemos hallar los primeros
momentos originales poblacionales y muestrales e igualarlos
Sabemos m1' = E ( X ) = m = l ; M 1' = å
X1
=X
n
Igualando m1' = M 1' Þ lˆ = X
INTRODUCCION
INTERVALO ALEATORIO
Es aquel intervalo que tiene por lo menos uno de sus extremos una variable
aleatoria.
donde
De acuerdo al tipo de sus limites se tiene 3 clases de IC. Suponiendo una v.a. o
una población X con DISTRIBUCIÓN de probabilidad f ( X ; j ) del que se toma una
m.a. tamaño n
Þ j 1 = G (X1, X2 ,....Xn); j 2 = G (X1, X2 ,....Xn) tal que j 1 < j 2
Þ tenemos:
( ) é
Þ El IC para m con s 2 (conocido) n ³ 30 = ê X ±
s Z0 ù
ú
ë n û
ERROR
1+ r
donde Z Þ P[Z £ Z 0 ] =
2
NOTA
1. Cuando no se conoce s y la m.a. n ³ 30 Þ se utiliza S
2. Cuando X~N (m , s 2 ) , aun cuando n<30, la definición del IC es valida
3. Cuando el muestreo es SIN REPOSICION de una población finita, se debe
corregir el ERROR
é s Z0 N -n ù
Þ El IC= ê X ± ú
ëê n N - 1 ûú
4. Cuando se quiere construir el IC para el total Þ
Þ [j , N ;j 2 N ] ó P[j , N £ TOTAL £ j 2 N ] = 100v%
Ejemplo
SOLUCIÓN
é s Z0 ù
a) Sabemos que el IC para m, con s 2 (conocida) cuando n ³ 30 = ê X ± ú
ë n û
1 + 0.95
Donde v=0.95 Þ Z 0 Þ P[Z £ Z 0 ] = = 0.975 Þ Z 0.975 = 1.96
2
X = 500 s » S = 100 n = 100
s Z0 s Z0 100(1.96)
EL ERROR = = = = 19.6
n n 100
é S Z0 ù é S Z0 ù
j1 = ê X - ú = 500 - 19.6 = 480.4; j 2 = ê X + ú = 500 + 19.6 = 519.6
ë n û ë n û
Þ El IC para m al 95% =[480.4;519.6]ó P[480.4 £ m £ 519.6] = 0.95
Significa que de 100 m.a que se toma de esa población; 95 m.a arrojaran un
promedio comprendido en el intervalo y solo 10 m.a. no se están comprometido
en el IC.
é s Z0 N -n ù
b) Como se conoce N=2000 Þ IC para m al 95% Þ ê X ± ú
ëê n N - 1 ûú
100(1.96) 2000 - 100
Þ ERROR= = 19.11
100 2000 - 1
j 1 = 500 - 19.11 = 480.89; j 2 = 500 + 19.11 = 519.11
Z 02 s 2 N
n=
Z 02 s 2 + E 2 ( N - 1)
Ejemplo
SOLUCIÓN
2
s Z0 æ S Z0 ö
a) Como el ERROR=10= Þ n = çç ÷÷
n è E ø
æ 60(1.96) ö
2
n=ç ÷ = 138.30 » 138
è 10 ø
60(1.961)
b) Como n=138 Þ El IC para m al 95% = 420 ±
138
é 117.6 ù
ê420 ± 11.7473 ú = [420 ± 10.0108] = [409.99;430.0108]
ë û
X ~. ( m xs y2 ) Y ~. (m y s y2 )
¯ ¯
m.a. tamaño n ³ 30 m.a. tamaño m ³ 30
X Y
é
s x2 s y ùú
2
El IC para m x - m y al 100v % = ê(x - y ) ± Z 0
+
ê n m ú
ë û
1+ v
Donde Z0 se obtiene mediante la P[Z £ Z 0 ] =
2
NOTA
Ejemplo
Una m.a. de 200 pilas de la marca “A” para calculadores muestra una vida media
de 140 hrs. y una desviación típica de 10 hrs. Otra m.a. de 120 pilas de la marca
“B” de una vida media de 125 hrs. Con una desviación típica de 9 hrs. determinar:
SOLUCIÓN
[ ]
x - y = (140 - 125) = 15 El IC para mx - m y al 95% = [15 ± 2.1246] = 12.88 £ m x - m y £ 17.12
Þ E=(2.575(1.0840)=2.7913
estima la proporción pˆ = = å
x xi
n n
é pˆ qˆ ù 1+ v
Þ El IC para “p” al 100v%= ê pˆ ± Z 0 ú donde Z 0 Þ P[Z £ Z 0 ] =
ëê n ûú 2
NOTA
Ejemplo
Se toma una m.a. de 600 estudiantes de una población estudiantil 360 sostuvieron
su preferencia por una determinada marca de CPU
SOLUCIÓN
360
a) Sabemos y n=600 ; x=360 Þ pˆ = = 0. 6
600
é pˆ qˆ ù
Þ El IC para “p” n ³ 30 = ê pˆ ± Z 0 ú ; v=0.95 Þ Z0=1.96
ëê n ûú
é pq ù
donde el error ê Z 0 ˆ ˆ ú = 1.96
(0.6)(0.4) = 1.96(0.02) = 0.0392
êë n úû 600
pˆ qˆ N -n
E = Z0
n N -1
n0 N Z 02 s 2 Z 02
n= donde ó n0 =
n0 + ( N - 1) E2 4E 2
para estimar la media para estimar la proporción
Ejemplo
Una importación de 2000 focos tiene una desviación típica de la duración de los
mismos de 100 hrs. El ingeniero de control de calidad desea determinar el tamaño
de la m.a. para estimar la duración promedio, con aproximación de ± 20 hrs. Del
promedio real con 95% de confianza.
SOLUCIÓN
Los datos son s=100; N=2000; E =20 v=0.95 Þ Z0=1.96
Como se conoce la población y no se conoce la proporción muestral
Þ utilizamos
96(2000) 192000
n= = = 91.65 » 92
96 + (1999) 2095
Ejemplo
El gerente de una agencia bancaria que tiene 1000 cuenta correntistas quiera
determinar la proporción de sus cuenta correntistas a los cuales les paga el sueldo
mensual, Para ello quiere determinar el tamaño de la m.a. con un error de ± 0.05
con un 90% de confianza
SOLUCIÓN
Z 02 pˆ qˆ
n0 = Cuando se quiere estimar la proporción cuando se conoce p̂
E2
Z 02
n0 = Cuando se quiere estimar la proporción cuando no se conoce p̂
4E 2
n0 N
n= donde N= tamaño de la población conocida
n0 + ( N - 1)
Ejemplo
SOLUCION
1ra fase
n0 =
Z 0s 2
=
(1.96)2 (100)2 = 96.04 » 96
E2 (20)2
2da fase
n0 N 96(10000) 960000
n= = = » 95
n0 + ( N - 1) 96 + 9.999 10095
INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE PROPORCIONES
n1 : x1 , x 2 ...x n n 2 : y1 , y 2 ... y n
x y
pˆ 1 = y qˆ1 = 1 - Pˆ1 pˆ 2 = y qˆ 2 = 1 - Pˆ2
n1 n2
é ù 1- v
ê(Pˆ1 - Pˆ2 ) ± Z 0 ú donde Z 0 Þ P[Z £ Z 0 ] =
pˆ 1 qˆ1 pˆ 2 qˆ 2
+
êë n1 n2 úû 2
Ejemplo
Un fabricante afirma que su nuevo producto de consumo popular prefieren mas los
varones que las mujeres. Para verificar tal afirmación se toma una m.a. de 250
varones hallándose que 175 prefieren el nuevo producto y otra m.a de 200
mujeres, hallándose que 120 prefieren el nuevo producto. Mediante un IC del 95%
para la verdadera diferencia de proporciones de preferencias entre hombres y
mujeres se puede concluir que el fabricante del nuevo producto tiene razón?
SOLUCIÓN
n1 = 250 var ones n 2 = 200 mujeres
x = 175 y = 120
175 120 Sabemos ;r=0.95 Þ Z0=1.96
pˆ 1 = = 0.7 pˆ 2 = = 0. 6
250 200
qˆ 2 = 0.3 qˆ 2 = 0.4
donde el ERROR
pˆ 1 - pˆ 2 =0.7-0.6=0.1
Sea una v.a. o una población X~N( m , s 2 ) donde se desconocen m , s 2 se toma una
m.a tamaño pequeño :n<30: n1 : x1 , x 2 ...x n del cual se estima n la media y varianza
åx å (x - x)
2
con x = y S =
i 2 i
respectivamente
n n -1
t0S t0S
Þ El IC para m con s 2 desconocido n<30= x - ;x+
n n
NOTA.-
1. Cuando el muestreo es un reemplazo de población finita
é t0S N -n ù
El IC para m al 100%= ê x ± ú
ëê n N - 1 ûú
2. Cuando se quiere estimar el total = [jˆ1 N ; jˆ 2 N ]
EJEMPLO
Los contenidos de 5 latas de café instantáneo de una determinada marca han
dado los siguientes pesos netos en grs.: 280, 290, 285, 275, 284
SOLUCION
Suponiendo que los pesos de las latas tienen distribución Normal:
t S
a) Sabemos que el IC para m al 100v% x ± 0
n
x=
åx i
= 282.8 : S 2 =
å (x i - x)
2
= 31.7 S = 5.6303
n n -1
2.776(5.6303)
El E = = 6.9898
5
El IC para m al 95% =[275.8102;289.7898]
t0S t0 S
b) Sabemos que jˆ 1 = x - ; jˆ 2 = x +
n n
t 0 (5.6303) (288.168 - 282.8) 5
jˆ 2 = 288.168 = 282.8 + Þ = t0
5 5.6303
1+ v
t 0 = 2.1319 Þ P[T £ 2.1319] = = 0.95
2
r = (0.95)2 - 1 = 0.90 = 90%
SOLUCIÓN
1.95
V=.95 P[t£t0]= Þ t 0.975;18 gdl = 2.101
2
“A” n=10; x =5.4 : Sx=1.35
“B” m=10: y =7 ; Sy=1.49
E =1.345
El IC para la m x - m y al 95%= [(5.4 - 7.3) m 1.345][- 1.9 m 1.345] = [- 3.245;-0.555]
Sea una v.a. ó una población X~N( m , s 2 ) con m , s 2 desconocidos. Se toma una
%= éê (n - 1)S 2 ; (n - 1)S 2 ùú
ê 2a 2
ú
ë x1- 2 ;(n-1) x 2 ;( n-1) û
a
Donde X 22- a ; X a2 son valores críticos que tienen distribución CHI cuadrado con (n-1)
2 2
a a
g.d.l., es decir P éê X 2 £ X a2 ùú = ; Péê X 2 £ X 12- a ùú = 1 -
ë 2 û 2 ë 2 û 2
CONSECUENCIA
é
El IC para s al 100v%= ê S
(n - 1) ; S
(n - 1) ùú
ê X 12- a X a2 ú
ë 2 2 û
Ejemplo
SOLUCION
åx å (x - x)
2
i 3023 i 4986.10
X= = = 302.3; S 2 = =
n 10 n -1 9
S2=554.0111 Þ S=23.5374
é ù
a) El IC para la s 2 ê (
al 90% = ê 2
n - 1)S 2 (n - 1)S 2 ú
: 2
X X a ( n -1) ú
êë 1- a2 ( n -1) 2 úû
[ ] [ ]
Þ P X 2 £ X 12- 0.10 ;9 g .d .l. = P X 2 £ X 02.95 ;9 Þ X 02.95 ;9 = 16.92
2
êë 2 úû
[ ]
P é X 2 £ X 12- 0.10 ;9 g.d .l .ù = P X 2 £ X 02.05 ;9 = 0.05 Þ X 02.05 ;9 = 3.325
é 9(554.011) 9(554.011) ù
=ê ; = [294.6867;1499.5786]
ë 16.92 3.325 úû
óP[294.6867 £ s 2 £ 1499.5786] = 0.90
m m -1
s 2
x S x2
El estadístico para es
s 2
y S y2
éS2 S x2 ù
s x2 ê x 1 ú
Þ El IC para la al 100v%= ; f
ê S y2 f1- a ;(n -1)( m -1) S y2 1- 2; ;(m -1)(n-1) ú
a
s 2y
ë 2; û
é 2 ù
s Sx 1 S x2
Þ El IC para la x al 100v%= ê ; f a ú
sy ê S y f 1- a ;(n -1)( m -1)
2
S y2 1- 2 ; ;(m-1)(n-1) ú
ë 2; û
P é F £ f 1- a : (n - 1)(m - 1)ù = 1 - a2
ê úû
donde ë
2
P é F £ f 1- a : (m - 1)(n - 1)ù = 1 - a2
êë 2 úû
EJEMPLO
SOLUCIÓN
r=0.95 a=0.05 n=8; m=6; S X2 =4.13 : S Y2 =2
a)
P é F £ f 1- 0.05 : 7.5 g.d .l.ù = P[F £ f 0.975 : 7.5] Þ f 0.975;7.5 = 6.85
êë 2 úû
b)
sx
Þ El IC para la al 95%= [0.5491;3.3051]
sy
é sx ù
ó P ê0.5491 £ £ 3.3051ú = 0.95
ëê sy ûú
Competencia:
-El estudiante debe utilizar correctamente las diferentes formas del protocolo para
efectuar pruebas de hipótesis ,tanto paramétricas como no paramétricas sobre cualquier
parámetro o distribución de una población para la toma de decisiones coherentes.
Objetivos.
PRUEBAS DE HIPOTESIS
INTRODUCCIÓN
HIPÓTESIS ESTADÍSTICA
Una hipótesis estadística es una afirmación ó conjetura con relación a los valores
de los parámetros ó con relación a las distribuciones de una ó más variables
aleatorias o poblaciones.
De acuerdo a su especificación tenemos 2 tipos de hipótesis:
TIPOS DE ERRORES
1) ERROR TIPO I
Se comete este tipo de error cuando se rechaza H0 y se acepta H1 cuando
H0 es verdadera.
2) ERROR TIPO II
Se comete este tipo de error cuando se rechaza H0 y se acepta H1 cuando
H0 es falsa.
Estos errores se los resume de la siguiente manera
NATURALEZA
H0 :VERDADERO H1: VERDADERO
DECISION
ACEPTA H0 CORRECTA ERROR TIPO II
ACEPTA H1 ERROR TIPO I CORRECTA
NIVEL DE SIGNIFICANCIÓN
Al cometer estos tipos de errores, se presentan bajo 2 niveles de significación:
1) NIVEL a DE SIGNIFICACIÓN
Significa:
P[comete error tipo I]= P[rechazar H0/H0 verdadero]
2) NIVEL b DE SIGNIFICACIÓN
Significa:
P[comete error tipo II]= P[aceptar H0/H0 verdadero]
Generalmente el nivel de significación mas utilizado es a =10%, 5%, 1%, para
tomar decisiones se deben establecer regiones críticas y /ó regiones de
aceptación.
TIPOS DE PRUEBA
De acuerdo a los planteamientos de los problemas se tiene 3 tipos de pruebas:
1. BILATERAL
Planteamiento
H0 :j = j0 vs H1 : j ¹ j 0
donde j = cualquier parámetro (m , s 2 , etc ), j 0 = valor del parámetro
2. UNILATERAL DERECHA
Planteamiento
H 0 : j £ j 0 vs H1 : j > j 0
3. UNILATERAL IZQUIERDA
Planteamiento
H 0 : j ³ j 0 vs H1 : j < j 0
Nota.- El tipo de prueba lo sugiere generalmente la hipótesis alterna.
PROCEDIMIENTO PARA DOCIMAR
1. Plantear las hipótesis
H 0 : j = j 0 vs H 1 : j ¹ j 0 Bilateral
H 0 : j £ j 0 vs H 1 : j > j 0 Unilateral Derecha
H 0 : j ³ j 0 vs H 1 : j < j 0 Unilateral Izquierda
2. Elegir el nivel de significación a =10%, 5%, 1% si no se conoce a se elige
a = 5%.
3. Elegir el estadístico de prueba apropiado, cuya distribución muestral sea
conocido, bajo el supuesto de que H0 es cierto
4. Establecer la RC ó la RA (determinando los valores críticos: tablas)
5. Determinar o calcular los valores de los estadísticos de prueba
6. Comparar estos valores con la RC y /o RA y concluir si:
El valor calculado Î RC Þ rechazar H0 y aceptar H1
El valor calculado ÏRC Þ aceptar H0 y rechazar H1
El valor calculado Î RC Þ aceptar H0 y rechazar H1
Al nivel a de significación.
El estadístico de prueba es x ®
( x - m0 ) n
; Z ~N(0.1) también se puede utilizar S
s
en reemplazo de s cuando no se conoce
TIPO DE PRUEBA
UNILATERAL DERECHA
H 0 : m £ m 0 vs H1 : m > m 0 Z1-a ;a
UNILATERAL IZQUIERDA
H 0 : m ³ m 0 vs H1 : m < m 0 - a ® Za
Ejemplo
Un banco estudia la posibilidad de abrir una sucursal en la ciudad de “El Alto”,
para ello establece el siguiente criterio para tomar la decisión “abrir la sucursal si
el ingreso per cápita familiar no es menor a Bs. 500.- en contrario no abrir”. Para
ellor toma una m.a. de 100 ingresos familiares, de esa ciudad la que da una media
de Bs. 480.-
a) Cuál es la decisión a tomar al nivel del 5% de significación suponiendo que la
desviación típica de esa población es de Bs. 50.-
SOLUCION
Planteamiento:
1) H 0 : m ³ 500 vs H1 : m < 500 x = 480 : s = 50 : n = 100
abrir la sucursal No abrir la sucursal
2) a =5% = 0.05
3) El estadístico de prueba es x ®
(x - m0 ) n ; ~N(0.1)
s
4) La RC = - a ; Z 0.05 = - a ;-1.645
5) Calculando Z C =
(480 - 500) 100
= -4
50
6) Comparando: Como Zc=-4 Î RC Þ Rechazamos H0 y aceptamos H1, es decir
no debe abrir la sucursal al 5% de significación.
PRUEBA RELATIVA A LA MEDIA: MUESTRAS PEQUEÑAS n<30 DE UNA VARIABLE O
POBLACION NORMAL
El estadístico de prueba es x ® T =
( x - m0 ) n
t ~(n<1) g.d.l.
s
Ejemplo
SOLUCION
Planteamiento
H 0 : m = 152 vs H1 : m ¹ 152 x = 154 : S = 2.7386
abrir la sucursal No abrir la sucursal
a =5% = 0.05
El estadístico de prueba es x ® T =
(x - m0 ) n
.
s
La RA = - t1- 0.05 ; t1- 0.05 = -t0.975 ;8 gdl = -2.306
2 2
RA = - 2.306 : 2.306
Calculando Tc =
(154 - 152) 9
= 2.1909
2.7386
Comparando: Como Tc=2.1909 Î RA Þ aceptamos H0 y rechazamos H1, es decir
el ingreso per cápita ha cambiado al 5% de significación.
( )
Sean 2 v.a. ó 2 poblaciones Y~ (m xs x2 )y Y~ m ys 2y donde m se desconoce
Se quiere verificar si existe diferencia significativa entre las medias de las 2
poblaciones
(x - y )(m x - m y )
El estadístico de prueba es ( x - y ) ® Z = ~N(0.1)
s x2 s y2
n
+ n
Se puede utilizar S 2 en reemplazo de s 2
UNILATERAL DERECHA
H 0 : m x - m y £ 0 vs H1 : m x - m y > 0 Z1-a ;a
UNILATERAL IZQUIERDA
H 0 : m x - m y ³ 0 vs H1 : m x - m y < 0 - a ® Za
Ejemplo
a=0.05
(x - y )(m x - m y )
El estadístico de prueba ( x - y ) ® Z = ~N(0.1)
s x2 s y2
n
+ m
Zc =
(0.1360 - 0.083) - 0.050 = 0.033
= 29.154
( 0.004 )
+ (0.005 )
2 2
0.001131923
32 32
( )
Sean 2 v.a. ó 2 poblaciones X~N (m xs x2 )y Y~N m ys 2y donde m y s 2 se desconoce
para verificar si existe diferencia significativa entre las medias poblacionales
mediante 2 muestras aleatorias pequeñas n<30 y m<30
UNILATERAL DERECHA
H 0 : m x - m y £ 0 vs H1 : m x - m y > 0 t1-a ;a
UNILATERAL IZQUIERDA
H 0 : m x - m y ³ 0 vs H1 : m x - m y < 0 - a - ta
Ejemplo
Diez barras de acero fabricadas por un proceso A tienen una fuerza de ruptura
media de 50, con una desviación estándar muestral de 10; muestras que 8
fabricadas por un proceso B, tienen una fuerza de ruptura media de 55 con una
desviación estándar muestral de 12. Suponiendo que la población de fuerzas de
ruptura normal con la misma desviación estándar, ......... con un nivel de
significancia del 5% la hipótesis que los 2 procesos producen acero de la misma
fuerza en contra de la posibilidad que no es así.
SOLUCION
H 0 : m A = mB vs H1 : m A ¹ m B
a=0.05
( )
Para realizar la prueba de hipótesis para la varianza poblacional s 2 se utiliza el
estadístico de prueba
UNILATERAL DERECHA
H 0 : s 2 £ s 02 vs H1 : s > s 02 Si X c2 > X 11 - a ; (n - 1)
UNILATERAL IZQUIERDA
H 0 : s 2 ³ s 02 vs H1 : s < s 02 Si X c2 > X 12a ; (n - 1)
Ejemplo
Una m.a. de 10 objetos elegidos al azar entre los producidos en cierta planta
industrial han mostrado los siguientes pesos en grs. 71, 66, 64, 72, 69, 67, 70, 68,
65, 69. Podrá aceptarse la hipótesis de que la varianza de los pesos de los
objetos es igual a 4 grs2 al 5% de significación. Suponiendo que la población de
los pesos tiene distribución normal.
SOLUCION
H 0 : s 2 = 4 grs 2 vs H1 : s ¹ 4 grs 2
a=0.05
El estadístico de prueba es S 2 ® X 2 =
(n - 1)S 2 ~X2 (n-1) gdl
s 02
Media x = 68.1 : Desviación S=2.60128
RA=(2.70 : 19.2)
9(2.60128)
2
Como X c =
2
= 15.225
4
Como X c2 =15.225 Î RA (2.7 ; 19.02) aceptamos H0 y rechazamos H1, es decir la
varianza es de 4 grs2 al 5% de significación.
S x2
F= ~F (n-1)(m-1) gdl
S y2
TIPO DE PRUEBA R.A (ACEPTAR H0 Y R.A (RECHAZAR H0
RECHAZAR H1) Y ACEPTAR H1)
BILATERAL
H 0 : s 12 = s 22 vs H1 : 12s ¹ s 22 f a ( n - 1)(m - 1); f1- a ( n - 1)(m - 1) |
2 2
UNILATERAL DERECHA
H 0 : s 12 £ s 22 vs H1 : 12s > s 22 Si F<fa;(n-1)m-1)
UNILATERAL IZQUIERDA
H 0 : s 12 ³ s 22 vs H1 : 12s < s 22 Si F>fa;(n-1(m-1)
Ejemplo
presentan estos datos suficiente evidencia para concluir que la varianza de los
pesos de A y B ya no son iguales? Suponiendo poblaciones normales use a=0.05
Planteamiento
H 0 : s 12 = s 22 vs H1 : 12s ¹ s 22
a=0.05
Sˆ x2
El estadístico de prueba es F = ~Fa(7.5)
Sˆ y2
RA= f 0.05 ;7.5; f1- 0.05 ;7.5 = f 0.025 ; f 0.975 = 0.189;6.85
2 2
4.125
Fc= = 2.0625
2
Como Fc Î RA = aceptamos H0 y rechazamos H1, es decir que las varianzas de la
producción de A y B son iguales al 5% de significación.
Ejemplo
Se quiere determinar si existe menos variabilidad en el plateado realizado por al
CIA A que en el efectuado por la CIA B. Si muestras aleatorias independientes de
tamaño 12 del trabajo desempeñado por las compañías producen SA=0.062 mil.
Pruébese la hipótesis de que s 12 = s 22 contra s 12 < s 22 con un nivel de significancia
del 5%
SOLUCION
a=0.05
Sˆ x2
El estadístico de prueba es F = ~Fa(n-1)(m-1)
Sˆ y2
(0.062 )2
Calcular Fc= = 3.14
(0.035)2
Como Fc =3.14>F2.82 rechazar H0 y aceptar H1, por lo tanto el plateado realizado
por la CIA A es menor variable que el plateado efectuado por la CIA B al 5% de
significación.
Para efectuar la prueba sobre una proporción en base a muestras grandes que
........de poblaciones Binomiales se utiliza el estadístico:
x - np0 pˆ - p x
Z= = p q 0 ~ Z~ N(0,1) donde pˆ =
np0q0 0 0 M
n
UNILATERAL DERECHA
H 0 : r £ r 0 vs H1 : r > r 0 Z1-a ;a
UNILATERAL IZQUIERDA
H 0 : r ³ r 0 vs H1 : r < r 0 - a (-) Za
SOLUCION
H 0 : r = 0.30 vs H1 : r ¹ 0.30
100
a=0.01 rˆ = = 0.25
400
pˆ - p0
El estadístico de prueba Z = p0 q0
~ Z~ N(0,1)
n
0.25 - 0.30
Como Z c = ( 0.30 )( 0.70 )
= -2.1834
400
Ejemplo
SOLUCION
H0: r = 0.90 vs H1: r < 0.90
174
a=0.05 rˆ = = 0.87
200
RC= - a : Za = - a : Z 0.05 = - a : -1.645