You are on page 1of 85

UNIVERSIDAD SALESIANA

DE BOLIVIA
CARRERA DE INGENIERÍA DE SISTEMAS

DOSSIER
INFERENCIA PROBABILÍSTICA
Cuarto Semestre

PORFIRIO ARDUZ URQUIETA


I - 2011
I ÍNDICE DEL CONTENIDO:
PAG.
UNIDAD I DISTRIBUCIONES DE PROBABILIDAD 2
1.1.Introducción –Distribución Bernoulli 3
1.2.Distribución Binomial 5
1.3.DistribuciónGeométrica 8
1.4.DistribucionPascal 9
1.5Distribución Multinomial 11
1.6Distribución Hipergeométrica 13
1.7Distribución Multivariante 17
1.8Distribución Poisson 18
1.9Distribución Uniforme 23
1.10Distribución Exponencial 25
1.11Distribución Normal 28
1.12 Teorema Central del límite 31
1.13Aproximaciones a la Normal 33

UNIDAD II DISTRIBUCIONES MUESTRALES 37


2.1.Población ,muestra aleatoria. 38
2.2 Distribución muestral de la media 39
2.3Distribución Chi Cuadrado 41
2.4Distribución T-student 45
2.5.Distribución F-Fisher 47
2.6.Distribución muestral de la Proporción 49

UNIDAD III ESTIMACIÓN PUNTUAL Y POR I.C. 52


3.1.Estimación puntual 53
3.2 Propiedades de un buen estimador 54
3.3Métodos de estimación puntual 56
3.4 Estimación por Intervalos de confianza 58
3.5.Tamaño muestral para estimar la media 61
3.6.Tamaño muestral para estimar la proporción 64
3.7.Tamaño muestral para poblaciones finitas 65
3.8.Intervalo de confianza para diferencia de proporciones 66
3.9.Intervalo de confianza para la media con varianza desconocida 67
3.10.Intervalo de confianza para la varianza 69
3.11.Intervalo de confianza para la razón de varianzas 70

UNIDAD IV PRUEBA DE HIPÓTESIS 72


4.1.Hipótesis Estadística 73
4.2 Tipos de errores 73
4.3.Pruebas relativas a medias y la varianza 75
4.4.Pruebas relativas a proporciones 82
UNIDAD V ANÁLISIS DE REGRESIÓN Y CORRELACIÓN 84
5.1Distribuciones Bidimensionales Correlación lineal 84
5.2.Regresión lineal simple 87
5.3. Coeficiente de determinación 87
5.4 Técnicas de estimación 88
5.5 Extensión de la Regresión lineal simple 90
5.6 Modelos de Regresión múltiple 93

PRACTICAS
Práctica Nº1 Modelo Binomial 95
Práctica Nº2 Modelo Geométrico y Pascal 95
Práctica Nº3 Modelo Multinomial 96
Práctica Nº4 Modelo Hipergeométrico 96
Práctica Nº5 Modelo Multivariado 97
Práctica Nº6 Modelo Poisson 97
Práctica Nº7 Modelo Uniforme 98
Práctica Nº8 Modelo Exponencial 98
Práctica Nº9 Modelo Normal 99
Práctica Nº10 Teorema central del Límite 100
Práctica Nº11 Aproximaciones a la Normal 100
Práctica Nº12 Distribución muestral de la Media 101
Práctica Nº13 Distribución muestral de la Proporción 102
Práctica Nº14 Distribución muestral de la Varianza 102
Práctica Nº15 Distribución T-Student 103
Práctica Nº16 Distribución F-Fisher 103
Práctica Nº17 Estimación puntual 103
Práctica Nº18 Estimación por I.C. 104
Práctica Nº19 Pruebas de Hipótesis sobre la Media y Varianza 107
Práctica Nº20 Pruebas sobre Proporciones 108

BIBLIOGRAFIA 109

GLOSARIO 110
PRESENTACIÓN

El presente Dossier se realizó en coordinación con los docentes de la Materia con el fin de
que cualquier estudiante del cuarto nivel de Ing. de Sistemas, pueda facilitar su proceso de
aprendizaje y enseñanza,de tal manera que :
-Identifique y utilice los modelos probabilísticos en problemas inherentes a variables
aleatorias
-Utilice la Docimasia de Hipótesis para probar,verificar, alguna característica de una
población.
_Utilice correctamente el análisis de regresión en la predicción,mediante el proceso de
aprendizaje cooperativo.
Cabe aclarar que el Dossier ha sido actualizado de acuerdo al formato emanado del Depto
de Planificación.
Es decir al principio de cada unidad, se incorporó las competencias su objetivo,la
descripción específica de la unidad ,las lecturas complementarias, la bibliografía básica y
electrónica .En cuanto a las prácticas se insertó al final del presente conjuntamente las
tablas y el glosario de términos técnicos elementales
La unidad I comprende el desarrollo de los principales modelos probabilísticos más
utilizados en la Ingeniería,
La unidad II trata sobre las distribuciones muestrales o especiales como (t-student,Chi
cuadrado,y la Fisher) más utilizadas en la Inferencia
La Unidad III está abocado a la estimación tanto puntual como por intervalos de confianza
De los principales parámetros de una población
La unidad IV se refiere a la realización de las diferentes pruebas de hipótesis paramétricas
principalmente y no paramétricas
Finalmente la unidad V trata sobre el análisis de la regresión en la predicción,el mismo que
está en power point
Por lo tanto el presente documento está basado en 4 partes:
I la Introducción
II El contenido o cuerpo del dossier
III Prácticas
IV Tablas estadísticas
V Bibliografía
VI Glosario

Esperamos que el presente documento sea de mucha utilidad para los estudiantes por lo que
estamos prestos a recibir sugerencias para que el mismo pueda ser mejorado.

La Paz ,28 de Febrero del 2011

Lic. Porfirio Arduz Urquieta.


UNIDAD N° 1

DISTRIBUCIÓN DE PROBABILIDADES

Competencia:

-Identifica y utiliza correctamente los modelos probabilísticos en la resolución de


problemas inherentes a variables aleatorias en forma general.

Objetivos.

-Resolver correctamente todo tipo de problema que tengan que ver con la incertidumbre ,
mediante la utilización de los modelos probabilísticos

Descripción general de la unidad:

-Esta unidad comprende el desarrollo de las diferentes distribuciones de probabilidades


tanto discretas como las continuas con sus respectivas características más aplicadas en el
campo de la Ingeniería
Tema Nº1 :Distribuciones Discretas
Competencia: Identifica y utiliza los Modelos de Distribuciones Discretas en la resolución
de problemas inherentes a variables aleatorias discretas
Descripción del tema:Se desarrollarán los principales Modelos de Distribución Discretos,
con sus respectivas características,para su posterior aplicación a la resolución de problemas.
Tema Nº 2:Distribuciones Continuas
Competencia: Identifica y aplica los principales Modelos de Distribución Continuos en la
resolución de problemas inherentes a variables continuas
Descripción del tema:Se desarrollarán los Modelos de distribución Continuas más
utilizadas en la Ingeniería de acuerdo a sus características,y su posterior aplicaciópn en la
resolución de problemas.

Lectura:Millar/Freund/Jonson “Probabilidad y Estadística para


Ingenieros”Edo.de México 1992 Pgs. 93 al 128
Bibliografía Básica: Moya y Saravia (1988) “Probabilidad e Inferencia
Estadística((2ª ed) Perú .Pags.407 al 553

Referencia electrónica:
http://www.itchihuahua.edu.mx/academic/industrial/sabaticiruta/private/01UNIDAD%20I
V.uhtm
INTRODUCCIÓN

Entre uno de los objetivos de la Estadística Matemática es de determinar una


distribución de probabilidad o un modelo probabilistico que satisfaga una serie de
supuestos para analizar los resultados obtenidos de un experimento aleatorio.

Entre las distribuciones de probabilidades tenemos:

a) Las distribuciones discretas como ser la Bernoulli, Binomial, Hipergeométrica,


Geométrica, Poisson, etc.
b) Las Distribuciones continuas tenemos la Uniforme, Experimental, la Normal, X2,
F, t

DISTRIBUCIONES DISCRETAS
Son aquellas distribuciones cuya variable aleatoria es discreta

1.DISTRIBUCIÓN BERNOULLI : X~Bernoulli (p)

Se tiene la distribución Bernoulli, cuando las pruebas ó ensayos son de carácter


dicotómico, es decir sólo tienen 2 posibles resultados:

E = éxito ; F = fracaso Þ e Þ W = [ E, F ] por ejemplo:


Sean los siguientes experimentos aleatorios:

e1 : “Lanzar una moneda” Þ W1 = [C , S ]


e 2 “Determinar el sexo del ” Þ W 2 = [V , M ]
e 3 : “verificar el resultado de un examen” Þ W 3 = [a, r ]

DEFINICIÓN

Se dice que una v. d. X~Bernoulli sii sv Rx= [0,1]; donde la V.A.D. x:” N° de éxitos
obtenidos en un ensayo dicotómico”; cuya

FUNCIÓN DE PROBABILIDAD O CUANTÍA p(x)=p[X=x]=p x(1-p)1-x; Rx= 0.1

Donde
p = probabilidad del éxito
q = probabilidad del fracaso
de tal manera que p+q=1
ó p = 1-q
ó q = 1-p
cuya distribución de probabilidad y representación gráfica es:
x P(x)
0 q
1 p

P(x)

p
q
x

0 1

FUNCION DE DISTRIBUCION ACUMULADA F (x)

F(x) = p (X £ x) = 0 si x<0
q si 0 £ x<1
1 si x³1

CARACTERISTICAS

Entre sus principales caracteristicas tenemos:

1) LA MEDIA
x 0 1
E ( x) = m = å xP( x) = p
P ( x) 9 p
E ( x) = m = 0(q ) + 1( p) = p
xP( x) 0 p

Mediante la F.g.m. sabemos que uno de los teoremas de la f.g.m.

d r M x (t )
m'r = por lo tanto debemos antes determinar
dt r t =0
[ ] å
la fgm = M x (t ) = E e tx = etx p x q1- x desarrollando la å
0 1-0 1 1-1
fgm = M x (t ) = e t ( 0)
p q +e t (1)
pq = q+etp
d ' (q + et p )
sabemos que E ( x ) = m = m '1 = t =0
= 0 + pet t =0 pe0 = p
dt '

2) LA VARIANZA

V ( x) = s 2 = E ( x 2 ) - m 2 = åx 2
p x q1- x - p 2
V ( x ) = s 2 = 0 2 p 0 q1-0 + 12 pq 0 - p 2 = p(1 - P) = p.q
mediante la f.g.m. V ( x ) = s = m '2 - m 2 2
donde m ' 2 =
d ' ' M x (t ) d ' q + et p
=
[ ] = pe t = pe 0 =
t =0 t =0 t =0 p
dt ' ' dt '
Þ V ( x ) = p - p = p(1 - p) =
2 p.

DISTRIBUCIÓN BINOMIAL X~ B(n,p) ó b(x :np)

Se llama experimento aleatorio binomial a un N° fijo “n” de reiteraciones


independientes de un experimento aleatorio Bernoulli que tiene las siguientes
característica:

1. Los resultados de cada prueba son de carácter dicotómico, es decir Bernoulli


2. Las n pruebas Bernoulli son independientes
3. La probabilidad de éxito “p” supuestamente se mantiene constante en cada
prueba

DEFINICIÓN una v.a.d X~b(n,p), donde

X : “ N° de éxitos obtenidos en “n” ensayos Bernoulli” con Rx = 0,1,2,3,... n cuya

FUNCIÓN DE PROBABILIDAD O CUANTÍA

n
P(X)= P[X=x]=( x )pxqn-x:Rx0,1,2,3...n

Donde
p = probabilidad de éxito
q = probabilidad de fracaso
n = N° de ensayos Bernoulli

FUNCIÓN DE DISTRIBUCIÓN Ó ACUMULADA F(x)

0
x
si x < 0
n
F(x)= P(X £ x) =B(x;np)= å (k ) p q k n-x
si 0 £ x < n
k =0
1 si x > n

CARACTERÍSTICAS

n
1) LA MEDIA E ( x) = m = å xP( x) = å x( x) p
Rx
x
q n- x = np

n
2) LA VARIANZA V ( x) = s 2 = E ( x 2 ) - m 2 = åx 2
( x) p x q n - x - (np) 2 = npq

[ ]
3) LA FGM M x (t ) = E e tx = [1 + p(e t - 1)]n
RESOLUCIÓN DE PROBLEMAS CON MODELOS PROBABILISTICOS

Para resolver correctamente problemas inherentes a modelos probabilìsticos, se


sugiere en un principio seguir los siguientes pasos:

1. Determinar el tipo de distribución de probabilidad que sigue la v. a. X de


acuerdo las características del experimento en cuestión.
2. Definir la v. a X de manera clara y completa con su Rx.
3. Determinar los parámetros de la función de probabilidad.
4. Utilizar correctamente la función de probabilidad, ó la acumulada ó tablas ó
CPU.

Ejemplo

La probabilidad de que cierto ordenador de cierta marca determinada falla, ante


una descarga eléctrica es del 1% ¿cuales son las probabilidades de que entre 10
ordenadores de dicha marca en un laboratorio.

a) 3 fallen
b) a lo más 2 fallen
c) al menos 3 fallen
d) el promedio y varianza que un ordenador falle

SOLUCIÓN

1) Como todo ordenador tiene sólo 2 posibles resultados falle o no falle


(dicotómico)
2) Suponiendo que cada ordenador funciona independientemente
3) Suponiendo que la probabilidad de falla de los ordenadores es casi constante

n
Entonces asumimos que la v.a.d. X~ b(n. p) Þ P(x)=( x )px qn-x Rx =0,1,2....n

Donde la v. a. d. X: “N° de ordenadores que fallan ante una descarga eléctrica de


entre 10”
æ 10 ö
n=10: p=0.01:q=0.99 Rx=0,1,2.......10 Þ P( x) = ç x ÷0.01 x 0.9910 - x ; R x = 0,1,2...10
è ø

æ 10 ö
a) 3 fallen Þ P ( x = 3) = ç 3 ÷(0.01) 3 (0.99) 7 = 0.00011
è ø
2
b) a los más 2 fallen Þ P( x £ 2) = å P( x ) = P(0) + 1P(1) + P(2) = 0.9999
0
10
c) al menos 3 fallen Þ P( x ³ 3) = å P( x) = P(3) + P(4) + ... + P(10)
3
mediante el complemento Þ P( x ³ 3) = 1 - P( x £ 2) = 1 - 0.9999 = 0.00011

d) El promedio E(x)=np=10(0.01)=0.1=10%La Varianza


V(x):npq=10(0.01)(0.99)=0.099

APLICACIÓN DE LA BINOMIAL EN EL MUESTREO

Considerando cada elemento de una muestra aleatoria (m.a.) como un ensayo


Benoulli entonces la Distribución Binomial puede aplicarse en el muestreo bajo las
siguientes circunstancias:

1. Cuando el muestreo es con o sin reemplazo de una población infinita o muy


grande
2. Cuando el muestreo es con reemplazo de una población pequeña o finita

Bajo estas 2 circunstancias entonces la v.a.d. X se define

X:”N° de elementos de la clase de nuestro interés en una m.a. de tamaño n”

K N °de elementos denuestro int eres


Donde p = =
N Población
x n-x
æ n öæ k ö æ kö
p( x) = P[ X = x] = ç x ÷ç ÷ ç1 - ÷ : x = 0,1,2,3...n
è øè N ø è Nø

NOTA.- en la práctica el muestreo se lo realiza sin reemplazo de poblaciones


finitas especialmente cuando se realiza control de calidad, por lo tanto la
distribución adecuada es la hipergeométrica.

USO DE TABLAS

Cuando el tamaño de la m.a. es muy grande ( n ³ 30) el cálculo de las


probabilidades resulta tedioso porque lo que se sugiere utilizar paquetes
estadísticos ó las tablas las que están construidas en términos de la función de
distribución ó acumulada F(x); para ello se debe utilizar las siguientes relaciones

Para probabilidades acumuladas


x
F ( x) = P[X £ x ] = B( x; n. p) = å b(k ; n. p); x = 0,1,2....n
k =0

Para probabilidades puntuales

P(x=x)=b(x:n.p)= B(x:n;p)-B((x-1);n.p)
Ejemplo

En una importación de computadoras muy grande, se sabe que por experiencia


que el 25% de las mismas están infectadas con cierto virus. Se relaciona al azar
20 computadoras del lote de importación, para efectuar un control de calidad.

a) Cual es la verdadera distribución de probabilidad y cual debe asumirse por


necesidad del N° de computadoras infectadas con el virus
b) Cual es la probabilidad de que 3 cpu estas infectados
c) Cual la probabilidad que más de 3 estén infectadas
d) Determinar la media, la varianza y la desviación estándar

SOLUCIÓN

a) Como se trata de realizar un control de calidad la verdadera distribución es la


hipergeométrica, pero como no se conoce la población N se asume la
æ 20 ö
distribución Binomial. X b(n,p) Þ p( x ) = ç x ÷(0.25) x (0.75) 20- x x = 0,1.2...20
è ø
Donde P=0.25; q=0.75; n=20; x:”N° de CPU infectados en una m.a. de 30”
Rx=0,1,2......20
æ 20 ö
b) P P( x = 3) = ç 3 ÷(0.25)3 (0.75)17 = 0.1339
è ø
Tablas P(x=3)=b(3;20;0.25)=B(3;20;0.25)-B(2;20;0.25)=0.2252-0.0913=0.1339
c) P(x > 3) = åP(x) =1 - P(x £ 3) =1 - éêæç 0 ö÷(0.25)0 (0.75)20 + æç 1 ö÷0.25(0.75)19 + æç 2 ö÷0.252 (0.75)18 + æç 3 ö÷0.253 (0.75)17ùú = 0.7748P
20 20 20 20 20

4 ëè ø è ø è ø è ø û

tablas P[x>3]=1-P[x £ 3]=1-B(3;20;0.25)=1-0.2252=0.7748


d) E ( x) = m = np = 20(0.25) = 5 ;V ( x ) = s 2 = npq = 20(0.25)(0.75) = 3.75s = 1.94

DISTRIBUCIÓN GEOMÉTRICA

Esta distribución es una de los casos especiales de la Binomial y se utiliza cuando


existe un proceso Bernoulli y se desea obtener el primer éxito.

DEFINICIÓN

Se dice que la v.a.d.x...G(p): donde p= probabilidad del éxito en cada intento


Donde X:”N° de ensayos Bernouli hasta obtener el 1er éxito “Rx=1,2,3...

FUNCIÓN DE PROBABILIDAD P(x)=P[x=x]=pqx-1 : Rx=1,2,3...

FUNCIÓN DE DISTRUBUCION F(x)=P[x £ x]= 0 si x<1


1-qx si ³ 1
å xP( x) = p
1
LA MEDIA E ( x) = m =

q
LA VARIANZA V ( x) = s 2 = E ( x 2 ) - m 2 =
p2
q
LA DESVIACIÓN TÍPICA s = V ( x) =
p2

LA f.g.m M x (t ) = p[q - e t q 2 ] =
-1 p
q - et q 2

PROPIEDADES

1. No tiene memoria
2. Es decreciente, es decir P[x]<P(x-1) "x = 2,3

Ejemplo

1. Si la probabilidad que un postulante para aprobar la tesis en un intento al


finalizar sus estudios académicos es del 75% ¿cuál la probabilidad de que un
postulante apruebe la tesis?

a) En el primer intento
b) En el segundo intento
c) En el cuarto intento
d) Cual su esperanza matemática

SOLUCIÓN

Como X~G(p) Þ P(x)=0.75(0.25)x-1 Rx =1,2,3...donde p=0.75; q=0.75; “Nº de


intentos hasta aprobar la tesis”

a) Primer intento X=1 ) Þ P(x=1)=(0.75)(0.25)1-1=0.75=75%


b) Segundo intento X=2 Þ P(x=2)=(0.75)(0.25)2-1=0.1875 @ 19%
c) Tercer intento X=4 Þ P(x=4)=(0.75)(0.25)4-1=0.0117 @ 2%

Ejemplo

2. Suponga que la probabilidad de obtener línea durante la mayor congestión de


llamadas telefónicas de un canal de TV es del 3% en cada intento que se haga.

Calcular la probabilidad de que sean necesarios exactamente


a) 6 intentos para tener línea
b) A lo más 3 intentos

SOLUCIÓN
X~G(p) Þ P(x)= 0.03(0.97x-1 : Rx= 1,2,3,….

p =0.03 : q =0.97 Þ x: “Nº de intentos hasta obtener línea” Rx= 1,2,3,….

a) x= 6 intentos Þ P(x=6) = 0.03(0.97)6-1 = 0.0258


b) x £ 3 Þ P(x £ 3)= F(x=3)= 1-qx= 1-0.973= 0.0873
P(x £ 3)=
3

å P( x) = 0.03(0.97)
1
0
+ 0.03(0.97)1 + 0.03(0.97) 2 = 0.03 + 0.0291 + 0.02823 = 0.0873

DISTRIBUCION BINOMIAL NEGATIVA O PARCIAL

Es otro caso especial de la Binomial y es una extensión de la Geométrica, que se


utiliza cuando los experimentos aleatorios son también un proceso Bernoulli, hasta
que ocurra el n-ésimo éxito:

DEFINICIÓN

Se dice que una v.a.d. x ~. P(v. p) donde:

r = Nº de exactos obtenidos
p = probabilidad del éxito
X:” Nº de veces o intentos que se realiza el experimento Beunoulli hasta obtener r
éxitos” tal que r £ x; Sii

FUNCION DE PROBABILIDAD

æ x - 1ö v x -v
P ( x ) = P[x = x] = çç ÷÷ p q : Px = v, (v - 1) : (v - 2 )...
è v - 1 ø
FUNCION DE DISTRIBUCIÓN F(x)

ì 0 æ k - 1ö r k - r : Si x<r
P ( x £ x ) = íå çç ÷÷ p q
î è r - 1ø : Si x³r

LA MEDIA

æ x - 1ö v x-v v
E ( x) = m = å xçç ÷÷ p q =
è v - 1 ø p

LA VARIANZA
rq
V ( x) = s 2 = E ( x 2 ) - m 2 =
p2

Ejemplo 1

Una maquina se utiliza para fabricar ciertos chips en serie se sabe que la
probabilidad de cada chip sea defectuosos es del 10%. Si se controla la calidad
del CHIP producido sabiendo que la máquina se apaga cuando se producen 4
chips defectuosos; cual es la probabilidad de que la máquina pare en el 10mo
chip producido.

p=10
q =90
v=4
x=10
æ x - 1ö
x ~. P(v, p ) = P( x ) = çç ÷÷(0.1) (0.9 ) : Rx = 4, T ,6...
4 x -4

è 4 - 1ø
x :" N º de chips producidos hasta controlar 4 defectuosos
A :" la maquina pare Þ A = [x = 10]
æ10 - 1ö
Þ P( A) = P[x = 10] = çç ÷÷(0.1) (0.9 ) = 84(0....... = 0.0045
4 10 - 4

è 4 -1 ø
Ejemplo 2

La probabilidad que un CPU de cierta marca expuesto a cierto virus se contagie es


del 0.40. cual es la probabilidad de que la 10ma CPU expuesto sea al 3ra en
contraerla

SOLUCION

p =0.40
q =0.60
v =3
x =10
æ x - 1ö v x - v
x ~. P(v, p ) = P( x ) = çç ÷÷ p q : x : v, v + 1, v + 2,...
è v - 1 ø
x :" N º de CPUs exp uestos al virus hasta 10 a sea la 3 a en contraerla
æ 9ö
P[x = 10] = çç ÷÷(0.40) (0.60) = 0.0645
3 7

è 2ø
DISTRIBUCIÓN MULTINOMIAL
Es una generalización de la distribución Binomial, se utiliza cuando se tienen
ensayos o experimentos aleatorios que tienen más de 2 posibles resultados,
donde las probabilidades de los resultados son los mismos en cada ensayo, todos
los ensayos son independientes.

DEFINICIÓN

Sea un experimento aleatorio ε que tiene las siguientes características


1) tiene K posibles resultados E1,E2.... Ek que son:

a. Mutuamente excluyentes E : I Ej. = f "i ¹ j


k
b. Colectivamente exhaustivos U E i = W
i= 1
k
2) La P[Ei ] = pi = probabilidad del éxito del i - esimo resultado tal que å Pi = 1
i= 1
Se dice que las vs.as.ds. xi ~. Multinomial (n, pi ) : i = 1,2,3...k

Donde Xi:”Nº de veces que el evento Ei ocurre en los n ensayos

Rxi=[0,1,2...n];i=1,2,3...k Sii

n! x x x
FUNCIÓN DE PROBABILIDAD P(x1,x2.... xk)= p1 1 p2 2 ... p k k
x1 ! x2 !...x k !
MEDIA E(xi)=npi

LA VARIANZA V(xi)= npiqi donde qi=1-pi i=1,2,...k

Ejemplo
Las probabilidades de que una lamparilla de cierto tipo de proyector de
diapositivas dura

menos de 40 hrs. de uso continuo es 0.30


Entre 40 y 80 hrs. de uso continuo es 0.50
Ó de mas de 80 hrs. de uso continuo es 0.20 respectivamente

Calcular la probabilidad de entre 8 lamparillas:


2 duran menos de 40 hrs.
5 duran menos de 40-80 hrs.
1 dura más de 80 hrs.

SOLUCION
Sean los eventos
E1:”Duran menos de 40 hrs” Þ P[E1] = 0.30
E2:”Duran entre 40 y 80 hrs” Þ P[E2] = 0.50
E3:”Duran menos de 80 hrs” Þ P[E3] = 0.30
3
Como E i I Ej = f y U = W ademas å P( E1 ) = 1
i =1
Þ xi ~. Multinomial (ni pi )
x :" N º devecesqueocurreeleventoEi (i = 1,2,3)entre 8 lamparillas
x1 = 2
8!
x 2 = 5 Þ P( 2,5,1) = (0.30) 2 (0.50) 5 (0.20)1 = 0.0945
2!5!1!
x3 = 1

Ejemplo
La probabilidades que una declaración de impuestos sea llenado
correctamente es del 60%
que tenga un error favorable del declarante es del 20%
que tenga un error favorable al fisco es del 10%
que tenga ambos tipos de errores es del 10%

Se elige al azar 10 de tales declaraciones para una auditoria

Cual es la probabilidad que

5 estén correctas; 3 tengan error favorable al declarante


1tenga error que favorece al fisco y
1temga ambos tipos de error.

SOLUCION
Sean los eventos
E1: “Declaración correcta” Þ P[E1] = 0.60
E2: “Declaración favorable al declarante” Þ P[E2] = 0.20
E3: “Declaración favorable al fisco” Þ P[E3] = 0.10
E4: “Declaración error de ambos tipos” Þ P[E4] = 0.10
Como E i I Ej = f ademas P( E1 ) = 1
UEi = W Þ x1 ~. Multinomial (10, pi )
x :" N º de veces que ocurre el evento Ei (i = 1,2,3,4)entre 10 declaraciones
10!
P(5,3,11) = (0.60) 5 (0.20) 3 (0.10)1 (0.10)1 = 0.0314
5!3!1!1!

DISTRIBUCIÓN HIPERGEOMÈTRICA

Esta distribución se utiliza generalmente cuando se realiza un muestreo sin


repetición de una población finita N conocida que se divide en : 2 clases M éxito y
N-M fracasos, donde la probabilidad del éxito ya no es constante porque en cada
extracción es diferente por lo tanto los ensayos ya no son independientes, tiene
mucha aplicación cuando se efectúa control de calidad.
DEFINICIÓN

Se dice que una v.a.d X ~ H(N,nM)ó h(x:NnM)donde

N =tamaño de la población
X:”Nº exactos en un m.a. de tamaño n sin reposición
n =tamaño de la m.a. ó Nº de extracciones Rx=[0,1,2..Min (n, M) Sii
M =Nº de elementos exitosos

FUNCION DE PROBABILIDAD

æ M öæ N - M ö
çç ÷÷çç ÷÷
è x øè n - x ø
p ( x ) = P[x = x ] : R c = 0,1,2...Min(n.M )
æNö
çç ÷÷
è nø

FUNCION DE DISTRIBUCIÓN

ì 0 Sii x <0

ï æ M öæ N - M ö
ï x çç ÷÷çç ÷÷
[ ] ï è k øè n - k ø
F ( x ) = P x £ x = íå 0 £ x < Min(n, M )
ïk =0 æNö
çç ÷÷
ï ènø x ³ Min ( n , M 9
ïî 1
Si

MEDIA
éM ù
E ( x) = m = å xP( x) = nêë N úû
VARIANZA
é M ùé M ùé N - n ù
V ( x) = s 2 = n ê ú ê1 - ú ê factor de corrección
ë N ûë N û ë N - 1 úû
Ejemplo
Como parte de un estudio sobre la contaminación del aire un Ing. Geológico
decide examinar la emisión de gases tóxicos de 6 de los 24 camiones de una CIA
si 4 de esos camiones, emiten cantidades de gases tóxicos. Cual es la
probabilidad de que:

a) Ninguno de ellos
b) Mas de 3 emitan gases

SOLUCION

Como se trata del control de calidad X~H(N,n,M)


N = 24
n=6
M =4 éxitos
N-M = 20 fracasos

æ 4 öæ 20 ö
çç ÷÷çç ÷
è x øè 6 - x ÷ø
P ( x) = x = 0,1,2,3,4
æ 24 ö
çç ÷÷
è6ø
æ 4 öæ 20 ö
çç ÷÷çç ÷
è 0 øè 6 - 0 ÷ø 38.760
a) P ( x = 0 ) = = = 0.2880
æ 24 ö 134.596
çç ÷÷
è6ø
æ 4 öæ 20 ö æ 24 ö
b) P[x > 3] = å P( x ³ 4) = P(4) = çç ÷÷çç
190
÷÷ çç ÷÷ = = 0.0014
è 4 øè 6 - 4 ø è 6 ø 134596

Ejemplo
En el laboratorio de Sistemas hay 20 CPUs donde existen 6 CPUs con
desperfecto. Si se elige aleatoriamente 4 CPUs para su reparación.
a) cual es la probabilidad de que al menos 1 CPU deba ser reparado
b) cual es el Nº esperado de CPU para ser reparado y su varianza

SOLUCION
Como se trata de control de calidad y se tiene el tamaño de la población

N = 20
n=6
M =4
N-M = 14

X~H(N,nM)

Donde X: “Nº de CPUs que tienen desperfecto de entre 20”

Rx=0,1,2,3,4
æ 6 öæ14 ö
çç ÷÷çç ÷÷
è 0 øè 4 ø
a) P( x ³ 1) = 1 - P( x £ 0) = 1 - = 0.7934
æ 20 ö
çç ÷÷
è4ø
éM ù é6ù
b) E ( x ) = n ê ú = 4ê ú = 1.2
ëN û ë 20 û
é M ù é M ùé N - n ù é 6 ùé 6 ù é 20 - 4 ù
V ( x ) = n ê ú ê1 ú ê ú = 4ê ú ê1 - ú ê ú
ë N û ë N ûë N - 1 û ë 20 û ë 20 û ë 20 - 1 û
æ 24 öæ 14 öæ 16 ö 5.376
V ( x ) = ç ÷ç ÷ç ÷ = = 0.7074
è 20 øè 20 øè 19 ø 7.600

APROXIMACIÓN DE LA HIPERGEOMETRICA A LA BINOMIAL

Cuando la población N es grande con relación a n es máximo el 10% de N;


n £ 0.1N Þ por lo tanto el muestreo puede ser con o sin reemplazo, por lo tanto la
probabilidad del éxito son casi independienteÞ se puede aproximar a la binomial
M
con p = : q = 1- M
n
x n-x
æ n öæ M ö æ M ö
Þ h( x, N , n, M ) @ b( x : nM ) @ ç x ÷ç ÷ ç1 - ÷ : x = 0,1,2...MIn( nM )
è øè N ø è Nø
LA MEDIA

éM ù
E x = m = np » n ê ú
ëNû

LA VARIANZA

é M ùé M ù
V ( x ) = s 2 = npq » n ê ú ê1 - ú
ë N ûë N û

Ejemplo
Una importación de 100 computadoras, de las cuales 25 se sabe que tienen
desperfecto. Se realiza un control de calidad para ello se toman 10 computadoras,
cual es la probabilidad:
a) de que 2 tengan desperfectos
b) cual el Nº esperado de CPUs con desperfecto y para ello utiliza la
verdadera distribución y una aproximación si se puede

SOLUCION
Como se trata de control de calidad
æ M öæ N - M ö
çç ÷÷çç ÷÷
è x øè M - x ø
La verdadera distribución X ~ H(N.n.M) Þ p( x) =
æNö
çç ÷÷
ènø
N = 100
n = 10
M =25
N-M =75

X: “Nº de computadores que tienen desperfecto entre 10


R x = 0,1, 2....10
æ 25 öæ 75 ö
çç ÷÷çç ÷÷
è 2 øè 8 ø
a) P( x = 2 ) = = 0.292
æ100 ö
çç ÷÷
è 10 ø
é 25 ù
b) E ( x ) = 10ê ú = 2.5
ë100 û

Como n=10 £ N 10/de 100 Þ se puede aproximar mediante la binomial

M 25
p= = = 0.25
N 100
M
q = 1- = 075
N
æ10 ö
a) p ( x - 2) = çç ÷÷(0.25) (0.75) = 0.2515
2 8

è2ø

DISTRIBUCIÓN MULTIVARIADA

Es una extensión de la hipergeométrica y se aplica cuando se realiza control de


calidad de una población que se clasifica en k clases de diferentes tipos M1, M2, Mk
k
Tal que N= U M i donde se extraen un m.s. de tamaño n sea reposición de una
i= 1
población tamaño N, donde:
a) Cada extracción tiene k posibles resultados
b) Los ensayos no son independientes

DEFINICIÓN
Se dice que los vs.as.ds. Xi ~ Multivariante

Donde Xi=”Nº de objetos del i-esimo tipo”

Rxi=0,1,2... Mn(Mi,n) Sii tal que åx i =n


FUNCION DE POBABILIDAD

æ M 1 öæ M 2 ö æ M k ö
çç ÷÷çç ÷÷...çç ÷÷
è x1 øè x 2 ø è x k ø
P(xi,x2... xk: N,n)=
æNö
çn÷
è ø

Ejemplo
En un depósito hay 20 TV de los cuales 10 son de 20’’: 6 de 18’’ ;4 de 15’’, se elige
al azar 10TV. Cual es la probabilidad de que haya 5 de 20’’, 3 de 18’’ y 2 de 15’’.
SOLUCION

Como N= M1+ M2+M3=10+6+4=20 Þ xi ~Multivariado

M1=Nº TV de 20” = 10 Þ x1 =5 Xi: “Nº de TV del i= esimo tipo” i=1,2,3


M2= Nº TV de 18”=6 Þ X2=3 Rxi=0,1,2,3,4
æ10 öæ 6 öæ 4 ö
çç ÷÷çç ÷÷çç ÷÷
è 5 øè 3 øè 2 ø 7.560
M3= Nº TV de 15”=4 Þ X3=2 p (5,3,2 : 20 : 10) = = = 0.1637
æ 20 ö 46.189
çç ÷÷
è 10 ø
DISTRIBUCIÓN DE POISSON

Por su aplicación es una de las mas importantes tanto como Proceso Poisson o
como aproximación a la Binomial

1) COMO PROCESO POISSON

Se considera como proceso, cuando la v.a.d. X es el Nº de eventos que


ocurren en un intervalo de tiempo o en una región espacio o volumen.

DEFINICIÓN

Se dice que una v.a.d. x ~ p(lt )ó x~ f ( xi ; lt )


donde l =Nº promedio de ocurrencias de eventos en una unidad de medida:
que pueden ser intervalo de tiempo, región especificad, dichas ocurrencias
son independientes Sii

FUNCIÓN DE PROBABILIDAD

P( x ) = P( X = x ) = lt x e - lt : x = 0,1,2,3... e = 2.71828..
donde l t = Nº promedio de ocurrencias de los eventos en las t unidades de
medida
cuando t= fijo Þ l t= a

a x - e -a
P ( x) = P ( x = x ) = : x = 0,1,2,3
x!

FUNCIÓN DE DISTRIBUCIÓN

ì
ï 0 Si x < 0
ïï x a k e -a
F ( x) = P[x £ x ] = í å x³0
ïa = 0 k!
ï
ïî
LA MEDIA E ( x) = m = lt = a

LA VARIANZA V ( x ) = s 2 = lt = a

USO DE TABLAS

Para facilitar el calculo se tiene confeccionados tablas en función de


distribución

F ( x) = P[x £ x] = F ( x : l )

En caso de valores puntuales P[x = x ] = f ( x, l ) = F ( x; l ) - F ( x - 1 : l )

Ejemplo

Supongan Que llegan en forma aleatoria una serie de llamadas a una


central telefónica con promedio de 3 llamadas por minuto. Calcular la
probabilidad de que ocurran:

a) 4 o más llamadas en el periodo de un minuto


b) 4 o mas llamadas en el periodo de 2 minutos
c) 4 o mas llamadas en el periodo de 20 segundos
SOLUCION
Como la ocurrencia de los eventos se da en periodos de tiempo x~. P(lt )
3 x e -3
Donde l = 3 llamadas t=1 minuto Þ P( x) = x = 0,1,2,3...
x!
x:”Nº de llamadas en un minuto
¥
P( x ³ 4) = å P( x ) = 1 - P[x £ 3] = 1 - [P(0) + P(1) + P(2 ) + P(3)]
4

é 3 0 e - 3 31 e -3 3 2 e -3 3 3 e -3 ù
a) =1- ê + + + ú
ë 0 ! 1 ! 2 ! 3! û
é 3 0 3 9 27 ù
= 1 - e -3 ê + + + ú = 0.3520
ë1 1 2 6û
b) lt = 3 * 2 = 6 Þ P(x ³ 4) = 1 - P( x £ 3) = 1 - F (3) = 1 - 0.151 = 0.849
c) lt = 3( 13 ) = 1 Þ P( x ³ 4) = 1 - P( x £ 3)1 - F (3) = 1 - 0.9801 = 0.019

2) COMO APROXIMACIÓN A LA BINOMIAL

Cuando la muestra N y la probabilidad del evento es muy pequeño existe


distribución binomial, es decir p<0.1 y np £ 5: p £ 0.005: n ³ 20: n>30

Entonces se puede utilizar la PISSON como límite o aproximación de la


binomial

Donde E ( x) = np = l Þ cte
l t x e - lt æ l ö l e
x -l
P( x) = » bç x i npˆ ÷ = x = 0,1,2
x! è ø x!
l x e -l
FUNCION DE PROBABILIDAD P( x ) = x = 0,1,2,3... l = np = cte
x!

FUNCION DE DISTRIBUCIÓN

ì 0x : Sik x-<l0
ï l e
F ( x ) = P[x £ x ] = íå : x³0
ï k = 0 k !
î
LA MEDIA E ( x) = m = np = l

LA VARIANZA V ( x ) = s 2 = l = np

Ejemplo

Se sabe que el 5% de la CPUs ensamblados en cierta factoría tiene


ensamblaje defectuoso. Cual la probabilidad de que 2 de 100 CPUs
ensamblados estén defectuosos:

a) mediante la verdadera distribución


b) mediante una aproximación
SOLUCION

n =100
p = 0.05
q = 0.95

æ 100 ö
a) x ~. b(100;0.05) Þ p ( x) = ç x ÷(0.05) (0.95) ; x = 1,2,3...100
x 10 - x

è ø
x =" N º CPUs mal ensambladas entre 500"
æ 100 ö
P( x = 2) = ç 2 ÷(0.05) (0.95)
10 - 2
= 0.0812
2

è ø
b)mediante una aproximación a la POISSON
5 x e -5
l = np = 100(0.05) = 5 Þ P( x) = : x = 0,1,2
x!
5 2 e - 5 25(e -5 )
P( x = 2) = = = 0.0842
2! 2

PROPIEDAD REPRODUCTIVA

Si 2 o mas variables tienen una misma distribución entonces la resultante


de sumar o restar será una nueva variable que tendrá la misma distribución
de probabilidad que sus sumandos.

n
Si Xi ~ misma distribución Si å x i = Y ~. misma distribución i= 1,2...n
i =1
Si X i ~. P(a i )" i = 1,2,...n
n
ÞY = åx
i =1
i Þ Y ~. P (a = åa i

Ejemplo

En una fabrica el Nº de accidentes por semana sigue un proceso de


POISSON con parámetro a = 2 .

Determinar:

a) la probabilidad de que haya 4 accidentes en el transcurso de 3 semanas


b) la probabilidad que haya 2 accidentes en una semana y otros 2
accidentes en la semana siguiente
c) Es lunes y ya hubo un accidente. La probabilidad que en aquella
semana no haya mas de 3 accidentes

SOLUCION

Definiendo las variables POISSON con parámetro a i = 2 : i = 1,2,3


X= “Nº de accidentes en cualquier semana
X1: “Nº de accidentes en la 1ra semana”
X2: “Nº de accidentes en la 2da semana”
X3: “Nº de accidentes en la 3ra semana”

Como las 3 v.a son independientes Þ Y = x1 + x 2 + x 3 ~. P (a = 2 + 2 + 2 = 6


6 4 e -6
a) P(Y = 4) = = 0.1339 Y :" N º de accidentes en 3 semanas"
4!
æ 2 2 e -2 ö
b) P( x1 = 2 Ù X 2 = 2) = P( x1 = 2) P( x 2 = 2) = çç ÷÷ = 0.0733
è 2! ø
a1 = 2 a 2 = 2
P[( x £ 3 Ù P( x ³ 1)] P(1 £ x ³ 3) P( x £ 3) - P( x £ 0)
c) P(x £ 3 x ³ 1) = = =
P( x ³ 1) P( x ³ 1) P( x ³ 1)
0.8647 - 0.1429
= = 0.8348
0.8647

DISTRIBUCIONES CONTINUAS

Los espacios muéstrales continuos y las v.a.c. surgen cuando se trabaja con
cantidades que se miden en una escala continua (velocidad de una CPU; la
cantidad de alcohol en la sangre, la cantidad de nicotina en un cigarrillo, etc.)

Entre las principales distribuciones de probabilidad continua tenemos la uniforme,


la experimental, la norma, algunas distribuciones muéstrales como la Chi
cuadrado, la t estudiante, la Fisher, etc.)

LA DISTRIBUCIÓN UNIFORME X~U [a,b]

DEFINICIÓN

Se dice que una v.a.c. X tiene distribución uniforme o rectangular en el intervalo [a,
b] tal que a< b Sii

FUNCION DE PROBABILIDAD O DENSIDAD


ì
ï
ï 1
f ( x) = í ;a £ x £ b 1

ï b - a b-a
ïî 0 ; eoc
a c d b
Para cualquier sub. intervalo [c, d] donde

a £ c £ d £ b Þ P[c £ x £ d ] = òc
d 1
b-a
dx =
1
b-a
[x]
d

c
=
1
b-a
[d - c] = d - c
b-a

además P(x=x) =0

Se dice distribución uniforme porque la P[c £ x £ d ] es la misma para todos los sub
intervalos que tienen la misma longitud.

FUNCION DE DISTRIBUCIÓN O ACUMULADA

x-a
F ( x) = P[x £ x] =
x x 1
ò ò
1 F(x)
dx = dx =
µb-a ab-a b-a
ì 0 Si x < a
ïx - a
F ( x) = P[x £ x] = í Si a £ x < b
ï b -1 a Si x ³ ba
î
a b x’
LA MEDIA

a a +b
ò
1
m = E ( x) = x dx =
b b-a 2

LA VARIANZA

b æ a +b ö (b - a ) ó = (a - b )
2 2 2

ò
1
V ( x) = s 2 = x2 dx - ç ÷ =
a b-a è x ø 12 12

Ejemplo 1

Suponga que un punto es elegido al azar en el intervalo (1;4)


Calcular la probabilidad de que el punto esté:
a) En la posición 3
b) El punto este entre 3/2 y 3

SOLUCION

X ~ U[a, b]donde a =1 ; b =4
X: “posición del punto en el intervalo [1,4]”

ì ì0
ï ï Si x < 1
ï1 ï x -1
Þ f ( x) = í ; 1 £ x £ 4; F ( x)í Si 1 £ x < 4
ï 3 ï 4 - 1
Si x ³ 4
ï0 ; eoc
ïî1
î

dx = [x ]3 = (0) = 0
3 1 1 3 1
a) P( x = 3) = ò
3 3 3 3

é3 ù 31 1 3 1é 3ù 1 é3ù 1
b) P ê < x < 3ú = ò3 dx = [x] 3 = ê3 - = =
ë2 û 23 3 2 3ë 2 úû 3 êë 2 úû 2

o también mediante la función distribución acumulada

é3 ù é 3ù æ3ö
P ê < x < 3ú = P[x < 3] - P ê x £ ú = F (3) - F ç ÷
ë2 û ë 2û è2ø
2 2 -1 2 2 3 1
3 1
= - = - = =
3 3 3 3 6 2

Ejemplo 2

Suponga que cierta línea de transporte publico pasa por un determinado paradero
de control o de espera, a un horario estricto con intervalos de 30 minutos durante
el día. Si un pasajero llega a ese paradero en un instante aleatorio durante el día.
Calcular la probabilidad de que tenga que esperar:

a) más de 15 minutos
b) Exactamente 7 minutos

SOLUCION

X ~ U[0.30]donde a = 0 ; b =30
X = “tiempo de espera en minutos del pasajero”

ì ì0
ï ï Si x £ 0
ï1 ï x -0 x
f ( x) = í ; 0 £ x £ 30; F ( x )í = Si 0 £ x < 30
ï 30 ï 30 - 0 30
Si x ³ 30
ïî 0 ; eoc ïî1
[x]15 = = minuto
30
ò
1 1 30 15 1
a) P( x > 15) = dx =
15 30 30 30 2
b) P[x = 7] = 0

Ejemplo 3
Sea la v.a. X...U[0,6] calcular
6
P[ x - m > 2] : sabemos que m=
= 3 reemplazando
2
P[ x - 3 > 2] = 1 - P[ x - 3 £ 2] = 1 - P[-2 £ x - 3 £ 2]
= 1 - P[1 £ x £ 5] = 1 - P[ P( x £ 5) - P( x < 1)] = 1 - F (5) + F (1)
5 1 1
=1- + =
6 6 3

DISTRIBUCIÓN EXPONENCIAL

Es un caso particular de la distribución gamma, que se aplica no solo a la


ocurrencia del 1er acierto en un proceso POISSON, si no también en los tiempos
de espera entre los aciertos; también se aplica en la teoría de la confiabilidad de
un sistema, y la teoría de colas.

DEFINICIÓN X ~ EXP (l )
Se dice que una v.a.c. X tiene distribución exponencial con parámetro (l )

FUNCION DE PROBABILIDAD O DENSIDAD

F(x)

ìïl - lx
e ;x ³ 0
f ( x) = í l
= 0.368l
ïî0 ; eoc e

donde e = 2.71828...:; (l ) = Cte. >0


0 1
l
x

FUNCION DE DISTRIBUCIÓN
F(x)

1
ì0 Si x<0
F ( x ) = P[ X £ x] = í
î1 - e
- lx
Si x³0

1
l
x
MEDIA

µ
ò
1
m = E ( x ) = xle - lx dx =
0 l
VARIANZA

x 2 1 1
V ( x ) = s 2 = ò x 2 le -lx dx - m 2 = - 2 = 2
0 l 2
l l

Ejemplo 1

Si el Nº de automovilistas que corren a cierta velocidad, que un radar detecta por


hora en cierta localidad es una v.a. POISSON con l =8.4 hrs. Cual es la
probabilidad de tomar un tiempo de espera menos a 10 minutos entre
automovilistas sucesivos?

SOLUCION

X ~ EXP( l ) donde l =8.4 hrs.

Donde X: “tiempo de espera en minutos”

ìï8.4 e -8.4 x ; x ³ 0 ìï0 Si x<0


f ( x) = í ; F ( x) = í
ïî0 ; eoc ïî1 - e -8.4 x Si x³0

Como X =10 minutos x 1hora = 1 horas


60min 6

é 1ù
1 1

Pêx £ ú = ò 8.4e -8.4 dx = - ò e -8.4 x (- 8.4)dx


6 6

ë 6û 0 0

[
= - e -8.4 x= -ée]
1
6
êë
0
6
- e -8.4( 0 ) ù
- 8.4( 1 )
úû
= -[0.2466 - 1] = 0.7534

mediante la acumulada P[x < 16 ] = F (16 ) = 1 - e -8.4( 6 ) = 0.7534


1

Ejemplo 2

El tiempo durante el cual una marca de computadora que opera en forma efectiva
antes de su primera reparación, se distribuye exponencialmente con un promedio
de fallas de 360 días

a) Si una de estas computadoras ha durado al menos 400 días, cual la


probabilidad de que dure al menos 200 días más
b) Si se están usando 5 de tales ordenadores, cual la probabilidad de que al
menos 3 de ellos continúan funcionando después de 360 días
SOLUCION

X~EXP( l ) Þ X ~ EXP ( 360


1
)

Como E(x)=360= l1 Þ l = 601

ìï 1 - 360
ìï0 x<0
x

e ;x³0 Si
f ( x) = í 360 ; F ( x) = í
ïî0 ; eoc
- x
ïî1 - e 360 Si x³0

X: “ tiempo que opera el ordenador hasta la primera falla


a - 360x

P [x ³ 200 + 200 x ³ 400 ] = [x ³ 600 x ³ 400 ] = P


[x ³ 600 I x ³ 400 ] = p [x ³ 600 ] = ò600 1
360
e dx
=e
-5

P [x ³ 400 ] p [x ³ ] a
9

- 360x
400
ò 1
400 360
e dx

Ó mediante la acumulada

1 - éê1 - e 360 ùú
- 600
p[x ³ 600] 1 - P[x < 600] 1 - F (600)
- 600 -
5
ë û e 360 - 600 + 400 - 20 =e 9
= = = = 400 = e 360 360
=e 36
= e -0.5556
P[x ³ 400] 1 - P[x < 400] 1 - F (400) é - 400 ù - 360
1 - ê1 - e 360 ú e
ë û

RELACION ENTRE EL MODELO EXPONENCIAL Y POISSON

La distribución exponencial tiene una relación especial con la PISSON porque


X~P[ l ]donde X: “N° de veces que ocurre un evento en un periodo “t” con
promedio l ”
Þ la v.a. T: “tiempo entre la ocurrencia de 2 eventos consecutivos de POISSON
Þ T ~ EXP[ l ]

TEORIA DE LA CONFIABILIDAD (Rt)

Una de las aplicaciones principales de la distribución exponencial se da en la


confiabilidad del funcionamiento normal de un sistema o componente electrónico.

DEFINICIÓN

La confiabilidad (Rt) de un sistema en determinado medio ambiente, durante un


periodo “t”, se define como la probabilidad de que su tiempo para fallar (T) excede
a su tiempo de funcionamiento normal (t)

[ ]
Þ R (t ) = P[T > t ] = 1P[T £ t ] = 1 - 1 - e - lt = e -lt
Ejemplo

La probabilidad de buen funcionamiento de un elemento de cierto equipo de


sonido se distribuye exponencialmente con:

ì0.02 e 0.02 t ; t > 0


f (t ) = í Determinar la confiabilidad del elemento en un periodo de
î 0 : eoc
50 hrs.

SOLUCION

P[T > 50] = R (50) = e -0.02 (50 ) = e -1 = 0.3679

DISTRIBUCIÓN NORMAL

Es la distribución mas importante de la teoría estadística, porque casi todos los


fenómenos físicos, científicos sociales psicológicos, tienen un comportamiento
normal, además casi todas las distribuciones bajo ciertos requisitos se pueden
aproximar mediante la normal.

DEFINICIÓN

Se dice que una v.a.c. X ~ N( m , s 2 ) Sii

FUNCION DE PROBABILIDAD
1 F(x)
s 2P

- [( x - m ) / s ]2
1
f ( x) = e 2
;-¥ < x < ¥
s 2P

P = 3.1416...
donde
e = 2.71828

m = Me = Mo

CARACTERÍSTICAS

1. Es simétrica respecto a m donde f ( x) = 1


s 2P
2. Es creciente en el intervalo < -¥, m > cuando x< m
3. Es decreciente en el intervalo < m , ¥ > cuando x> m
FUNCION DE DISTRIBUCIÓN F(x) - 1

x
F ( x) = P[ x £ x ] = ò x f ( x)dx
¥
½

LA MEDIA

¥
E ( x) = ò x f ( x)dx = m

LA VARIANZA

¥
V ( x ) = ò x 2 f ( x )dx - m 2 = s 2

F(x)
1
DISTRIBUCIÓN NORMAL ESTANDAR s 2P
F(z)

Estandarizar la Normal significa llevar


o trasladar la distribución hasta que m = 0 y s 2 = 1

; z....N (0.1)
x -m
Mediante la v.a.e.= z = s

m =0 z m z x
USO DE TABLAS

Cuando la v.a.c. X ~ N( m , s 2 ) no esta estandarizada ( m ¹ 0 : s 2 ¹ 1 ), la misma se la


x-m
debe estandarizar con z = y colocar en acumulada F(z)ó f ( z ) = P(z £ z )
s
Ejemplo

Sea X...N(5,4)cual la probabilidad de que x

a) toma valores entre 4 y 7?


b) Toma valores mayores que 10?

SOLUCION

x-m
a)P[4<x<7]estandarizando mediante z =
s
donde m = 5;s 2 = 4;s = 2

é 4 - 5 x - m 7 - 5ù
Pê < < = p[- 0.5 < z < 1] = p[z < 1] - P[z £ -0.5] = F (1) - F (-0.5) = 0.8413 - 0.3085 = 0.5328
ë 1 s 2 úû
é x - m 10 - 5 ù
b) P[x > 10] = P ê > = P[z > 2.5] = 1 - p[z £ 2.5] = 1 - F (2.5) = 0.0062
ë s 2 úû

Ejemplo

El tiempo T requerido para contagiarse un computadora por cierto virus es una v.a.
normal con media 31 segundos y desviación estándar 5 segundos.

a) Cual la probabilidad que un ordenador se contagie con el virus en menos de


35 segundos
b) Si un ordenador particular se observa que no está siendo contagiado por el
virus en 30 segundos, cual es la probabilidad de contagiarse antes de los
35 segundos

SOLUCION

T ~ N(31,5)
T: “tiempo requerido para contagiarse una CPU con el virus en segundos”

é T - m 35 - 31ù é 4ù
a) P[T < 35] = P ê < ú = Pê z < = F (0.8) = 0.7881
ë s 5 û ë 5 úû

b) P[T < 35 / T > 30] = P


[30 < T < 35] = P[305-31 < z < 355-31 ] = P[- 0.2 < z < 0.8] = F (0.8) - F (-0.2) = 0.3674 = 0.63
P[T > 30] P[z > 30 5-31 ] P[z > -0.2] 1 - F (-0.2) 0.5793

PROPIEDAD REPRODUCTIVA

La distribución normal también goza de esta propiedad, es decir:


Sean n.v.a. independiente : X1+ X2+...+Xn donde Xi...N m i ; s i 2 si sumamos dichas ( )
( )
n n n

åx = Y ~ N m y ;s y donde m y = å m ;s = ås
2 2 2
variables i i y i
i= 1 i= 1 i =1

æ n n ö
Þ Y ~. N ç
ç
è
å m ;s = ås
i=1
i
2
y
i=1

i ÷
ø

Ejemplo

Sea una v.a. y = ê


é xi + x 2 ù
ë 2 û
ú - x3 ( )
donde Xi...N m i ; s i 2 ; i =1,2,3
m1 = 20 ; m 2 = 25 m 3 = 25
s 12 = 5 ; s 22 = 11; s 32 = 5

a) Cual la distribución de probabilidad Y?


b) Calcular P[Y>0]

SOLUCION

( ) (
Como Xi...N m i ; s i 2 =Y...N m y ;s y 2 )
donde
é x + x2 ù1
m y = E ( y) = E ê 1 - x3 ú [E ( x1 ) + E ( x 2 )] - Ex3
ë 2 û2
m y = [20 + 16] - 25 = -7
1
2
æ x + x2 ö 1
s 2y = v( y ) = vç 1 - x3 ÷ = [v (x1 ) + v ( x 2 )] + v( x3 )
è 2 ø 4
s 2y = [5 + 11] + 5 = 9 Þ s y = 3
1
4
Þ Y ~. N (-7;9)
é Y - m y 0 - (-7) ù é 7ù
P[Y > 0] = P ê > ú = P ê z > ú = 1 - F (2.33) = 1 - 0.9901 = 0.0099
ëê s y 3 ûú ë 3û

TEOREMA CENTRAL DEL LIMITE

Este es el teorema mas importante de la estadística, porque mediante la misma


nos permite aproximar a la distribución normal sumas finitas de v.a.
independientes, que pueden tener cualquier distribución de probabilidad con
media y varianzas conocidas

DEFINICIÓN

Sea una sucesión de n. v. a. i.: X1, X2, ... Xn

Cuyas medias E(Xi)= m i y cuyas varianzas V(Xi)= s i2 (conocidas y finitas)

Þ Si sumamos los n.v.a.i.: X1+X2+...+ Xn=Yn, con la condición que los Xi


contribuyan con una cantidad mínima despreciable a la variación de la suma
n n

å åm
i =1
xi -
i =1
i
åm
Yn - i
Þ La v.a.e. de la variación: 1) Z n = = ; Z n ~. N (0.1)

å
n
s i2 ås 2
i

i =1
CASO ESPECIAL

Cuando Xi....MISMA DISTRIBUCION


Þ La secuencia de las n.v.a.i.: X1,X2,..., Xn
Þ E(Xi)= m y V(Xi)= s 2
Þ Yn=X1+X2+...+ Xn= å x1

2) Z n = å x - å m = å x - nm = å x
i i i - nm

ås ns
2 s 2 n

ó también dividiendo entre “n”

Zn =
å xi
n
- ån
m
=
(x n - m ) n ; Z n ~. N (0.1)
s n s
n

Ejemplo1

Suponiendo que la vida útil de un componente electrónico de uso continuo, tiene


distribución exponencial, con un promedio de 100 hrs. Tan pronto como se
deteriora, es reemplazado por otro para que continúe funcionando.

a) calcular la probabilidad de que durante 209,5 días se necesiten mas de 36


de estos componente
b) cuantos de estos componentes se necesitan par que duren al menos 4536
hrs., con una probabilidad de 0.9901

SOLUCION
Como X i ~. EXPæç ö÷ donde X: “Duración del i=esima componente” en horas”
1
èl ø
I=1,2,......36
1
Donde E (x)= = 100 Þ l
l
1
V ( x) = = 100 2 ; s = 100; Yn: “tiempo total de duración de los n componentes”
l 2

n=36

n.u = 36(100) Þ Z n = åx i - nm
=
Y 36 - 3600
=
Y 36 - 3600
s n 100 36 600

é 5028 - 3600 ù
P[Y36 < 5028] = estandarizando Þ P ê Z 36 < ú
a) ë 600 û
P[Z 36 < 2.38] = F (2.38) = 0.9913
P[Yn ³ 4.536] = 0.9901 Þ 1 - P[Yn £ 4.536] = 0.9901
P[Yn £ 4.536] = 1 - 0.9901 = 0.0099 estandarizado
é 4.536 - 100n ù
b) P ê Z n £ ú = 0.0099 donde el valor crítico
ë 100 n û
4.536 - 100n
= -2.33 resolviendo la ecuación haciendo X = n
100 n
X = 8.018 Þ n = x 2 = 8.018 2 Þ n = 64.3 » 64

Ejemplo 2

La longitud que se puede estirar sin ruptura un filamento de nylon es una v.a.
exponencial con media de 5000 pies. Cual es la probabilidad aproximadamente
que la longitud media de 100 filamentos este comprendido entre 4750 y 5550 pies.

SOLUCION

é 1 ù
X : ~. EXPê ú
ë 5000 û
X: “longitud de estiramiento sn ruptura del i-esimo filamento” i=1,2....100
1 ( xn - m ) n
E ( x) = = 5000 por Zn = estandarizando
l s
æ1ö
2
é (4570 - 5000) 5550 - 5000 100 ù
V ( x ) = ç ÷ = (5000) 2 P[4750 £ x100 £ 5550] = r ê 100 £ z £ ú
èl ø ë 5000 5000 û
s = 100
P[- 0.5 £ z100 £ 1.1] = F (1) - F (-0.5) = 0.8643 - 0.3085 = 0.5558

APROXIMACIONES DE LAS DISTRIBUCIONES DISCRETAS A LA NORMAL

Mediante el teorema central del limite, se pueden aproximar distribuciones


discretas a la norma, para ello se debe convertir un v.a continuo, mediante
factores de corrección de acuerdo a las siguientes situaciones:

1) P[x = x ] = P[x - 0.5 £ x £ x + 0.5]


2) P[x £ x ] = P[x £ x £ x + 0.5]
3) P[x < x ] = P[x £ x £ x - 0.5]
4) P[x ³ x ] = P[x ³ x - 0.5]
5) P[x > x ] = P[x ³ x + 0.5]
6) P[a £ x £ b ] = P[a - 0.5 £ x £ b + 0.5]

RESUMEN DE LAS APROXIMACIONES MEDIANTE


Z=
å X -åm
i i
Þ Z ~. N (0.1)
ås 2
i

DISTRIBUCION REQUISITO MEDIA VARIANZA V.A ESTANDAR


CORREGIDA
BINOMIAL n > 10; p » 1 ll = np x ± 0.5 - np
2 Z»
np > 5; p £ 1 V ( x) = npq npq
2
nq >; p > 1
2
Hipergeométrica n ³ 0.1N
m = nê ú
éM ù

[MN ]
x ± 0. 5 -
n ³ 0.05 N ëNû nM
N
[1 - MN ][ NN--n1 ]
é M ùé M ùé
V ( x ) = n ê ú ê1 - ú ê
ë N ûë N ûë

POISSON n®¥ m=l x ± 0.5 - nl



nl > 5 s =l
2 nl

Ejemplo 1
1 si la v.a. X....b(20;0.5) calcular la P[x =7]
a) De manera exacta, b)Aproximada

SOLUCION
ænö
Sabemos que P ( x) = çç x ÷÷ p x q n - x ; x = 0.1.2...n
è ø
Donde n=20
p=0.5
q=0.5
a) Exactamente o con la verdadera distribución binomial
æ 20 ö
P ( x = 7) = çç 7 ÷÷(0.5)7 (0.5)13 = 0.0739
è ø
b) Aproximadamente mediante la Normal

Donde np =10 corrigiendo P[7 - 0.5 £ x £ 7 + 0.5]

P[6.5 £ x £ 7.5]
npq 10(0.5)(0.5) = 2.24 Þ P[6.5 £ x £ 7.5] estandarizando
[
PZ £ 7.5 -10
2.24
] - P[Z £ 6.5 -10
2.24
]
= P[Z £ -1.12] - P[Z £ -1.57]
= F (- 1.12) - F (- 1.57 ) = 0.0732

Ejemplo 2
Suponga que la probabilidad de que cierta marca de CPU, esta en servicio
después de 1 año es 0.80. Si la “U” adquiere 35 de tales CPUs. Cual la
probabilidad de que

a) 7,b)al menos 5 de las CPUs adquiridos NO esta en servicio después de 1


año?

SOLUCION

X~b(n,p) Þ X~b(35;0.20)
n = 35; p =0,20; q =0,80

Como n = 35>10 y p=0.20<0.5 podemos aproximar mediante la Normal con np=7 y


npq = 5.6 = 2.3664

a)
x ± 0.5 - np
P[x = 7] = P[6.5 £ x £ 7.5] donde Z =
npq
é 6.5 - 7 7.5 - 7 ù
Þ Pê £Z£ = P[- 0.2113 £ Z £ 0.2113] = P[Z £ 0.21] - P[Z £ -0.21]
ë 2.3664 2.3664 úû
= F (0.21) - F (-0.21) = 0.1664

b)
P[x ³ 5] = P[x ³ 5 - 0.5] = P[x ³ 4.5] = 1 - P[x < 5]
é 4. 5 - 7 ù
= 1 - P êZ £ = 1 - P[Z < -1.056] = 1 - F ( -1.06) = 0.8554
ë 2.3664 úû

Ejemplo 3

El tiempo que un cajero de un banco emplea para atender a un cliente es una v.a.
con media 3.1 minutos y una desviación estándar de 1.7 minutos. Si se observan
los tiempos y corresponden a 64 clientes ¿Cuál la probabilidad de que el tiempo
promedio de los mismos sea por menos 3.4 minutos?

SOLUCIÓN
Como X ~. P(x)

m = l = 3 .1 P[x 64 > 3.4] = 1 - P[x 64 < 3.4]


s = l = 3.1
2
é
1 - Pêz <
(3.4 - 3.1) 64 ù = 1 - P[z < 1.41]
ú
s = 1 .7 ë 1 .7 û
n = 64 = 1 - F (1.41)
= 1 - 0.9207 = 0.0793

UNIDAD II

DISTRIBUCIONES MUESTRALES

Competencia:

-El estudiante debe saber utilizar las diferentes distribuciones muestrales ,es decir las
diferentes distribuciones de cualquier estadístico estimado a partir de muestras aleatorias
para realizar eficientemente la Inferencia Estadística

Objetivos.

-Utilizar correctamente el concepto de muestra aleatoria en las diferentes distribuciones


muestrales ,para realizar generalizaciones respecto de una población en base a estadísticos

Descripción general de la unidad:


-Esta unidad comprende el desarrollo de los siguientes conceptos:Población-Parámetro
Muestra aleatoria-Estadístico; Distribución muestral:de la Media ,Diferencia de Medias,de
la Proporción y la diferencia de Proporciones,de la Varianza y razón de Varianzas,con sus
respectivas distribuciones especiales como: la “t” student,La Normal,La “Chi Cuadrado” y
La “F” de Fisher.

Lectura:Millar/Freund/Jonson “Probabilidad y Estadística para


Ingenieros”Edo.de México 1992 Pgs. 187 al 205
Bibliografía Básica: Moya y Saravia (1988) “Probabilidad e Inferencia
Estadística((2ª ed) Perú .Pags.559 al 623

Referencia electrónica:
http://www.itcomitan.edu.mx/tutoriales/estadística/contenido/unidad_2_4.html
INTRODUCCIÓN
Se llama distribución muestral, cuando la variable resulta ser un estadístico o estadígrafo, calculado en
base a los datos de una m.a.
Estos estadísticos se utilizan para realizar inferencia estadística para la toma de
decisiones, respecto alguna característica de la población ó respecto a la
distribución de la misma.
Para desarrollar las distribuciones muéstrales es necesario recordar algunos
conceptos básicos:
POBLACION f(x);P(x);X,Y
Estadísticamente población es el conjunto de todas las observaciones posibles
que puede tomas una v.a. X. Por lo tanto la distribución de la población es la
distribución de la v.a. X. Las poblaciones de acuerdo a su magnitud pueden ser:
POBLACIONES FINITAS (N)
Son aquellas que están limitadas o acotadas
POBLACIONES INFINITAS
Son aquellas que no están imitadas, estadísticamente las poblaciones muy
grandes se las consideran infinitas.
- El proceso para obtener la información de toda la población es el CENSO

PARÁMETROS

Son todas las medidas descriptivas que caracterizan a la población como por
ejemplo la media = m, la varianza s2 etc. Los parámetros se denotan con las letras
griegas

MUESTRA ALEATORIA
(m.aÞn) una m.a. de tamaño “n” es un subconjunto representativo de la
población, el proceso para obtener la información se llama muestreo

ESTADISTICO,
Son todas las medidas descriptivas que se obtienen a partir de la información de al
m.a. como por ejemplo: la media = x , la varianza= S2 etc. Generalmente se las
denota con las letras castellanas.

DEFINICIÓN DE m.a.

Dada una población f(x);P(x) ó X con media m y varianza s2


Se llama m.a. De tamaño “n” al conjunto de n.v.a X1, X2,... Xn tal que satisfacen 2
requisitos:

1. Xi son independientes donde la distribución conjunta es


a) Si X es discreta Þ P( X 1, X 2 ,....X n ) = P ( X 1 ) P( X 2 ).... p( X n ) = PP( x )
b) Sí X ex continua Þ f ( X 1 , X 2 ,....X n ) = f ( X 1 ) f ( X 2 ).... f ( X n ) = P f ( x)
2. Xi tienen la misma distribución X
a) f(xi) = f(x)ó P (xi)= P(x); i=1,2…n
b) E ( xi ) = m ;V ( xi ) = s 2

Nota. Esta definición es valida cuando:


1. La población es infinita con ó sin reposición
2. La población es finita, con reposición

Ejemplo
2
Sea una población X~N (m,s ), se toma un m.a. tamaño n X1, X2,... Xn

a) Escribir la función de probabilidad conjunta de la m.a.


b) Sí n = 6 ; m=20; s2 =25 Calcular la probabilidad de que b) X1 +X3+ X 4
-X6 sea mayor que 52
DEFINICIÓN
x-m 2
- 1 æç ö÷
1 2 è s ø
2
como X~N (m,s ) sabemos que f(x)= e
s 2P
a) la función de probabilidad conjunta de la m.a. de tamaño “n” es
n
é ù
2
x-m
- 1 æç ö÷
2è ø
f(X1, X2,... Xn)= f ( xi ) f ( x2 )... f ( xn ) = Pf ( xi ) = [ f ( xi )] = êê ú
s
n 1
e ú
êë
s 2P úû
b) Sí X1 +X3+ X4 -X6 =Y por la propiedad reproductivaÞY~N(mysy2), donde:

my=E(Y)=E(X1 +X3+ X4 -X6)= E(X1)+E(X3)+E( X4 )-E(X6)=20+20+20-20=40

sy2=V(Y)= V(X1 +X3+ X4 -X6)= V(X1)+V(X3)+V( X4 )-V(X6)=25+25+25-25=100

sy=10

Y - mY
Mediante el teorema central del limite Þ Z = ;~(0.1)
sY
é 52 - 40 ù
Þ P[Y > 52] = ê Z > = P[Z > 1.2] = 1 - P[Z £ 1.2] = 1 - F (1.2) = 0.1151
ë 10 úû

DISTRIBUCIÓN MUESTRAL DE LA MEDIA


Sea una población X con media m y varianza s2 del cual se toma una m.a. de
tamaño n: X1, X2,... Xn del cual se obtiene su media muestral x

ÞSe cumple:

a) E ( x ) = m ;
s2
b) V ( x ) =
n

c) Z =
(x - m ) n ; ~N (0.1)
s
Nota
æ s2 ö
1) Cuando n ® ¥ Þ x ~ N çç m j ÷÷ cuando n ³ 30, no importa si la población
è n ø
es discreto o continuo
æ s2 ö
2) Cuando n ³ 2 si X~N(m,s2)Þ x ~ N çç m ÷÷
è n ø
3) Si el muestreo es sin reemplazo de una población finita de tamaño N

s2 æ N -nö
ÞV( x )= s 2 x = ç ÷ factor de corrección
n è N -1 ø
Ejemplo
Suponiendo que una población consta de los siguientes valores
observados:3,4,7,9,12. Calcular
a) La media y Varianza poblacionales
b) Determinar la distribución muestral de la media de la m.a. de tamaño 2
escogidos con reposición
c) Se extrae una m.a de tamaño 36 con reposición cual la P[5 £ x £ 8]

SOLUCIÓN

Como N=5Þ m = å
xi 3 + 4 + 7 + 9 + 12
= =7
N 5
s2 =å
299 54
x 2 P ( x) - m 2 = - 72 = = 10.8 ; s = 3.2863
5 5

b) La distribución muestral de la media se obtiene mediante:

x P( x) x P( x) x 2 P( x )
3 4 7 9 12 3 1
25 3
25
9
25
3.5 2

3 (3.3 ) (3.4 ) (3.7 ) (3.9 ) (3.12 ) 1


25

4
x 3 3. 5 5 6 7. 5 2
25

5 25
4 ( 4.3 ) ( 4.4 ) (4.7 ) (4.9 ) ( 4.12 ) 5.5 2
25
x 3.5 4 5.5 6.5 8 6 2
25

7 (7.3 ) (7.4 ) (7.7 ) (7.9 ) (7.12 ) 6.5


2
25

x 5 5.5 7 8 9. 5 7
1
25

(9.3 ) (9.4 ) (9.7 ) (9.9 ) (9.12 )


2
9 7.5 25
4
x 6 6.5 8 9 10.5 8 25
1
(12.3 ) (12 .4 ) (12.7 ) (12.9 ) (12.12 ) 9 25
12 2
x 7.5 8 9.5 10.5 12 9.5
2
25

25
10.5
1
25
12 144
12 25 25
TOTAL 175
25

mx = E ( x ) = å x P ( x ) =
175
=7
25
s x2 = V ( x ) = å x 2 P (x ) - m 2 =
1360
- 7 2 = 5. 4
25

c) Se extrae una m.a. tamaño 36 con reposición


n = 36 sabemos que x ~ m ,
s2
y Z=
(x - m ) n
n s
m =7
é (5 - 7 ) 36 (8 - 7 )
36 ù
s 2 = 3.2863 = 1 P ê £Z£ ú
ë 3.2863 3.2863 û

Þ P[- 3.65 £ Z £ 1.83] = P[Z £ 1.83] - P[Z £ -3.65]


= F (1.83) - F (- 3.65) = 0.9664 - 0 = 0.9664

DISTRIBUCIONES ESPECIALES UTILIZADAS EN PRUEBAS

Cuando las m.a, son pequeñas n<30 no se pueden suponer que la distribución
muestral es NORMAL, TAMPOCO SE PUEDE APLICAR EL teorema central del
limite, por lo que se debe recurrir otras distribuciones muéstrales las especiales
que estén relacionadas con la NORMAL;entre estas distribuciones tenemos: la
CHI-cuadrado, la t-Student y la F de Fisher

DISTRIBUCIÓN CHI CUADRADO X R2 Ó X a2

Es un caso particular de la distribución gamma, tiene muchas aplicaciones entre


ellas para la construcción de IC y las pruebas de Hipótesis de la Varianza

DEFINICION
Sean r v.a. independientes: Z1,Z2,…Zr tal que Zi~N (0.1)
r
Sumando los cuadrados Z12 + Z 22 + Z r2 = å Zi2 ~ X r2 grados de libertas, Sii
i =1
FUNCIÓN DE DENSIDAD
R=1

R=3 R=7 R=10

ìï 1
f x 2 (x ) = í r
V
-1 - X
X 2 e 2; 0< X <¥
ïî 2 2 h ( 2r )
;esc

Donde h = función gamma


r = grados de libertad o Nº de variables

CARACTERÍSTICAS

1) A medida que aumente los grados de libertad tienden a normalizarse


2) LA MEDIA m = E ( x 2 ) = r
3) LA VARIANZA s 2 = E ( x 2 ) = 2r

PROPIEDAD REPRODUCTIVA

Sean K v.a. independiente: X1, X2,... Xk tal que Xi ~ X2(ri)


Þ Si sumamos åX i
2
~ X æ2 k ö
çå i ÷
ç r÷
èi= 1 ø

F(x)
FUNCIÓN DE DISTRIBUCIÓN

[ ] ò
F ( x) = P x £ X a2 =
0
xa2
f ( x )dx = a
a
1-a
[ ] [
Cuando P x > X a2 = 1 - P x £ X a2 = 1 - a ]
USO DE TABLAS

Dada la importancia y la complejidad de su calculo, se tiene confeccionado tablas,


en base a la función de distribución con 2 entradas, donde:

La 1ra columna representa los grados de libertad “r”


La 1ra fila representa el nivel de significancia ó probabilidad 0 £ a £ 1
La intersección de fila columna de le valor critico X a2
Ejemplo 1

X ~ X 262 Determinar las siguientes probabilidades


a) P[x £ 17.29]
b) P[x ³ 38.88]
c) P[13.84 £ x £ 45.64]
d) P[x £ 40]

SOLUCIÓN

Como v=26

[ ]
a) P[x £ 17.29] = P x £ X 02.10 = 0.10

[ ]
b) P[x ³ 38.88] = 1 - P[x < 38.88] = 1 - P x < X 02.95 = 1 - 0.95 = 0.05

c)
[ ] [ ]
P[13.84 £ x £ 45.64] = P[x £ 45.64] - P[x £ 13.84] = P x £ X 02.99 - P x £ X 02.025 = 0.99 - 0.025 = 0.965

[ ]
d) P[x £ 40] = P x £ X 02.96 = 0.96 mediante interpolación
38.9 40 41.9
a - 0.95 0.975 - a
¯ ¯ ¯ = Þ a = 0.96
40 - 38.9 41.9 - 40
0.95 a 0.975

Ejemplo 2

Si X~ X r2 hallar los valores críticos:

a) “a” tal que P[x £ a ] = 0.999 si r = 30


b) “a” y “b” tal que P[a £ x £ b] = 0.95 si r = 13 ; además P( x > b ) = 0.023
c) “a” tal que P( x £ a ) = 0.015 si r = 8

a) P[x £ a ] = 0.999 si r = 30 Þ P[x £ 59.7] = 0.999 Þ a = 59.7

b) P[a £ x £ b] = 0.95 Þ P( x £ b) - P (x £ a ) = 0.95

como P( x > b) = 0.025 Þ 1 - P( x £ b) = 0.025 Þ 1 - 0.025 = 0.975 Þ b = 24.7

c) P( x £ a ) = 0.015 si r = 8

interpolando
2.18 a 1.65
a - 2.18 0.015 - 0.025
¯ ¯ ¯ =
1.65 - 2.18 0.01 - 0.025
0.025 0.015 0.01
a - 2.18 - 0.01
=
- 0.53 - 0.015
Þ a = 2.18 - 0.3533 = 1.8267

DISTRIBUCIÓN MUESTRAL DE LA VARIANZA

DEFINICIÓN

Sea una v.a. ó una población X~N(m,s2) donde m,y s2 son desconocidos, por lo
tanto se toma una m.a. de tamaño n para estimar la media x y la varianza S2 tal
que
2
a) x y S .son dos estadísticos independientes donde S 2
=
å (x - x )
i
2

además la
n

varianza muestral insesgada es Sˆ 2 = å (x - x )


i
2

n -1

b) El estadístico
(n - 1)S ~X2(n-1) g.d.l. cuando n ® ¥
ˆ 2

s2
( )
c) E S 2 =
(n - 1)s 2
n
2
nS
d) ~ X2(n-1) g.d.l.
s 2

Ejemplo
Se tiene una población X ~ N(m,s2)del cual se toma una m.a. tamaño 15 y se tiene
S2. Calcular:
é S2 ù
a) P ê0.3107 £ ££ 1.9427ú ;
ë s 2
û
é Sˆ 2 ù
b) P ê0.3329 £ 2 £ 2.0814ú
ëê s ûú
SOLUCION
a)
é ù
S2
[
P ê0.3107 £ 2 £ 1.9427 ú = P 0.3107(0.15) £ X 142 £ 1.9427(15)
s
]
ë û
[ ] [ ] [
Þ P 4.6605 £ X 14 £ 29.1405 = P X 142 £ 29.1405 - P X 142 £ 4.6605 ;
2
]
Þ P[X 2
14 < X 02.99 ] - P[X < X ] = 0.99 - 0.01 = 0.98
2
14
2
0.01
b)
é ù
Sˆ 2
[
P ê0.3329 £ 2 £ 2.0814ú = P 0.3329(14) £ X 142 £ 0.20814(14)
s
]
êë úû
[ ] [
Þ P 4.6606 £ X 142 £ 2.91396 = P X 142 £ 2.91396 - P X 142 £ 4.6606 ] [ ]
= 0.991 - 0.01 = 0.98

DISTRIBUCIÓN t –STUDENT (T)


- Es otra distribución relacionada con la NORMAL y la gamma que se usa
principalmente en las estimaciones y en las pruebas de hipótesis de la media
cuando las m.a. son pequeñas:n<30
DEFINICIÓN
Sean 2 variables aleatorias independientes:

- Z ~ N(0.1); Y ~ X R2 dividiendo ambas variables


Z
ÞT = Þ Se dice que tiene una distribución t-student con v grados de libertad
Y
r

Sii

FUNCION DE PROBABILIDAD

h ( r 2+1 )
f (t ) =
rPh ( )
[1 + ]: -¥ < t < ¥
r
t2
r
2

Esta distribución está completamente determinado solo por el parámetro r


Gráficamente tienen las siguientes características N(0.1)

r=5
1) Es simétrica con respecto t=0=m
2) Cuando n o v se hace grande tiende a normalizarse r=3

3) Tiene mayor dispersión que la normal

t=0=m
ESPERANZA MATEMÁTICA

¥
E ( x) = m = E (T ) = ò t f (t )dt = 0; r > 1

VARIANZA

¥
V (T ) = s 2 = E (t 2 ) - (mt ) =
r
ò t 2 f (t ) dt - 0 2 = ;v > 2
2
-¥ r-2

USO DE TABLAS
Dada la importancia en la Estadística Inferencial y la complejidad de su calculo, se
tiene confeccionado tablas con 2 entradas.

Esta tabla esta confeccionada en función de la acumulada P[T £ t ] Donde en la


primera fila se tiene los percentiles o probabilidades en la primera columna se
tiene los grados de libertad n ó r, la intersección de fila columna corresponde a los
ta
valores críticos ta Porque P[T £ ta ] = ò f (t )dt = a
-a
f(t)

Como la distribución es simétrica Þ ta = -t i -a

ta
Ejemplo

Determinar el valor critico de P[T £ t 0.90 ] con v=5 g.d.l.

SOLUCIÓN

P[T £ 1.176] = 0.90

EJEMPLO 2

Determinar el valor crítico de P[T £ t 0.10 ] con v=5 g.d.l.

SOLUCIÓN

P[T £ t1-0.10 ] = P[T £ t 0.90 ] = P[T £ -1.476] = 010

DISTRIBUCIÓN DE
(x - m ) n
~t(n-1)g.d.l.
S

LA V. A. O ESTADÍSTICO

Ejemplo

Si x es la media y S2 es la varianza de una m.a. de tamaño 9 seleccionado de una


población NORMAL con media m = 90 Calcular
é
P ê0.2353 £
ë
x - 90
s
ù
[
£ 1.1183ú = P 0.2353 9 £ T £ 1.1183 9
û
]
P[0.7059 £ T8 £ 3.3549] = P[T8 £ 3.3549] - P[T8 £ 0.7059]
= 0.995 - 0.75 = 0.245

DISTRIBUCIÓN F O DE FISHER X~ F (r1 , r2 )ó ~ f a ;r1 ,r2

Esta distribución especial generalmente se utiliza para comparar las varianzas de


2 v.a independientemente o de 2 poblaciones normales, mediante los IC y las
pruebas de hipótesis sobre sus varianzas mediante la razón de las mismas

DEFINICIÓN

Sean 2 v.a. independientes V~ x r22 y r~ x r22


U
Si se donde F = 1 ~ F ( r1 r2 ) g .d .l. Sii
r
V
r2

FUNCIÓN DE DENSIDAD

ì
( )
ï v1 +v2 v21 v 221
ïh 2 v1 v 2
f F (Z ) = í ;0 < Z < a
( )( )
ï h 2h 2
v1 v2

ï 0
î
Cuya gráfica nos permite determinar sus características
ff(2)
F(10.2)
1) A medida que aumentan los F(10.2)
grados de libertad tienen a
normalizarse de manera positiva

MEDIA

v2
m (F ) = E(F ) = m = ; v2 > 2
v2 - 2

2) VARIANZA

Zv 22 (v1 + v 2 - 2)
s 2 (F ) = V (F ) = ; v2 > 4
v1 (v 2 - 2) 2 (v 2 - 4)
FUNCIÓN DE DISTRIBUCIÓN O ACUMULADA
F(x)

F ( x ) = P[F £ f a ] = a

Cuando P[F > Fa ] = 1 - P[F £ f a ] = 1 - a

a
1- a
fa = v.critico

USO DE TABLAS

Se tiene 3 entradas:

La 1ra columna representa los g.d.l. del denominado r2


La 2da columna representa la probabilidad (p= a )
La 1ra fila representa los grados de libertad (g.d.l.) del numerador r1
La intersección de filas columnas nos da el valor critico fa

Ejemplo 1

Si X ~ F ( 4.5) hallar probabilidades


a) P[x £ 7.39]
b) P[x > 11.4]
c) P[x £ 8]
d) P[x £ 0.0645]
Solución
Como v1= 4: v2=5
a) P[x £ 7.39] = P[x £ f 0.975 ] = 0.975
b) P[x > 11.4] = 1 - P[x £ 11.4] = 1 - P[x £ f 0.99 ] = 1 - 0.99 = 0.01
c) P[x £ 8] = P[x £ f 0.9773 ] = 0.9773 interpolando
Ejemplo 2
Si F ~F(6,10) Hallar el valor “c”(valor crítico) tal que
a) P[x £ c ] = 0.99
b) P[x ³ c ] = 0.05
SOLUCIÓN
a) P[x £ c ] = 0.99 Þ P[x £ 0.246] = 0.99 Þ c = 0.246
P[x ³ c ] = 0.05 Þ 1 - P[x < c ] = 0.05 = P(x < c ) = 0.95
b)
= P[x ³ 3.22] = 0.95 = c = 3.22

DISTRIBUCIÓN MUESTRAL DE LA PROPORCION


Sea una población X~b(n.p) Donde se desconoce p, se toma una m.a. tamaño “n”:
X + X 2 + ... + X n x
X1, X2,... Xn se estima la proporción p = 1 =
n n
Donde
æ xö
1) E ( p ) = m p = E ç ÷ = E (x ) de la distribución binomial E(x)=np
1
ènø n
1
reemplazando E ( p ) = np = p
n
æ xö 1
V ( p ) = V ç ÷ = 2 V ( x)
2) ènø n de la binomial V(x)= npq
1 pq
= 2 npq =
n n
P(1 - p)
V (p) =
pq pq
Þs p = Ós p =
n n n
p- p
3) Cuando n ® ¥ Þ la v.a.c. Z = :Z~N(0.1)
pq
n

Nota 1 Si la m.a. de tamaño”n” se obtiene de una población finita de tamaño N Sin


reemplazo
pq N -n
Þs p =
n N -1

p- p
ÞZ = : Z ~N(0.1)
pq N -n
n N -1

El factor de corrección por continuad en la distribución muestral de proyección es


1
2n

Ejemplo
Suponiendo que un lote de 50 ordenadores hay 10 defectuosos
Cual la probabilidad de que en una m.a. de tamaño n, ordenadores elegidos al
azar

1) Con reposición a)n=5 b)n=60 :i)20%; ii) más de 20% ordenadores sean
defectuosos
2) SIN REPOSICION

SOLUCION
10
1. con reposición :n=5; p = = 20 : q = 0.80
50
a)
i) X~b(5;0.20) donde
X:”Nº de PC ordenadores entre 5 con reposición
æ5ö
P( x ) = ç x ÷(0.20 ) (0.80) 5- x : Rx = 0,1,2...5
x

è ø
x= el 20% de 5=1
æ 5ö
Þ P[ p = 0.20] Þ P( x = 1) = ç1÷(0.20)(0.8) = 0.4096
4

è ø
ii ) P[ p > 0.20] = p[ X > 1] = 1 - P[ X £ 1] = 1 - B(1;5;0.20) = 1 - 0.7373 = 0.2627

b)
i) con n=60 como n>30 podemos aproximar mediante la normal

P[ p = 0.20] = P[x = 12] = corrigiendo P[11.5 £ x £ 12.5]


x - 60(0.20) x - 12
Estandarizando mediante Z =
60(0.2)(0.80) 3.0984

é11.5 - 12 12.5 - 12 ù
p (x = 12) = P ê £Z£ = P[- 0.16 £ Z £ 0.16]
ë 3.0984 3.0984 úû
P[Z £ 0.16] - P[z £ -0.16] = F (0.16) - F (- 0.16) = F (0.16) - 1 + F (0.16)
= 2 F (0.16) - 1 = 0.1272
æ 60 ö
Mediante la binomial P( x = 12) = ç12 ÷(0.20)12 (0.8)48 = 0.1278
è ø
Aplicando la verdadera distribución de la proporción, mediante
p- p 1
Z= donde el factor de corrección es
pq 2n
n

é 1 1 ù
P( p = 020) Þ P ê0.20 - £ p £ 0.20 + ú
ë 2(60) 2(60) û
P[0.1917 £ p £ 0.2083] ; estandarizado
é ù
0.1917 - 020 0.2083 - 0.20 ú
Pê £Z £ = P[- 0.16 £ Z £ 0.16]
ê (0.20 )(0.80 ) ( 0.20 )(0.80 ) ú
ë 60 60 û

P[z £ 0.16] - P[z £ -0.16] = F (0.16) - F (- 0.16 ) = F (- 0.16 ) - 1 + F (0.16)


= 2 F (0.16) - 1 = 2(0.5636) - 1 = 0.1272

ii) P[ p > 0.20] Þ Binomialmente


12
P[x > 12] = 1 - P[x £ 12] = 1 - å P( x) = como es demasiado largo recurrimos
0
mediante la aproximación a la normal, mediante

x ± 0.5 - np
Z= Þ 1 - p[x £ 12 + 0.5] = 1 - P[x £ 12.5] donde np=(60)(0.2)=12
npq
é 12.5 - 12 ù
estandarizando 1 - P ê z £ = 1 - P[z £ 0.16] = 1 - F (0.16) = 1 - 0.5636 = 0.4364
ë 3.0984 úû
mediante la distribución de la proporción
p- p
Z= = cuyo factor de corrección es 1
2n
pq
n

é 1 ù
P[ p > 0.20] = 1 - P[ p £ 0.20] = 1 - P ê p £ 0.20 + ú
ë 2(60) û
é ù
0.2083 - 0.20 ú
1 - P[ p > 0.2083]es tan darizando Þ= 1 - P Z £ê
ê ( 0.20 )( 0.80 ) ú
ë 60 û
é 0.0083 ù
= 1 - Pêz £ = 1 - P[Z £ 0.16] = 1 - F (0.16) = 1 - 0.5636 = 0.4364
ë 0.0516 úû

UNIDAD III
UNIDAD III :ESTIMACION PUNTUAL Y POR INTERVALOS

Competencia:

-El estudiante debe saber construir los diferentes Intervalos de Confianza a partir de las
estimaciones puntuales utilizando las diferentes distribuciones de cualquier parámetro ,para
poder realizar Inferencia Estadística

Objetivos.

-Utilizar correctamente el concepto de Estimación Puntual para la construcción eficiente de


Intervalos de Confianza de cualquier parámetro sujeto de investigación ,para poder realizar
generalizaciones respecto de la población en estudio y tomar decisiones coherentes

Descripción general de la unidad:

-Esta unidad comprende el desarrollo de los siguientes conceptos:Estimación-Estimador ,


Tipos de estimación:Puntual ,las propiedades de un buen estimador puntual y por
Intervalos de Confianza,La construción de los Intervalos de confianza de: La media,
diferencia de medias,(muestras grandes y pequeñas),la proporción y la diferencia de
proporciones,la varianza y la razón de varianzas ,utilizando las respectivas Distribuciones
especiales muestrales.

Lectura:Millar/Freund/Jonson “Probabilidad y Estadística para


Ingenieros”Edo.de México 1992 Pgs.208 al 213
Córdova Zamora “Estadística Descriptiva e Inferencial” 2ª ed.Perú 1996
Pags,333 al 375
Bibliografía Básica: Moya y Saravia (1988) “Probabilidad e Inferencia
Estadística((2ª ed) Perú .Pags.627al 684

Referencia electrónica: http://e-stadistica.bio.ucm.es/mod_intervalos5.html

ESTIMACIÓN PUNTUAL Y por INTERVALOS DE CONFIANZA

INTRODUCCIÓN

La teoría de la inferencia estadística se divide en 3 grandes áreas:

1. La estimación
2. Las pruebas de hipótesis
3. la teoría de la decisión

ESTIMACIÓN ESTADÍSTICA

Estadísticamente la estimación es el proceso por el cual se aproxima el valor de


cualquier parámetro desconocido de una población ( m , s 2 , s , r ) mediante los
estadísticos ( X , S 2 , S , v, etc. ) etc. obtenidos de una m. a. tomados de la población.

PRUEBA DE HIPÓTESIS

La prueba de hipótesis o docimasia de hipótesis consiste en comprobar, verificar


confirmar o rechazar si algún parámetro j ó alguna función de j es igual algún
valor preconcebido de j
TEORÍA DE LA DECISIÓN

La teoría de la decisión trata sobre las diferentes estrategias y diversos criterios


de decisión, para la toma de decisión frente a la incertidumbre.

MÉTODOS DE ESTIMACIÓN

Para estimar parámetros en base a m.a. y sus estadísticos se tiene 2 métodos de


estimación: 1) PUNTUAL 2) POR INTERVALOS DE CONFIANZA

ESTIMACIÓN PUNTUAL

Se dice que una estimación puntual cuando se obtiene un solo valor para cada
estadístico que nos permite aproximarnos al valor del parámetro en cuestion.

ESTADÍGRAFO

Llamado también estadístico, es toda medida descriptiva que se obtiene de la m.


a. y que sirve para estimar parámetros. Por lo tanto el estadígrafo esta en función
de la m.a.

Y = G ( X 1, , X 2 ,... X n ) cuyo valor y = g (x1 , x2 ,...xn )

PARÁMETRO j
Es toda medida descriptiva que sintetiza alguna característica de la población cuyo
valor se obtiene de toda la población
j = f ( X 1, X 2 ,...X n ) cuyo valor j = g (x1 , x2 ,...xn )
ESTIMADOR ĵ
Se llama estimador de un parámetro a cualquier estadígrafo: y = g ( x1, x2 ,...xn ) que
nos permite aproximar al valor del parámetro.
- Un mismo parámetro puede tener varios estimadores puntuales, se elegirá
aquel que se aproxime mas al valor del parámetro j
- Para poder elegir el mejor estimador se debe recurrir a:
LAS PROPIEDADES DE UN BUEN ESTIMADOR
Se dice que un estimador es un buen estimador si cumple minimamente los
siguientes requisitos o propiedades.
1. INSESGABILIDAD
Sea un estimador cualquiera ĵ del parámetro j , entonces se dice que es
INSESGADO sii

La E [jˆ ] = j ó E [jˆ - j ] = 0
2. CONSISTENCIA
Se dice que un estimador insesgado es consistente sii
a) Lim E[ĵ ] = j
n ®¥

b) lím V [ĵ ] = 0
n®¥
3. EFICIENCIA
Considerando todos los posibles estimadores insesgados de un
parámetro j , será eficiente aquel que tiene mínima varianza, llamándose
también estimadores de mínima varianza del parámetro j .
Sean dos estimadores insesgados jˆ1 y jˆ 2 de j
V (jˆ1 )
Þ si V (jˆ1 ) < V (jˆ 2 ) ó < 1 Þ el estimador ĵ1 es mas eficiente que ĵ 2
V (jˆ 2 )
4. ERROR CUADRÁTICO MEDIO (MSE) ĵ
Sea un estimador jˆ = G (x1, x2 ...xn ) un jˆ de j
Þ MSE (jˆ ) = E [jˆ - j ] = Var (jˆ ) + [j - E (jˆ )]
2 2

cuando el estimador es insesgado Þ MSE (jˆ ) = Var (jˆ )

EFICIENCIA RELATIVA Sean dos estimadores jˆ1 y jˆ 2 con Þ MSE (ĵ1 ) y


MSE (ĵ 2 )

Þ la eficiencia relativa de ĵ 2 respecto de ĵ1 se define como:


MSE (jˆ1 )
SI < 1 Þ ĵ 2 es mas eficiente que ĵ1
MSE (jˆ 2 )

Ejemplo

Se tienen 2 v.a o dos poblaciones X1 y X2 distribuidas independientemente

X1 ~ I (2j , s 2 ) Þ E ( X 1 ) = 2j ;V ( X 1 ) = s 2
X2 ~ I (4j , s 2 ) Þ E ( X 2 ) = 4j ;V ( X 2 ) = s 2

Donde j es el parámetro poblacional en cuestión; para ello se proponen 2


estimadores:
X1 X 2 X X
jˆ1 = + ;jˆ 2 = 1 + 2 Cual de los 2 estimadores es el mejor, elija de acuerdo
4 8 10 5
alas propiedades de un buen estimador

SOLUCIÓN
1) INSESGABILIDAD sabemos que E (jˆ ) = j
Para el 1er estimador ĵ1 Para el 2do estimador ĵ 2
éX X ù 1 éX X ù 1
E = ê 1 + 2 ú = E( X1 ) + E (X 2 ) ; E = ê 1 + 2 ú = E ( X1 ) + E ( X 2 )
1 1
ë 4 8 û 4 8 ë 10 5 û 10 5
1
(2j ) + 1 (4j ) = j Þ jˆ1 es insesgado; 1 (2j ) + 1 (4j ) = j Þ jˆ2 es insesgado
4 8 10 5
EFICIENCIA Será eficiente aquel estimador que tenga mínima varianza
æX X ö æX X ö
V (jˆ1 ) = V ç 1 + 2 ÷ V (jˆ 2 ) = V ç 1 + 2 ÷
è 4 8 ø
; è 10 5 ø

V (jˆ1 ) = V ( X 1 ) + V ( X 2 ) V (jˆ 2 ) = V (X 1 ) + V (X 2 )
1 1 1 1
16 64 100 25
V (jˆ1 ) = s + s = s V (jˆ 2 ) =
1 2 1 2 5 2 5 2
s
16 64 64 100
5 2
s
como 64 = 1.5625 > 1 Þ V (jˆ1 ) > V (jˆ 2 ) Þ El estimador ĵ 2 es mas eficiente que ĵ1
5 2
s
100

2) CONSISTENCIA Deben satisfacer 2 requisitos

a) Lim E [jˆ ] = j ó lím V [jˆ ] = 0


n®¥ n®¥

límE [jˆ1 ] = lim j = j ; límE [jˆ 2 ]= lim j = j


n ®¥ n®¥ n ®¥ n®¥

límV [jˆ1 ]= lim 5


64
s2 = 5s 2
¥
= 0 ; límV [jˆ 2 ]= lim 5
100
s2 = 5s 2
¥
= 0
n®¥ n ®¥ n®¥ n ®¥

significa que ambos estimadores son consistentes

MÉTODO DE ESTIMACIÓN PUNTUAL

La estimación puntual se lo puede realizar principalmente por 2 métodos:


1) mediante la máxima verosimilitud
2) mediante los momentos
3)
1) METODO DE LA MÁXIMA VEROSIMILITUD (M.V.)

Este método se fundamenta en el principio de elegir el valor del parámetro j a


estimarse para el cual f ( X 1 , X 2 ,...X n ;j ) es la probabilidad conjunta de obtener los
valores muestrales es una función máxima.
De acuerdo a este método se obtiene estimadores
a) suficientes
b) insesgados y de mínima varianza
c)
DEFINICIÓN
Sea una v.a. X cuya función de probabilidad: f(X, j ) depende del parámetro j que
se desconoce, para ello se toma una m.a. tamaño n : X 1 , X 2 ,...X n cuyos valores
X 1 , X 2 ,...X n Þ la función verosimilitud de la m.a. se define
n
V (j ) = f ( X 1, X 2 ,...X n , j ) = f ( X 1 , j ) f ( X 2 , j )... f ( X n , j ) = p f ( Xi, j ) , si X es continuo
i =1
n
V (j ) = p( X 1 , X 2 ,...X n , j ) = p ( X 1, j ) p( X 2 , j )... p ( X n , j ) = p p( Xi, j ) , si X es discreta
i =1
El método de M.V. consistente en tomar como valor estimado j , el valor que
maximice la v ( j ) para ello se debe logaritmizar
L = ln V (j ) = å ln f (x, j ) luego se debe derivar e igualar a 0
dL
= å S ln f (x j ) = 0
i

dj Sj

Nota.- Cuando la distribución de probabilidad tiene varios parámetros


desconocidos, se obtendrán tantas ecs. Como parámetros estimar
Así si se tiene K parámetros a estimar j1 ,j 2 ...j k
dL dL dL
Þ =0 = 0 : ... =0
dj1 dj 2 dj k

Ejemplo
Obtener el estimador de M.V. de lal probabilidad de éxitos “p” para una v.a.
x~Bernoulli, mediante el método de la M.V.

SOLUCIÓN
Sabemos que x~B(1,p) donde
P(x)= p x (1 - p)1- x ; x=0.1 donde 0<p<1
Sea una m.a. tamaño n : X 1 , X 2 ,...X n cuyos valores x1 , x 2 ,...x n donde
1) x~B(1,p) Þ p( xi , p ) = p xi (1 - p )1- x1 ; i = 1,2,...n

2) Þ V ( p ) = p p (xi , p ) = p p xi (1, p )1- xi = p å i (1 - p )å (1- xi )


n n
x
i= 1 i= 1

é n
ù
3) Þ aplicando logaritmos Þ L = ln V ( p ) = å xi ln p + ên - å X i ú ln (1 - p )
ë i =1 û
dL å xi n - å xi
4) Þ derivando con respecto a p e igualando a cero = + (- 1) = 0
dp p 1- p
5) Resolviendo la ecuación

åx i
=
n - å xi
Þ
1 - p n - å xi 1
= ; -1 =
n
-1
p 1- p p å xi p å xi
Þ
1
=
n
Þ pˆ =
åx i
Þ pˆ = x
p å xi n
2) MÉTODO DE LOS MOMENTOS
Este método consiste en igualar los primeros momentos muestrales originales con
los primeros momentos poblacionales originales m v' = M v'
Donde M v' = E (x r ) = å x r = å x r p(xi , j1, j 2 ...j k ) : v = 1,2,...k

M v' = E (x ) =
r åx v
i

n
m v' = ò x v f ( xi , j1 , j 2 ...j k )dx
Rx
Ejemplo
Sea una m.a. tamaño n : X 1 , X 2 ,...X n de una población X con distribución POISSON
con parámetro l Se pide estimar l .mediante el método de los momentos

SOLUCIÓN
Como solo se debe estimar un solo parámetro l , solo debemos hallar los primeros
momentos originales poblacionales y muestrales e igualarlos
Sabemos m1' = E ( X ) = m = l ; M 1' = å
X1
=X
n
Igualando m1' = M 1' Þ lˆ = X

ESTIMACION POR INTERVALOS DE CONFIANZA

INTRODUCCION

La estimación puntual aunque reúna todas las propiedades de una buena


estimación (insesgamiento, consistencia, eficiencia) adolece de una desventaja y
es que no nos proporciona ningún nivel de significación y/o de confianza. Por lo
tanto es necesario recurrir a otro tipo de estimación que nos permite algún nivel de
significación que es la estimación por intervalos de confianza.

INTERVALO ALEATORIO

Es aquel intervalo que tiene por lo menos uno de sus extremos una variable
aleatoria.

INTERVALO DE CONFIANZA (IC)

Sea una v.a. o una población X cuya DISTRIBUCIÓN de probabilidad: f(X; j )


donde el j se desconoce
Þ Se toma una m. a. de tamaño n: X1, X2 ,....Xn cuyos valores : x1, x2 ,....xn del que
se toman 2 estadísticas j 1 = G (X1, X2 ,....Xn); j 2 = G (X1, X2 ,....Xn) tal
que j 1 < j 2 : para los cuales se cumple: P[j 1 £ j £ j 2 ] = 100v% = 100(1 - a )%

donde

v= nivel de confianza Þ 100%


a = nivel de significancia Þ 0%
j 1 = limite inferior del IC para el parámetro j
j 2 =limite superior del IC para el parámetro j

NIVEL DE CONFIANZA (r) Y NIVEL DE SIGNIFICACION a

La elección de los niveles de confianza y/o de significación depende del


investigador los que generalmente son:

r= 0.90 0.95 0.975 0.98 0.99


a= 0.10 0.05 0.025 0.02 0.01

CLASES DE INTERVALOS DE CONFIANZA

De acuerdo al tipo de sus limites se tiene 3 clases de IC. Suponiendo una v.a. o
una población X con DISTRIBUCIÓN de probabilidad f ( X ; j ) del que se toma una
m.a. tamaño n
Þ j 1 = G (X1, X2 ,....Xn); j 2 = G (X1, X2 ,....Xn) tal que j 1 < j 2
Þ tenemos:

1. BILATERAL [j 1 ; j 2 ]óP[j 1 £ j £ j 2 ] =100v%


2. UNILATERAL INFERIOR [j 1 £ ¥]óP[j 1 £ j ] =100v%
3. UNILATERAL SUPERIOR [-a ; j 2 ]óP[j £ j 2 ] =100v%

NOTA.- Para construir un IC para j es necesario


a) Elegir el nivel de confianza r Þ 1: (99%, 95%, 90%) ó
Elegir el nivel de significancia a Þ 0: (1%, 3%, 10%)
b) Hallar 2 estadísticos j 1 y j 2 tal que j 1 £ j 2
INTERVALO DE CONFIANZA PARA LA MEDIA POBLACIONAL ( m ) CUANDO
SE CONOCE LA VARIANZA POBLACIONAL (s 2 )EN MUESTRAN GRANDES
n ³ 30
Sea una v.a. o una población X~ (m , s 2 ) donde se desconoce m, pero se conoce
(s 2 ), se toma una m. a. grande n ³ 30 del que se estima la media X

( ) é
Þ El IC para m con s 2 (conocido) n ³ 30 = ê X ±
s Z0 ù
ú
ë n û
ERROR
1+ r
donde Z Þ P[Z £ Z 0 ] =
2

NOTA
1. Cuando no se conoce s y la m.a. n ³ 30 Þ se utiliza S
2. Cuando X~N (m , s 2 ) , aun cuando n<30, la definición del IC es valida
3. Cuando el muestreo es SIN REPOSICION de una población finita, se debe
corregir el ERROR

é s Z0 N -n ù
Þ El IC= ê X ± ú
ëê n N - 1 ûú
4. Cuando se quiere construir el IC para el total Þ
Þ [j , N ;j 2 N ] ó P[j , N £ TOTAL £ j 2 N ] = 100v%

Ejemplo

Un analista de mercado desea estimar el ingreso per cápita familiar mensuales de


una determinada población. Para ello toma una m.a de tamaño 100 de esa
población la cual determinó que el promedio del ingreso familiar es de $us. 500.-.
Suponiendo que el ingreso familiar mensual sigue una distribución normal con
desviación típica igual a $us. 100.-

a) Construya un IC para la media del ingreso familiar de toda esa población


b) Construya un IC para la media del ingreso familiar de toda esa población si es
de 2000
c) Construya un IC para el total de ingreso familiar de toda esa población, al nivel
del 95%

SOLUCIÓN

é s Z0 ù
a) Sabemos que el IC para m, con s 2 (conocida) cuando n ³ 30 = ê X ± ú
ë n û
1 + 0.95
Donde v=0.95 Þ Z 0 Þ P[Z £ Z 0 ] = = 0.975 Þ Z 0.975 = 1.96
2
X = 500 s » S = 100 n = 100
s Z0 s Z0 100(1.96)
EL ERROR = = = = 19.6
n n 100
é S Z0 ù é S Z0 ù
j1 = ê X - ú = 500 - 19.6 = 480.4; j 2 = ê X + ú = 500 + 19.6 = 519.6
ë n û ë n û
Þ El IC para m al 95% =[480.4;519.6]ó P[480.4 £ m £ 519.6] = 0.95

Significa que de 100 m.a que se toma de esa población; 95 m.a arrojaran un
promedio comprendido en el intervalo y solo 10 m.a. no se están comprometido
en el IC.
é s Z0 N -n ù
b) Como se conoce N=2000 Þ IC para m al 95% Þ ê X ± ú
ëê n N - 1 ûú
100(1.96) 2000 - 100
Þ ERROR= = 19.11
100 2000 - 1
j 1 = 500 - 19.11 = 480.89; j 2 = 500 + 19.11 = 519.11

Þ El IC para m al 95% =[480.89; 519.11]ó P[480.89 £ m £ 519.11] = 0.95

c) El IC para el total al 95%= [j , N ; j 2 N ] = [480.89(2000);519.11(2000)] = [961780; 1038220]

TAMAÑO MUESTRAL PARA ESTIMAR LA MEDIA

Para determinar el tamaño de la m.a cuando se quiere estimar la media


poblacional mediante el IC, se presenta 2 situaciones

a) Cuando el muestreo se hace con reposición ó cuando no se conoce la


2
s Z0 æs Z ö
población se toma su error Þ Edel cual se despeja n n = çç 0
÷÷
n è E ø
b) Cuando el muestreo se hace sin reposición, es decir cuando se conoce la
és Z 0 N -n ù
población, se toma su error Þ ê ú del cual se despeja n
êë n N - 1 úû

Z 02 s 2 N
n=
Z 02 s 2 + E 2 ( N - 1)

Ejemplo

Un grupo de 50 animales experimentales reciben una cierta clase de raciones por


un lapso de 2 semanas. Sus aumentos de pesos arrojan los valores X =420 grs. y
S=60 grs.
a) ¿Que tamaño debe tomarse, si se desea que X difiera de m por menos de 10
grs. con 0.95 de probabilidad de ser correcto?
b) Encontrar el IC del 95% para m ?

SOLUCIÓN
2
s Z0 æ S Z0 ö
a) Como el ERROR=10= Þ n = çç ÷÷
n è E ø

además v=0.95 =Z0=1.96

æ 60(1.96) ö
2
n=ç ÷ = 138.30 » 138
è 10 ø
60(1.961)
b) Como n=138 Þ El IC para m al 95% = 420 ±
138

é 117.6 ù
ê420 ± 11.7473 ú = [420 ± 10.0108] = [409.99;430.0108]
ë û

O =P( 409.99 ≤ m≤ 430.0108) = 0.95

INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS DE 2


POBLACIONES CON DESVIACIONES TÍPICAS CONOCIDAS MUESTRALES
GRANDES (n, m ³ 30)

Sean 2 v.a. independiente ó 2 poblaciones, de las cuales se desconocen sus


media, pero se conocen sus varianzas o desviaciones típicas se quiere estimar,
mediante un IC del 100v% la diferencia de sus medias (m x - m y ) ; de las cuales se
toman 2 m.a. ;grandes y luego se obtienen sus medias respectivas

X ~. ( m xs y2 ) Y ~. (m y s y2 )
¯ ¯
m.a. tamaño n ³ 30 m.a. tamaño m ³ 30
X Y
é
s x2 s y ùú
2
El IC para m x - m y al 100v % = ê(x - y ) ± Z 0
+
ê n m ú
ë û
1+ v
Donde Z0 se obtiene mediante la P[Z £ Z 0 ] =
2
NOTA

1) Si X~ N (m x s x2 ) y Y~ N (m y s 2y ) conocidos s x2 y s 2y aun cuando las muestras son


pequeñas n. m <30 la definición anterior es válida
2) Si no se conoce, s x2 y s 2y , pero se tienen muestras grandes
é 2 ù
S x2 S y ú
El IC para m x - m y al 100 v% = ê(x - y ) ± Z 0 +
ê n m ú
ë û

Ejemplo

Una m.a. de 200 pilas de la marca “A” para calculadores muestra una vida media
de 140 hrs. y una desviación típica de 10 hrs. Otra m.a. de 120 pilas de la marca
“B” de una vida media de 125 hrs. Con una desviación típica de 9 hrs. determinar:

a) Un IC del 95% para la diferencia de la vida media de las poblaciones A y B


b) Un IC del 99% para la diferencia de la vida media de ambas poblaciones

SOLUCIÓN

Como x =140 : Sx=10 con n=200 de la marca “A”


y =125 : Sy=9 con m=120 de la marca “B”
é 2 ù
S x2 S y ú
a) r=0.95 =Z0=1.96 =El IC para m x - m y al 95% = ê(x - y ) ± Z 0 +
ê n m ú
ë û
2
S x2 S y 10 2 9 2
E = Z0 + = 1.96 + = 196(1.08401) = 2.1246
n m 200 120

[ ]
x - y = (140 - 125) = 15 El IC para mx - m y al 95% = [15 ± 2.1246] = 12.88 £ m x - m y £ 17.12

b) r=0.99 Þ P[Z < Z 0 ] =


1.99
= 0.995 Þ Z 0.995 = 2.575
2

Þ E=(2.575(1.0840)=2.7913

Þ El para m x - m y al 99%=[15 ± 2.7913]=[12.2087;17.7913]=[12;18]

INTERVALO DE CONFIANZA PARA LA PROPORCIÓN, MUESTRA GRANDE


(n ³ 30)
Sea una v.a ó una población X~b(n,p) donde se desconoce la proporción
poblacional p, se toma una m.a tamaño grande (n ³ 30) : X1 ,X2 ,....Xn del cual se

estima la proporción pˆ = = å
x xi
n n
é pˆ qˆ ù 1+ v
Þ El IC para “p” al 100v%= ê pˆ ± Z 0 ú donde Z 0 Þ P[Z £ Z 0 ] =
ëê n ûú 2
NOTA

Cuando el muestreo es SIN REPOSICIÓN de una población finita se debe corregir


N -n
el modulo error con
N -1
é pˆ qˆ N -n ù
Þ El IC para “p” al 100v%= ê pˆ ± Z 0 ú
êë n N - 1 úû

Ejemplo

Se toma una m.a. de 600 estudiantes de una población estudiantil 360 sostuvieron
su preferencia por una determinada marca de CPU

a) Hallar el IC del 95% para la proporción “p” de preferencia de dicha marca de


CPU
b) Si la proporción de preferencia se estima en 0.6 determine el error máximo de
estimación, si se quiere confianza del 98%

SOLUCIÓN
360
a) Sabemos y n=600 ; x=360 Þ pˆ = = 0. 6
600
é pˆ qˆ ù
Þ El IC para “p” n ³ 30 = ê pˆ ± Z 0 ú ; v=0.95 Þ Z0=1.96
ëê n ûú
é pq ù
donde el error ê Z 0 ˆ ˆ ú = 1.96
(0.6)(0.4) = 1.96(0.02) = 0.0392
êë n úû 600

Þ El IC para “p” al 95% =[0.6 ± 0.0392]=[0.5608;0.6392]


Þ P[0.5608 £ p £ 0.6392] = 0.95
también
Þ P[56,08% £ p £ 63,92%] = 0.95

b) Como p̂ =0.6; v=0.98 P[Z £ Z 0 ] =


1.98
= 0.99 Þ Z 0.99 = 2.33
2

Error máximo = 2.33


(0.6)(0.4) = 2.33(0.02) = 0.0466
600
TAMAÑO MUESTRAL PARA ESTIMAR UNA PROPORCIÓN
Para estimar el tamaño de la m.a. cuando se quiere construir un IC para la
proporción, se toma su error ya sea con reposición o sin reposición dependiendo si
se conoce ó no la población

a) Cuando no se conoce la población


pˆ qˆ Z 2 pˆ qˆ
E = Z0 Þn= 0 2
n E
b) Cuando no se conoce la población ni la p̂
Z 02
n=
4E 2
c) Cuando se conoce la población

pˆ qˆ N -n
E = Z0
n N -1
n0 N Z 02 s 2 Z 02
n= donde ó n0 =
n0 + ( N - 1) E2 4E 2
para estimar la media para estimar la proporción

Ejemplo

Una importación de 2000 focos tiene una desviación típica de la duración de los
mismos de 100 hrs. El ingeniero de control de calidad desea determinar el tamaño
de la m.a. para estimar la duración promedio, con aproximación de ± 20 hrs. Del
promedio real con 95% de confianza.

SOLUCIÓN
Los datos son s=100; N=2000; E =20 v=0.95 Þ Z0=1.96
Como se conoce la población y no se conoce la proporción muestral

Þ utilizamos
96(2000) 192000
n= = = 91.65 » 92
96 + (1999) 2095

Ejemplo
El gerente de una agencia bancaria que tiene 1000 cuenta correntistas quiera
determinar la proporción de sus cuenta correntistas a los cuales les paga el sueldo
mensual, Para ello quiere determinar el tamaño de la m.a. con un error de ± 0.05
con un 90% de confianza
SOLUCIÓN

Como N=1000; E=0.05; v=0.90 Þ Z0=1.645


271(1000) 271000
Þn= = = 213.39 » 214
271 + (999) 1270
TAMAÑO DE LA MUESTRA PARA POBLACIONES FINITAS

Cuando el muestreo se realiza sin reposición de una población finita, se debe


utilizar el factor de corrección, por lo tanto se debe determinar mediante 2 fases:

1ra fase.- Se debe determinar la muestra inicial


Z 0s 2
n0 = Cuando se quiere estimar la media
E2

Z 02 pˆ qˆ
n0 = Cuando se quiere estimar la proporción cuando se conoce p̂
E2
Z 02
n0 = Cuando se quiere estimar la proporción cuando no se conoce p̂
4E 2

2da Fase.- Se determina la muestra final

n0 N
n= donde N= tamaño de la población conocida
n0 + ( N - 1)

Ejemplo

La desviación típica de la duración de cierto “chips” de una determinada fabrica es


100 hrs. Para un embarque de 10.000 chips, el gerente de control de calidad de la
fabrica, desea determinar el tamaño de la m.a para estimar la duración media con
aproximación de ± 20 hrs. del promedio real con 95%

SOLUCION

s=100: N=10.000 n=? E =20 r=0.95 ÞZ0=1.96

De acuerdo al muestreo sin reposición de una población finita

1ra fase

n0 =
Z 0s 2
=
(1.96)2 (100)2 = 96.04 » 96
E2 (20)2

2da fase

n0 N 96(10000) 960000
n= = = » 95
n0 + ( N - 1) 96 + 9.999 10095
INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE PROPORCIONES

Sean 2 poblaciones X~b(n1p1) : Y~b(n2p2) donde se desconocen las proporciones


poblacionales.

Se toman 2 m.a. tamaños grandes n1 , n 2 ³ 30

n1 : x1 , x 2 ...x n n 2 : y1 , y 2 ... y n

Se estiman sus proporciones muestrales

x y
pˆ 1 = y qˆ1 = 1 - Pˆ1 pˆ 2 = y qˆ 2 = 1 - Pˆ2
n1 n2

Þ El IC para P1-P2 al 100v% con n1 , n 2 ³ 30

é ù 1- v
ê(Pˆ1 - Pˆ2 ) ± Z 0 ú donde Z 0 Þ P[Z £ Z 0 ] =
pˆ 1 qˆ1 pˆ 2 qˆ 2
+
êë n1 n2 úû 2

Ejemplo
Un fabricante afirma que su nuevo producto de consumo popular prefieren mas los
varones que las mujeres. Para verificar tal afirmación se toma una m.a. de 250
varones hallándose que 175 prefieren el nuevo producto y otra m.a de 200
mujeres, hallándose que 120 prefieren el nuevo producto. Mediante un IC del 95%
para la verdadera diferencia de proporciones de preferencias entre hombres y
mujeres se puede concluir que el fabricante del nuevo producto tiene razón?

SOLUCIÓN
n1 = 250 var ones n 2 = 200 mujeres
x = 175 y = 120
175 120 Sabemos ;r=0.95 Þ Z0=1.96
pˆ 1 = = 0.7 pˆ 2 = = 0. 6
250 200
qˆ 2 = 0.3 qˆ 2 = 0.4

donde el ERROR

é (0.7 )(0.3) + (0.6)(0.4) ù = 0.0882


ê E = 1.96 ú
ëê 250 200 ûú

pˆ 1 - pˆ 2 =0.7-0.6=0.1

Þ El IC para P1=P2 al 95 %[0.1 ± 0.0882]=[0.0118;0.1882]

ó también p [0.0118 £ P1 - P2 £ 0.1882]


Como la diferencia de la proporción de varones y mujeres que prefieren el nuevo
producto es positivo, se puede concluir que P1>P2, es decir que el fabricante tiene
razón al 5% de significancia.

INTERVALO DE CONFIANZA PARA LA MEDIA CON VARIANZA DESCONOCIDA


MUESTRAS PEQUEÑAS

Sea una v.a. o una población X~N( m , s 2 ) donde se desconocen m , s 2 se toma una
m.a tamaño pequeño :n<30: n1 : x1 , x 2 ...x n del cual se estima n la media y varianza
åx å (x - x)
2

con x = y S =
i 2 i
respectivamente
n n -1
t0S t0S
Þ El IC para m con s 2 desconocido n<30= x - ;x+
n n

NOTA.-
1. Cuando el muestreo es un reemplazo de población finita
é t0S N -n ù
El IC para m al 100%= ê x ± ú
ëê n N - 1 ûú
2. Cuando se quiere estimar el total = [jˆ1 N ; jˆ 2 N ]

EJEMPLO
Los contenidos de 5 latas de café instantáneo de una determinada marca han
dado los siguientes pesos netos en grs.: 280, 290, 285, 275, 284

a) Construya un IC para la media de todos los contenidos de latas de café


b) Con qué grado de confianza se estima de tal manera que el contenido
promedio d café tenga los límites : 277,432; 288,168

SOLUCION
Suponiendo que los pesos de las latas tienen distribución Normal:
t S
a) Sabemos que el IC para m al 100v% x ± 0
n

x=
åx i
= 282.8 : S 2 =
å (x i - x)
2

= 31.7 S = 5.6303
n n -1
2.776(5.6303)
El E = = 6.9898
5
El IC para m al 95% =[275.8102;289.7898]

t0S t0 S
b) Sabemos que jˆ 1 = x - ; jˆ 2 = x +
n n
t 0 (5.6303) (288.168 - 282.8) 5
jˆ 2 = 288.168 = 282.8 + Þ = t0
5 5.6303
1+ v
t 0 = 2.1319 Þ P[T £ 2.1319] = = 0.95
2
r = (0.95)2 - 1 = 0.90 = 90%

INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS CON VARIANZAS


DESCONOCIDAS, PERO IGUALES, MUESTRAS PEQUEÑAS; n, m<30

Sean 2 v.a. ó 2 poblaciones X~N( m x , s x2 ) : Y~N( m y , s 2y ) donde se desconocer las


medias, pero que tienen una misma varianza.
Se toman 2 m.a tamaño pequeños n<30:m<30 donde se obtienen x : S X2 ; y : S y2
El estadístico de prueba para m x - m y es (x - y )
[
Þ El IC para m x - m y al 100v% = ( x - y ) ± t 0 S c 1
n
+ 1
m
]
1+ v
donde P[T £ t 0 ] =
2
(n - 1)S x2 + (m - 1) S y2
t0~t(n+m-2)gdl. Sc =
n+m-2
Ejemplo
En 2 m.a. independientes de 10 bolsas de arroz de un kilo de 2 molinera “A” y “B”
se encontraron los siguientes porcentajes de grano quebrados por kilo
A: 6,5,6,7,4,7,6,4,3,6
B: 7,6,7,9,5,8,7,6,10,8
Suponiendo que los porcentajes de granos quebrados por kilo en cada molinera se
distribuye normalmente con la misma varianza. Determine un IC del 95% para la
diferencia de las 2 medias de porcentajes de granos quebrados por kilo de arroz
de las molineras “A” y “B”

SOLUCIÓN

1.95
V=.95 P[t£t0]= Þ t 0.975;18 gdl = 2.101
2
“A” n=10; x =5.4 : Sx=1.35
“B” m=10: y =7 ; Sy=1.49

E =1.345
El IC para la m x - m y al 95%= [(5.4 - 7.3) m 1.345][- 1.9 m 1.345] = [- 3.245;-0.555]

INTERVALO DE CONFIANZA PARA LA VARIANZA

Sea una v.a. ó una población X~N( m , s 2 ) con m , s 2 desconocidos. Se toma una

m.a de tamaño n : x1 , x 2 ...x n= x= å i : S 2= å 1


x (x - x ) 2
El IC para s 2 al 100 r
n n -1

%= éê (n - 1)S 2 ; (n - 1)S 2 ùú
ê 2a 2
ú
ë x1- 2 ;(n-1) x 2 ;( n-1) û
a
Donde X 22- a ; X a2 son valores críticos que tienen distribución CHI cuadrado con (n-1)
2 2

a a
g.d.l., es decir P éê X 2 £ X a2 ùú = ; Péê X 2 £ X 12- a ùú = 1 -
ë 2 û 2 ë 2 û 2

CONSECUENCIA

é
El IC para s al 100v%= ê S
(n - 1) ; S
(n - 1) ùú
ê X 12- a X a2 ú
ë 2 2 û

Ejemplo

A un laboratorio de ensayo de materiales se lleva una m.a. de 10 cables para


obtener sus cargas de rotura a la tracción, cuyos resultados en kg/cm2son :
280,295,308,320,265,350,300,310,285,310; considerando que estas cargas
poseen distribución normal. Se pude construir

a) El IC del 90% para la varianza


b) El IC del 90% para la desviación

SOLUCION

åx å (x - x)
2
i 3023 i 4986.10
X= = = 302.3; S 2 = =
n 10 n -1 9
S2=554.0111 Þ S=23.5374

é ù
a) El IC para la s 2 ê (
al 90% = ê 2
n - 1)S 2 (n - 1)S 2 ú
: 2
X X a ( n -1) ú
êë 1- a2 ( n -1) 2 úû

Como v =0.90; n=10 S2=554.011 a = 0.10

[ ] [ ]
Þ P X 2 £ X 12- 0.10 ;9 g .d .l. = P X 2 £ X 02.95 ;9 Þ X 02.95 ;9 = 16.92
2

êë 2 úû
[ ]
P é X 2 £ X 12- 0.10 ;9 g.d .l .ù = P X 2 £ X 02.05 ;9 = 0.05 Þ X 02.05 ;9 = 3.325

é 9(554.011) 9(554.011) ù
=ê ; = [294.6867;1499.5786]
ë 16.92 3.325 úû
óP[294.6867 £ s 2 £ 1499.5786] = 0.90

b) El IC para s al 90%= [ 294.6867 ; 1499.5786 ] = [17.1664;38.7244]


óP[17.1664 £ s £ 38.7244] = 0.90
INTERVALO DE CONFIANZA PARA LA RAZON DE VARIANZAS

Sean 2 v.a. {o 2 poblaciones

= se toma una m.a “n” Þ x = å å (x - x)


2
x i i
X~N( m x , s ) se desconoce s
2 2
: S x2 =
n -1
x x
n

se toma una m.a “m” Þ y = å


Y~N( m y , s ) se desconoce s Þ
2
y
2
y
xi
: S y2 =
å (y i - y)
2

m m -1
s 2
x S x2
El estadístico para es
s 2
y S y2
éS2 S x2 ù
s x2 ê x 1 ú
Þ El IC para la al 100v%= ; f
ê S y2 f1- a ;(n -1)( m -1) S y2 1- 2; ;(m -1)(n-1) ú
a
s 2y
ë 2; û

é 2 ù
s Sx 1 S x2
Þ El IC para la x al 100v%= ê ; f a ú
sy ê S y f 1- a ;(n -1)( m -1)
2
S y2 1- 2 ; ;(m-1)(n-1) ú
ë 2; û

P é F £ f 1- a : (n - 1)(m - 1)ù = 1 - a2
ê úû
donde ë
2

P é F £ f 1- a : (m - 1)(n - 1)ù = 1 - a2
êë 2 úû

EJEMPLO

Suponga que 2 maquinas “A” y “B” producen independientemente el mismo tipo de


objeto y que el tiempo que cada una emplea en producirlos se distribuye
normalmente con respectivas varianzas s x2 ; s y2 desconocidos. Se toma 2 m.a una
de “A” y otra de “B” obteniéndose los siguientes resultados.

m.a tamaño n=8 Þ”A”: 17,23,21,18,22,20,21,19


m.a tamaño m=6 Þ”B”: 13,16,14,12,15,14 Se pide construir

a) Un IC para la razón de varianzas al 95%


b) Un IC para la razón de desviaciones al 95%

SOLUCIÓN
r=0.95 a=0.05 n=8; m=6; S X2 =4.13 : S Y2 =2
a)
P é F £ f 1- 0.05 : 7.5 g.d .l.ù = P[F £ f 0.975 : 7.5] Þ f 0.975;7.5 = 6.85
êë 2 úû

P é F £ f 1- 0.05 : 5.7 g.d .l .ù = P[F £ f 0.975 : 5.7] Þ f 0.975 ;5.7 = 5.29


êë 2 úû
s x2 é 4.13 æ 1 ö 4.13
Þ El IC para la al 95%= ê ç ÷; (5.29)ùú = [0.3015;10.9239]
s 2
y ë 2 è 6.85 ø 2 û
é s x2 ù
ó P ê0.3015 £ £ 10.9239ú = 0.95
êë s y2 úû

b)
sx
Þ El IC para la al 95%= [0.5491;3.3051]
sy
é sx ù
ó P ê0.5491 £ £ 3.3051ú = 0.95
ëê sy ûú

UNIDAD IV PRUEBAS DE HIPOTESIS

Competencia:

-El estudiante debe utilizar correctamente las diferentes formas del protocolo para
efectuar pruebas de hipótesis ,tanto paramétricas como no paramétricas sobre cualquier
parámetro o distribución de una población para la toma de decisiones coherentes.

Objetivos.

-Utilizar correctamente la Docimasia de hipótesis para probar cualquier aspecto de una


población que con lleva un grado de incertidumbre para tomar decisiones coherentes.

Descripción general de la unidad:

-Esta unidad comprende el desarrollo de los siguientes conceptos: Hipótesis estad


ística,clases de hipótesis estadísticas,Tipos de errores; como también la realización de las
dieferentes pruebas de Hipótesis tales como :acerca de la media con varianza poblacional
conocida como desconocida ,acerca de la varianza y de la razón de varianzas, acerca de la
proporción como diferencia de proporciones.

Lectura:Millar/Freund/Jonson “Probabilidad y Estadística para


Ingenieros”Edo.de México 1992 Pgs.225 al 286
Córdova Zamora “Estadística Descriptiva e Inferencial” 2ª ed.Perú 1996
Pags,385 al 440
Bibliografía Básica: Moya y Saravia (1988) “Probabilidad e Inferencia
Estadística((2ª ed) Perú .Pags.701al 749
Referencia electrónica: http://descartes.cnice.mecd.es/materiales-
didacticos/Muestreo/-Inferencia-Estadística/pruebas-hipotesis.html

PRUEBAS DE HIPOTESIS

INTRODUCCIÓN

En la estadística inferencia el área de las pruebas de hipótesis constituye uno de


los aspectos importantes por su utilización.
La mayoría de las pruebas de hipótesis estadística se refieren a 2 aspectos:
1) A probar los valores de los parámetros de una variable o población,
llamadas pruebas paramétricas.
2) También se refieren al tipo o naturaleza de las diferentes distribuciones de
las diferentes variables o poblaciones, llamándose pruebas no
paramétricas.
La que generalmente se utiliza con las pruebas paramétricas, la que supone
conocer la naturaleza de la población.
Para desarrollar las diferentes pruebas de hipótesis es necesario desarrollar
algunos conceptos básicos como ser:

HIPÓTESIS ESTADÍSTICA
Una hipótesis estadística es una afirmación ó conjetura con relación a los valores
de los parámetros ó con relación a las distribuciones de una ó más variables
aleatorias o poblaciones.
De acuerdo a su especificación tenemos 2 tipos de hipótesis:

1) HIPÓTESIS ESTADÍSTICA SIMPLE


Son aquellas hipótesis completamente especificas, es decir están definidos
sus valores y el tipo de distribución.
2) HIPÓTESIS ESTADÍSTICA COMPUESTA
Son aquellas hipótesis que no están completamente especificadas, es decir
puede no estar bien definido los valores de sus parámetros ó no estar
especificado el tipo de distribución de la variable ó población.
DOCIMACIA DE HIPÓTESIS
Es el proceso por el cual se efectúa la prueba de hipótesis. Para docimar se
necesita 2 tipos de hipótesis:
1) LA HIPÓTESIS NULA H0
Es aquella hipótesis completamente especificada es la que se quiere probar
con el fin de rechazarla. Para identificar si una hipótesis es nula debe tener
por lo menos la igualdad £; =; ³
2) HIPÓTESIS ALTERNA H1
Es aquella hipótesis contraria a la nula, es decir que no está completamente
especificada y que se acepta cuando se rechaza la hipótesis nula y que
generalmente para identificarla no debe tener el signo de la igualdad > ¹ <

TIPOS DE ERRORES

Se toma decisiones en base a las muestras, nos conduce inevitablemente a


cometer 2 tipo de errores:

1) ERROR TIPO I
Se comete este tipo de error cuando se rechaza H0 y se acepta H1 cuando
H0 es verdadera.

2) ERROR TIPO II
Se comete este tipo de error cuando se rechaza H0 y se acepta H1 cuando
H0 es falsa.
Estos errores se los resume de la siguiente manera

NATURALEZA
H0 :VERDADERO H1: VERDADERO
DECISION
ACEPTA H0 CORRECTA ERROR TIPO II
ACEPTA H1 ERROR TIPO I CORRECTA

NIVEL DE SIGNIFICANCIÓN
Al cometer estos tipos de errores, se presentan bajo 2 niveles de significación:

1) NIVEL a DE SIGNIFICACIÓN
Significa:
P[comete error tipo I]= P[rechazar H0/H0 verdadero]

2) NIVEL b DE SIGNIFICACIÓN
Significa:
P[comete error tipo II]= P[aceptar H0/H0 verdadero]
Generalmente el nivel de significación mas utilizado es a =10%, 5%, 1%, para
tomar decisiones se deben establecer regiones críticas y /ó regiones de
aceptación.

REGION CRÍTICA R.C.


Es parte del rango del estimador que de acuerdo a una prueba prescrita nos
conduce a rechazar H0 y aceptar H1 a cierto nivel de significación. Esta RC se
sugiere determinar o utilizar cuando se presentan pruebas unilaterales.
REGION DE ACEPTACIÓN R.A.
Es parte del rango del estimador que de acuerdo a una prueba presenta permite
aceptar H0 y rechazar H1. Se sugiere utilizar esta RA cuando se presentan
pruebas bilaterales.

TIPOS DE PRUEBA
De acuerdo a los planteamientos de los problemas se tiene 3 tipos de pruebas:

1. BILATERAL

Planteamiento

H0 :j = j0 vs H1 : j ¹ j 0
donde j = cualquier parámetro (m , s 2 , etc ), j 0 = valor del parámetro

2. UNILATERAL DERECHA
Planteamiento
H 0 : j £ j 0 vs H1 : j > j 0
3. UNILATERAL IZQUIERDA
Planteamiento
H 0 : j ³ j 0 vs H1 : j < j 0
Nota.- El tipo de prueba lo sugiere generalmente la hipótesis alterna.
PROCEDIMIENTO PARA DOCIMAR
1. Plantear las hipótesis
H 0 : j = j 0 vs H 1 : j ¹ j 0 Bilateral
H 0 : j £ j 0 vs H 1 : j > j 0 Unilateral Derecha
H 0 : j ³ j 0 vs H 1 : j < j 0 Unilateral Izquierda
2. Elegir el nivel de significación a =10%, 5%, 1% si no se conoce a se elige
a = 5%.
3. Elegir el estadístico de prueba apropiado, cuya distribución muestral sea
conocido, bajo el supuesto de que H0 es cierto
4. Establecer la RC ó la RA (determinando los valores críticos: tablas)
5. Determinar o calcular los valores de los estadísticos de prueba
6. Comparar estos valores con la RC y /o RA y concluir si:
El valor calculado Î RC Þ rechazar H0 y aceptar H1
El valor calculado ÏRC Þ aceptar H0 y rechazar H1
El valor calculado Î RC Þ aceptar H0 y rechazar H1
Al nivel a de significación.

PRUEBAS RELATIVAS A MEDIAS MUESTRAS GRANDES

El estadístico de prueba es x ®
( x - m0 ) n
; Z ~N(0.1) también se puede utilizar S
s
en reemplazo de s cuando no se conoce

TIPO DE PRUEBA

BILATERAL R.A (ACEPTAR H0 Y R.A (RECHAZAR H0 Y


RECHAZAR H1) ACEPTAR H1)
H 0 : m = m0 vs H1 : m ¹ m 0 - Za ; Z a
2 2

UNILATERAL DERECHA
H 0 : m £ m 0 vs H1 : m > m 0 Z1-a ;a
UNILATERAL IZQUIERDA
H 0 : m ³ m 0 vs H1 : m < m 0 - a ® Za

Ejemplo
Un banco estudia la posibilidad de abrir una sucursal en la ciudad de “El Alto”,
para ello establece el siguiente criterio para tomar la decisión “abrir la sucursal si
el ingreso per cápita familiar no es menor a Bs. 500.- en contrario no abrir”. Para
ellor toma una m.a. de 100 ingresos familiares, de esa ciudad la que da una media
de Bs. 480.-
a) Cuál es la decisión a tomar al nivel del 5% de significación suponiendo que la
desviación típica de esa población es de Bs. 50.-

SOLUCION
Planteamiento:
1) H 0 : m ³ 500 vs H1 : m < 500 x = 480 : s = 50 : n = 100
abrir la sucursal No abrir la sucursal
2) a =5% = 0.05
3) El estadístico de prueba es x ®
(x - m0 ) n ; ~N(0.1)
s
4) La RC = - a ; Z 0.05 = - a ;-1.645

5) Calculando Z C =
(480 - 500) 100
= -4
50
6) Comparando: Como Zc=-4 Î RC Þ Rechazamos H0 y aceptamos H1, es decir
no debe abrir la sucursal al 5% de significación.
PRUEBA RELATIVA A LA MEDIA: MUESTRAS PEQUEÑAS n<30 DE UNA VARIABLE O
POBLACION NORMAL

El estadístico de prueba es x ® T =
( x - m0 ) n
t ~(n<1) g.d.l.
s

TIPO DE PRUEBA R.A (ACEPTAR H0 Y R.A (RECHAZAR H0 Y


RECHAZAR H1) ACEPTAR H1)
BILATERAL
- t1- a ; t1- a
2 2

UNILATERAL DERECHA t1-a ;a


UNILATERAL IZQUIERDA - a ® ta

Ejemplo

Se sabe que el ingreso per cápita de un gran número de ciudadanos, se distribuye


normalmente con un promedio de $us. 152.- Un estudio estadístico reciente una
m.a de 9 personas de esa población ha dado los siguientes resultados en $us.158,
154, 152, 156, 151, 150, 153, 155, 157. Al 5% de significancia. Ha cambiado el
ingreso per cápita de ésa población?.

SOLUCION

Planteamiento
H 0 : m = 152 vs H1 : m ¹ 152 x = 154 : S = 2.7386
abrir la sucursal No abrir la sucursal

a =5% = 0.05
El estadístico de prueba es x ® T =
(x - m0 ) n
.
s
La RA = - t1- 0.05 ; t1- 0.05 = -t0.975 ;8 gdl = -2.306
2 2

RA = - 2.306 : 2.306

Calculando Tc =
(154 - 152) 9
= 2.1909
2.7386
Comparando: Como Tc=2.1909 Î RA Þ aceptamos H0 y rechazamos H1, es decir
el ingreso per cápita ha cambiado al 5% de significación.

PRUEBA DE HIPOTESIS SOBRE DIFERENCIA DE MEDIAS: MUESTRAS


GRANDES

( )
Sean 2 v.a. ó 2 poblaciones Y~ (m xs x2 )y Y~ m ys 2y donde m se desconoce
Se quiere verificar si existe diferencia significativa entre las medias de las 2
poblaciones
(x - y )(m x - m y )
El estadístico de prueba es ( x - y ) ® Z = ~N(0.1)
s x2 s y2
n
+ n
Se puede utilizar S 2 en reemplazo de s 2

TIPO DE PRUEBA R.A (ACEPTAR H0 Y R.A (RECHAZAR


RECHAZAR H1) H0 Y ACEPTAR H1)
BILATERAL
H 0 : m x - m y = 0 vs H1 : m x - m y ¹ 0 |
- Z1- a ; Z1- a
2 2

UNILATERAL DERECHA
H 0 : m x - m y £ 0 vs H1 : m x - m y > 0 Z1-a ;a
UNILATERAL IZQUIERDA
H 0 : m x - m y ³ 0 vs H1 : m x - m y < 0 - a ® Za
Ejemplo

Para probar la afirmación de que la resistencia de un alambre eléctrico puede


reducirse en más de 0.050 W (homios), mediante aleación, 32 valores obtenidos
de alambre ordinario produjeron: una media= 0.1360 Ω ;y desviacion = 0.004 Ω
y32 valores obtenidos con alambre fabricado a base de aleación produjeron una
media de 0.083 Ω con una desviación tipica de 0.005 Ω Se apoya la afirmación al
5%?

H 0 : m x - m y £ 0.050 vs H1 : m x - m y > 0.050


no se apoya la afirmación Se apoya la afirmación

a=0.05
(x - y )(m x - m y )
El estadístico de prueba ( x - y ) ® Z = ~N(0.1)
s x2 s y2
n
+ m

RC= Z1-a ;a >Þ tZ 0.95 : ¥ Þ [1.645 ¥]

Zc =
(0.1360 - 0.083) - 0.050 = 0.033
= 29.154
( 0.004 )
+ (0.005 )
2 2
0.001131923
32 32

Como Zc=29.154 Î RC Þ Rechazar H0 y aceptar H1, es decir se apoya la


afirmación que la resistencia de un alambre eléctrico puede reducirse en más de
0.050 (homios).
PRUBA DE HIPOTESIS SOBRE LA DIFERENCIA DE MEDIAS: MUESTRAS
PEQUEÑAS

( )
Sean 2 v.a. ó 2 poblaciones X~N (m xs x2 )y Y~N m ys 2y donde m y s 2 se desconoce
para verificar si existe diferencia significativa entre las medias poblacionales
mediante 2 muestras aleatorias pequeñas n<30 y m<30

El estadístico de prueba es ( x - y ) ® T (x - y ) - (m x - m y ) nm(n + m - 2) ~ ta :n+m-2 gdl


=
(n - 1)S x2 + (m - 1)S y2 n+m

TIPO DE PRUEBA R.A (ACEPTAR H0 Y R.A (RECHAZAR


RECHAZAR H1) H0 Y ACEPTAR H1)
BILATERAL
H 0 : m x - m y = 0 vs H1 : m x - m y ¹ 0 |
- t1- a ; t1- a
2 2

UNILATERAL DERECHA
H 0 : m x - m y £ 0 vs H1 : m x - m y > 0 t1-a ;a
UNILATERAL IZQUIERDA
H 0 : m x - m y ³ 0 vs H1 : m x - m y < 0 - a - ta

Ejemplo

Diez barras de acero fabricadas por un proceso A tienen una fuerza de ruptura
media de 50, con una desviación estándar muestral de 10; muestras que 8
fabricadas por un proceso B, tienen una fuerza de ruptura media de 55 con una
desviación estándar muestral de 12. Suponiendo que la población de fuerzas de
ruptura normal con la misma desviación estándar, ......... con un nivel de
significancia del 5% la hipótesis que los 2 procesos producen acero de la misma
fuerza en contra de la posibilidad que no es así.

SOLUCION

H 0 : m A = mB vs H1 : m A ¹ m B

a=0.05

El estadístico de prueba ( x - y ) ® T (x A - y B ) - 0 nm( n + m - 2 )


=
(n - 1)S A2 + (m - 1)S B2 n+m

RA Þ t1-a ;a = - t0.975 : t0.975 = - 2.12 2.12


50 - 55 80(16)
Con Tc = = = -0.965
9(10) + 7(12)
2 2
18
Como Tc=-0.965 Î RA Þ aceptamos H0 y rechazamos H1, es decir no hay razon
para creer que los 2 procesos producen acero con fuerzas diferentes.

PRUEBA DE HIPOTESIS SOBRE LA VARIANZA

( )
Para realizar la prueba de hipótesis para la varianza poblacional s 2 se utiliza el
estadístico de prueba

S( xi - x ) (n - 1)S 2 ~X2 (n-1) gdl


2
S2 = ~X2 =
n -1 s 02
TIPO DE PRUEBA R.A (ACEPTAR H0 Y R.A (RECHAZAR H0
RECHAZAR H1) Y ACEPTAR H1)
BILATERAL
H 0 : s 2 = s 02 vs H1 : s ¹ s 02 X 2 a2 ; X 21- a2 |

UNILATERAL DERECHA
H 0 : s 2 £ s 02 vs H1 : s > s 02 Si X c2 > X 11 - a ; (n - 1)
UNILATERAL IZQUIERDA
H 0 : s 2 ³ s 02 vs H1 : s < s 02 Si X c2 > X 12a ; (n - 1)

Nota.- s 02 valor de varianza postulada

Ejemplo

Una m.a. de 10 objetos elegidos al azar entre los producidos en cierta planta
industrial han mostrado los siguientes pesos en grs. 71, 66, 64, 72, 69, 67, 70, 68,
65, 69. Podrá aceptarse la hipótesis de que la varianza de los pesos de los
objetos es igual a 4 grs2 al 5% de significación. Suponiendo que la población de
los pesos tiene distribución normal.

SOLUCION

H 0 : s 2 = 4 grs 2 vs H1 : s ¹ 4 grs 2
a=0.05
El estadístico de prueba es S 2 ® X 2 =
(n - 1)S 2 ~X2 (n-1) gdl
s 02
Media x = 68.1 : Desviación S=2.60128

RA=(2.70 : 19.2)
9(2.60128)
2
Como X c =
2
= 15.225
4
Como X c2 =15.225 Î RA (2.7 ; 19.02) aceptamos H0 y rechazamos H1, es decir la
varianza es de 4 grs2 al 5% de significación.

PRUEBA DE HIPOTESIS RELATIVAS A 2 VARIANZAS

Para realizar la prueba de hipótesis sobre la diferencia de 2 varianzas de 2


poblaciones que supuestamente tienen distribución normal, se utiliza el estadístico
de prueba, la razón de varianzas muestrales

S x2
F= ~F (n-1)(m-1) gdl
S y2
TIPO DE PRUEBA R.A (ACEPTAR H0 Y R.A (RECHAZAR H0
RECHAZAR H1) Y ACEPTAR H1)
BILATERAL
H 0 : s 12 = s 22 vs H1 : 12s ¹ s 22 f a ( n - 1)(m - 1); f1- a ( n - 1)(m - 1) |
2 2

UNILATERAL DERECHA
H 0 : s 12 £ s 22 vs H1 : 12s > s 22 Si F<fa;(n-1)m-1)
UNILATERAL IZQUIERDA
H 0 : s 12 ³ s 22 vs H1 : 12s < s 22 Si F>fa;(n-1(m-1)

Nota.- generalmente se coloca en el numerador del estadístico la varianza más


alta

Ejemplo

2 máquinas A y B producen independientemente el mismo tipo de articulo cuyo


peso es de importancia. La varianza de los pesos de A ha sido siempre igual a la
varianza de los pesos de B, frecuentemente se han tomado una m.a. de A y otra
de B obteniéndose los siguientes resultados:

muestra de A: 17, 23, 21, 18, 22, 20, 21, 19


muestra de B: 13, 16, 14, 12, 15, 14

presentan estos datos suficiente evidencia para concluir que la varianza de los
pesos de A y B ya no son iguales? Suponiendo poblaciones normales use a=0.05

Planteamiento
H 0 : s 12 = s 22 vs H1 : 12s ¹ s 22
a=0.05
Sˆ x2
El estadístico de prueba es F = ~Fa(7.5)
Sˆ y2
RA= f 0.05 ;7.5; f1- 0.05 ;7.5 = f 0.025 ; f 0.975 = 0.189;6.85
2 2

4.125
Fc= = 2.0625
2
Como Fc Î RA = aceptamos H0 y rechazamos H1, es decir que las varianzas de la
producción de A y B son iguales al 5% de significación.

Ejemplo
Se quiere determinar si existe menos variabilidad en el plateado realizado por al
CIA A que en el efectuado por la CIA B. Si muestras aleatorias independientes de
tamaño 12 del trabajo desempeñado por las compañías producen SA=0.062 mil.
Pruébese la hipótesis de que s 12 = s 22 contra s 12 < s 22 con un nivel de significancia
del 5%

SOLUCION

H0: s 12 = s 22 vs H1: s 12 < s 22

a=0.05
Sˆ x2
El estadístico de prueba es F = ~Fa(n-1)(m-1)
Sˆ y2

La RA= Si Fc<f0.05;11,11 f0.95:11:11 =2.82

(0.062 )2
Calcular Fc= = 3.14
(0.035)2
Como Fc =3.14>F2.82 rechazar H0 y aceptar H1, por lo tanto el plateado realizado
por la CIA A es menor variable que el plateado efectuado por la CIA B al 5% de
significación.

PRUEBAS RELATIVAS A PROPORCIONES: MUESTRAS GRANDES

Para efectuar la prueba sobre una proporción en base a muestras grandes que
........de poblaciones Binomiales se utiliza el estadístico:

x - np0 pˆ - p x
Z= = p q 0 ~ Z~ N(0,1) donde pˆ =
np0q0 0 0 M
n

TIPO DE PRUEBA R.A (ACEPTAR H0 Y R.A (RECHAZAR H0 Y


RECHAZAR H1) ACEPTAR H1)
BILATERAL
H 0 : r = r0 vs H1 : r ¹ r 0
- Z1- a ; Z1- a
2 2

UNILATERAL DERECHA
H 0 : r £ r 0 vs H1 : r > r 0 Z1-a ;a
UNILATERAL IZQUIERDA
H 0 : r ³ r 0 vs H1 : r < r 0 - a (-) Za

Nota.- r 0 =valor de la proporción postulada


Ejemplo
Un fabricante afirma que el porcentaje de consumidores de su producto es del
30%. Con el fin de evaluar ésta afirmación, se tomó una m.a. de 400
consumidores y se encontró que 100 prefieren el producto. Es ésta suficiente
evidencia para concluir que el porcentaje de preferencia del antiguo producto ha
cambiado al 1% de significación?

SOLUCION
H 0 : r = 0.30 vs H1 : r ¹ 0.30

100
a=0.01 rˆ = = 0.25
400

pˆ - p0
El estadístico de prueba Z = p0 q0
~ Z~ N(0,1)
n

RA= - Z1- 0.01 ; Z1- 0.01 = - Z 0.995 ; Z 0.995 = - 2.575 : 2.575


2 2

0.25 - 0.30
Como Z c = ( 0.30 )( 0.70 )
= -2.1834
400

Comparando Zc=-2.1834 RAÞaceptamos H0 y rechazamos H1 ; es decir el


porcentaje de preferencia de consumidores para el producto no ha cambiado al
1% de significación

Ejemplo

En un estudio diseñado para investigar si ciertos detonadores empleados con


explosivos en una mina de carbón cumplan con los requerimientos de que al
menos el 90% encenderá el explosivo al ser detonado se encontró que 174 de 200
detonadores funcionan adecuadamente. Probar la hipótesis de que
r = 0.90 contra r < 0.90 al 5% de significación.

SOLUCION
H0: r = 0.90 vs H1: r < 0.90

174
a=0.05 rˆ = = 0.87
200
RC= - a : Za = - a : Z 0.05 = - a : -1.645

0.87 - 0.90 - 0.03


Como Z c = ( 0.90 )( 0.10 )
= = -1.414
0.021213203
200

Comparando -1.414 Î RCÞaceptamos H0 y rechazamos H1 ; es decir no hay


razón para afirmar que la clase determinada de detonador no cumple con las
normas especificadas al 5% de significación.

You might also like