Professional Documents
Culture Documents
Propiedades de la varianza
El valor de la varianza debe ser siempre positivo > 0. Como la
varianza se encuentra elevada al cuadrado, por consiguiente se
encontraran resultados positivos.
La varianza de una constante es igual a cero Si
todos los elementos de una observacin tienen el mismo
resultado, encontraremos que no existe ninguna diferencia entre
los resultados y su media, por consiguiente la varianza ser igual
a cero.
La varianza de una constante ms una variable, es igual a la
varianza.
Anlisis Estadstico:
la dispersin medidas de desviacin promedio.
En donde:
= varianza de la poblacin.
= desviacin estndar de la poblacin.
= frecuencia de cada una de las clases.
x = punto medio de cada clase.
= media de la poblacin.
N = tamao de la poblacin.
Anlisis Estadstico:
la dispersin medidas de desviacin
promedio.
s = varianza de la muestra.
s = desviacin estndar de la muestra.
x = valor de cada una de las n observaciones.
= media de la muestra.
n-1 = nmero de observaciones de la muestra menos 1.
DETERMINARCIN DE LA VARIANZA Y DE LA DESVIACIN TPICA DE LAS VENTAS DE 100
RESTAURANTES
PUNTO FRECUENCIA
CLASE MEDIO (x) (x) *x MEDIA () x - (x - ) (x - )
700 - 799 750 4 3000 1250 -500 250000 1000000
800 - 899 850 7 5950 1250 -400 160000 1120000
900 - 999 950 8 7600 1250 -300 90000 720000
1000 -
1099 1.050 10 10500 1250 -200 40000 400000
1100 -
1199 1.150 12 13800 1250 -100 10000 120000
1200 -
1299 1.250 17 21250 1250 0 0 0
1300 -
1399 1.350 13 17550 1250 100 10000 130000
1400 -
1499 1.450 10 14500 1250 200 40000 400000
1500 -
1599 1.550 9 13950 1250 300 90000 810000
1600 -
1699 1.650 7 11550 1250 400 160000 1120000
1700 -
1799 1.750 2 3500 1250 500 250000 500000
1800 -
1899 1.850 1 1850 1250 600 360000 360000
100 125000 6680000
media es igual
Anlisis Estadstico:
Distribucin de muestreo.
Teorema: Dada una poblacin, si extraemos todas las muestras
posibles de un mismo tamao, entonces la media de la distribucin de
todas las medias muestrales posibles. Ser igual a la media de la
poblacin.
Base conceptual para muestrear distribuciones.
Si tomamos todas las muestras posibles de una poblacin que
deseamos estudiar , a continuacin calcularamos la media y la
desviacin estndar para cada una de estas muestras como resultado
cada muestra tendra su propia media, y su propia desviacin
estndar para cada una de estas muestras.
Nota: Ninguna de las medias individuales sera la misma que la media
de poblacin. stas tenderan a estar cerca de la media de la poblacin,
pero rara vez quedaran exactamente en ese valor.
Si producimos una distribucin de todas las medias de cada muestra
que se pudiera tomar. Dicha distribucin, conocida como distribucin
de muestreo de la media. Esta distribucin de las medias de la
muestra tendra su propia media
Tendra su propia media (my sub x testada) y su propia desviacin
estndar
(sigma sub x testada).
Inferencia Estadstica:
Teora de estimacin.
Estimaciones de intervalo e intervalo de confianza
Recuerde: En estadstica, la probabilidad que asociamos con una
estimacin de intervalo se conoce como el nivel de confianza.
Esta probabilidad ndica qu tanta confianza tenemos de que la
estimacin de intervalo incluya al parmetro de poblacin.
Los intervalo de confianza se expresan con frecuencia en trminos
de errores estndar, ms que como valores numricos.
Inferencia Estadstica:
Teora de estimacin.
Clculo de estimaciones de intervalo de la media a partir de
muestras grandes.
Ejemplo, se quiere estimar la vida media que se puede esperar de
los limpiadores de parabrisas. Se ha determinado que la
desviacin estndar de la vida til de la poblacin es de 6 meses,
con una vida media de 21 meses, se selecciona una sola muestra
de 100 parabrisas.
Cmo el vendedor utiliza 10,000 al ao, nos pide que encontremos
una estimacin de intervalo con un nivel de confianza de 95%. El
tamao de la muestra es mayor que 30, de modo que el teorema
central del lmite nos permite usar la distribucin normal como
nuestra distribucin de muestreo, incluso si nuestra poblacin no
est normalmente distribuida. Entonces calculamos el error
estndar de la media.
Inferencia Estadstica:
Teora de estimacin.
A continuacin consideraremos el nivel de confianza 95%,
buscamos en la tabla y, conseguimos un error estndar de 1.96 de
la media y nuestros lmites de confianza son:
Probabilidad y Estadstica.
Distribucin binomial.
Probabilidad de un estudiante llegue tarde.
Probabilidad y Estadstica.
Distribucin binomial.
Probabilidad de dos estudiantes lleguen tarde r= 2
Probabilidad y Estadstica.
Distribucin binomial.
Probabilidad de que tres estudiantes lleguen tarde r= 3
Probabilidad y Estadstica.
Distribucin binomial.
Probabilidad de que cuatro estudiantes lleguen tarde r= 4
Probabilidad y Estadstica.
Distribucin binomial.
Probabilidad de que cinco estudiantes lleguen tarde r=5
Caracterstica de la distribucin t
Es simtrica
Es ms plana que la distribucin normal.
Hay una distribucin t para cada tamao posible de muestra.
A medida que el tamao de muestra se hace ms grande la
distribucin t se aproxima igual a la distribucin normal.
Anlisis Estadstico:
Teora de estimacin.
Una distribucin t es menor en la media y mayor en los extremos que una
distribucin normal.
La distribucin t tiene, ms porcentaje de su rea en los extremos que
distribucin normal.
Nota: Para tamaos de muestra mayores de 30, la distribucin t se
asemeja tanto a la normal que se utiliza esa ltima para aproximar a la
distribucin t.
Grados de libertad es el nmero de valores de una muestra que podemos
especificar libremente, despus de que ya sabemos algo de dicha
muestra.
Ejemplo si tenemos
Anlisis Estadstico:
Prueba de Hiptesis.
Las dos actividades principales de la estadstica inferencial
son el uso de datos:
Para estimar un parmetro poblacional (la media, la porcin o la desviacin
estndar).
Probar una hiptesis o afirmacin con respecto a un parmetro poblacional.
La prueba de hiptesis es un procedimiento estndar para probar una
aseveracin acerca de una propiedad de una poblacin.
La prueba de hiptesis tiene como objeto principal evaluar suposiciones o
afirmaciones acerca de los valores estadsticos de poblacin.
La suposicin puede ser cierta o falsa.
La prueba comienza con un suposicin, llamada hiptesis que hacemos con
respecto a un parmetro de la poblacin.
Luego recolectamos datos de muestra, producimos estadsticas y usamos
esta informacin para decidir qu tan probable es que sea correcto nuestro
parmetro de poblacin acerca del cual hicimos la hiptesis.
Anlisis Estadstico:
Prueba de Hiptesis.
Digamos que suponemos un cierto valor para una
media de poblacin. Para probar la validez de
nuestra suposicin recolectamos datos de muestra y
determinamos la diferencia entre el valor
hipotetizado y el valor real de la media de dicha
muestra.
Despus juzgamos si la diferencia es significativa o
no.
Mientras ms pequea sea la diferencia, mayor ser
la probabilidad de que nuestro valor hipotetizado
para la media sea correcto. Mientras mayor sea la
diferencia, ms pequea ser la probabilidad.
Anlisis Estadstico:
Prueba de Hiptesis.
Nota: No podemos aceptar o rechazar una hiptesis sobre un parmetro
de poblacin simplemente por intuicin. Ms bien, necesitamos aprender
cmo decidir objetivamente si aceptamos o rechazamos una corazonada,
con base en informacin acerca de la muestra.
En la prueba de hiptesis, debemos establecer el valor supuesto o
hipotetizado del parmetro de la poblacin antes de comenzar a tomar la
muestra.
La suposicin que deseamos probar se conoce como hiptesis nula, y se
simboliza H. Ejemplo si quisiramos probar la hiptesis de que la media
de la poblacin es igual a 100. La simbolizaramos y la leeramos La
hiptesis nula es que la media de la poblacin es igual a 100 H: =100
Si en un problema usamos un valor hipotetizado de una media de
poblacin, lo representaramos como: se lee el hipotetizado de la
media de la poblacin.
Si los resultados de nuestra muestra no respaldan la hiptesis, debemos
concluir que se cumple alguna otra cosa.
Anlisis Estadstico:
Prueba de Hiptesis.
Siempre que rechazamos la hiptesis, la conclusin que si aceptamos, se
llama hiptesis alternativa y se simboliza H.
H: > 100 La hiptesis alternativa es que la media de poblacin es
mayor que 100.
H: < 100 La hiptesis alternativa es que la media de la poblacin es
menor que 100.
Nota: El propsito de la prueba de hiptesis no es cuestionar el valor
calculado de la estadstica de muestra, sino hacer juicio con respecto a la
diferencia entre estadstica de muestra y un parmetro de la poblacin.
Si suponemos que la hiptesis es correcta, entonces el nivel de
significancia indicar el porcentaje de media de muestra que est fuera
de ciertos lmites.
Seleccin del nivel de significancia.
Mientras ms alto sea el nivel de significancia que utilizamos para probar
una hiptesis, mayor ser la probabilidad de rechazar hiptesis nula
cuando es cierta.
Anlisis Estadstico:
Prueba de Hiptesis.
Anlisis Estadstico:
Prueba de Hiptesis.
Errores tipo I y tipo II
El rechazo de un hiptesis nula cuando es cierta se denomina error del
tipo I ( su probabilidad es tambin el nivel de significancia de la prueba).
Se simboliza como (alfa).
Al hecho de aceptar una hiptesis nula cuando es falsa se denomina error
del tipo II y su probabilidad se simboliza como beta (beta).
La probabilidad de cometer un tipo de error puede reducirse slo si
deseamos incrementar la probabilidad de cometer el otro tipo de error, es
decir, con el fin de obtener un beta bajo, tendremos que tolerar un alfa
alta.
Despus de definir el nivel de significancia a utilizar, lo siguiente ser en
determinar la distribucin de probabilidad adecuada ( La distribucin
normal (z) y la distribucin t de student ).
Nota: Al probar el valor hipotetizado de una media al igual que en la
estimacin, se utiliza el multiplicador de la poblacin finita siempre que la
poblacin sea finita en tamao, el muestreo se haga sin remplazo y la
muestra sea de ms de 5% de la poblacin.
Anlisis Estadstico:
Prueba de Hiptesis.
Decisiones en cuanto a los tipos de error.
Si se acepta una hiptesis verdadera la decisin es correcta.
Si se acepta una hiptesis falsa, cometemos el error tipo II.
Si rechazamos una hiptesis verdadera, cometemos el error tipo I.
Si rechazamos una hiptesis falsa la decisin es correcta.
Ejemplo I: Probar la hiptesis de que el precio medio de un
apartamento con tres dormitorios y dos baos, en un sector del
D.N. es 15,000 pesos. Explique en qu condiciones cometeramos
un error y de qu tipo?
Error tipo II, si aceptamos el precio del apartamento de 15,000,
cuando no lo es.
Error tipo I, si rechazamos el precio de 15,000, cuando es cierto.
Ejemplo II: Supongamos que la universidad desea contratar los
servicios de una estudiante para trabajar en la biblioteca. Para ello
es sometida a una entrevista bajo las siguientes hiptesis.
Anlisis Estadstico:
Prueba de Hiptesis.
a) La estudiante Awilda es competente parar desarrollar la labor.
b) La estudiante Awilda no es competente para esa labor.
) En qu condiciones los encargados de evaluarla cometern un
error de tipo I o de tipo II.
) Error tipo I: Decidir si Awilda no es competente si realmente lo
es.
) Error tipo II: Decidir que Awilda es competente si realmente no lo
es.
Anlisis Estadstico:
Prueba de Hiptesis.
Prueba de hiptesis de dos extremos y de un extremo
Una prueba de dos extremos rechazar la hiptesis nula si la media de
muestra es significativamente mayor o menor que la media de la
poblacin hipotetizado. Por consiguiente, en una prueba de dos
extremos existe, dos regiones de rechazo.
Una prueba de dos extremos es apropiada cuando la hiptesis nula es
= (en donde es algn valor especificado) y la hiptesis
alternativa es distinta .
Ejemplo: Un fabricante de focos elctricos desea producirlo con una
vida media de 1,000 horas = = 1,000 si el tiempo de vida es
ms corto perder clientes si el tiempo de vida es muy largo, entonces
subirn los costos. Deber tomar una muestra con el fin de probar la
hiptesis H: = 1,000. Como no quiere desviarse significativamente de
1,000 horas en ninguna direccin, la hiptesis alternativa ser H:
1,000, y entonces rechaza la hiptesis nula si la vida media de los focos
de la muestra est muy por arriba de 1,000 horas y muy por debajo de
1,000 horas.
Anlisis Estadstico:
Prueba de Hiptesis.
Prueba de un solo extremo, si un comprador de focos no desea
aceptar un lote a menos que su vida media sea de al menos 1,000
horas. La empresa rechazar el lote cuando pruebe que su vida
media est por debajo de la mil horas. Entonces la hiptesis para
el mayorista son: H: = 1,000 H < 1,000. Rechaza la : H slo si
la vida media de los focos muestreados est significativamente
por debajo de las 1,000 horas. Esta prueba de extremo es
conocida como prueba de extremo izquierdo.
Una prueba de extremo derecho es cuando H: = H >
conocida tambin como prueba de extremo superior.
Anlisis Estadstico:
Prueba de Hiptesis.
Prueba de hiptesis de media cuando se conoce la desviacin
estndar de la poblacin.
Prueba de dos extremos de medias: Prueba en la escala de la varianza
original
Ejemplo: Los ejes traseros de camiones deben soportar 80,000 lbs. por
pulgadas cuadradas. La experiencia indica que la desviacin estndar de la
fuerza de los ejes es de 4,000 lbs. El fabricante selecciona una muestra de
100 ejes de la produccin. Los prueba y encuentra que la capacidad de
carga media de la muestra es de 79, 600 libras. Simblicamente.
Anlisis Estadstico:
Prueba de Hiptesis.
Anlisis Estadstico:
Prueba de Hiptesis.
Prueba de hiptesis de porcin: Muestras grandes
Pruebas de dos extremos de porciones. Recordemos que la binomial
es la distribucin tericamente para usarse a trabajar con porciones,
por el simple hecho de que los datos son discreto y el tamao de la
muestra es menor de 30. Si aumenta el tamao de la muestra
podemos usar la distribucin normal, porque al aumentar el tamao
de la muestra la distribucin binomial se aproxima a la normal.
Por consiguiente, podemos utilizar la distribucin normal para
aproximar la distribucin de muestreo.
Ejemplo: La compaa trata de evaluar la porcin de empleados cuyas
capacidad, capacitacin y experiencia de supervisin los califican
para promocionarlos. Recursos Humanos dice que el 80% de los
empleados de la compaa son promocionables. Se hace una
entrevista a fondo con 150 empleados y encuentra que, a su juicio
slo el 70% de la muestra est calificada para su promocin.
Anlisis Estadstico:
Prueba de Hiptesis.
Anlisis Estadstico:
Prueba de Hiptesis.
Prueba de Hiptesis.
Solucin:
Es una prueba de dos extremos.
Puesto que el tamao de la muestra es de 20 el nmero de grados
de libertad es de 19, es decir, 20-1.
Entonces buscamos en la tabla de la distribucin t en la columna
encabezada por 0.10, hasta llegar a la hilera correspondiente a 19
grados de libertad, all encontramos el valor crtico de t, 1,729.
Como no se conoce la desviacin estndar de la poblacin
debemos estimarla usando la desviacin estndar de la muestra.
= S = 11.
Anlisis Estadstico:
Prueba de Hiptesis.
Como estamos usando una estimacin de error estndar de la
poblacin, el error estndar de la media tambin ser una
estimacin.
Anlisis Estadstico:
Prueba de Hiptesis.
Prueba para diferencias entre medias: Tamao de muestra pequeos.
Cuando el tamao de la muestra es pequea basaremos la prueba
de muestra en la distribucin t.
Ejemplo: Se va aprobar un programa educativo para grupo de
jvenes altamente peligrosos, el programa es ms caro, que el
que haban usado anteriormente. Un psiclogo desea saber, a un
nivel de significancia de 0,05, si este gasto ha aumentado la
sensibilidad de los jvenes.
H: = hiptesis nula: No hay diferencia en los niveles de
sensibilidad proporcionados por los dos programas.
H: < hiptesis alternativa: El nuevo programa tiene como
resultado niveles ms altos de sensibilidad.
= 0.05 Nivel de significancia para la prueba de esta hiptesis.
Anlisis Estadstico:
Prueba de Hiptesis.
H:= hiptesis nula: No hay diferencia en los niveles de sensibilidad
proporcionados por los dos programas.
H:> hiptesis alternativa : El nuevo programa tiene como resultado niveles de
sensibilidad ms altos.
= 0.05 nivel de significancia para la prueba de esta hiptesis.
Anlisis Estadstico:
Prueba de Hiptesis.
Continuando.
Anlisis Estadstico:
Prueba de Hiptesis.
Ahora calculamos el error estndar:
Prueba de Hiptesis.
Los resultados del muestreo son:
Ejemplo: El sndico de Santo Domingo est interesado en la
relacin que existe entre la edad de un camin de basura y los
gastos anuales de reparacin que debera esperar. Con el fin de
determinar esta relacin, el director ha acumulado informacin
referente a cuatro de los camiones que la ciudad posee
actualmente.
Inferencia Estadstica:
Anlisis de regresin y correlacin.
Ejemplo:
Nmero de camin Edad (X) Gasto de reparacin
en miles de pesos
(Y)
101 5 7
102 3 7
103 3 6
104 1 4
Inferencia Estadstica:
Anlisis de regresin y correlacin.
Ya hemos conseguido la pendiente, ahora debemos encontrar la
interseccin.
5 31 (20+(2)(5) 1
11 40 (20+(2)(11) -2
4 30 (20+(2)(4) 2
5 34 (20+(2)(5) 4
3 25 (20+(2)(3) -1
Error total = 0
Suma de los
errores cuadrados
= 1,50
Inferencia Estadstica:
Anlisis de regresin y correlacin.
Ejemplo: El ejercicio que relaciona los gastos en investigacin,
desarrollo e innovacin con las ganancias.
AO Gastos Ganancia XY X Y
(n=6) en I+D+I s anuales
(X) (Y)
2006 5 31 155 25 961
2007 11 40 440 121 1600
2008 4 30 12 16 900
2009 5 34 170 25 1156
2010 3 25 75 9 625
2011 2 20 40 4 400
x=30 XY= 180 X=200 Y=5,642
Inferencia Estadstica:
Anlisis de regresin y correlacin.
Ahora ya podemos calcular el error estndar.
Inferencia Estadstica:
Anlisis de regresin y correlacin.
Intervalos de prediccin aproximados.
Como podrn recordar, por ejemplo, que si un valor estimado cae
dentro de dos desviaciones estndar, esto nos dar el 95% de
seguridad que as es.
Si tomamos la ecuacin de estimacin de la reparacin de los
camiones, y realizamos una estimacin para cuatro aos
predecimos que tendr un gasto de reparacin anual de 6.75
Inferencia Estadstica:
Anlisis de regresin y correlacin.
Anlisis de correlacin.
El anlisis de correlacin es la herramienta estadstica que
podemos usar para describir el grado hasta el cual una variable
est relacionada linealmente con otra.
Nota: Con frecuencia, el anlisis de correlacin se utiliza junto con
el anlisis de regresin para medir qu tan bien la lnea de
regresin explica los cambios en la variable dependiente Y.
Sin embargo, la correlacin tambin se puede usar sola para
medir el grado de asociacin entre dos variables.
Existen dos medidas para describir la correlacin entre dos
variables: El coeficiente de determinacin y el coeficiente de
correlacin.
Inferencia Estadstica:
Anlisis de regresin y correlacin.
El coeficiente de determinacin: Es la principal forma en que
podemos medir la extensin, o fuerza, de la asociacin que existe
entre dos variables, X,Y. Como se ha usado una muestra de puntos
para desarrollar lneas de regresin, nos referimos a esta medida
como el coeficiente de determinacin de muestra.
El coeficiente de determinacin de muestra se desarrolla de la
relacin entre dos tipos de variacin: La variacin de los valores
de X en conjunto de datos alrededor de:
I. La lnea de regresin ajustada
II. Su propia media.
. Nota: El termino variacin en esto dos casos se utiliza en sentido
estadstico usual para significar la suma de un grupo de
desviaciones cuadradas. Por lo que es razonable expresar la
variacin de los valores de Y alrededor de la lnea de regresin
con esta ecuacin.
Inferencia Estadstica:
Anlisis de regresin y correlacin.
La segunda variacin, la de los valores de Y alrededor de su propia
media, est determinada:
Interpretacin de r
Condiremos la dos formas en la que las variables X y Y pueden
relacionarse. En la siguiente tabla pueden ver que cada valor
observado de Y cae en la lnea de estimacin, como puede
demostrarse visualmente. Esta es una correlacin perfecta.
Inferencia Estadstica:
Anlisis de regresin y correlacin.
La ecuacin de estimacin para estos datos es fcil de determinar.
Puesto que la lnea de regresin pasa a travs del origen, sabemos
que la interseccin Y es cero, y puesto que Y se incrementa en 4
cada vez que X aumenta en 1, la pendiente es igual a 4, Por
consiguiente la lnea de regresin es:
= (0) = 0
Inferencia Estadstica:
Anlisis de regresin y correlacin.
Ahora podemos encontrar el denominador de la fraccin:
AO Gastos Ganancia XY X Y
(n=6) en I+D+I s anuales
(X) (Y)
2006 5 31 155 25 961
2007 11 40 440 121 1600
2008 4 30 12 16 900
2009 5 34 170 25 1156
2010 3 25 75 9 625
2011 2 20 40 4 400
x=30 XY= 180 X=200 Y=5,642
Inferencia Estadstica:
Anlisis de regresin y correlacin.
Solucin:
Inferencia Estadstica:
Anlisis de regresin y correlacin.
Ahora podemos determinar el error estndar del coeficiente de
regresin.
Inferencia Estadstica:
Regresin mltiple y anlisis de correlacin.
Los datos que estn en la tabla se sustituyen con facilidad en la
frmula: