You are on page 1of 66

MG-617-T Modelos para la Toma de Decisiones

Noviembre 2015

Ing. Rubn Daro Estrella, MBA


Cavaliere dellordine al Merito della Repubblica Italiana
Ingeniero de Sistemas, Administrador, Matemtico, Telogo y Maestro
reubendarioestrella@hotmail.com / rd_estrella@hotmail.com

www.atalayadecristo.org
Anlisis de Regresin y
Correlacin - PAG. 116
El modelo estadstico que nos permite representar la relacin
entre dos variables (dependiente e independiente) se denomina
Ecuacin de Regresin, ya que a travs de el podemos regresar o
proyectar datos sobre el posible comportamiento futuro del
fenmeno.
Dada una coleccin de datos de muestra apareados, la ecuacin
de regresin
y = bo + bix
y = f(x)
Donde bo es la ordenada de origen y bi es la pendiente.
describe la relacin entre dos variables. La grfica de la
ecuacin de regresin se denomina lnea de regresin (o lnea de
mejor ajuste, o lnea de mnimos cuadrados).
Anlisis de Regresin y
Correlacin
Mnimos cuadrados ordinarios (MCO).

El propsito del anlisis de regresin es determinar una recta que


se ajuste a los datos muestrales mejor que cualquier otra recta
que pueda dibujarse.

bo y bi estos valores los podemos determinar a travs de un


procedimiento matemtico que se denomina Mnimos Cuadrados
Ordinarios (MCO). MCO producir una recta que se extiende
por el centro del diagrama de dispersin aproximndose a todos
los puntos de datos mas que cualquier otra recta.
Anlisis de Regresin y
Correlacin
Caso I.
La gerencia de TortugAir, considera que existe una
relacin directa entre los gastos publicitarios y el
nmero de pasajeros que escogen viajar por TortugAir.
Para determinar si esta relacin existe, y si es as cul
podra ser la naturaleza exacta, los analistas decidieron
utilizar los procedimientos de MCO para determinar el
modelo de regresin. Represente grficamente los
resultados.
y = bo + bix
Anlisis de Regresin y
Correlacin

Observacin Publicidad Pasajeros Datos de Regresin para AEROMAR


Mes En miles US$ En miles
X Y XY X^2 Y^2
1 10 15
2 12 17
3 8 13
4 17 23
5 10 16
6 15 21
7 10 14
8 14 20
9 19 24
10 10 17
11 11 16
12 13 18
13 16 23
14 10 15
15 12 16
TOTALES 187 268
Anlisis de Regresin y Correlacin
Anlisis de Regresin y
Correlacin

Observacin Publicidad Pasajeros Datos de Regresin para AEROMAR


Mes En miles US$ En miles
X Y XY X^2 Y^2
1 10 15 150 100 225
2 12 17 204 144 289
3 8 13 104 64 169
4 17 23 391 289 529
5 10 16 160 100 256
6 15 21 315 225 441
7 10 14 140 100 196
8 14 20 280 196 400
9 19 24 456 361 576
10 10 17 170 100 289
11 11 16 176 121 256
12 13 18 234 169 324
13 16 23 368 256 529
14 10 15 150 100 225
15 12 16 192 144 256
TOTALES 187 268 3,490 2,469 4,960
Mnimos cuadrados ordinarios
(MCO)

Suma de los cuadrados de X


SCx = (Xi-X')
SCx = X - [(X)/n]

Suma de los cuadrados de Y


SCy = (Yi-Y')
SCy = Y - [(Y)/n]
Mnimos cuadrados ordinarios
(MCO)
Suma de los productos cruzados de X y Y
SCxy = (Xi-X')(Yi-Y')
SCxy = XY - [(X)(Y)/n]

Vale la pena notar que las primeras porciones de cada una de estas
formulas:
SCx = (Xi-X')
SCy = (Yi-Y')
SCxy = (Xi-X')(Yi-Y')
Ilustran como la recta MCO se basa en las desviaciones de las
observaciones a partir de su media.
Mnimos cuadrados ordinarios
(MCO)
SCx = X - [(X)/n] 137.73333
SCx = (Xi-X') 137.73333
SCy = Y - *(Y)/n+ 171.73333
SCy = (Yi-Y') 171.73333
SCxy = XY - *(X)(Y)/n+ 148.93333
SCxy = (Xi-X')(Yi-Y') 148.93333
bi = SCxy/SCx 1.08132
X' 12.46667
Y' 17.86667
bo = Y' - biX' 4.38625
Anlisis de Regresin y
Correlacin
Dadas las sumas de cuadrados y los productos cruzados, es
sencillo calcular la pendiente de la recta de regresin y el
intercepto, as:
La Pendiente de la recta de regresin.
bi = SCxy/SCx
El intercepto de la recta de regresin.
bo = Y' - biX'
donde Y' y X' son las medias de los valores de Y y los valores de
X.

NOTA: Estos clculos son extremadamente sensibles a la


aproximacin. Por tanto, se aconseja en aras de la exactitud,
efectuar los clculos hasta con cinco o seis cifras decimales.
Observacin Publicidad Pasajeros

Mes En miles US$ En miles A B


Publicidad Pasajeros XY X^2 Y^2 X-X' Y-Y' A*B (X-X')^2 (Y-Y')^2
1 10 15 150 100 225 -2.46667 -2.86667 7.071111 6.084444 8.217778
2 12 17 204 144 289 -0.46667 -0.86667 0.404444 0.217778 0.751111
3 8 13 104 64 169 -4.46667 -4.86667 21.73778 19.95111 23.68444
4 17 23 391 289 529 4.533333 5.133333 23.27111 20.55111 26.35111
5 10 16 160 100 256 -2.46667 -1.86667 4.604444 6.084444 3.484444
6 15 21 315 225 441 2.533333 3.133333 7.937778 6.417778 9.817778
7 10 14 140 100 196 -2.46667 -3.86667 9.537778 6.084444 14.95111
8 14 20 280 196 400 1.533333 2.133333 3.271111 2.351111 4.551111
9 19 24 456 361 576 6.533333 6.133333 40.07111 42.68444 37.61778
10 10 17 170 100 289 -2.46667 -0.86667 2.137778 6.084444 0.751111
11 11 16 176 121 256 -1.46667 -1.86667 2.737778 2.151111 3.484444
12 13 18 234 169 324 0.533333 0.133333 0.071111 0.284444 0.017778
13 16 23 368 256 529 3.533333 5.133333 18.13778 12.48444 26.35111
14 10 15 150 100 225 -2.46667 -2.86667 7.071111 6.084444 8.217778
15 12 16 192 144 256 -0.46667 -1.86667 0.871111 0.217778 3.484444
TOTALES 187 268 3490 2469 4960 148.9333 137.7333 171.7333
X Y XY X^2 Y^2

MEDIA 12.46667 17.86667


Observacin Publicidad Pasajeros y = bo + bix
Mes En miles US$ En miles Pasajeros

Publicidad Pasajeros Publicidad y = 4.38625 + 1.08132


1 10 15 10 15.19942
2 12 17 12 17.36205
3 8 13 8 13.03679
4 17 23 17 22.76864
5 10 16 10 15.19942
6 15 21 15 20.60600
7 10 14 10 15.19942
8 14 20 14 19.52469
9 19 24 19 24.93127
10 10 17 10 15.19942
11 11 16 11 16.28074
12 13 18 13 18.44337
13 16 23 16 21.68732
14 10 15 10 15.19942
15 12 16 12 17.36205

TOTALES 187 268


X Y

MEDIA 12.46667 17.86667


Anlisis de Regresin y Correlacin
Anlisis de Regresin y
Correlacin
El error estndar de estimacin Se

Es una medida del grado de dispersin de los valores Yi


alrededor de la recta de regresin. Mide la variacin de los
puntos de datos por encima y por debajo de la recta de
regresin. Refleja la tendencia a desviarse del valor real de Y
cuando se utiliza el modelo de regresin para fines predictivos.

El error estndar de estimacin mide la variacin promedio de


los puntos de datos alrededor de la recta de regresin que se
utiliza para estimar Y y por ende proporciona una medida del
error que se presentara en dicha estimacin.
Anlisis de Regresin y Correlacin
El error estndar de estimacin Se
Se = (Yi-Y^i)/n-2
Suma de Cuadrados del Error - SCE
SCE = SCy [(SCxy)/SCx]
En un modelo de regresin simple, se imponen dos restricciones en el conjunto
de datos, debido a que se deben dos parmetros, o y ix. Por tanto hay n-2
grados de libertad y CME es

Cuadrado Medio del Error


CME = SCE/n-2
El Error Estndar Se = CME
__________________________________________________

Se = [SCy ((SCxy)/SCx)]/n-2
El error estndar siempre se expresa en las mismas unidades que la variable
dependiente Y.
SCE = SCy - (SCxy)/SCx 10.68925

CME = SCE/n-2 0.82225

Se = CME 0.90678
Se= (( SCy - (SCxy)/SCx)/(n-2)) 0.90678
r = SCxy / (SCx)(SCy) 0.968378
Anlisis de Regresin y
Correlacin
El valor positivo para un bi indica una relacin directa. A medida que la publicidad aumenta,
tambin lo hace el numero de pasajeros. Ahora es til obtener una medida de la fuerza de esa
relacin. Esta es la funcin del Coeficiente de Correlacin, desarrollada por Carl Pearson, a
veces se le llama el Coeficiente de Correlacin producto-momento de Pearson.
El Coeficiente de Correlacin r puede asumir cualquier valor entre -1 y +1, es decir,
-1 r +1
Un valor de r = -1 indica una relacin negativa entre X y Y.
Suma de Cuadrados Total
SCT = (Yi-Y')
Suma de Cuadrados de la Regresin
SCR = (Y^i-Y')
Suma de Cuadrado de Error
SCE = (Yi-Y^i)

Coeficiente de Correlacin
r = SCR/SCT
r = SCxy / (SCx)(SCy)
Regression Analysis

r0.938 n15
r0.968 k1
Std. Error0.907 Dep. Var.Pasajeros

ANOVA table
Source SS df MS F p-value
Regression 161.0441 1 161.0441 195.86 3.24E-09
Residual 10.6893 13 0.8223
Total 171.7333 14

Regression output confidence interval


variables coefficients std. error t (df=13) p-value 95% lower 95% upper
Intercept 4.3863 0.9913 4.425 .0007 2.2447 6.5278
Publicidad 1.0813 0.0773 13.995 3.24E-09 0.9144 1.2482
Anlisis de Regresin y
Correlacin
Caso II.
Para apoyar las ventas de un producto de consumo
masivo en un mercado altamente competitivo una
empresa inicio a comienzos de ao una intensa campaa
publicitaria. La comparacin entre la inversin
publicitaria y las ventas del producto en 12 meses se
colocan en la siguiente tabla:

a) Formule la ecuacin de regresin.


b) Si invertimos en publicidad $400,000 cual debera
ser las posibles ventas?
Anlisis de Regresin y
Correlacin

VENTAS PUBLICIDAD
MESES EN MILES EN MILES
Y X
ENERO 350 200
FEBRERO 300 250
MARZO 630 300
ABRIL 840 250
MAYO 930 330
JUNIO 1,060 180
JULIO 1,280 150
AGOSTO 850 350
SEPTIEMBRE 700 200
OCTUBRE 1,160 250
NOVIEMBRE 1,180 250
DICIEMBRE 1,500 170
TOTALES 10,780 2,880
Regression Analysis

r0.090 n12
r-0.300 k1
Std. Error364.293 Dep. Var.VENTAS

ANOVA table
Source SS df MS F p-value
Regression 131,272.7273 1 131,272.7273 0.99 .3434

Residual 1,327,093.9394 10 132,709.3939

Total 1,458,366.6667 11

Regression output confidence interval


variables coefficients std. error t (df=10) p-value 95% lower 95% upper
Intercept 1,312.8788 429.8695 3.054 .0122 355.0699 2,270.6877

PUBLICIDAD -1.7273 1.7367 -0.995 .3434 -5.5969 2.1423


Anlisis de Regresin y
Correlacin
Caso III.
El departamento de ventas de una Compaa realiza un anlisis comparativo
entre el volumen de pedidos levantados y numero de visitas efectuadas. Por
sus diez vendedores en cierto periodo de tiempo, todos los vendedores
trabajan en zonas similares, en lo referente al numero de clientes que maneja
cada uno y potencial de compra de dichos clientes. Los resultados obtenidos
son los siguientes:
a) Formule la ecuacin de regresin.
b) Cunto ascendera el posible monto de los pedidos si las visitas fueran
250?
c) Cul es el grado de relacin entre las variables?
d) Determine el error estndar.
e) Haga el diagrama de dispersin.
f) Grafique la recta de regresin.
Anlisis de Regresin y
Correlacin
PEDIDOS
EN MILES VISITAS
VENDEDOR US$ REALIZADAS
1 13,4 245
2 10,3 172
3 15,1 291
4 6,9 124
5 7,3 191
6 14,2 218
7 5,2 101
8 11,8 259
9 14,3 307
10 5,5 142
TOTALES
Estimados y Tamao de Muestra Pg. 146

Las dos aplicaciones principales de la estadstica inferencial


implican el uso de datos de muestra para (1) estimar el valor
de un parmetro de poblacin y (2) llegar a una conclusin
acerca de una poblacin.

Estimador: es una estadstica de muestra (como la media de


muestra) que se usa para aproximar un parmetro de poblacin.

Existen dos tipos de estimadores que se utilizan normalmente:


- Estimador puntual
- Estimador por intervalo
Estimados

Estimado puntual: es un valor individual (o punto) que se usa para


aproximar un parmetro de poblacin.

Estimador Puntual: utiliza un nmero nico o valor para localizar una


estimacin del parmetro.

La media de muestra es el mejor estimado de la media de poblacin.

Podemos decir que la media de la muestra es un estimador no predispuesto


de la media de la poblacin, lo que quiere decir que la distribucin de las
medias de muestra tiende a centrarse alrededor del valor de la media de la
poblacin. (Es decir, las medias de muestra no tienden a sobreestimar
sistemticamente el valor de , y tampoco tienden a subestimar
sistemticamente dicho valor. En vez de ello, tienden a centrarse en el valor
de misma).
Estimados

Estimacin por intervalo: especifica el rango dentro del cual est el


parmetro desconocido.

Intervalo de Confianza: denota un rango dentro del cual puede encontrarse


el parmetro. Es una gama (o un intervalo) de valores que probablemente
contiene el valor verdadero del parmetro de poblacin.

Un intervalo de confianza se asocia a un grado de confianza, que es una


medida de la certeza que tenemos de que nuestro intervalo contiene el
parmetro de poblacin.

Nivel de confianza (grado o coeficiente de confianza): es la probabilidad 1-


(a menudo expresada como el valor porcentual equivalente) de que el
intervalo de confianza contiene el verdadero valor del parmetro.
Existen tres niveles de confianza relacionados comnmente con los intervalos
de confianza: 99, 95 y 90%, denominados coeficientes de confianza.
Estimados
Valor Alfa : Es la probabilidad de error o la probabilidad de que un intervalo
dado no contenga la media poblacional desconocida.

Valor Critico Z: Es el nmero que est en la frontera que separa las estadsticas
de muestra que probablemente ocurrirn, de aquellas que probablemente no
ocurrirn. Es un puntaje con la propiedad de que separa un rea de /2 de la cola
derecha de la distribucin normal estndar.

Margen de Error E: Es la mxima diferencia probable (con una probabilidad de


1-) entre la media de muestra observada y el verdadero valor de la media de
poblacin . El margen de error tambin se denomina error mximo de la
estimacin y puede obtenerse multiplicando el valor critico y la desviacin
estndar de las medias de muestras.

E = Z * /n
Estimados

E = Z * /n
Intervalo de confianza para estimar (media poblacional real
desconocida) cuando es conocida.

I. C. para estimar = X' E


Caso I.
Para estimar el gasto promedio de los clientes en el McDonald's
local, los estudiantes de Mtodos Cuantitativos toman una
muestra de 200 clientes y encuentran un gasto promedio de
US$5.67, con una desviacin estndar poblacional de US$1.10.
Cul es el intervalo de confianza del 95% para los gastos
promedio de todos los clientes? Interprete sus resultados.
Estimados

Caso I.
Para estimar el gasto promedio de los clientes en el McDonald's
local, los estudiantes de Mtodos Cuantitativos toman una
muestra de 200 clientes y encuentran un gasto promedio de
US$5.67, con una desviacin estndar poblacional de US$1.10.
Cul es el intervalo de confianza del 95% para los gastos
promedio de todos los clientes? Interprete sus resultados.
I. C. para estimar = X' E
Datos: E = Z * /n = 1.96 * (1.10/200) = 0.15
n=200 N.C.=95% I.C. para estimar = US$5.67 0.15
x'=US$5.67 I.C.=?
=US$1.10 = US$5.52 US$5.82
Confidence interval - mean

95% confidence level


5.67 mean
1.1 std. dev.
200 n
1.960 z
0.152 half-width
5.822 upper confidence limit
5.518 lower confidence limit
Estimados

Caso I.
Para estimar el gasto promedio de los clientes en el McDonald's local, los
estudiantes de Mtodos Cuantitativos toman una muestra de 200 clientes y
encuentran un gasto promedio de US$5.67, con una desviacin estndar
poblacional de US$1.10. Cul es el intervalo de confianza del 95% para los
gastos promedio de todos los clientes? Interprete sus resultados.
I. C. para estimar = X' E
E = Z * /n = 1.96 * (1.10/200) = 0.15
I. C. = US$5.52 US$5.82
Los estudiantes poseen un 95% de confianza de que la media poblacional
desconocida del gasto de los clientes del McDonal's evaluados se encuentra
entre el intervalo US$5.52 US$5.82.
Si se construyen todos los NCn intervalos de confianza, el 95% de ellos
contendr la media poblacional desconocida. Esto por supuesto significa que
el 5% de todos los intervalos estara errado - no contendran la media
poblacional, el Valor alfa .
Clculo del E cuando se desconoce
(desviacin estndar poblacional)
Si n > 30, podemos sustituir de la formula del E por la desviacin estndar de la
muestra s.
E = Z * s/n
Procedimiento para construir un intervalo de confianza para (basado en una
muestra grande: n > 30).
1. Encuentre el valor critico Z que corresponda al grado de confianza deseado.
2. Evale el margen de error E = Z * /n. Si se desconoce la desviacin
estndar de la poblacin , use el valor de la desviacin estndar de la muestra
s, siempre que n > 30.
3. Con el valor del margen de error calculado y el valor de la media de muestra
X', obtenga los valores de X'-E y X'+E. Sustituya estos valores en el formato
general del intervalo de confianza:
X'-E X'+E
= X' E
(X'-E ,X'+E
4. Redondee los valores resultantes aplicando la regla de redondeo.
Regla de Redondeo para intervalos de
confianza empleados para estimar

1. Si usa el conjunto de datos original para construir un


intervalo de confianza, redondee los limites del
intervalo de confianza a una posicin decimal ms que
las empleadas en el conjunto de datos original.

2. Si desconoce el conjunto de datos original y slo usa


las estadsticas resumidas (n, x', s), redondee los limites
del intervalo de confianza de acuerdo al mismo nmero
de posiciones decimales que se usan para la media de
muestra.
Intervalo de confianza para estimar

Justificacin: La idea bsica en que se apoya la construccin de intervalos de


confianza tiene que ver con el teorema del limite central, que indica que en el
caso de muestras grandes (n > 30), la distribucin de las medias de muestra es
aproximadamente normal con media y desviacin estndar /n. El formato de
los intervalos de confianza en realidad es una variacin de la ecuacin:
Z = (X' - )/(/n)
X' - = Z (/n)
- = Z (/n) - X' (-1)
= X' - Z (/n)
= X' E

Precisin: Un intervalo estrecho ofrece mayor precisin, aunque la


probabilidad de que contenga se reduce.
Intervalo de confianza para estimar

Caso I.
Una muestra consiste en 75 televisores adquiridos hace varios aos. Los
tiempos de reemplazo de esos televisores tienen una media de 8.2 aos y una
desviacin estndar de 1.1 aos (basados en datos de "Getting Things Fixed",
Consumer Reports). Construya un intervalo de confianza del 90% para el
tiempo de reemplazo medio de todos los televisores de esa poca.

Caso II.
Utilice el grado de confianza y los datos de muestra dados para determinar (a)
el margen de error y (b) el intervalo de confianza para la media de la poblacin
1. Estaturas de mujeres: confianza del 95%; n=50, x'=63.4 pulgs., s=2.4 pulgs.
2. Promedios de calificaciones: confianza del 99%; n=75, x'=2.76, s=0.88.
3. Puntajes en una prueba: confianza del 90%; n=150, x'=77.6; s=14.2.

Ejercicios de la Seccin 1 al 10 pgs. 175 y 176.


Estimacin de una proporcin de poblacin

Las decisiones dependen con frecuencia de parmetros que son


binarios, parmetros con slo dos posibles categoras dentro de las
cuales pueden clasificarse las respuestas. En este evento, el
parmetro de inters es la proporcin poblacional.

Tanto las proporciones como las probabilidades se expresan en


forma decimal o fraccionaria. Al trabajar con porcentajes, los
convertimos en proporciones omitiendo el signo de por ciento y
dividiendo entre 100. Por ejemplo, la tasa del 48% de personas
que no compran libros puede expresarse en forma decimal como
0.48.
Estimacin de una proporcin de poblacin

Estimado puntual para la proporcin de poblacin.


La proporcin de muestra p es el mejor estimado puntual de la proporcin de
poblacin.
p = x/n

proporcin de muestra de x xitos en una muestra de tamao n.

Intervalo de confianza para la proporcin poblacional.

Muchos asuntos de negocios tratan la proporcin de la poblacin. Una firma de


marketing puede querer averiguar si un cliente (1) compra o (2) no compra el
producto. Un banco con frecuencia debe determinar si un depositante (1) pedir
o (2) no pedir un crdito para auto. Muchas firmas deben determinar la
probabilidad de que un proyecto para presupuestar capital (1) generar o (2) no
generar un rendimiento positivo.
Estimacin de una proporcin de poblacin

Si n*p y n*(1-p) son mayores que 5, la distribucin de las proporciones


muestrales ser normal y la distribucin muestral de la proporcin muestral
tendr una media igual a la proporcin poblacional y error estndar de:
Error estandar de la distribucin muestral de las proporciones muestrales:
_______ ____
p = p(1-p)/n = pq/n

Estimacin del Error estndar de la distribucin muestral de las


proporciones muestrales:
_______ _____
sp = p(1-p)/n = pq/n

Margen de error del estimado de la proporcin de la poblacin:


____
E = (Z)( pq/n)
Estimacin de una proporcin de poblacin

Regla de redondeo para estimados de intervalo de confianza para la proporcin de


poblacin

Redondee los limites del intervalo de confianza a tres dgitos significativos.

Intervalo de confianza para estimar la proporcin poblacional.


I.C. para estimar la
proporcin poblacional =pE
Caso I. E = (Z)( pq/n)
En una encuesta de 1068 estadounidenses, 673 dijeron que tenan contestadoras
telefnicas (basados en datos de International Mass Retail Association, informados en
USA Today). Utilizando estos resultados de muestra, determine:
a. El estimado puntual de la proporcin de la poblacin de todos los estadounidenses que
tienen contestadora telefnica.
b. El estimado de intervalo del 95% de la proporcin de todos los estadounidenses que
tienen contestadora telefnica.
Estimacin de una proporcin de poblacin

I.C. para estimar la


proporcin poblacional =pE
Caso I. E = (Z)( pq/n)
En una encuesta de 1068 estadounidenses, 673 dijeron que tenan contestadoras
telefnicas (basados en datos de International Mass Retail Association, informados en
USA Today). Utilizando estos resultados de muestra, determine:
a. El estimado puntual de la proporcin de la poblacin de todos los estadounidenses que
tienen contestadora telefnica.
b. El estimado de intervalo del 95% de la proporcin de todos los estadounidenses que
tienen contestadora telefnica.
a. Estimado puntual para la proporcin de poblacin. p = x/n = 673/1068 = 0.630
b. Intervalo de confianza para estimar la proporcin poblacional.
E = 1.96 ((0.630)(0.370)/1068) = 0.0290
I.C. para estimar la proporcin poblacional:
0.630 - 0.0290 < < 0.630 + 0.0290
0.601 < < 0.659
Confidence interval - proportion

95% confidence level


0.63 proportion
1068 n
1.960 z
0.029 half-width
upper confidence
0.659 limit
0.601 lower confidence limit
Estimacin de una proporcin de poblacin
En una encuesta de 1068 estadounidenses, 673 dijeron que tenan contestadoras
telefnicas (basados en datos de International Mass Retail Association, informados en
USA Today). Utilizando estos resultados de muestra, determine:
a. El estimado puntual de la proporcin de la poblacin de todos los estadounidenses que
tienen contestadora telefnica.
b. El estimado de intervalo del 95% de la proporcin de todos los estadounidenses que
tienen contestadora telefnica.
a. Estimado puntual para la proporcin de poblacin. p = x/n = 673/1068 = 0.630
b. Intervalo de confianza para estimar la proporcin poblacional.
E = 1.96 (((0.630*0.370)/1068)) = 0.0290
I.C. para estimar la proporcin poblacional:
0.630 - 0.0290 < < 0.630 + 0.0290
0.601 < < 0.659
Este resultado a menudo se informa en el formato siguiente: "Se estima que el porcentaje
de los estadounidenses que tiene contestadora telefonica es del 63%, con un margen de
error de mas o menos 2.9 puntos porcentuales. Tambin debe informarse el nivel de
confianza, pero eso casi nunca se hace en los medios de comunicacin.
EJERCICIOS DE LA SECCION 20 AL 25 - PAG. 182.
Determinacin del tamao apropiado de la muestra

El tamao de la muestra juega un papel importante al


determinar la probabilidad de error as como en la
precisin de la estimacin.

Una vez se ha seleccionado el nivel de confianza, los


factores importantes influyen en el tamao muestral:

(1) la varianza de la poblacin y

(2) el tamao del error E tolerable que el investigador


esta dispuesto a aceptar.
Determinacin del tamao apropiado de la muestra

Tamao de la muestra para estimar .


Z = (X' - )/(/n)
X' - = Z (/n)
n(X' - ) = Z
n = Z/(X' - )
n = Z/(X' - )
n = Z/E
n =[Z/E]
E = Error de Muestreo
El tamao de la muestra debe ser entero.

Regla de redondeo para el tamao de muestra n.


Al calcular el tamao de muestra n, si la frmula anterior no produce un nmero
entero, siempre debe aumentarse el valor de n al siguiente numero entero mayor.
Determinacin del tamao apropiado de la muestra

n =[Z/E]

El tamao de la muestra no depende del tamao de la poblacin (N); el


tamao de muestra depende del grado de confianza deseado, el margen de
error deseado y del valor de la desviacin estndar .

La duplicacin del margen de error hace que el tamao de la muestra


requerida se reduzca a la cuarta parte de su valor original. Por otro lado, si se
reduce a la mitad el margen de error se cuadruplicar el tamao de la muestra.
Lo que esto implica es que si queremos resultados ms exactos, es preciso
aumentar sustancialmente el tamao de la muestra.

Dado que las muestras grandes generalmente requieren ms tiempo y dinero,


a menudo es necesario efectuar un trueque entre el tamao de la muestra y el
margen de error E.
Determinacin del tamao apropiado de la muestra

n =[Z/E]
Caso I.
Un economista desea estimar los ingresos medios durante el primer ao de
trabajo de un graduado universitario que, en un alarde de sabidura, tomo un
curso de estadstica. Cuantos de tales ingresos es necesario encontrar si
queremos tener una confianza del 95% en que la media de muestra este a
menos de US$500 dlares de la verdadera media de la poblacin? Suponga
que un estudio previo revelo que, para tales ingresos, = US$6250.
DATOS:
N.C.=95% ===> Z=1.96
Queremos que la media de la muestra este dentro de un margen de US$500
de la media de la poblacin.
E=US$500
=US$6,250
n = [(1.96 * 6250)/500]=
Determinacin del tamao apropiado de la muestra

Caso II.
Que tan grande se requiere que sea una muestra para que proporcione una
estimacin del 90% del numero promedio de graduados de las universidades
de la nacin con un error de 2000 estudiantes si una muestra piloto reporta
que s=8,659?

Caso III.
Nielsen Media Research quiere estimar la cantidad media de tiempo (en
horas) que los estudiantes universitarios de tiempo completo dedican a ver
televisin cada da entre semana. Determine el tamao de muestra necesario
para estimar esa media con un margen de error de 0.25 horas (15 minutos).
Suponga que se desea un grado de confianza del 96%, y que un estudio piloto
indico que la desviacin estndar se estima en 1.87 horas.
Determinacin del tamao apropiado de la muestra

QUE PASA SI SE DESCONOCE ?


1.- Podemos utilizar la REGLA PRACTICA DE INTERVALO.
En conjuntos de datos representativos, el intervalo del conjunto tiene una
anchura aproximada de cuatro desviaciones estndar (4s), as que la desviacin
estndar se puede aproximar de la siguiente manera:

desviacin estndar intervalo/4


intervalo/4

Esta expresin proporciona una estimacin burda de la desviacin estndar, si


conocemos los puntajes mximo y mnimo. Si conocemos el valor de la
desviacin estndar, podemos usarlo para entender mejor los datos, obteniendo
estimaciones burdas de los puntajes mximo y mnimo como se indica.
mnimo (media) - 2 * (desviacin estndar)
mximo (media) + 2 * (desviacin estndar)
Determinacin del tamao apropiado de la muestra

QUE PASA SI SE DESCONOCE ?


Caso I. n =[Z/E]
Si razonamos que los precios de los libros de textos universitario
tpicamente varan entre US$10 y US$90 dlares.
Usted planea estimar el precio de venta medio de un libro de texto
universitario. Cuantos libros de textos deber muestrear si desea tener
una confianza del 95% en que la media de la muestra estar a menos de
US$2 dlares de la verdadera media de la poblacin ?
DATOS:
intervalo/4
(US$90-US$10)/4 US$20
N.C.=95% ===> Z=1.96
E=US$2 dlares
Determinacin del tamao apropiado de la muestra

QUE PASA SI SE DESCONOCE ?


n =[Z/E]
Caso II.
Boston Marketing Company lo acaba de contratar para realizar una encuesta
con el fin de estimar la cantidad media de dinero que los asistentes al cine de
Massachussets gastan (por pelcula). Primero use la regla practica del intervalo
para hacer un estimado burdo de la desviacin estndar de las cantidades
gastadas. Es razonable suponer que las cantidades tpicas varan entre US$3
dlares y unos US$15 dlares. Luego utilice esa desviacin estndar para
determinar el tamao de muestra que corresponde a una confianza del 98% y a
un margen de error de 25 centavos de dlar.
Tamao de la muestra para estimar la
proporcin poblacional

Si despejamos a "n" de la expresin del margen de error E.


E = (Z) (pq/n)
E = (Z)(pq/n)
E = (Z)(pq/n)
En = (Z)(pq)
n = [(Z)(pq)]/E

Cuando se puede obtener un estimado razonable de p utilizando


muestras previas, un estudio piloto o los conocimientos de algn
experto se utiliza la formula anterior.
Tamao de la muestra para estimar la
proporcin poblacional
Cuando no se conoce el estimado puntual p:
n = [(Z)* 0.25]/E
Si no se puede conjeturarse un valor, puede asignarse el valor de 0.5 tanto a p como a
q, con lo que el tamao de muestra resultante ser al menos tan grande como necesita
ser. La justificacin para la asignacin de 0.5 es la siguiente: el valor mas alto posible
del producto p*q es de 0.25, y ocurre cuando p=0.5 y q=0.5 como se puede observar en
la siguiente tabla que usted debe completar:
p q p*q
0.1 0.9 0.09
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
Tamao de la muestra para estimar la
proporcin poblacional
Caso I.
Las compaas de seguros se estn preocupando porque el creciente uso de telfonos
celulares esta teniendo como resultado un mayor nmero de accidentes automovilsticos,
y estn considerando implementar tarifas ms altas para conductores que usan tales
aparatos. Queremos estimar, con un margen de error de tres puntos porcentuales, el
porcentaje de conductores que hablan por telfono mientras conducen. Suponiendo que
queremos tener una confianza del 95% en nuestros resultados, cuntos conductores
debern encuestar?
a. Supongamos que tenemos un estimado de p basado en un estudio previo que indic
que el 18% de los conductores habla por telfono (basados en datos de la revista
Prevention).
b. Suponga que no tenemos informacin previa que sugiera un posible valor de p.
SOLUCION:
a) DATOS: n = [(Z)(pq)]/E
p=0.18 ; q=0.82 n = [(1.96)(0.18*0.82]/(0.03) =
N.F.=95% ==> Z=1.96
E=0.03 = tres puntos porcentuales
b) DATOS: n = [(Z)* 0.25]/E
n = [(1.96)* 0.25]/(0.03) =
Tamao de la muestra para estimar la
proporcin poblacional
Caso I.
Las compaas de seguros se estn preocupando porque el creciente uso de
telfonos celulares esta teniendo como resultado un mayor numero de
accidentes automovilsticos, y estn considerando implementar tarifas mas altas
para conductores que usan tales aparatos. Queremos estimar, con un margen de
error de tres puntos porcentuales, el porcentaje de conductores que hablan por
telfono mientras conducen. Suponiendo que queremos tener una confianza del
95% en nuestros resultados, cuantos conductores debern encuestar?
SOLUCION:
a) DATOS: n = [(Z)(pq)]/E
p=0.18 ; q=0.82 n = [(1.96)(0.18*0.82]/(0.03) =
N.F.=95% ==> Z=1.96
E=0.03 = tres puntos porcentuales
b) DATOS: n = [(Z)* 0.25]/E
n = [(1.96)* 0.25]/(0.03) =
Si comparamos estos dos resultados de tamao de muestra vemos que, si no tenemos
conocimiento de un estudio anterior, se requiere una muestra ms grande para obtener
los mismos resultados que cuando se puede estimar el valor de p.
Tamao de la muestra para estimar la
proporcin poblacional

Caso II.
Una compaa de comunicaciones esta considerando un proyecto
para prestar servicio telefnico de larga distancia. Se le pide a
usted realizar un sondeo de opinin para estimar el porcentaje de
los consumidores que esta satisfecho con su servicio telefnico de
larga distancia actual. Usted quiere tener una confianza del 90%
en que su porcentaje de muestra estar a menos de 2.5 puntos
porcentuales del valor real para la poblacin, y un sondeo sugiere
que el porcentaje en cuestin anda alrededor del 85%. Que tan
grande deber ser la muestra?
Bioestadstica
Bioestadstica : Es la aplicacin de la Estadstica al rea de la
salud.

Es la aplicacin de la estadstica a la biologa y de forma


ms frecuente a la medicina.

Esta proporciona algunas de las herramientas bsicas para la


descripcin y cuantificacin de los procesos de enfermedades y
de salud, que incluye la evaluacin de hiptesis, el estudio de
pruebas diagnosticas, la determinacin de la eficacia de las
intervenciones clnicas y teraputicas, la realizacin de
predicciones pronsticas y el estudio de la historia natural de las
enfermedades.
Bioestadstica
Epidemiologa: Estudio de la salud y la enfermedad de las
poblaciones humanas, con mayor precisin, los modelos de salud
y enfermedad as como los factores que influyen en estos
patrones.
Ciencia mdica cuyo objeto es estudiar la incidencia y
distribucin de las enfermedades en grandes poblaciones, as
como los factores que condicionan su expansin y gravedad .
Se considera la ciencia bsica para la medicina preventiva y
una fuente de informacin para la formulacin de polticas de
salud pblica, polticas sanitarias encaminadas a la prevencin de
enfermedades, lesiones y muertes prematuras.
Los datos epidemiolgicos muestran la prevalencia de una
enfermedad, su variacin estacional en el ao, su localizacin
geogrfica y su relacin con ciertos factores de riesgo.
Proporcin y Tasas

Proporcin = a / a + a
a = b
Proporcin = a / a + b
= parte dividida / entre el total

Relacin = a / a
Relacin = a / b
= una parte divida entre otra parte

Tasa = a / (a + b) x base

Las tasas son similares a las proporciones excepto en que se usa un


multiplicador (por ejemplo 1000, 10000 o 100000).
Tasas

Acontecimientos Nm. de persona a quienes aconteci algo (enfermedad o murieron)


Poblacin que corre riesgo Toda la gente que corre riesgo de presentar el
acontecimiento

Tasa de Mortalidad = Nm. de personas que falleci en un perodo determinado


Nm. de personas que estuvieron en riesgo de expirar
durante el mismo perodo.

Mortalidad global = Todas las muertes durante un ao civil x 1,000 = muertes x 1,000
Poblacin a mitad del ao

Tasas
Mortalidad proporcional = Muertes atribuidas a enfermedad en un ao determinado x 100
Total de muertes en la poblacin en el mismo ao

Tasa de Mortalidad = Nios menores de 1 que fallecen por 1000 nacidos vivos.
Infantil

Tasa de Letalidad por Caso = Nm. de muertes por una enfermedad especfica
que se presenta en un perodo determinado
Nm. de individuos con la enfermedad especificada
durante ese perodo
Tasas
Tasa de Morbilidad = Nm. de individuos que presentan un
(ndice de ataque) Padecimiento en un perodo determinado
Nm. de personas de una poblacin en riesgo

Muchos epidemilogos opinan que las tasas de morbilidad proporcionan una medida ms
directa del estado de salud de una poblacin.

Medidas de Morbilidad:

La Prevalencia = Nm. de individuos con una enfermedad determinada, en cierto punto


Poblacin en riesgo de tener esa enfermedad en ese momento

Incidencia = Nm. de casos nuevos que se presentan en un intervalo determinado


Poblacin en riesgo al inicio de ese intervalo

You might also like