You are on page 1of 38

EJERCICIOS DE REGRESIN MULTIPLE (Estadstica)

CASO 6

En el bisbol, el xito de un equipo se suele considerar en funcin del


desempeo en bateo y en lanzamiento del equipo. Una medida del
desempeo en el bateo es la cantidad de cuadrangulares que anota el
equipo y una medida del desempeo en lanzamiento es el promedio
de carreras ganadas por el equipo que lanza. En general, se cree que
los equipos que anotan ms cuadrangulares (home run) y tienen un
promedio menor de carreras ganadas ganan un mayor porcentaje de
juegos. Los datos siguientes pertenecen a 16 equipos que
participaron en la temporada de la Liga Mayor de Bisbol de 2003; se
da la proporcin de juegos ganados, la cantidad de cuadrangulares
del equipo (HR, por sus siglas en ingls) y el promedio de carreras
ganadas (ERA, por sus siglas en ingls) (www.usatoday.com, 17 de
enero de 2004).
a. Obtenga la ecuacin de regresin estimada para predecir la
proporcin de juegos ganados en funcin de la cantidad de
cuadrangulares.
b. Obtenga la ecuacin de regresin estimada para predecir la
proporcin de juegos ganados en funcin del promedio de
carreras ganadas por los miembros del equipo que lanza.
c. Obtenga la ecuacin de regresin estimada para predecir la
proporcin de juegos ganados en funcin de la cantidad de
cuadrangulares y del promedio de carreras ganadas por los
miembros del equipo que lanza.
d. En la temporada de 2003, San Diego gan slo el 39.5% de sus
juegos, siendo el ms bajo de la liga nacional. Para mejorar
para el ao siguiente, el equipo trat de adquirir nuevos
jugadores que hicieran que la cantidad de cuadrangulares
aumentara a 180 y que el promedio de carreras ganadas por el
equipo que lanza disminuyera a 4.0. Use la ecuacin de
regresin estimada obtenida en el inciso para estimar el
porcentaje de juegos que ganara San Diego si tuviera 180
cuadrangulares y su promedio de carreras ganadas fuera 4.0.

Solucin ejercicio 6
a. Obtenga la ecuacin de regresin estimada para
predecir la proporcin de juegos ganados en funcin de
la cantidad de cuadrangulares.
1. LA RELACIN ESPERADA(TERICA)

HR-Proporcin de ganados: relacin Directa

2. DIAGRAMA DE DISPERSIN

Segn lo esperado podemos observar la proporcin de ganados tiene


una relacin directa con respecto a HR, ver el siguiente diagrama

3. CORRELACIN
H0: =0; h1: 0
Segn lo observado en la siguiente tabla.

Correlaciones
Proporcin de
ganados
Proporcin de ganados

Correlacin de Pearson

HR
1

Sig. (bilateral)
N
HR

,391
,134

16

16

Correlacin de Pearson

,391

Sig. (bilateral)

,134

16

16

Con un p-value mayor al 0.05, se acepta hiptesis nula, no presenta una


relacin significativa.
4. EL COEFICIENTE DE CORRELACIN: r=0.391, existe un
correlacin

Significativamente baja entre la HR con la proporcin de ganados.


5. COEFICIENTE DE DETERMINACIN AJUSTADO
r2adj=0.093; el HR explica en 9.30 % a la estimacin de la proporcin
de ganados y no es explicado en 91.00%
Resumen del modelo

Modelo

Error estndar

ajustado

de la estimacin

R cuadrado

,391a

R cuadrado

,153

,093

,066663

a. Predictores: (Constante), HR

6. PRUEBA DE VALIDEZ DEL MODELO


H0: =0 : la correlacin no es significativa
Ha: 0 : la correlacin es significativa
ANOVAa
Suma de
Modelo
1

cuadrados

Media
gl

cuadrtica

Regresin

,011

,011

Residuo

,062

14

,004

Total

,073

15

Sig.
,134b

2,532

a. Variable dependiente: Proporcion de ganados


b. Predictores: (Constante), HR

Con 5% de n.s, se acepta Ho. El modelo es NO significativo

7. EL MODELO
=0 ;
0
Ho: i
Ha: i

Coeficientesa
Coeficientes
Coeficientes no

estandarizad

95.0% intervalo de

estandarizados

os

confianza para B

Error
Modelo
1

B
(Constante
)

estndar
,354

,096

Beta

t
3,691

Sig.
,002

Lmite

Lmite

inferior

superior

,148

,560

HR

,001

,001

,391

1,591

,134

,000

a. Variable dependiente: Proporcion de ganados

Proporcin de ganados=0.354+0.001*HR
b. Obtenga la ecuacin de regresin estimada para
predecir la proporcin de juegos ganados en funcin del
promedio de carreras ganadas por los miembros del
equipo que lanza.
1. LA RELACIN ESPERADA(TERICA)
ERA Proporcin de ganados: relacin inversa

2. DIAGRAMA DE DISPERSIN
Segn lo esperado podemos observar que la proporcin de ganados
con respecto a ERA presentan una relacin inversa, ver el siguiente
diagrama

3. CORRELACIN
H0: =0;

h1: 0

Segn lo observado en la siguiente tabla.


Correlaciones
Proporcion de
ganados

ERA

,002

Proporcion de ganados

Correlacin de Pearson

-,709**

Sig. (bilateral)

,002

N
ERA

Correlacin de Pearson
Sig. (bilateral)

16

16

-,709**

,002

16

16

**. La correlacin es significativa en el nivel 0,01 (2 colas).

La proporcin de ganados con ERA si presenta relacin


significativa al 5% de

4. EL EFICIENTE DE CORRELACIN:
r=0.709, existe un correlacin alta significativa entre ERA
proporcin de ganados.

con la

5. COEFICIENTE DE DETERMINACIN AJUSTADO

r2adj=0.467; ERA explica en 46,7 % a la estimacin de la proporcin


de ganados y no es explicado en 53.3%
Resumen del modelo

Modelo

R cuadrado

,709a

R cuadrado

Error estndar

ajustado

de la estimacin

,503

,467

,051072

a. Predictores: (Constante), ERA

6. PRUEBA DE VALIDEZ DEL MODELO


H0: =0 : la correlacin no es significativa
Ha: 0 : la correlacin es significativa
ANOVAa
Suma de
Modelo
1

cuadrados

Media
gl

cuadrtica

Regresin

,037

,037

Residuo

,037

14

,003

Total

,073

15

Sig.

14,167

a. Variable dependiente: Proporcion de ganados


b. Predictores: (Constante), ERA

Con 5% de n.s, se rechaza Ho. El modelo es significativo

,002b

7. EL MODELO EVALUACION DE LOS PARMETROS.


=0 ;
0
Ho: i
Ha: i
Coeficientesa
Coeficientes
Coeficientes no

estandarizad

95.0% intervalo de confianza

estandarizados

os

para B

Error
Modelo
1

B
(Constante

estndar
,865

,097

-,084

,022

Beta

Sig.

Lmite

Lmite

inferior

superior

8,951

,000

,658

1,072

-3,764

,002

-,131

-,036

)
ERA

-,709

a. Variable dependiente: Proporcion de ganados

Proporcin de ganados=0.865-0.084*ERA
c. Obtenga la ecuacin de regresin estimada para predecir la
proporcin de juegos ganados en funcin de la cantidad de
cuadrangulares y del promedio de carreras ganadas por los
miembros del equipo que lanza.

1. LA RELACIN ESPERADA (TERICA)


o
o

HR-Proporcin de ganados: relacin directa


ERA Proporcin de ganados: relacin inversa

2. DIAGRAMA DE DISPERSIN
Segn lo esperado podemos observar la proporcin de ganados tiene
una relacin directa con respecto a HR, ver el siguiente diagrama

Segn lo esperado podemos observar que la proporcin de ganados


con respecto a ERA presentan una relacin inversa, ver el siguiente
diagrama

3. CORRELACIN
H0: =0;

h1: 0

Segn lo observado en la siguiente tabla.


Correlaciones
Proporcin de
ganados

HR

ERA

Proporcin de ganados

,391

-,709**

,134

,002

16

16

16

Correlacin de Pearson

,391

,260

Sig. (bilateral)

,134

Correlacin de Pearson

Sig. (bilateral)
N
HR

N
ERA

Correlacin de Pearson

16

16

16

**

,260

,002

,331

16

16

-,709

Sig. (bilateral)
N

,331

16

**. La correlacin es significativa en el nivel 0,01 (2 colas).

La proporcin de ganados
con ERA si presenta relacin
significativa al 5% de n.s.
La proporcin de ganados con HR no presenta relacin de
significativa.

o
o

4. EL EFICIENTE DE CORRELACIN
r=0.926, existe un correlacin alta significativa entre la HR y era con
la proporcin de ganados.
5. COEFICIENTE DE DETERMINACIN AJUSTADO
r2adj=0.837; ERA y HR explica en 83,7 % a la estimacin de la
proporcin de ganados y no es explicado en 16.3%
Resumen del modelo

Modelo
1

R cuadrado

,926a

R cuadrado

Error estndar

ajustado

de la estimacin

,858

,837

,028298

a. Predictores: (Constante), ERA, HR

6. PRUEBA DE VALIDEZ DEL MODELO


H0: =0 : la correlacin no es significativa
Ha: 0 : la correlacin es significativa
ANOVAa
Suma de
Modelo
1

cuadrados

Media
gl

cuadrtica

Regresin

,063

,032

Residuo

,010

13

,001

Total

,073

15

F
39,374

Sig.
,000b

a. Variable dependiente: Proporcion de ganados


b. Predictores: (Constante), ERA, HR

Con 5% de n.s, se rechaza Ho. El modelo es significativo

7. EL MODELO EVALUACION DE LOS PARMETROS.


=0 ;
0
Ho: i
Ha: i
Coeficientesa
Coeficientes
Coeficientes no

estandarizado

95.0% intervalo de confianza

estandarizados

para B

Error
Modelo
1

Lmite

estndar

(Constante)

,709

,060

HR

,001

,000

-,103

,013

ERA

Beta

Sig.

Lmite inferior

11,808

,000

,579

,839

,617

5,710

,000

,001

,002

-,870

-8,043

,000

-,130

-,075

a. Variable dependiente: Proporcion de ganados

Proporcin de ganados= 0.709+0.001*HR-0.103*ERA

d. En la temporada de 2003, San Diego gan slo el 39.5%


de sus juegos, siendo el ms bajo de la liga nacional.
Para mejorar para el ao siguiente, el equipo trat de
adquirir nuevos jugadores que hicieran que la cantidad
de cuadrangulares aumentara a 180 y que el promedio
de carreras ganadas por el equipo que lanza
disminuyera a 4.0. Use la ecuacin de regresin
estimada obtenida en el inciso para estimar el
porcentaje de juegos que ganara San Diego si tuviera
180 cuadrangulares y su promedio de carreras ganadas
fuera 4.0.
Proporcin
Proporcin
Proporcin
Proporcin
Proporcin

de
de
de
de
de

ganados=
ganados=
ganados=
ganados=
ganados=

superior

0.709+0.001*HR-0.103*ERA
0.709+0.001*180-0.103*4
0.709+0.252 -0.412
0.549
54,9%

Ejercicio 7
Los diseadores de mochilas usan materiales exticos como supernailon
Derlin, polietileno de alta densidad, aluminio para aviones o espumas
termo-moldeadas para hacer que las mochilas sean ms confortables y que
el peso se distribuya uniformemente eliminndose as los puntos de mayor
presin. En los datos siguientes se proporciona capacidad (en pulgadas
cbicas), evaluacin del confort, y precio de 10 mochilas probadas por
Outside Magazine. El confort est medido con una escala del 1 al 5, en la

que 1 denota un confort mnimo y 5 un confort excelente. (Outside Buyers


Guide, 2001).

Solucin ejercicio 7
a. Obtenga la ecuacin de regresin estimada que permita
predecir el precio de una mochila, dada su capacidad y la
evaluacin de su confort.

1. LA RELACIN ESPERADA (TERICA)


o
o
o

Capacidad precio: Relacin directa


Confort precio: Relacin directa
Capacidad confort: No hay relacin

2. DIAGRAMAS DE DISPERSIN:
o

Capacidad precio: Contra lo esperado podemos observar que


los datos no presentan relacin alguna, ver el siguiente
diagrama:

Confort precio: Segn lo esperado podemos observar que los


datos presentan relacin directa, con algunos puntos dispersos,
ver el siguiente diagrama:

Capacidad confort: Contra lo esperado podemos observar que


los datos presentan relacin directa, con algunos puntos
dispersos, ver el siguiente diagrama:

3. CORRELACIN
VARIABLES
o
o
o

PRUEBA

DE

HIPTESIS

ENTRE

Ho: =0: la correlacin no es significativa


Ha: 0: la correlacin es significativa
Segn lo observado en la siguiente tabla:

La capacidad no tiene relacin significativa con el confort.


El confort y el precio si presentan correlacin significativa al 5%
de n.s.
La capacidad y el confort no tienen una relacin significativa.

4. COEFICIENTE DE CORRELACIN R=0.912

Existe una correlacin alta significativa entre el confort y la capacidad


con el precio.

5. COEFICIENTE
R2ADJ=0.784

DE

DETERMINACIN

AJUSTADO:

El confort y la capacidad explican en 78.4% a la estimacin del costo,


y no es explicado en 21.6%

6. PRUEBA DE VALIDEZ DEL MODELO:


Ho: El modelo no es significativo
Ha: El modelo es significativo.

Como p-value=0.002, entonces con 5% de n.s. se rechaza Ho. El


modelo es significativo.

7. EL MODELO EVALUACIN DE LOS PARMETROS.


Ho: i=0; Ha: i0

Para Ho: 1=0, Ha: 10, la capacidad NO contribuye


significativamente para estimar el precio en el modelo.
o Para Ho: 2=0, Ha: 20, el confort si contribuye
significativamente para estimar el precio en el modelo.
Por lo tanto, rediseamos el modelo con una variable menos, donde el
nuevo modelo a buscar es:
Precio = bo + b1*Confort
o

8. COEFICIENTE DE CORRELACIN NUEVO R=0.849

Existe una correlacin alta significativa entre el confort con el precio.

9. COEFICIENTE DE DETERMINACIN AJUSTADO NUEVO:


R2ADJ=0.721
El confort explica en 72.1% a la estimacin del precio, y no es
explicado en 27.9%

10.

PRUEBA DE VALIDEZ DEL MODELO:

Ho: El modelo no es significativo


Ha: El modelo es significativo.

Como p-value=0.002, entonces con 5% de n.s. se rechaza Ho. El


modelo es significativo.

11.

EL MODELO EVALUACIN DE LOS PARMETROS.

Ho: i=0; Ha: i0

Para Ho: 1=0, Ha: 10, el confort si contribuye significativamente


para estimar el precio en el modelo.

12.

EL MODELO ES:

Precio de la mochila = -41.618 + 93.876*Confort


El precio de la mochila sin nivel de significancia y con las dos
variables es:
Precio = 356.121 -0.099*Capacidad +122.867*Confort
Sin embargo, con nivel de significancia al 5%, el modelo
estimado es:
Precio = -41.618 + 93.876*Confort

b. Interprete b1 y b2.
Con el primer modelo en el que el primer coeficiente (capacidad) no
contribuye significativamente al modelo:
0.099 es la estimacin del decremento esperado en el precio que
corresponde al aumento en una pulgada cbica en la capacidad cuando el
confort permanece constante.
122.867 es la estimacin del aumento esperado en el precio que
corresponde al aumento de la evaluacin del confort cuando la capacidad
permanece constante.
o

o Con el segundo modelo en el que si hay nivel de significancia:


93.876 es la estimacin del aumento esperado en el precio que
corresponde al aumento de la evaluacin del confort cuando la capacidad
permanece constante.

c. Diga cul ser el precio de una mochila cuya


capacidad sea 4500 pulgadas cbicas y la evaluacin
de su confort sea 4.
o

Con el primer modelo en el que el primer coeficiente (capacidad) no


contribuye significativamente al modelo:
Precio = 356.121 -0.099*(4500) +122.867*(4) = 402.09 = 402

Con el segundo modelo en el que si hay nivel de significancia:


Precio = -41.618 + 93.876*(4) = 333.89 = 334

Ejercicio 8
En la siguiente tabla se da el rendimiento anual, la evaluacin de la
seguridad (0=de alto riesgo, 10 segura) y el coeficiente de gastos anuales
de 20 fondos extranjeros (Mutual Funds, marzo del 2000).

a. Obtenga la ecuacin de regresin estimada que


relaciona el rendimiento anual con la evaluacin de la
seguridad y con el coeficiente de gastos anuales.
1. RELACIN ESPERADA (terica):
o
o
o

Rendimiento anual vs. Evaluacin de seguridad: relacin inversa.


Rendimiento vs. coeficiente de gastos anuales: relacin directa.
Evaluacin de seguridad vs. coeficiente de gastos anuales: no hay
relacin.

2. DIAGRAMA DE DISPERSIN:

Rendimiento vs Factor de seguridad: como se puede observar,


no hay relacin entre estas variables.

Diagrama de dispersin 1
140
120
100
80
Rendimiento Anual

60
40
20
0

6.2 6.4 6.6 6.8

7.2 7.4 7.6 7.8

Factor de Seguridad

Rendimiento vs coeficiente de gasto: como se puede observar,


no hay relacin entre estas variables.

Diagrama de dispersin 2
140
120
100
80
Rendimiento Anual

60
40
20
0
0.8

1.2

1.4

1.6

1.8

2.2

2.4

Coeficiente de gastos anuales

Coeficiente de gasto vs Factor de seguridad: como se puede


observar, no hay relacin entre estas variables.

Diagrama de dispersin 3
2.5
2
1.5
Coeficiente de variacin

1
0.5
0

6.2 6.4 6.6 6.8

7.2 7.4 7.6 7.8

Factor de seguridad

3. CORRELACIN:
Ho : p=0 :la correlacion no es significativa
o
Ha : p 0:la correlacion es significativa

Segun lo observado enla siguiente tabla :


Correlaciones
FS
Correlacin de Pearson
FS

Correlacin de Pearson
Sig. (bilateral)
N
Correlacin de Pearson
RENDA

Sig. (bilateral)
N

RENDA
*

-,659**

,021

,002

20

20

20

,668**

Sig. (bilateral)
N

COEFA

COEFA

-,513

-,513

,021

,001

20

20

20

**

**

-,659

,668

,002

,001

20

20

*. La correlacin es significante al nivel 0,05 (bilateral).

20

**. La correlacin es significativa al nivel 0,01 (bilateral).

o
o

El factor de seguridad no tiene relacin de significancia con el


coeficiente anual. Con el rendimiento anual presenta correlacin
significativa del 5%.
El coeficiente anual tiene correlacin de significancia al 5% de n.s con
el rendimiento anual.

4. COEFICIENTE DE CORRELACIN: r=0,763


Resumen del modelo
Modelo

R cuadrado

,763

R cuadrado

Error tp. de la

corregida

estimacin

,582

,533

16,97705

a. Variables predictoras: (Constante), COEFA, FS

5. COEFICIENTE DE CORRELACIN AJUSTADO:


r2 adj=0,533, el factor de seguridad y el coeficiente anual explican en
53,3% al rendimiendo anual y no es explicado en 46,7%.
Resumen del modelo
Modelo

R cuadrado

,763a

R cuadrado

Error tp. de la

corregida

estimacin

,582

,533

16,97705

a. Variables predictoras: (Constante), COEFA, FS

6. PRUEBA DE VALIDEZ DEL MODELO:


o Ho: =0 : la correlacin no es significativa
o

Ha: 0 : la correlacin es significativa


ANOVAa

Modelo

Suma de

gl

Media

cuadrados

6823,207

3411,604

Residual

4899,743

17

288,220

11722,950

19

11,837

a. Variable dependiente: RENDA


b.

Sig.

cuadrtica

Regresin

Total

Variables predictoras: (Constante), COEFA, FS

7. EL MODELO EVALUACIN DE LOS PARMETROS:


Ho: B1=0
o

,001b

Ha: B1 0

Para

Ho: B1=0 ;

Ha: B1 0 , El factor de seguridad si contribuye

significativamente para estimar los rendimiento anuales.

o Para

Ho: B2=0 ;

Ha : B2 0 , El coeficiente anual si contribuye

significativamente para estimar los rendimiento anuales.

Rendimiento=b 0+ b1FS+ b2Coeficiente anual

Rendimiento=247.35832.845FS+34.589Coeficiente anual

c. Estime el rendimiento anual de una empresa cuya


evaluacin de seguridad es de 7.5 y el coeficiente de
gastos anuales es 2.
Rendimiento=247.35832.845FS+34.589Coeficiente anual

Rendimiento=247.358-32.845*7.5+34.589*2
Rendimiento=70,2

Ejercicio 9
El ski acutico y el wakeboarding son dos deportes acuticos muy
actuales. Ya sea que se trate de ski acutico, de wakeboarding o de
navegacin, hallar el modelo que mejor se ajuste a las necesidades, puede
no ser una tarea sencilla. La revista Water Ski prob 88 lanchas y
proporcion una amplia informacin como ayuda para los consumidores. A
continuacin se presenta una parte de los datos que publicaron sobre 20
lanchas de 20 y 22 pies longitud (Water Ski, enero/febrero 2006). La manga
es el ancho mximo de la lancha (en pulgadas), HP son los caballos de
fuerza del motor y velocidad mxima es la velocidad mxima que alcanza la
lancha, en millas por hora.

Fabricante y Modelo
Calabria Cal Air Por V-3
Correct Craft Air Nautique 210
Correct Craft Air Nautique SV-211
Corrrect Craft Air Nautique 206
Limited
Gekko GTR 22
Gekko GTS 20
Malibu Response Lxi
Malibu Sunsetter Lxi
Malibu Sunsetter 21 XTi
Malibu Sunscape 21 LSV
Malibu Wakesetter 21 XTi
Malibu Wakesetter VLX
Malibu vRide
Malibu Ride XTi
Mastercraft ProStar 209
Mastercraft X-1
Mastercraft X-2
Mastercraft X-9
MB Sports 190 Plus
Svfara SVONE

Manga
100
91
93

HP
330
330
375

Velocidad
Mxima
45.3
47.3
46.9

91
96
83
93.5
98
98
98
98
98
93.5
93.5
96
90
94
96
92
91

330
375
375
340
400
340
400
340
400
340
320
350
310
310
350
330
330

46.7
50.1
52.2
47.2
46
44
47.5
44.9
47.3
44.5
44.5
42.5
45.8
42.8
43.2
45.3
47.7

a. Empleando estos datos obtenga la ecuacin de regresin


estimada que relaciona la velocidad mxima con la
manga y los caballos de fuerza de la lancha.
1. LA RELACIN ESPERADA (TERICA)
o
o
o

Manga-Velocidad Mxima : Relacin directa


Hp-Velocidad Mxima: Relacin directa
Manga - Hp: No hay relacin

2. DIAGRAMA DE DISPERSIN
o Manga-Velocidad Mxima: Segn lo esperado podemos
observar que los datos no tienen comportamiento directo, sino
que estos no presentan relacin, ver el siguiente diagrama:

Hp-Velocidad Mxima: Segn lo esperado podemos observar


que los datos no tienen comportamiento directo, sino que estos
no presentan relacin, ver el siguiente diagrama:

Manga - Hp: Segn lo esperado podemos observar que los


datos no poseen ninguna relacin, ver el siguiente diagrama:

3. CORRELACIN PRUEBA DE HIPTESIS ENTRE


VARIABLES
Ho : p=0 :la correlacion no es significativa

Ho: p 0:la correlacion es significativa

Segun lo observado enla siguiente tabla

Correlaciones
Manga

-0,488*

,272

0,029

20

20

20

Correlacin de Pearson

0,258

0,453*

Sig. (bilateral)

0,272

Sig. (bilateral)
N

Hp

N
Correlacin de Pearson
Velocidad_Maxima

Velocidad_Maxima

,258

Correlacin de Pearson
Manga

Hp

Sig. (bilateral)
N

0,045

20

20

20

-0,488*

0,453*

0,029

0,045

20

20

20

*. La correlacin es significante al nivel 0,05 (bilateral).

La manga no tiene relacin significativa con el Hp. Con


Velocidad_Maxima presenta correlacin significativa al 5% de
n.s.

1.2 Hp tambin presenta una correlacin significativa al 5% de


n.s con Velocidad_Maxima.

r=0.773 ,

4. COEFICIENTE DE CORRELACIN:

Existe una correlacin alta significativa entre la manga y hp con el


costo:
Resumen del modelo
Modelo

R cuadrado

,773a

R cuadrado

Error tp. de la

corregida

estimacin

,597

,550

1,59538

a. Variables predictoras: (Constante), Hp, Manga

5. PRUEBA DE VALIDEZ DEL MODELO


Ho:

El modelo no es significativo

H 1 : El modelo es significativo.
ANOVAa
Modelo

Suma de

gl

Media

cuadrados

Sig.

cuadrtica

Regresin

64,157

32,078

Residual

43,269

17

2,545

107,426

19

Total

12,603

,000b

a. Variable dependiente: Velocidad_Maxima


b. Variables predictoras: (Constante), Hp, Manga

6. EL MODELO EVALUACIN DE LOS PARMETROS


Ho: B1=0
Ha: B1 0

Para

Ho: B1=0 ;

Ha: B1 0,

El

manga

si

contribuye

significativamente para estimar la velocidad de mxima del modelo.

Para

Ho: B2=0 ;

Ha: B2 0,

El Hp si contribuye significativamente

para estimar los la velocidad de mxima del modelo.

Velocidad=b0 + b1Manga+ b2Hp

b. La Svfara SV 609 tiene una manga de 85 pulgadas y


motor de 330 caballos de fuerza. Utilice la ecuacin de
regresin estimada obtenida en el inciso a) para estimar
la velocidad mxima de la Svfara SV609.
Velocidad=b0 + b1Manga+ b2Hp
Veloci dad=64.9660.3985+0.051330

Velocidad=48.646

Ejercicio 25
Borrons realiza revisiones anuales de los corredores de bolsa en lnea,
en la que se incluyen tanto corredores a los que se les puede contactar va
un explorador de Internet, as como corredores que tienen acceso directo y
que ponen al cliente en contacto directo con el servidor de una red de
corredores de bolsa. La oferta y el desempeo de cada corredor se evalan
en seis reas, empleando para cada rea una escala de 0 a 5. Los resultados
se ponderan para obtener una evaluacin general y a cada corredor se le
asigna una evaluacin final que va de cero a cinco estrellas. Tres de las
reas evaluadas son ejecucin de la operacin, facilidad de uso y gama de
ofertas. Un 5 en ejecucin de la operacin significa que la llegada del pedido
y el proceso de ejecucin fluyeron con facilidad de un paso a otro. En
facilidad de uso, 5 significa que el sitio es de fcil uso y que se puede
ajustar para ver lo que le interesa al usuario ver. Un 5 en gama de ofertas
significa que todas las transacciones pueden realizarse en lnea. En los
datos siguientes se presentan las puntuaciones obtenidas en ejecucin de la
operacin, facilidad de uso y gama de ofertas y el nmero de estrellas
obtenidas por los integrantes de una muestra de 10 corredores de bolsa
(Barrons, 10 de marzo de 2003).
Corredor
Ejecucin de la
Uso
Gama Estrella
operacin
s
Wall St. Access
3.7
4.5
4.8
4.0
E*Trade (Power)
3.4
3.0
4.2
3.5
E*Trade
2.5
4.0
4.0
3.5
(Standard)
Preferred Trade
4.8
3.7
3.4
3.5
my Track
4.0
3.5
3.2
3.5
TD Waterhouse
3.0
3.0
4.6
3.5
Brown & Co.
2.7
2.5
3.3
3.0

Brokerage
America
Merrill Lynch
Direct
Strong Funds

1.7

3.5

3.1

3.0

2.2

2.7

3.0

2.5

1.4

3.6

2.5

2.0

a. Determine la ecuacin de regresin estimada que se puede usar para


predecir el nmero de estrellas dadas las evaluaciones a ejecucin, facilidad
de uso y gama de ofertas.
b. Emplee la prueba F para determinar la significancia global de la relacin.
Empleando como nivel de significancia 0.95, cul es la conclusin?
c. Emplee la prueba t para determinar la significancia de cada una de las
variables independientes. Empleando como nivel de significancia 0.05, cul
es la conclusin?
d. Elimine cualquiera de las variables independientes que no sea significativa
para la ecuacin de regresin estimada. Cul es la ecuacin de regresin
estimada que recomienda? Compare R2 con el valor de R2 para el inciso a).
Analice las diferencias.

Solucin ejercicio 25
1. LA RELACIN ESPERADA (TERICA)
o
o
o
o
o
o

Ejecucin de la operacin - Estrellas: Relacin Directa


Uso - Estrellas: Relacin Directa
Gama - Estrellas: Relacin Directa
Ejecucin de la operacin Uso: Relacin Directa
Ejecucin de la operacin Gama: Relacin Directa
Uso Gama : Relacin Directa

2. DIAGRAMA DE DISPERSIN

o
o
o
o

Segn lo esperado podemos observar que los datos si tienen


comportamiento directo entre la Gama, Uso y la ejecucin de la
operacin con las estrellas.
Tambin se observa que el uso no tiene relacin con la ejecucin de
la operacin.
Adems, la gama con el uso tampoco presentan relacin.
A s mismo, la gama con la ejecucin de la operacin no tienen
relacin aparente.

3. CORRELACIN: PRUEBA DE HIPTESIS


Ho: p=0: La correlacin no es significativa
Ha: p0: La correlacin es significativa
Correlaciones
Ejecucin de la

Uso

Gama

Estrellas

operacin
Ejecucin de la operacin

Correlacin de Pearson

,229

,434

,746*

Sig. (bilateral)

,524

,210

,013

10

10

10

10

Correlacin de Pearson

,229

,301

,420

Sig. (bilateral)

,524

,397

,227

N
Uso

N
Gama

10

10

10

10

Correlacin de Pearson

,434

,301

,827**

Sig. (bilateral)

,210

,397

10

Estrellas

,003

10

10

10

Correlacin de Pearson

,746

,420

**

Sig. (bilateral)

,013

,227

,003

10

10

10

,827

*. La correlacin es significante al nivel 0,05 (bilateral).


**. La correlacin es significativa al nivel 0,01 (bilateral).

Las estrellas presentan correlacin significativa al 5% de nivel


de significancia con la ejecucin y la gama, mientras que con el
uso no presenta relacin significativa.
Entre la ejecucin de la operacin-uso, ejecucin de la
operacin-gama y la gama-uso no se encuentra relacin
significativa.

o
o

4. COEFICIENTE DE CORRELACIN
R= 0.941, Existe una correlacin alta significativa entre la ejecucin
de la operacin, uso y la gama.
Resumen del modelo
Modelo

R cuadrado

,941a

R cuadrado

Error tp. de la

corregida

estimacin

,886

,828

2,43100

a. Variables predictoras: (Constante), Gama, Uso, Ejecucin de la


operacin

5. COEFICIENTE DE CORRELACIN AJUSTADO


R2 adj = 0.828, la ejecucin de la operacin, uso y la gama
explican en 82.8% a la estimacin de las estrellas, y no es explicado en
17.2%
.

6. PRUEBA DE VALIDEZ DEL MODELO


Ho: =0: el modelo no es significativo
Ha:

0: La correlacin es significativa
ANOVAa

Modelo

Suma de
cuadrados

gl

Media
cuadrtica

Sig.

10

Regresin
1

274,541

91,514

35,459

5,910

310,000

Residual
Total

15,485

,003b

a. Variable dependiente: Estrellas


b. Variables predictoras: (Constante), Gama, Uso, Ejecucin de la operacin

Se prueba que el modelo es significativo.

7. EL MODELO EVALUACIN DE LOS PARMETROS


Ho: i =0: El modelo no es significativo
Ha: i 0: El modela es significativo
Coeficientesa

Modelo

Coeficientes

estandarizados

tipificados

Error tp.

3,451

5,307

,255

,086

Uso

,132

Gama

,459

(Constante)
Ejecucin de la
1

Coeficientes no

operacin

Intervalo de confianza de
t

Sig.

Beta

95,0% para B
Lmite

Lmite

inferior

superior

,650

,540

-9,534

16,436

,460

2,978

,025

,045

,464

,140

,138

,944

,382

-,211

,476

,123

,586

3,722

,010

,157

,760

a. Variable dependiente: Estrellas

Para Ho: 1 =0; Ha: 1 0, La ejecucin de la operacin


si
contribuye significativamente para estimar las estrellas del modelo.
o Para Ho: 2 =0; Ha: 2 0, el uso NO contribuye significativamente
para estimar las estrellas del modelo.
o Para Ho: 3 =0; Ha: 3 0, el uso si contribuye significativamente
para estimar las estrellas del modelo.
El modelo es:
o

Estrellas=3.415+0.255ejecucin+0.132Uso+ 0.459Gama

COEFICIENTE DE CORRELACIN
R= 0.932, Existe una correlacin alta significativa entre la ejecucin
de la operacin, uso y la gama.
Resumen del modelo
Modelo

R cuadrado

R cuadrado

Error tp. de la

corregida

estimacin

,932a

,869

,831

2,41186

a. Variables predictoras: (Constante), Gama, Ejecucin de la operacin

COEFICIENTE DE CORRELACIN AJUSTADO


R2 adj = 0.831, la ejecucin de la operacin, uso y la gama explican en
83.2% a la estimacin de las estrellas, y no es explicado en 16.8%.

PRUEBA DE VALIDEZ DEL MODELO


Ho: =0: el modelo no es significativo
Ha: 0: La correlacin es significativa
ANOVAa
Modelo

Suma de

gl

Media

cuadrados
Regresin
1

Sig.

cuadrtica

269,281

134,640

40,719

5,817

310,000

Residual
Total

23,146

,001b

a. Variable dependiente: Estrellas


b. Variables predictoras: (Constante), Gama, Ejecucin de la operacin

Se prueba que el modelo es significativo.

EL MODELO EVALUACIN DE LOS PARMETROS


Ho: i =0: El modelo no es significativo
Ha: i 0: El modela es significativo
Coeficientesa

Modelo

(Constante)
1

Ejecucin de la
operacin
Gama

Coeficientes no

Coeficientes

estandarizados

tipificados

Error tp.

6,718

3,989

,264

,084

,485

,119

Intervalo de confianza de
t

Sig.

Beta

95,0% para B
Lmite

Lmite

inferior

superior

1,684

,136

-2,715

16,151

,476

3,131

,017

,065

,463

,621

4,080

,005

,204

,767

a. Variable dependiente: Estrellas

o
o

Para Ho: 1 =0; Ha: 1 0, La ejecucin de la operacin si contribuye


significativamente para estimar las estrellas del modelo.
Para Ho: 3 =0; Ha: 3 0, el uso si contribuye significativamente para
estimar las estrellas del modelo.
El modelo es:

Estrellas=6.718+0.264ejecucin+ 0.485Gam

RESULTADOS
a. Determine la ecuacin de regresin estimada que se
puede usar para predecir el nmero de estrellas dadas
las evaluaciones a ejecucin, facilidad de uso y gama de
ofertas.
Estrellas=3.415+0.255ejecucin+0.132Uso+ 0.459Gama

b. Emplee la prueba F para determinar la significancia


global de la relacin. Empleando como nivel de
significancia 0.95, cul es la conclusin?
Utilizando la prueba F en el Anlisis 1:
Ho: =0: el modelo no es significativo
Ha: 0: La correlacin es significativa
ANOVAa
Modelo

Suma de

gl

Media

cuadrados
Regresin
1

Total

Sig.

cuadrtica

274,541

91,514

35,459

5,910

310,000

Residual

15,485

,003b

a. Variable dependiente: Estrellas


b. Variables predictoras: (Constante), Gama, Uso, Ejecucin de la operacin

Se obtiene para F=15.485, y un p-value de 0.003 que con un 5% de


significancia se rechaza Ho. Por ello, se concluye que el la prueba
proporciona evidencia estadstica suficiente para concluir que los
parmetros no son igual a cero y que la relacin global entre las estrellas y
el conjunto de variables independientes es significativa.

c. Emplee la prueba t para determinar la significancia de


cada una de las variables independientes. Empleando
como nivel de significancia 0.05, cul es la conclusin?
Ho: i =0: El modelo no es significativo
Ha: i 0: El modela es significativo
Coeficientesa

Modelo

Coeficientes

estandarizados

tipificados

Error tp.

3,451

5,307

,255

,086

Uso

,132

Gama

,459

(Constante)
Ejecucin de la
operacin

Coeficientes no

Intervalo de confianza de
t

Sig.

Beta

95,0% para B
Lmite

Lmite

inferior

superior

,650

,540

-9,534

16,436

,460

2,978

,025

,045

,464

,140

,138

,944

,382

-,211

,476

,123

,586

3,722

,010

,157

,760

a. Variable dependiente: Estrellas

o
o
o

Para Ho: 1 =0; Ha: 1 0, La ejecucin de la operacin si contribuye


significativamente para estimar las estrellas del modelo.
Para Ho: 2 =0; Ha: 2 0, el uso NO contribuye significativamente
para estimar las estrellas del modelo.
Para Ho: 3 =0; Ha: 3 0, el uso si contribuye significativamente para
estimar las estrellas del modelo.

d. Elimine cualquiera de las variables independientes que


no sea significativa para la ecuacin de regresin
estimada. Cul es la ecuacin de regresin estimada
que recomienda? Compare R2 con el valor de R2 para el
inciso a). Analice las diferencias.
Por lo tanto rediseamos el modelo con una variable menos, donde el
nuevo modelo a buscar es:
Estrellas= 0 + 1 * La ejecucin de la operacin + 2 * Gama
Comparando R2:
Del primer anlisis: R2=0.828
Del segundo anlisis: R2=0.831
Se observa que cuando se elimin la variable que no era significante
para el modelo, aumento el R2 lo que explica que hay menor porcentaje de
variabilidad de las estrellas cuando se usan las variables de ejecucin de
la operacin y la Gama.

Ejercicio 31
La seccin Gua para el usuario del sitio en la Red de la revista Car and
Driver proporciona informacin sobre pruebas viales (road test) de
automviles, camiones, SUV (acrnimo en ingls de Sport Utility Vehicle) y
vans. Abajo se presentan las puntuaciones generales para calidad general,
modelo de vehculo, frenado, manejo, economa de combustible, confort
interior, aceleracin, confiabilidad, ajuste y terminado, transmisin dadas a
diversos vehculos empleando una escala del 1 (lo peor) a 10 (lo mejor).
Aqu se presenta una parte de los datos de 14 automviles Deportivos/GT
(www.caranddriver.com, 7 de enero de 2004).

a. D una ecuacin de regresin estimada usando manejo, confiabilidad, y


ajuste y terminado para predecir la calidad general.
b. Otro de los automviles deportivos/GT evaluados por Car and Driver es el
Honda Accord. Las evaluaciones de manejo, confiabilidad, y ajuste y
terminado dadas a este automvil fueron 8.28, 9.06 y 8.07,
respectivamente. Estime la evaluacin general dada a este automvil.
c. D un intervalo de 95% de confianza para la calidad general de todos los
automviles deportivos y GT con las caractersticas enumeradas en el inciso
a).
d. D un intervalo de prediccin de 95% para la calidad general del Honda
Accord descrito en el inciso b).
e. La evaluacin general dada por Car and Driver para el Honda Accord fue
8.65. Compare esta evaluacin con las estimaciones obtenidas en los incisos
b) y d).

Solucin ejercicio 31
a. D una ecuacin de regresin estimada usando manejo,
confiabilidad, y ajuste y terminado para predecir la
calidad general.
1.
LA RELACIN ESPERADA:
Manejo-General: relacin directa
Confiabilidad-General: relacin directa
Ajuste y terminado-General: relacin directa
Manejo Confiabilidad: relacin directa
Manejo Ajuste: relacin directa
Ajuste Confiabilidad: relacin directa

2.

DIAGRAMA DE DISPERSIN

Manejo-General: Segn lo esperado los datos tienen comportamiento


directo, ver el siguiente diagrama:

Confiabilidad-General: Segn lo esperado


comportamiento directo, ver el siguiente diagrama:

los

datos

tienen

Ajuste y terminado-General: Segn lo esperado los datos tienen


comportamiento directo, ver el siguiente diagrama:

Entre las variables independientes se espera que exista cierta relacin


y lo observado es:
Manejo Confiabilidad: sin relacin
Manejo Ajuste: relacin directa
Ajuste Confiabilidad: sin relacin

3.

CORRELACIN POR CADA PAR DE VARIABLES

o
o
o

4.

La puntuacin de la calidad general tiene relacin con el manejo,


confiabilidad y ajuste terminado.
El ajuste y el manejo existe cierta relacin significativa, por lo tanto
puede afectar al modelo.
Entre el manejo y la confiabilidad no existe relacin

COEFICIENTE DE CORRELACIN: R=0.93

Coeficiente de correlacin: r=0.93, existe una correlacin alta


significativa entre la Ajuste y terminado, Confiabilidad y manejo con el
general.

5.

COEFICIENTE DE DETERMINACIN AJUSTADO:


R2ADJ=0.824

Ajuste y terminado, Confiabilidad y manejo explican en 82.4% a la


estimacin del costo, y no es explicado en 17.6%

6.

VALIDEZ DEL MODELO

P-value =0, entonces el modelo es significativo con 5% de nivel de


significancia.

7.

EL MODELO - EVALUACIN DE LOS PARMETROS

Para ho: B1=0, Ha: B1o, El manejo si contribuye significativa para


estimar los costos en el modelo.
Para ho: B2=o, Ha: B2o , La confiabilidad si contribuye
significativamente para estimar los costos en el modelo.
Para Ho: B3=o, HA: B3o El ajuste y terminado si contribuye
significativamente para estimar los costos en el modelo.
Por lo tanto el modelo a usar es:
General=0.55+0.276*Manejo+0.447*Confiabilidad+0.270*Ajuste

b)
Otro de los automviles deportivos/GT evaluados por Car
and Driver es el Honda Accord. Las evaluaciones de manejo,
confiabilidad, y ajuste y terminado dadas a este automvil
fueron 8.28, 9.06 y 8.07, respectivamente. Estime la
evaluacin general dada a este automvil
General=-0.55+0.276*8.28+0.447*9.06+0.270*8.07=7.964

You might also like