You are on page 1of 27

UNIDAD 5. REGRESIN LNEAL SIMPLE.

1.1. REGRESION LINEAL SIMPLE.


En problemas bivariables, es decir cuando se tienen involucradas dos variables; de lo cual se tiene
como inters determinar s existe una relacin significativa entre ellas, lo primero que se debe es
identificar, cual es la variable independiente (X), es la que afecta a la otra y dependiente (Y), la
afectada. Por ejemplo se desea estudiar si el nmero de horas que dedica un trabajador en
capacitacin esta directamente ligado a su productividad, en este caso X: No. de horas de
capacitacin e Y: la productividad del trabajador.

DIAGRAMA DE DISPERSIN.

Cuando se tiene identificado la variables, un primer es recomendable medir el grado de relacin que
existe entre ellas, con la finalidad de conocer si la correspondencia entre ellas es significativa. El
diagrama de dispersin es una manera rpida de analizar si existe una relacin significativa entre dos
variables, en el eje vertical se seala la variable dependiente, tambin identificada como el efecto
(Y), mientras que en la variable independiente o la causa, se seala, en el eje horizontal (X), si al
graficar los puntos sealados forman una nube con tendencia, ya sea positiva o negativa, si existe
relacin entre las variables.

Cuando la relacin es positiva y significativa, positiva es porque a un aumento de X, corresponde un


aumento de Y, y es significativa, ya que la nube de datos muestra claramente una tendencia, se
seala en la siguiente figura:
Grfica de dispersin de y vs. x
16

14

12

10
y

1 2 3 4 5 6 7
x

Una relacin es significativa, pero negativa, cuando la nube de datos la tendencia es a disminuir Y,
cuando X aumento, la siguiente figura representa dicho caso:

Grfica de dispersin de y vs. x

14

12

10

8
y

0 1 2 3 4 5 6 7 8 9
x
Cuando la relacin no es significativa, la nube de datos es demasiado gruesa, y no se presenta
tendencia clara, es decir esta se representa como la recta y es paralela al eje horizontal, como se
presenta en la siguiente figura:

Grfica de dispersin de y vs. x

14

12

10

8
y

0 1 2 3 4 5 6 7 8 9
x

Al trazar la grfica de dispersin debe de tenerse cuidado de comenzar los ejes con los valores
mnimos de cada variable y terminar con los valores mximos, para no dibujar grficas
desproporcionadas que no se puedan interpretar, como la que se presenta a continuacin:
Grfica de dispersin de y vs. x

50

40

30
y

20

10

10 20 30 40 50
x

COEFICIENTE DE CORRELACION ().

Si no se desea hacer el anlisis grfico se puede calcular el coeficiente de correlacin (Rho), el


cual se calcula de acuerdo con una muestra el cual se determine mediante la letra () que se define
como el grado de relacin entre dos variables, el valor de puede estar en el siguiente rango
1 < < 1, si el valor es = 1, seala una relacin significativa entre las variables, pero
negativa, es decir a medida que aumenta la variable X, la variable Y disminuye. Pero si al contrario,
si = 1, la relacin es positiva, y a medida que aumenta X, tambin se incrementa Y. Si = 0, la
relacin no es significativa, por lo tanto X e Y son independientes. Se puede sealar de manera muy
rpida que si || 0.75, la relacin entre las variables es significativa.

El valor de , se calcula de la siguiente manera, es importante aclarar que todas las frmulas de
Regresin Lneal Simple, utilizadas se encuentran en el Anexo 1:

xy n y
x
r
( y )
2
( x) 2

y x
2 2

n n
Para facilitar los clculos, se utilizan las sumas de cuadrados, como sigue; de , =
( )2 ( )2
2 , de , = y de , = 2 .


De lo anterior se tiene que = .

Ejemplo:

Una compaa desea conocer si la inversin hecha en gastos de publicidad afecta las ventas de su
producto, se tomaron datos de 20 meses como se muestra a continuacin:

Mes Gastos de publicidad Ventas


($ 1,000) ($1,000,000)
1 4.3 19.2
2 5.1 20.7
3 6.2 24.8
4 7.1 37.1
5 9.3 36.4
6 8.7 34.2
7 2.4 8.1
8 3.5 15.1
9 6.4 25.3
10 8.1 30.1
11 9.3 36.4
12 9.7 38.2
13 10.1 40.1
14 11.4 45.3
15 3.8 12.1
16 6.3 24.3
17 9.4 36.5
18 12.1 48.1
19 10.2 42.1
20 10.7 47.3

Lo primero que se determina son las variables:

X: Publicidad y Y: Ventas.

Al realizar el diagrama de dispersin se tiene:


Grfica de dispersin de Ventas vs. Gastos
50

40
Ventas

30

20

10

2 4 6 8 10 12
Gastos

Conclusin: La relacin es significativa.

Si se determina mediante el coeficiente de correlacin se tienen las siguientes sumatorias:

= 4.3 + 5.1 + + 10.7 = 154.1


=1

= 19.2 + 20.7 + + 47.3 = 621.4


=1

2 = 4.32 + 5.12 + + 10.72 = 1340.09


=1

2 = 19.22 + 20.72 + + 47.32 = 21959.66


=1

= 4.3(19.2) + 5.1(20.7) + + 10.7(47.3) = 5409.58


=1
Estas sumatorias se pueden obtener en cualquier calculadora o en Excel.

De lo anterior se determina:

154.12
= 1340.09 = 152.7495
20

621.42
= 21959.66 = 2652.762
20

154.1(621.4)
= 5409.58 = 621.693
20

621.393
Por lo tanto se tiene que = = 0.976, de ah que se puede concluir que la
152.7495(2652.762)

relacin es significativa, por lo tanto los gastos de publicidad definitivamente afectan las ventas.

ECUACION DE LA LINEA DE REGRESION SIMPLE.

Si las variables tienen una relacin significativa, se debe buscar un modelo que represente los datos,
el modelo ms simple es una lnea, = 0 + 1 , la cual se estima de acuerdo con la siguiente
frmula: = 0 + 1 , donde:



0 = 1 y = .
1 2 2 ( )

El valor de 0 representa la ordenada al origen, mientras que 1, es la pendiente de la lnea de


regresin, esta es la variable que seala si existe una relacin fuerte entre las variables, adems que
representa la cantidad de incremento que se tiene en Y, por una unidad de incremento de X.

Si se utiliza la simbologa de las sumatorias se tiene que:

1 =
0 =
1 .

Ejemplo:

Del problema anterior determine la ecuacin que representa a los datos.


621.693 621.4 154.1
1 =
= 4.07 y = = 31.07, mientras que = = 7.705, por lo tanto
152.7495 20 20
0 = 31.07 4.07(7.705) = 0.28935.

Entonces la ecuacin de regresin lineal simple es: = 0.2894 + 4.07, donde Y: Ventas y X:
Publicidad.

La pendiente seala que por cada milln de pesos gastados en publicidad las ventas son de 4.07
millones de pesos.

La ecuacin se puede dibujar en el diagrama de dispersin, definiendo dos valores de X, por


ejemplo, para = 5, = 0.2894 + 4.07(5) = 20.0606, para = 10, el valor de =
0.2894 + 4.07(10) = 40.4106, por lo tanto uniendo los dos puntos de referencia se traza la recta
que representa al grupo de datos:

Grfica de dispersin de Ventas ($1000,000) vs. Publicidad ($1000,000)

50

40
Ventas ($1000,000)

30
Y=-0.2894+4.07(X)

20

10

2 4 6 8 10 12
Publicidad ($1000,000)
1.1.1 PRUEBA DE HIPTESIS EN LA LINEA DE
REGRESION LINEAL SIMPLE.
Con la ecuacin de la lnea regresin se pueden hacer pruebas que determinen principalmente para
determinar si existe una relacin significativa entre las variables, las pruebas a desarrollar son:

1) Modelo significativo.
2) De la ordenada al origen.
3) De la pendiente.
4) Del coeficiente de correlacin.

PRUEBA DE HIPTESIS PARA CONOCER SI EL MODELO ES


SIGNIFICATIVO.

Las pruebas de hiptesis se pueden realizar de diferentes mtodos, para el caso de este texto, se
harn siguiendo los siguientes pasos:

1. Pregunta: Se inicia con la pregunta acerca del parmetro estadstico a contestar.


2. Hiptesis estadsticas: Se define de acuerdo con la pregunta 0 y 1 .
3. Nivel de significancia: Se determina el error tipo I, en el que se desea hacer la prueba,
regularmente se usa de 1% a 10%.
4. rea de aceptacin de 0 : De acuerdo al tipo de prueba.
5. Regla de decisin: Tomando en rea de aceptacin de 0 , se define la regla de decisin para
aceptar o rechazar 0 .
6. Estadstico de prueba: Con la informacin obtenida se determina el estadstico de prueba para
contrastarla con la hiptesis planteada.
7. Decisin: Se decide si se acepta o rechaza 0 .
8. Respuesta: Se contesta la pregunta realizada de acuerdo con la decisin tomada.

Esta es la primera prueba que se realiza, con la finalidad de conocer si existe una relacin
significativa entre las variables, se hace mediante la prueba F, usando la tabla de Anlisis de
Varianza (ANOVA), usando una prueba unilateral a la derecha. La tabla ANOVA se construye de la
siguiente manera:

Fuente Suma de cuadrados Grados de libertad Cuadrado medio Estadstico F

Regresin 1

Error 2

Total 1

Los clculos se realizan de la siguiente manera:

Suma de cuadrados de la regresin = 1 .

Suma de cuadrados total = .

Suma de cuadrados del error =


Cuadrado medio de la regresin = .
1


Cuadrado medio del error = .
2


El estadstico de prueba = .

Ejemplo:

Con los datos del ejemplo anterior, determine si el modelo es significativo, usando un nivel de
significancia de 0.05

1) Pregunta: El modelo es significativo?


2) Hiptesis: 0 : Modelo no significativo (1 = 0)
1 : Modelo significativo (1 0)
3) Nivel de significancia: = 0.05
4) rea de aceptacin de 0 : En este caso 1 = 1 y 2 = 18, por lo tanto para = 0.05, de ah que
(1,18) = 4.41
5) Regla de decisin: Se acepta 0 , si F< 4.41, en caso contrario se rechaza.
6) Estadstico de prueba (Tabla ANOVA):
= 4.07(621.693) = 2530.2905
= 2652.762
Fuente Suma de Grados de libertad Cuadrado medio Estadstico F
cuadrados
Regresin 2530.2905 1 2530.2905 371.8828
Error 122.4715 18 6.804
Total 2652.762 19

7) Regla de decisin: Se rechaza 0 .


8) Respuesta: El modelo es significativo.

PRUEBA DE HIPTESIS PARA LA ORDENADA AL ORIGEN.


La ordenada al origen 0, representa el valor de , cuando = 0, es donde pega la recta en el eje
vertical, algunas veces no tiene tanto inters como la pendiente, pero se puede probar usando la
prueba , cuando los grados de libertad son = 2, la prueba puede ser unilateral o bilateral,
depende de la pregunta.
0 0

El estadstico de prueba en este caso es: = 2

=1

Donde:
0 es la ordenada al origen que se desea probar-
,es la desviacin estndar de la lnea de regresin y es igual a = .

Ejemplo:
Probar que la ordenada al origen es igual a cero, usando un nivel de significancia de 0.01.
1) Pregunta: La ordenada al origen es igual a cero?
2) Hiptesis: 0 : 0 = 0
1 : 0 0
3) Nivel de significancia: = 0.01

4) rea de aceptacin de 0 : En este caso = 18 y para = 0.01, entonces = 0.005 de ah que
2

/2(18) = 2.878.
5) Regla de decisin: Se acepta 0 , si 2.878 < < 2.878, en caso contrario se rechaza.
0.28940
6) Estadstico de prueba: = 6.804 = 2.6084, por lo tanto = =0.1675
1340.09
2.6084
20(152.7495)

7) Decisin: Se acepta 0 .
8) Respuesta: El valor de la ordenada al origen puede ser igual a cero.

PRUEBA DE HIPTESIS PARA LA PENDIENTE.


Es la variable del modelo de regresin ms importante, ya que si existe pendiente y esta es
significativa, la relacin entre las variables, tambin los es. La prueba T, sirve para probar cualquier
valor especifico de la pendiente, pero principalmente interesa considerar que la es diferente de cero.
El estadstico de prueba es:

1 1

= con = 2.

Ejemplo:

Con los datos del ejemplo anterior, probar la hiptesis de que la pendiente es igual a cero, utilice un
nivel de significancia del 0.05.

1) Pregunta: La ordenada al origen es igual a cero?


2) Hiptesis: 0 : 1 = 0
1 : 1 0
3) Nivel de significancia: = 0.05

4) rea de aceptacin de 0 : En este caso = 18 y para = 0.05, entonces = 0.025 de ah que
2

/2(18) = 2.101.
5) Regla de decisin: Se acepta 0 , si 2.101 < < 2.101, en caso contrario se rechaza.
1 1
4.070
6) Estadstico de prueba: por lo tanto = = 2.6084 = 19.2846
152.7495

7) Decisin: Se rechaza 0 .
8) Respuesta: La pendiente es diferente de cero.

PRUEBA DE HIPTESIS DEL COEFICIENTE DE CORRELACION ().

Se puede responder a la pregunta acerca de que si tiene algn valor en particular, regularmente se
prueba si = 0, ya que sealara que la relacin no existe entre las variables.

El estadstico de prueba es:


= 2
con = 2
1
2

Ejemplo:

Probar la hiptesis de que > 0.75, usando un nivel de significancia del 0.01

1) Pregunta: > 0.75?


2) Hiptesis: 0 : 0.75
1 : > 0.75
3) Nivel de significancia: = 0.01
4) rea de aceptacin de 0 : = 18, por lo tanto para = 0.001, de ah que = 2.552.
5) Regla de decisin: Se acepta 0 , si < 2.552, en caso contrario se rechaza.
6) Estadstico de prueba:
0.976 0.75
= = 39.9515
2
1 0.976
18
7) Decisin: Se rechaza 0 .
8) Respuesta: 0.75, por lo anterior la relacin es significativa.

COEFICIENTE DE DETERMINACIN ( )
Seala la proporcin de la suma de los cuadrados de las desviaciones de los valores de Y con
respecto a su promedio que se puede atribuir a la relacin lineal entre X e Y. Se determina basado en
una muestra de la siguiente manera:


2 =

Ejemplo:

Determinar el coeficiente de determinacin e interpretar el resultado.

2 = 0.9762 = 0.953, por lo tanto se puede determinar que 95.3% de la suma de cuadrados totales
se atribuyen a la relacin lineal entre X e Y.

1.1.2 CALIDAD DEL AJUSTE EN REGRESION LINEAL


SIMPLE.
Esta tiene que evaluarse tomando en cuenta, que tanto los datos se ajustan al modelo de regresin
lineal, la evaluacin de la idoneidad del modelo se determina mediante el error o residual; que es
igual a la diferencia entre el valor observado de y el valor pronosticado, por los tanto:

= , y se toman tres supuestos acerca de los residuales o errores:

1. Normalidad del error.


2. Homoscedasticidad.
3. Independencia de los errores.

NORMALIDAD DEL ERROR:

En este caso se determina que los errores tienen una media igual a cero y una varianza 2 y se
distribuyen de acuerdo con una normal, para comprobarlo se desarrollan dos procedimientos; el
histograma de los errores y el papel de probabilidad:

Ejemplo:
Con los datos del ejemplo anterior, calcular el error o residual, y comprobar que se comportan de
acuerdo con una normal con media de cero y desviacin estndar , mediante:

a) Un histograma.
b) El papel de probabilidad.

Para el modelo se tienen los errores siguientes:


Mes Gastos Ventas
1 4.3 19.2 17.212 1.988
2 5.1 20.7 20.468 0.232
3 6.2 24.8 24.945 -0.145
4 7.1 37.1 28.608 8.492
5 9.3 36.4 37.562 -1.162
6 8.7 34.2 35.120 -0.920
7 2.4 8.1 9.479 -1.379
8 3.5 15.1 13.956 1.144
9 6.4 25.3 25.759 -0.459
10 8.1 30.1 32.678 -2.578
11 9.3 36.4 37.562 -1.162
12 9.7 38.2 39.190 -0.990
13 10.1 40.1 40.818 -0.718
14 11.4 45.3 46.109 -0.809
15 3.8 12.1 15.177 -3.077
16 6.3 24.3 25.352 -1.052
17 9.4 36.5 37.969 -1.469
18 12.1 48.1 48.958 -0.858
19 10.2 42.1 41.225 0.875
20 10.7 47.3 43.260 4.040

a) Histograma: Trazado mediante en Minitab se tiene el siguiente histograma:


Histograma de e
Normal

Media -0.00035
9
Desv .Est. 2.539
N 20
8

6
Frecuencia

0
-6 -4 -2 0 2 4 6 8
e

Conclusin: Como se puede observar los datos no se ajustan a una normal, pero si tiene una media
aproximadamente a cero.
b) Papel de probabilidad: Este es un grafico trazado en el Minitab, se tiene:

Grfica de probabilidad de e
Normal - 95% de IC
0.99
M edia -0.00035
Desv .E st. 2.539
0.95 N 20
AD 1.682
V alor P <0.005

0.8
Probabilidad

0.5

0.2

0.05

0.01
-10 -5 0 5 10
e

Conclusin: Como podemos observar el error ms alto, sale de los limites, por lo tanto no se pueden
considerar que los datos se aproximan a una normal, adems el Pvalor es menor de 0.005, y para
aceptar que los datos se aproximan a una normal, > , para un nivel de significancia de
0.05, se rechaza 0 .

HOMOSCEDASTICIDAD DE LOS ERRORES.

Mediante la grfica de los residuales se puede conocer si pueden suponer que las varianzas son
iguales, ya que graficando los errores con respecto a los valores de la variable independiente (), si
la homoscedasticidad no se cumple, se tendr mucha variabilidad, en la siguiente grfica se puede
observar que los valores de (), presenta entre ellos bastante dispersin, por lo cual se concluye que
no existe homoscedasticidad.

Grfica de dispersin de e vs. x

5.0

2.5

0.0 0
e

-2.5

-5.0

1 2 3 4 5
x

Otra forma de medir la homoscedasticidad es mediante en estadstico de Bartlett, el cual no lo


trataremos en este libro.

Ejemplo:

Con los datos del ejemplo anterior, determinar si cumplen con la homoscedasticidad en los errores:

Al realizar la grfica se tiene:


Grfica de dispersin de e vs. Gastos
10

4
e

0 0

-2

-4
2 4 6 8 10 12
Gastos

Como se puede observar el punto 4, que corresponde a = 7.1, el error es 8.492, que sin duda
alguna presenta una mayor variabilidad, por lo tanto se concluye que los errores no cumplen con la
homoscedasticidad.

INDEPENDENCIA DE LOS ERRORES.

La independencia se puede analizar mediante una grfica de residuales, si los errores se tienen un
patrn de comportamiento aleatorio, los errores son independientes, en este caso los errores se
grafican por el orden como fueron apareciendo.

Ejemplo:

Con los datos del ejemplo anterior, determinar si los errores son independientes:
vs. orden
(la respuesta es Ventas)
10

4
Residuo

-2

-4
2 4 6 8 10 12 14 16 18 20
Orden de observacin

Como se puede apreciar el punto 4, se encuentra separado significativamente del valor de cero, y por
otra parte las observaciones de la 9 al 18, que son un total de 10 de manera consecutiva se
encuentran por debajo de cero, regularmente se permiten hasta 7, antes de concluir que los datos no
se presentan de manera independiente, por lo tanto los errores no cumplen con el supuesto de
independencia.

1.1.3. ESTIMACION Y PREDICCION POR INTERVALO


EN REGRESION LINEAL SIMPLE.
Uno de los principales usos de la regresin es estimar los valores de la lnea de regresin, as como
tambin los valores de la variable dependiente.

INTERVALO DE CONFIANZA PARA LA ORDENA AL ORIGEN DE LA


LINEA DE REGRESIN LINEAL SIMPLE.

La estimacin puntual es mediante 0, y utilizando un nivel de confianza, se tiene:


2 2
0 /2 < 0 < 0 + /2 donde = 2.

Ejemplo:

Con los datos del ejemplo anterior y utilizando un intervalo de confianza del 95%, determine el
valor de 0 .


En este caso 1 2 = 0.95, por lo tanto = 2.101
2

1340.09 1340.09
0.2894 2.101(2.2684) < 0 < 0.2894 + 2.101(2.2684)
20(152.7495) 20(152.7495)

3.4459 < 0 < 2.8671, dado que el valor pasa por el cero, se considera que 0 = 0. No es de
inters estudiar la ordenada al origen, puede pasar por cero sin afectar la relacin entre las variables.

INTERVALO DE CONFIANZA PARA EL COEFICIENTE DE LA


PENDIENTE DE LA LINEA DE REGRESIN LINEAL SIMPLE.

Se puede hacer la estimacin de 1, esta variable nos seala la relacin entre las variables, si el
intervalo pasa por cero, seala que la relacin no es significativa, para un nivel de confianza el
clculo se hace de acuerdo con la siguiente frmula:


1 /2
1 + /2
< 1 < donde = 2

Ejemplo:

Con los datos del ejercicio anterior, calcule el valor de la pendiente, usando un nivel de confianza
del 90%, y determinar si la relacin entre las variables es significativa.


Para 1 2 = 0.9, se tiene /2 = 1.734, entonces:

2.6084 2.6084
4.07 1.734 ( ) < 1 < 4.07 1.734 ( ), por lo tanto se tiene:
152.7495 152.7495
3.704 < 1 < 4.436, dado que no pasa por cero, la relacin entre las variables es significativa.

PRONOSTICOS Y PREDICCIONES UTILIZANDO EL MODELO DE


REGRESION LINEAL SIMPLE.

Uno de los objetivos de utilizar modelos de regresin es determinar pronsticos o predicciones de


los valores de las Y, cuando se somete a valores de X.

INTERVALO DE CONFIANZA.

Este se refiere al valor promedio que tomara en promedio Y para los el valor de X, se determina de
la siguiente manera:

1 2
( ) 1 ( ) 2
0 /2 + 0 < /0 < 0 + /2 + 0 donde = 2

Donde = 0 + 1 0 y 0 es el valor supuesto de X.

Ejemplo:

Determine un intervalo de confianza del 90%, para el valor esperado de Y, cuando = 10.


Entonces = 40.4106 y = 0.05, los grados de libertad = 18, por lo tanto /2 = 1.734, se
2

tiene:

1 (10 7.705)2
40.4106 1.734(2.6083) + < /10
20 152.7495

1 (10 7.705)2
< 40.4106 + 1.734(2.6083) +
20 152.7495

39.096 < /10 < 41.7252

Conclusin: Aseguramos con una confianza del 90%, que para el valor de = 10, el valor
promedio de Y se encuentra entre 39.096 a 41.7252.
INTERVALO DE PREDICCION

Se utiliza para conocer el valor de variacin que puede tomar Y para un valor de X, el cual se
determina de la siguiente manera:

1 2
( ) 1 ( ) 2
0 1 + + 0 < < 0 + 1 + + 0 donde = 2
2 2

Ejemplo:

Determine un intervalo de confianza del 90% para el rango de valores de Y, cuando = 10.

En este caso se tiene:

1 (10 7.705)2
40.4106 1.734(2.6083)1 + + <
20 152.7495

1 (10 7.705)2
< 40.4106 + 1.734(2.6083)1 + +
20 152.7495

35.7006 < < 45.1206

Conclusin: Aseguramos con una confianza del 90%, que para = 10, el valor de Y se encuentra
en el rango de 35.7006 a 45.1206.

1.1.4 USO DE SOFTWARE ESTADSTICO.


Existen varios software estadsticos, para resolver problemas de regresin lineal simple, para este
libro se utiliza el Minitab, para resolver los problemas planteados, y como cualquiera ofrece ventajas
y desventajas, pero para la regresin los resultados son bastante amigables.

Ejemplo:
Resolver el problema anterior en Minitab, determinando:
a) El diagrama de dispersin.
Grfica de dispersin de Ventas vs. Gastos
50

40
Ventas

30

20

10

2 4 6 8 10 12
Gastos

Como se puede observar la relacin entre las variables es significativa, ya que existe claramente una
tendencia en la lnea de regresin trazada.

b) La ecuacin de regresin lineal simple.


La ecuacin de regresin es
Ventas = - 0.29 + 4.07 Gastos

c) Mediante la tabla ANOVA, determinar si el modelo es significativo, usar un nivel de


significancia de 0.05.

1) Pregunta: El modelo de regresin es significativo?


2) Hiptesis: 0 : Modelo no significativo
1 : Modelo significativo
3) Nivel de significancia: = 0.05
4) rea de aceptacin de 0 :
Grfica de distribucin
F, df1=1, df2=18
1.0

0.8

0.6
Densidad

0.4

0.2

Aceptacin de Ho 0.05
0.0
0 4.414
X

5) Regla de decisin: Se acepta Ho si < 4.414, en caso contrario se rechaza.


6) Tabla ANOVA:
Anlisis de varianza
Fuente GL SC CM F P
Regresin 1 2530.3 2530.3 371.92 0.000
Error residual 18 122.5 6.8
Total 19 2652.8

7) Decisin: No se puede rechazar Ho


8) Respuesta: El modelo es significativo, si existe relacin lineal entre las ventas y los gastos.

d) Probar si 0 es igual a cero, usar un nivel de significancia de 0.01.

1) Pregunta: 0 = 0 ?
2) Hiptesis: 0 : 0 = 0
1 : 0 0
3) Nivel de significancia: = 0.01
4) rea de aceptacin de 0 :
Grfica de distribucin
T, df=18

0.4

0.3
Densidad

0.2

0.1
Aceptacin de Ho

0.005 0.005
0.0
-2.878 0 2.878
X

5) Regla de decisin: Se acepta Ho si -2.878<T<2.878, en caso contrario se rechaza.


6) Estadstico de prueba:
En el Minitab se tiene:
Predictor Coef SE Coef T P
Constante -0.289 1.728 -0.17 0.869
Gastos 4.0700 0.2110 19.29 0.000

Al evaluar 0, corresponde a la Constante de la ordena al origen, por lo tanto = 0.17


7) Decisin: No se puede rechazar Ho
8) Respuesta: La ordenada al origen es igual a cero.

e) Probar si 1 es igual a cero, con un nivel de significancia de 0.05

1) Pregunta: 1 = 0 ?
2) Hiptesis: 0 : 1 = 0
1 : 1 0
3) Nivel de significancia: = 0.05
4) rea de aceptacin de 0 :
Grfica de distribucin
T, df=18

0.4

0.3
Densidad

0.2

0.1

Aceptacin de Ho
0.025 0.025
0.0
-2.101 0 2.101
X

5) Regla de decisin: Se acepta Ho si -2.101<T<2.101, en caso contrario se rechaza.


6) Estadstico de prueba:
En el Minitab se tiene:
Predictor Coef SE Coef T P
Constante -0.289 1.728 -0.17 0.869
Gastos 4.0700 0.2110 19.29 0.000

Al evaluar 1, corresponde a la Gastos, por lo tanto = 19.29


7) Decisin: Se rechaza Ho
8) Respuesta: 1 = 0, por lo tanto el modelo es significativo.

f) Determine las ventas esperadas los gastos son de $10,000, usando un intervalo de confianza de
90%.
EE de
Nueva obs Ajuste ajuste IC de 90% IP de 90%
1 40.411 0.758 (39.096, 41.725) (35.700, 45.121)

De manera puntual las ventas son: 40.411 millones y el intervalo de confianza de 90%, las ventas se
encuentran entre 39.096 a 41.725 millones.

g) Determine el intervalo de ventas si los gastos son de $10,000, usando un intervalo de confianza
de 90%.
En este caso se tiene que las ventas oscilaran entre 35.7 a 45.121 millones.

h) Analizar los errores de acuerdo con las grficas:

Grficas de residuos para Ventas


Grfica de probabilidad normal vs. ajustes
0.99 10

0.9
Probabilidad

Residuo
0.5

0
0.1

0.01
-5 0 5 10 10 20 30 40 50
Residuo Valor ajustado

Histograma vs. orden


10
8
Frecuencia

6 5
Residuo

4
0
2

0
-4 -2 0 2 4 6 8 2 4 6 8 10 12 14 16 18 20
Residuo Orden de observacin

Como se puede observar el la grfica superior izquierda, los errores o residuales no tienen una
distribucin normal, ya que el mes 4 tiene una residual o error de 8.492, valor se ve reflejado en el
resto de las grfica, en la superior del lado derecho, es el punto ms alto que sobresale, en la inferior
del lado izquierdo este punto ocasiona la barra de la derecha, y finalmente en la grfica de la derecha
inferior el cuarto punto se debe a este residual y ocasiona que los puntos 9 al 18 se encuentren por
debajo de cero.

You might also like