You are on page 1of 15

MEDIDAS DE VARIACIN

El anlisis de regresin se usa con propsitos de prediccin, la meta es desarrollar un modelo estadstico que se puede usar para predecir los valores de una variable dependiente o de respuesta basados en los valores de al menos una variable independiente o explicativa.
Para examinar que tan bien predice la variable independiente a la variable dependiente en el modelo estadstico, es necesario desarrollar varias medidas de variacin: La suma de cuadrados total (SCT). La suma de cuadrados de regresin (SCR) Suma de cuadrados de Error (SCE)

Profesor. Juan Daz Valencia.

REGRESIN Y CORRELACIN ESTIMACIN DEL ERROR


Estudio de caso. Una cadena de supermercados ha aumentado el porcentaje de mercadeo con el incremento en el nmero de tiendas; los dueos nunca han empleado un enfoque sistemtico para la eleccin del lugar, esto se bas, en esencia, en que se consider un gran sitio o una buena renta. Ahora, la empresa con un nuevo plan estratgico para abrir varias tiendas nuevas, le pidi al director de proyectos y planeacin que desarrollara un enfoque para predecir las ventas anuales en todas las tiendas nuevas. El director decidi examinar la relacin entre el tamao (en pies cuadrados) de una tienda y sus ventas anuales (miles de dlares), para ello seleccion aleatoriamente una muestra de 14 tiendas.

Tienda rea [pies2] Venta [anual] N X Y 1 1726 3681 2 1642 3895 3 2816 6653 4 5555 9543 5 1292 3418 6 2208 5563 7 1313 3660 8 1102 2694 9 3151 5468 10 1516 2898 11 5161 10674 12 4567 7585 13 5841 11760 14 3008 4085

Mediante el mtodo de mnimos cuadrados el director de planeacin halla el siguiente modelo de regresin, y el coeficiente de determinacin.

Modelo de regresin lineal = + Y= 1,6861x + 901,25 Coeficiente de Correlacin r = 0,9538 Coeficiente de Determinacin. R = 0,9098 Coeficientes de regresin b = 1,6861 a = 901,247

Al interpretar la pendiente b = 1,686. significa que por cada incremento de una unidad en X, se estima que le valor promedio de Y aumenta 1686 dlares,

Coeficiente de Determinacin.

Medidas de variacin en la Regresin.


Suma de cuadrados total = Suma de cuadrados de regresin + Suma de cuadrados de error

SCT = SCR + SCE.


= 5826,928571

Tienda rea [pies2] venta [anual] valor estimado SCR SCE N X Y ( - )2 (Y - )2 1 1726 3681 3811,236 4063016,54 16961,4157 2 1642 3895 3669,612 4654014,79 50799,7505 3 2816 6653 5648,976 31667,1177 1008064,19 4 5555 9543 10266,93 19713612,7 524074,645 5 1292 3418 3079,512 7548297,82 114574,126 6 2208 5563 4623,888 1447306,62 881931,349 7 1313 3660 3114,918 7355001,34 297114,387 8 1102 2694 2759,172 9411130,38 4247,38958 9 3151 5468 6213,786 149658,67 556196,758 10 1516 2898 3457,176 5615727,25 312677,799 11 5161 10674 9602,646 14256042,1 1147799,39 12 4567 7585 8601,162 7696371,12 1032585,21 13 5841 11760 10749,126 24228027,5 1021866,24 14 3008 4085 5972,688 21245,811 3563365,99 106191120 10532258,6

SCR = 106.191.119,76
SCE = 10.532.258,64

SCT = 116.723.378,41

R2 = 0,90976736

ERROR ESTNDAR DE LA ESTIMACIN.


La recta de regresin no es un pronosticador perfecto, al igual que no se espera que todos los valores sean idnticos a su media aritmtica, tampoco puede pensarse que todos los datos estn justo sobre la recta de regresin. Por lo tanto se hace necesario desarrollar un estadstico que mida la variabilidad de los valores de Y pronosticados. La desviacin estndar alrededor de la recta de regresin la llamaremos error estndar de la estimacin. Representado por el smbolo SYX.

Calcule el error estndar de la estimacin para el ejemplo de eleccin de sitio. (en Excel)
Error tpico 936,8500077

Interpretacin del error estndar de la desviacin.


Representa una medida de variacin alrededor de la recta de regresin ajustada. Se mide en las unidades de la variable dependiente Y. la interpretacin del error estndar es similar al de la desviacin estndar, esta mide la variabilidad alrededor de la media aritmtica, el error estndar de la regresin mide la variabilidad alrededor de la recta de regresin ajustada. El error estndar de la desviacin se puede usar para determinar si existe una relacin estadsticamente significativa entre las dos variables y hacer inferencias acerca de los valores pronosticados de Y. El error estndar nos permite deducir la confiabilidad de la ecuacin de regresin que hemos desarrollado. El error estndar de la estimacin mide la variabilidad, o dispersin de los valores observados alrededor de la lnea de regresin.

Inferencias acerca de la pendiente.


El objeto de este apartado es hacer inferencias acerca de la relacin entre las variables de una poblacin con base en los datos de la muestra.

Prueba t para la pendiente.


Es posible determinar la existencia de relacin significativa entre las variables X e Y probando si 1 (La pendiente de la poblacin) es igual a cero. Si la hiptesis se rechaza, la conclusin es que existe evidencia de una relacin lineal. Las hiptesis nula y alternativa se establecen de la siguiente manera:

H0 : 1 = 0 No hay relacin lineal H1 : 1 0 Hay relacin lineal


Prueba de hiptesis para la pendiente de la poblacin 1 mediante la prueba t. El estadstico t es igual a la diferencia entre la pendiente de la muestra y la pendiente hipottica dividida entre el error estndar de la pendiente Sb1.

El estadstico de prueba sigue una distribucin t con n 2 grados de libertad. Con relacin al ejemplo de la seleccin del sitio, podemos probar si existe una relacin significativa entre el tamao de la tienda y las ventas anuales con un nivel de significancia = 0,05
Donde b1 = + 1,6861 n = 14 Sb1 = 0,1533 (error estndar de la pendiente) Por lo tanto, para probar la existencia de una relacin a un nivel de significancia de 0,05 se tiene:

Prueba de hiptesis sobre la pendiente de la poblacin con un nivel de significancia = 5% con 12 grados de libertad.

Consideraciones para la interpretacin del estadstico t. Si el valor t calculado > tn - 2 Entonces se rechaza H0 O si t calculado < - tn 2. No se rechaza H0
Conclusin: como t = 11 > t12 = 2,1788 entonces podemos decir que

existe una relacin lineal significativa entre la ventas anuales promedio y el tamao de la tienda.

Prueba de la existencia de Correlacin.


Recordemos que el coeficiente de correlacin r mide la fuerza de relacin entre dos variables. Podemos generar la hiptesis que es 0, por tanto las hiptesis nula y alternativa son:

H0: = 0 (NO hay correlacin) H1: 0 (Existe correlacin)


Aplicamos:

Para el ejemplo tenemos que t 10,64 si asumimos el nivel de significancia de = 0,05 se tiene que: t = 10,64 > 2.1788 entonces rechazamos la hiptesis nula, as concluimos que existe evidencia de una asociacin entre las ventas anuales y el tamao de la tienda.

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22

MAT GEOM X Y 5 4 4 3 5 2 5 4 3 1 3,5 3 3 3 4 4 4 3,5 3,5 2,5 3,5 3,5 5 4 4,5 4 4,5 3,5 4 4 3,8 4,5 3,8 3,5 4 3,5 2 1 2,5 2 3 2,5 4,5 3,8

Ejercicio 1. 1 construya l a recta de regresin 2 Si un estudiante obtiene una nota de 4,3 cunto se espera que obtenga en geometra. 3 Calcule el coeficiente de correlacin y determinacin e interprtelos. 4 Realice una prueba t y diga si existe una relacin lineal significativa. Utilice un nivel de significancia del 2% y 5%. 5 Verifique si existe evidencia o no de correlacin entre las variables. Utilice nivel de significancia de 2% y del 5%.

Ejercicio 2. A menudo se utiliza el tratamiento trmico para carburar partes metlicas como los engranes, el espesor de la capa carburada se considera una caracterstica importante del engrane y contribuye a la confiabilidad general de la parte. Debido a la naturaleza critica de esta caracterstica, se lleva a cabo una prueba de laboratorio en cada carga del horno. La prueba es destructiva, donde una parte real se corta en forma transversal y se remoja en un qumico durante cierto tiempo. Esta prueba implica correr un anlisis de carbn sobre una superficie del paso del engranaje (parte superior de los dientes del engrane) y la raz del engrane (entre los dientes). Los datos son los resultados del anlisis de carbn del paso de engrane para 19 partes. (ver la siguiente pgina)

N 1 2 3 4 5 6 7 8 9 10

Tiempo de Paso del remojo engrane N 0,58 0,013 11 0,66 0,016 12 0,66 0,015 13 0,66 0,016 14 0,66 0,015 15 0,66 0,016 16 1,00 0,014 17 1,17 0,021 18 1,17 0,018 19 1,17 0,019

Tiempo Paso del de engrane remojo 1,17 0,021 1,17 0,019 1,17 0,021 1,20 0,025 2,00 0,025 2,00 0,026 2,20 0,024 2,20 0,025 2,20 0,024

Ejercicio 2. 1 construya la recta de regresin 2 Si el tiempo de remojo es 1,18 en cunto se espera el paso del engrane. 3 Calcule el coeficiente de correlacin y determinacin e interprtelos. 4 Diga si existe una relacin lineal significativa. 5 Verifique si existe evidencia o no de correlacin entre las variables. Utilice nivel de significancia de 2% y del 5%.

You might also like