You are on page 1of 44

MODELACION POR EXCEL Y EL CRITERIO DE AKAIKE (AIC) EN R

JULIO JOSE DIAZ CORTEZ


SADAN FARAR TON MOSQUERA

INGENIERO AGRICOLA:
JUSTO FUENTES CUELO

UNIVERSIDAD DE SUCRE
FACULTAD DE INGENIERIA
PROGRAMA INGENERIA AGRICOLA
SINCELEJO-SUCRE
10/02/12

TALLER ESTADISTICA APLICADA


Ejercicio 1 de san Cayetano (Sc): Al estimar una funcin de demanda para
resistencia a la compresin (Rcomp), en cierta ciudad intermedia, se incluyeron
las siguientes variables:
Y: Rcomp, X1: tmax, X2: tmaxnom, X3: pea, X4: psss, X5: pen, X6: abs, X7: iapla,
X8: ialar, X9: pus, X10: puc, X11: vas, X12: vac, X13: trit, X14: desg.
Obtenemos la funcin de demanda para el Rcomp, mediante los siguientes
pasos los cuales se demostraran en la siguiente tabla.
X1

X2

X3

X4

X5

X6

X7

X8

X9

X10

X11

X12

X13

X14

5,00

3,81

1,93

1,97

2,02

2,15

25,30

24,83

1276,42

1489,81

33,86

22,81

26,10

28,23

233,20

3,81

3,81

2,46

2,55

2,71

3,70

13,32

22,42

1384,53

1585,09

43,72

35,57

25,61

28,78

253,85

3,81

3,81

2,57

2,61

2,69

1,79

33,37

28,46

1399,43

1598,87

45,55

37,79

22,98

27,98

340,09

3,81

2,54

2,50

2,56

2,65

2,25

20,42

39,91

1346,60

1527,92

46,14

38,88

27,54

29,16

340,32

3,81

2,54

2,50

2,56

2,65

2,33

20,43

34,90

1318,30

1541,89

47,27

38,32

25,71

27,96

417,03

3,81

3,81

2,51

2,57

2,65

2,12

23,36

38,13

1315,47

1522,45

47,59

39,34

24,57

28,58

414,62

3,81

3,81

2,50

2,55

2,64

2,26

17,08

20,18

1313,77

1530,94

47,45

38,76

27,19

27,77

343,82

3,81

3,81

2,69

2,75

2,86

2,24

15,70

22,28

1356,04

1554,34

49,59

42,22

28,29

27,47

292,65

3,81

3,81

2,61

2,63

2,68

1,01

23,11

26,64

1347,92

1532,64

48,36

41,28

28,26

27,40

429,47

3,81

3,81

2,57

2,59

2,63

0,94

20,01

23,99

1344,15

1617,36

49,70

37,07

27,37

28,27

216,74

3,81

3,81

2,52

2,57

2,65

1,98

24,19

21,37

1355,85

1579,62

46,20

37,32

28,53

27,43

267,69

3,81

3,81

2,52

2,59

2,71

2,81

22,40

22,85

1315,47

1523,02

47,80

39,56

25,71

28,55

357,51

3,81

3,81

2,52

2,59

2,71

2,75

23,26

32,57

1334,72

1549,62

47,04

38,51

23,58

28,08

279,22

3,81

3,81

2,53

2,59

2,69

2,39

20,22

35,44

1358,49

1582,83

46,30

37,44

28,61

26,15

497,09

3,81

3,81

2,54

2,59

2,68

2,01

30,09

19,69

1316,42

1553,96

48,17

38,82

29,01

29,81

442,73

3,81

2,54

1,91

1,97

2,03

3,17

24,65

42,54

1276,42

1489,81

46,22

37,70

26,10

31,75

158,96

3,81

2,54

2,45

2,41

2,59

2,12

13,32

22,42

1384,53

1585,10

43,49

35,30

25,61

27,40

253,85

3,81

2,54

2,58

2,61

2,67

1,41

33,37

28,46

1394,53

1598,87

45,95

38,03

22,98

29,76

434,70

3,81

3,81

2,50

2,55

2,64

2,25

20,42

39,91

1347,36

1517,17

46,11

39,31

27,54

27,56

243,25

3,81

3,81

2,33

2,40

2,50

2,96

20,43

34,90

1341,70

1554,70

45,90

38,52

25,71

27,93

317,92

3,81

3,81

2,54

2,57

2,57

2,25

23,36

38,13

1315,47

1522,45

47,59

39,34

26,76

27,68

662,38

3,81

3,81

2,53

2,59

2,68

2,26

17,08

20,18

1313,77

1530,94

48,07

39,49

28,36

27,47

241,89

3,81

3,81

2,69

2,75

2,86

2,24

15,70

22,28

1356,10

1554,30

48,63

41,12

27,41

28,63

204,31

3,81

3,81

2,64

2,71

2,73

1,01

23,11

26,64

1347,92

1532,64

48,55

41,50

27,60

28,61

409,48

3,81

3,81

2,62

2,67

2,76

1,96

20,01

23,99

1344,15

1617,36

47,49

36,82

27,15

27,14

297,92

3,81

3,81

2,52

2,57

2,66

1,98

24,19

21,37

1355,85

1579,62

46,20

37,32

29,76

29,97

209,82

3,81

3,81

2,51

2,59

2,71

2,83

22,40

22,85

1315,47

1523,02

47,59

39,32

27,22

28,85

328,00

3,81

2,54

2,50

2,57

2,59

2,76

23,26

32,57

1334,72

1549,62

46,61

38,02

28,25

26,40

244,59

3,81

2,54

2,51

2,58

2,68

2,51

20,22

35,44

1358,49

1582,83

46,30

37,44

27,10

29,72

354,69

3,81

2,54

2,54

2,58

2,66

1,86

28,04

20,32

1316,42

1553,96

48,17

38,32

28,54

26,44

287,71

Regresin 1

Luego de haber observado el resultado de la regresin en donde se incluyen todos


los coeficientes de nuestra funcin de demanda para Resistencia a la
compresin (Rcomp). Si este fuera el modelo definitivo, nuestra funcin
quedara de la siguiente manera:

Pero nos falta determinar si los coeficientes de las variables X1, X2, X3, X4, X5,
X6, X7, X8, X9, X10, X11, X12, X13 y X14, son significativamente diferentes de
cero. Esto nos lo indica el valor de la probabilidad que se encuentra ms a la
derecha del resultado.
Si el valor de la probabilidad es menor que 0.05, significa que ese coeficiente es
significativamente diferente de cero, lo que se puede interpretar como que la
variable X correspondiente si est explicando la variabilidad de la variable Y.

El procedimiento continua ordenando los valores de las probabilidades de los


coeficientes obtenidos y la mayor probabilidad de todas las que sean mayores que
0.05, nos indicar que esa variable X no est explicando a Y, luego debemos
retirarla. Para nuestro caso los valores ordenados de las probabilidades de los
coeficientes quedaran como se muestra:
Variables

Coeficientes

Error tpico

Estadstico t

Probabilidad

X1

-143,781006

364,335583

-0,39463893

0,69866381

X6

30,4663835

74,7791423

0,4074182

0,68945596

X13

-5,85354928

13,5451969

-0,43214944

0,67178072

X4

-822,02496

1408,09812

-0,58378386

0,56804129

X14

12,8667588

20,4649297

0,62872236

0,53898778

X7

3,723717

5,34296551

0,69693824

0,49650143

X2

30,8422886

37,794689

0,81604822

0,42724215

X5

-834,605305

847,743051

-0,98450268

0,34048301

X10

2,82588267

2,69160149

1,04988895

0,31039093

X12

59,4143752

52,6293276

1,12892142

0,276663

X11

-96,6920965

62,4637644

-1,54797101

0,14246577

X8

5,93092735

3,79060896

1,56463708

0,13851686

X9

-5,27439913

3,14930468

-1,67478211

0,11469326

X3

2474,57148

1434,90907

1,72454934

0,10514784

Intercepcin

3287,60895

4256,35993

0,77239919

0,45187726

Como puede observar los coeficientes de X1, X6, X13, X4, X14, X7, X2, X5, X10,
X12, X11, X8, X9, Y X3, tienen probabilidades mayores que 0.05, lo que indica
que su aporte a la variabilidad de Y no es significativo y el coeficiente con la mayor
probabilidad es el de X1 (0,69866381), lo que nos indica que debemos eliminar la
variable X1 y proceder a efectuar una nueva regresin lineal mltiple. Teniendo en
cuenta que al eliminar una variable el comportamiento de las que quedan puede
variar significativamente.
Eliminamos la columna de la variable X1 y realicemos una nueva regresin lineal
mltiple con lo cual obtenemos el siguiente resultado:

Regresin 2

Variables

Coeficientes

Error tpico

Estadstico t

Probabilidad

X13

-4,95123122

12,9938161

-0,3810452

0,70818183

X14

13,1185789

19,9079995

0,65896018

0,51929304

X6

45,4461057

62,7062087

0,72474651

0,47907309

X2

28,2198027

36,2109869

0,77931604

0,44716805

X7

4,16114579

5,08696021

0,81800242

0,42537082

X4

-1075,86862

1219,10019

-0,88251042

0,3905674

X5

-791,824047

818,300111

-0,96764504

0,34762195

X10

3,04775055

2,56184422

1,18967052

0,25153081

X12

64,5051457

49,6595105

1,29894848

0,21236986

X11

-91,3696744

59,3594669

-1,53926036

0,14328228

X9

-5,13060123

3,04450523

-1,68520033

0,11135099

X8

6,30564441

3,57162713

1,76548228

0,09655625

X3

2662,83349

1317,10023

2,02173945

0,06025629

Intercepcin

1743,9464

1633,25736

1,06777195

0,30146992

La tabla anterior nos indica que el mayor valor de la probabilidad que es mayor
que 0.05 es la probabilidad del coeficiente de X13, lo que nos indica que debemos
eliminar la variable X13y realizar otra regresin lineal mltiple, la cual se muestra a
continuacin:
Regresin 3:

Variables

Coeficientes

Error tpico

Estadstico t

Probabilidad

X14

13,791704

19,3245005

0,71369007

0,48510263

X6

48,9295938

60,4564421

0,80933631

0,42950459

X2

30,0586852

34,9740623

0,8594565

0,40204613

X5

-723,369643

778,006493

-0,92977327

0,36550404

X4

-1207,81195

1139,12386

-1,06029905

0,30384128

X7

4,91804937

4,56384241

1,07761157

0,29626163

X10

2,92679903

2,47736739

1,18141501

0,25370204

X12

61,9616805

47,9557276

1,29206007

0,21362536

X11

-89,0214676

57,5352573

-1,54725071

0,14021607

X9

-4,9397901

2,92656674

-1,68791302

0,10968695

X8

6,76231444

3,27887

2,06239175

0,05479495

X3

2729,5189

1272,17837

2,14554734

0,04664373

Intercepcin

1457,4411

1412,96948

1,03147387

0,31677095

La tabla anterior nos indica que el mayor valor de la probabilidad que es mayor
que 0.05 es la probabilidad del coeficiente de X14, lo que nos indica que debemos

eliminar la variable X14 y realizar otra regresin lineal mltiple, la cual se muestra
a continuacin:
Regresin 4:

Variables

Coeficientes

Error tpico

Estadstico t

Probabilidad

X6

39,583232

58,21106

0,67999504

0,50516

X5

-577,119434

740,234332

-0,77964424

0,44573115

X2

27,6708969

34,3359103

0,80588797

0,43082598

X4

-1083,21896

1110,21933

-0,97568015

0,34215417

X10

2,62202054

2,40679439

1,0894244

0,29033762

X12

57,8595948

46,9566732

1,2321911

0,2337315

X7

5,74813701

4,3525851

1,32062599

0,20317196

X11

-80,5410934

55,5223332

-1,45060715

0,16409293

X9

-4,44609786

2,80461466

-1,5852794

0,13031396

X8

6,57240702

3,2232067

2,03908952

0,05640162

X3

2347,27831

1138,10876

2,06243762

0,05390199

Intercepcin

1687,10155

1356,95771

1,24329707

0,22970932

La tabla anterior nos indica que el mayor valor de la probabilidad que es mayor
que 0.05 es la probabilidad del coeficiente de X6, lo que nos indica que debemos

eliminar la variable X6 y realizar otra regresin lineal mltiple, la cual se muestra a


continuacin:
Regresin 5:

Variables

Coeficientes

Error tpico

Estadstico t

Probabilidad

X5

-307,641802

616,309828

-0,49916745

0,62339188

X2

24,022818

33,430955

0,71858007

0,48114398

X4

-897,095187

1060,6185

-0,84582269

0,40817808

X7

4,866991

4,09601367

1,18822626

0,24938534

X10

3,1086657

2,26518834

1,37236522

0,18593511

X12

67,8001435

43,9873265

1,54135632

0,13972067

X11

-91,9865666

52,1556649

-1,76369272

0,09385815

X9

-5,02178771

2,63568432

-1,90530697

0,07198782

X3

1845,38023

853,977562

2,16092356

0,04367959

X8

7,02085229

3,1100627

2,25746327

0,03594347

Intercepcin

2033,58289

1239,73934

1,64033101

0,11738747

La tabla anterior nos indica que el mayor valor de la probabilidad que es mayor
que 0.05 es la probabilidad del coeficiente de X5, lo que nos indica que debemos

eliminar la variable X5 y realizar otra regresin lineal mltiple, la cual se muestra a


continuacin:
Regresin 6:

Variables

Coeficientes

Error tpico

Estadstico t

Probabilidad

X2

26,1525597

32,5292301

0,80397106

0,43086658

X10

2,80828129

2,14240895

1,31080543

0,20477631

X12

60,9722013

41,0142014

1,48661194

0,15271268

X4

-1241,73186

789,868481

-1,5720742

0,13162004

X11

-84,2273278

48,8419508

-1,72448738

0,10004242

X7

5,96783708

3,38621279

1,76239281

0,09328012

X9

-4,84215746

2,56152285

-1,89034326

0,07329179

X3

1899,37006

831,047581

2,28551301

0,03333225

X8

7,60639191

2,82577805

2,69178675

0,01402774

Intercepcin

2042,72659

1216,11307

1,67971765

0,10856696

La tabla anterior nos indica que el mayor valor de la probabilidad que es mayor
que 0.05 es la probabilidad del coeficiente de X2, lo que nos indica que debemos

eliminar la variable X2 y realizar otra regresin lineal mltiple, la cual se muestra a


continuacin:
Regresin 7:

Variables

Coeficientes

Error tpico

Estadstico t

Probabilidad

X10

2,72338753

2,12171201

1,2835802

0,21327246

X4

-1093,93683

761,683195

-1,43620975

0,16567327

X12

60,1065883

40,65339

1,47851356

0,15411406

X7

5,8106817

3,35198163

1,73350643

0,0976653

X11

-84,4388953

48,4282637

-1,74358709

0,09585452

X9

-4,86929783

2,53964326

-1,91731567

0,06890245

X3

1786,45232

812,167465

2,19961079

0,03917144

X8

6,99445102

2,69832674

2,59214383

0,01700595

Intercepcin

2270,54503

1172,63893

1,93626952

0,06640896

La tabla anterior nos indica que el mayor valor de la probabilidad que es mayor
que 0.05 es la probabilidad del coeficiente de X10, lo que nos indica que debemos
eliminar la variable X10 y realizar otra regresin lineal mltiple, la cual se muestra
a continuacin:

Regresin 8:

Variables

Coeficientes

Error tpico

Estadstico t

Probabilidad

X12

11,807448

15,6130614

0,75625451

0,45751891

X4

-830,37061

744,200424

-1,11578895

0,27655224

X11

-27,0746189

18,9280183

-1,43039902

0,16665301

X7

6,07511304

3,39452802

1,78967827

0,08728175

X3

1462,16603

783,150843

1,86702989

0,07528071

X9

-1,7749424

0,81055023

-2,18979938

0,03943206

X8

6,6106249

2,72088874

2,42958295

0,02373348

Intercepcin

1662,04487

1088,21206

1,52731709

0,14093257

La tabla anterior nos indica que el mayor valor de la probabilidad que es mayor
que 0.05 es la probabilidad del coeficiente de X12, lo que nos indica que debemos
eliminar la variable X12 y realizar otra regresin lineal mltiple, la cual se muestra
a continuacin:

Regresin 9:

Variables

Coeficientes

Error tpico

Estadstico t

Probabilidad

X4

-710,213409

720,244239

-0,98607302

0,3343577

X11

-14,8090749

9,66685083

-1,53194408

0,13917656

X7

5,8324785

3,34773589

1,74221584

0,09482932

X3

1348,48713

761,40325

1,77105513

0,08980445

X9

-1,6055851

0,77171689

-2,08053644

0,04880318

X8

7,29400921

2,54245401

2,86888541

0,00867588

Intercepcin

1276,65824

952,526658

1,3402861

0,19324299

La tabla anterior nos indica que el mayor valor de la probabilidad que es mayor
que 0.05 es la probabilidad del coeficiente de X4, lo que nos indica que debemos
eliminar la variable X4 y realizar otra regresin lineal mltiple, la cual se muestra a
continuacin:

Regresin 10:

Variables

Coeficientes

Error tpico

Estadstico t

Probabilidad

X11

-15,3180632

9,64749576

-1,5877761

0,12542562

X7

6,03527196

3,33948691

1,80724528

0,08327689

X9

-1,43868944

0,7524939

-1,91189515

0,06790003

X8

6,86605294

2,5036939

2,74236916

0,0113458

X3

623,382121

197,372684

3,15840119

0,00424685

Intercepcin

1084,8505

931,916408

1,16410709

0,25582288

La tabla anterior nos indica que el mayor valor de la probabilidad que es mayor
que 0.05 es la probabilidad del coeficiente de X11, lo que nos indica que debemos
eliminar la variable X11 y realizar otra regresin lineal mltiple, la cual se muestra
a continuacin:

Regresin 11:

Variables

Coeficientes

Error tpico

Estadstico t

Probabilidad

X9

-0,86172231

0,67868915

-1,26968629

0,21588845

X7

6,1214302

3,43912227

1,77993968

0,08724557

X8

5,6181331

2,44837868

2,29463405

0,03042497

X3

375,034317

123,987142

3,02478395

0,00568867

Intercepcin

251,173421

792,998213

0,31673895

0,7540715

La tabla anterior nos indica que el mayor valor de la probabilidad que es mayor
que 0.05 es la probabilidad del coeficiente de X9, lo que nos indica que debemos
eliminar la variable X9 y realizar otra regresin lineal mltiple, la cual se muestra a
continuacin:

Regresin 12:

Variables

Coeficientes

Error tpico

Estadstico t

Probabilidad

X7

6,08670358

3,4792594

1,74942506

0,09201435

X8

5,4512847

2,47346109

2,20390962

0,03658665

X3

288,010008

104,529402

2,7553014

0,01056755

Intercepcin

-680,580154

304,044769

-2,23842086

0,03397372

La tabla anterior nos indica que el mayor valor de la probabilidad que es mayor
que 0.05 es la probabilidad del coeficiente de X7, lo que nos indica que debemos
eliminar la variable X7 y realizar otra regresin lineal mltiple, la cual se muestra a
continuacin:

Regresin 13:

Variables

Coeficientes

Error tpico

Estadstico t

Probabilidad

x3

273,088913

108,08302

2,5266588

0,0176835

x8

5,75924683

2,55959923

2,25005805

0,03279811

Intercepcin

-517,761297

300,291394

-1,72419625

0,09610563

Observamos que todas las probabilidades de las tres variables X7, X8, y X3 todas
son menores que 0.05, lo que indica que nuestro modelo definitivo quedara de la
siguiente manera:

Algunos detalles adicionales del reporte de Excel nos permiten observar adems
que nuestro modelo definitivo es bueno por el valor del Valor crtico de F el cual
es de 0.022350389, que es mucho menor que 0.05.
Otro valor que se puede interpretar es el valor de R que es igual a 0.18948873, a
partir del cual puede decirse que aproximadamente el 18.95% de la variacin en Y
es debida a las variables X3, y X8.

San Cayetano (Sc) por R:


Cargamos el archivo en R, seleccione todo el conjunto de datos y envelas a R con
la siguiente orden:
d=read.delim("clipboard")
attach(d)
Invocamos la librera MASS (que contiene la funcin stepAIC()) con la siguiente
orden:
library(MASS)
Genere una regresin lineal mltiple con la variable Y, en funcin de todas las
dems variables X, con la siguiente orden:
r1=lm(y~.,data=d)
Puede observar todos los detalles de la modelacin con la siguiente orden:
summary(r1)

En el listado anterior, observamos que los valores de las probabilidades de cada


uno de los coeficientes estimados, aquellos valores mayores de 0.05 significan
que deben salir del modelo. Puede seguir el procedimiento indicado en el taller de
regresin lineal mltiple.
Pero puede realizar la modelacin con eliminacin hacia atrs, utilizando la
funcin stepAIC(), con la siguiente orden:
r2=stepAIC(r1,k=log(length(d)))
Importante usar k=log(length(d) este nos brinda una salida detallada de todos los
pasos del proceso de modelacin. Observe que se incluye dentro del parntesis el
valor de la matriz d. El resultado es el siguiente:

Como puede apreciar las variables que selecciona el mtodo de eliminacin hacia
atrs no son las mismas que obtuvimos con el procedimiento manual utilizando
Excel. Con esta observacin procedemos a realizar una regresin lineal mltiple
en R utilizando solamente las variables X11, X7, X9, X8 y X3, la cual la podemos
realizar de la siguiente manera:
r1=lm(y~x11+x7+x9+x8+x3,data=d)
summary(r1)

Y = 1084.8505 + X11*-15.3181 + X7*6.0353 X9*-1.4387 + x8*6.8661 +


x3*623.3821
Algunos detalles adicionales del reporte de R nos permiten observar adems que
nuestro modelo definitivo es bueno por el valor del P-value el cual es de 0.01498,
que es mucho menor que 0.05.
Otro valor que se puede interpretar es el valor de R que es igual a 0.426, a partir
del cual puede decirse que aproximadamente el 42.6% de la variacin en Y es
debida a las variables X11, X7, X9, X8 y X3.
El procedimiento en Excel report solamente las variables X3 y X8

Mientras que el procedimiento en R:


Y = 1084.8505 + X11*-15.3181 + X7*6.0353 X9*-1.4387 + X8*6.8661 +
X3*623.3821

Slo nos restara averiguar si existe alguna diferencia significativa entre los dos
modelos, lo cual lo podemos averiguar con la funcin anova() de R. Llamemos a r1
al primer modelo de tres variables X11, X7, X9, X8 y X3, luego llamemos r2 al
segundo modelo de dos variables X11 y X3. Finalmente verificaremos si hay
diferencias entre ellos aplicando la funcin anova() a los dos modelos r1 y r2. El
procedimiento en R es el siguiente:

r1=lm(y~x11+x7+x9+x8+x3,data=d)
r2=lm(y~x11+x3,data=d)
anova(r1,r2)
El resultado se muestra a continuacin:

El resultado de la funcin anova() de R, que realmente es un anlisis de la


varianza de los dos modelos, nos reporta un valor de la probabilidad igual a
0.01234. Como este valor es menor que 0.05 podemos concluir que los dos
modelos tienen diferencias significativas, es decir, cualquiera de los dos modelos
que se utilicen dar resultados estadsticamente significativas. El planteamiento de
las hiptesis sera:
Ho:
Ha:

r1 = r2
r1 r2

Como el valor de la probabilidad Pr(>F) fue de 0.01234 y este valor es menor que
0.05, podemos rechazar la hiptesis nula con lo que concluimos que los dos
modelos r1 y r2 son diferentes.

Ejercicio 2 de Tol viejo (Tv): Al estimar una funcin de demanda para


resistencia a la compresin (Rcomp), en cierta ciudad intermedia, se incluyeron
las siguientes variables:
Y: Rcomp, X1: tmax, X2: tmaxnom, X3: pea, X4: psss, X5: pen, X6: abs, X7: iapla,
X8: ialar, X9: pus, X10: puc, X11: vas, X12: vac, X13: trit, X14: desg.
Obtenemos la funcin de demanda para el Rcomp, mediante los siguientes
pasos los cuales se demostraran en la siguiente tabla.
x1

x2

x3

x4

x5

x6

x7

x8

x9

x10

x11

x12

x13

x14

1,50 2,54 1,93 1,97 2,02 2,15 25,30 24,83 1276,42 1489,81 22,81 22,81 26,10 28,23 262,71
1,50 2,54 2,46 2,55 2,71 3,70 13,32 22,42 1384,53 1585,09 35,57 35,57 25,61 28,78 282,41
1,50 2,54 2,57 2,61 2,69 1,79 33,37 28,46 1399,43 1598,87 37,79 37,79 22,98 27,98 330,57
1,50 2,54 2,50 2,56 2,65 2,25 20,42 39,91 1346,60 1527,92 38,88 38,88 27,54 29,16 351,00
1,50 3,81 2,50 2,56 2,65 2,33 20,43 34,90 1318,30 1541,89 38,32 38,32 25,71 27,96 420,99
1,50 3,81 2,51 2,57 2,65 2,12 23,36 38,13 1315,47 1522,45 39,34 39,34 24,57 28,58 502,30
1,50 3,81 2,50 2,55 2,64 2,26 17,08 20,18 1313,77 1530,94 38,76 38,76 27,19 27,77 394,37
1,50 3,81 2,69 2,75 2,86 2,24 15,70 22,28 1356,04 1554,34 42,22 42,22 28,29 27,47 303,44
1,50 3,81 2,61 2,63 2,68 1,01 23,11 26,64 1347,92 1532,64 41,28 41,28 28,26 27,40 387,50
1,50 3,81 2,57 2,59 2,63 0,94 20,01 23,99 1344,15 1617,36 37,07 37,07 27,37 28,27 270,05
1,50 3,81 2,52 2,57 2,65 1,98 24,19 21,37 1355,85 1579,62 37,32 37,32 28,53 27,43 302,08
1,50 2,54 2,52 2,59 2,71 2,81 22,40 22,85 1315,47 1523,02 39,56 39,56 25,71 28,55 354,69
1,50 2,54 2,52 2,59 2,71 2,75 23,26 32,57 1334,72 1549,62 38,51 38,51 23,58 28,08 302,37
1,50 2,54 2,53 2,59 2,69 2,39 20,22 35,44 1358,49 1582,83 37,44 37,44 28,61 26,15 462,82
1,50 2,54 2,54 2,59 2,68 2,01 30,09 19,69 1316,42 1553,96 38,82 38,82 29,01 29,81 278,45
5,08 3,81 2,59 2,67 2,79 2,76 28,53 29,20 1336,98 1548,87 44,29 38,35 26,42 29,67 669,52
3,81 3,81 2,51 2,56 2,65 2,06 22,42 19,70 1341,89 1530,94 46,54 39,01 25,72 28,45 421,67
3,81 3,81 2,44 2,50 2,60 2,51 28,46 18,37 1336,23 1531,32 46,54 37,24 23,01 28,13 215,68
3,81 2,54 2,47 2,52 2,60 1,93 39,91 25,37 1366,42 1579,81 44,68 36,04 26,84 29,16 320,29
3,81 2,54 2,44 2,47 2,52 1,37 34,90 22,04 1365,47 1558,87 44,04 36,11 26,65 28,13 255,15
3,81 3,81 2,54 2,59 2,67 1,89 38,13 28,93 1364,53 1517,74 46,28 40,25 24,57 28,58 568,25
3,81 3,81 2,55 2,60 2,67 1,81 20,18 25,42 1356,04 1555,28 46,82 39,01 27,43 27,77 359,03
3,81 2,54 2,53 2,57 2,64 1,60 22,28 27,96 1351,32 1452,45 46,59 42,59 27,98 27,47 379,78
3,81 3,81 2,44 2,51 2,61 2,59 26,64 23,47 1344,15 1498,11 44,91 38,60 28,26 27,40 210,04
3,81 3,81 2,50 2,56 2,60 2,59 23,99 24,01 1315,47 1508,11 46,96 39,19 27,37 28,27 193,32
3,81 3,81 2,46 2,53 2,65 2,90 21,37 27,56 1356,23 1504,34 44,42 38,35 28,53 27,43 327,67
3,81 3,81 2,42 2,48 2,58 2,56 22,85 26,13 1333,40 1521,51 44,90 37,13 25,71 28,55 317,82
3,81 3,81 2,51 2,56 2,65 2,11 32,57 26,70 1356,04 1502,64 45,97 40,13 23,58 28,08 162,67
3,81 3,81 2,38 2,44 2,53 2,49 35,44 29,08 1338,87 1485,47 45,13 39,12 28,61 26,15 404,78
3,81 3,81 2,40 2,47 2,56 2,58 19,69 24,51 1435,85 1559,43 40,17 35,02 29,01 29,81 261,70

Regresin 1:

Luego de haber observado el resultado de la regresin en donde se incluyen todos


los coeficientes de nuestra funcin de demanda para Resistencia a la
compresin (Rcomp). Si este fuera el modelo definitivo, nuestra funcin
quedara de la siguiente manera:
Y = 783.493529 + x1*102.3715017 + x2*25.5789293 + x3*-671.887951 + x4*1172.10603 + x5*2217.481569 + x6*-112.146043 +
x7*1.807528918 +
x8*8.699090676 + x9*-1.46328161 + x10*0.362831829 + x11*-27.9621945 +
x12*15.30868059 + x13*2.676998888 + x14*-3.36748835
Pero nos falta determinar si los coeficientes de las variables X1, X2, X3, X4, X5,
X6, X7, X8, X9, X10, X11, X12, X13 y X14, son significativamente diferentes de
cero. Esto nos lo indica el valor de la probabilidad que se encuentra ms a la
derecha del resultado.
Si el valor de la probabilidad es menor que 0.05, significa que ese coeficiente es
significativamente diferente de cero, lo que se puede interpretar como que la
variable X correspondiente si est explicando la variabilidad de la variable Y.

El procedimiento continua ordenando los valores de las probabilidades de los


coeficientes obtenidos y la mayor probabilidad de todas las que sean mayores que
0.05, nos indicar que esa variable X no est explicando a Y, luego debemos
retirarla. Para nuestro caso los valores ordenados de las probabilidades de los
coeficientes quedaran como se muestra:

Variables

Coeficientes

Error tpico

Estadstico t

Probabilidad

x3

-671,887951

7535,68755

-0,0891608

0,93013369

x14

-3,36748835

27,9960441

-0,12028444

0,90585419

x4

-1172,10603

8053,91447

-0,14553247

0,88622812

x10

0,36283183

2,12007142

0,17114132

0,86639993

x13

2,67699889

13,7431513

0,19478785

0,84817277

x12

15,3086806

56,413948

0,2713634

0,78981055

x7

1,80752892

4,28351686

0,42197311

0,67903021

x6

-112,146043

192,434902

-0,58277393

0,56870363

x2

25,5789293

40,033937

0,63893115

0,53250363

x5

2217,48157

1781,38051

1,24481072

0,23229942

x11

-27,9621945

22,0654403

-1,26723936

0,2243913

x1

102,371502

71,6497028

1,42877776

0,17356107

x9

-1,46328161

0,97554552

-1,49996242

0,1543763

x8

8,69909068

5,04912171

1,72289186

0,10545423

Intercepcin

783,493529

1967,46712

0,39822446

0,69607531

Como puede observar los coeficientes de X3, X14, X4, X10, X13, X12, X7, X6, X2,
X5, X11, X1, X9, Y X8, tienen probabilidades mayores que 0.05, lo que indica que
su aporte a la variabilidad de Y no es significativo y el coeficiente con la mayor
probabilidad es el de X3 (0,93013369), lo que nos indica que debemos eliminar la
variable X3 y proceder a efectuar una nueva regresin lineal mltiple. Teniendo en
cuenta que al eliminar una variable el comportamiento de las que quedan puede
variar significativamente.
Eliminamos la columna de la variable X3 y realicemos una nueva regresin lineal
mltiple con lo cual obtenemos el siguiente resultado:

Regresin 2

Variables

Coeficientes

Error tpico

Estadstico t

Probabilidad

x14

-2,33992911

24,7102478

-0,09469468

0,92573313

x10

0,33863603

2,03640372

0,1662912

0,87001104

x13

3,19720907

12,0512453

0,26530114

0,79416528

x12

14,4879618

53,904817

0,26876933

0,79154198

x7

1,86621964

4,09931883

0,45525116

0,65504542

x2

26,6155036

37,1020435

0,7173595

0,48349469

x4

-1866,46536

1988,84309

-0,93846788

0,361956

x6

-96,5214115

77,0051995

-1,25344019

0,22805289

x11

-27,8400362

21,3291956

-1,30525486

0,21026545

x5

2268,86946

1632,47574

1,38983349

0,18361566

x1

102,613527

69,3430895

1,47979456

0,15834826

x9

-1,46056049

0,94435569

-1,54662116

0,14150386

x8

8,97105752

3,89686225

2,30212334

0,03509866

Intercepcin

711,887721

1739,51855

0,40924411

0,68778659

La tabla anterior nos indica que el mayor valor de la probabilidad que es mayor
que 0.05 es la probabilidad del coeficiente de X14, lo que nos indica que debemos
eliminar la variable X14 y realizar otra regresin lineal mltiple, la cual se muestra
a continuacin:

Regresin 3:

Variables

Coeficientes

Error tpico

Estadstico t

Probabilidad

x10

0,36715982

1,9544172

0,18786154

0,8532093

x13

3,39288386

11,5215034

0,29448274

0,77195467

x12

15,4239854

51,423014

0,29994324

0,76785705

x7

1,8477782

3,9735461

0,46501995

0,64781815

x2

27,1916143

35,5170061

0,76559421

0,45441672

x4

-1912,78339

1870,72337

-1,02248329

0,32088317

x6

-96,8794976

74,6367924

-1,29801261

0,21161852

x11

-27,7198287

20,6614665

-1,34161961

0,19736716

x5

2285,41355

1575,07946

1,45098302

0,16498735

x1

102,003495

67,0005098

1,52242864

0,14628572

x9

-1,46338601

0,91595872

-1,59765499

0,12853956

x8

9,0220186

3,74533627

2,40886744

0,02762623

Intercepcin

634,081191

1487,87173

0,42616657

0,67533362

La tabla anterior nos indica que el mayor valor de la probabilidad que es mayor
que 0.05 es la probabilidad del coeficiente de X10, lo que nos indica que debemos
eliminar la variable X10 y realizar otra regresin lineal mltiple, la cual se muestra
a continuacin:

Regresin 4:

Variables

Coeficientes

Error tpico

Estadstico t

Probabilidad

x12

6,65574881

20,9976713

0,31697557

0,7549091

x13

3,89697643

10,9002878

0,35751133

0,72486663

x7

2,10073282

3,63689107

0,57761775

0,57067776

x2

28,2986374

34,0732515

0,83052354

0,41712322

x4

-1759,39787

1637,41599

-1,07449658

0,29679343

x6

-101,235552

69,016263

-1,46683618

0,15967499

x5

2313,0575

1525,58849

1,51617394

0,14684056

x11

-25,3279179

15,830144

-1,59998026

0,12700758

x9

-1,35985555

0,7117455

-1,91059242

0,07211915

x1

92,9162358

45,1001198

2,06022149

0,05413487

x8

9,02055141

3,64358085

2,47573796

0,02346017

Intercepcin

841,508289

970,211939

0,86734481

0,39716891

La tabla anterior nos indica que el mayor valor de la probabilidad que es mayor
que 0.05 es la probabilidad del coeficiente de X12, lo que nos indica que debemos
eliminar la variable X12 y realizar otra regresin lineal mltiple, la cual se muestra
a continuacin:

Regresin 5:

Variables

Coeficientes

Error tpico

Estadstico t

Probabilidad

x13

4,96200576

10,121075

0,4902647

0,62956019

x7

2,06897763

3,54840866

0,58307197

0,56670185

x2

29,1574488

33,1515917

0,87951882

0,39010862

x4

-1822,74701

1586,23642

-1,14910172

0,26477457

x6

-106,414997

65,4474941

-1,62595984

0,12043005

x5

2438,77207

1437,83945

1,69613657

0,10618386

x9

-1,41507411

0,67356355

-2,10087692

0,04922882

x11

-21,3310655

9,3413843

-2,28350155

0,03408427

x1

83,9854509

34,3725986

2,44338381

0,02448556

x8

9,49577716

3,24126963

2,92964741

0,00859914

Intercepcin

826,162596

945,787185

0,87351849

0,39328732

La tabla anterior nos indica que el mayor valor de la probabilidad que es mayor
que 0.05 es la probabilidad del coeficiente de X13, lo que nos indica que debemos
eliminar la variable X13 y realizar otra regresin lineal mltiple, la cual se muestra
a continuacin:

Regresin 6:

Variables

Coeficientes

Error tpico

Estadstico t

Probabilidad

x7

1,47667252

3,27243282

0,45124609

0,65666691

x2

28,0185986

32,4359935

0,86381194

0,39793277

x4

-1696,53917

1535,19561

-1,10509642

0,28223535

x6

-106,303384

64,1921599

-1,65601819

0,11332484

x5

2324,8396

1391,7274

1,67047053

0,1104028

x9

-1,38904259

0,65859219

-2,10910881

0,04773906

x11

-21,6641234

9,13800391

-2,37077196

0,02791093

x1

86,3133519

33,390285

2,58498398

0,01769181

x8

9,34288768

3,16437023

2,95252673

0,00787231

Intercepcin

931,948152

903,188034

1,03184289

0,31446289

La tabla anterior nos indica que el mayor valor de la probabilidad que es mayor
que 0.05 es la probabilidad del coeficiente de X7, lo que nos indica que debemos
eliminar la variable X7 y realizar otra regresin lineal mltiple, la cual se muestra a
continuacin:

Regresin 7:

Variables

Coeficientes

Error tpico

Estadstico t

Probabilidad

x2

23,2148656

30,0527327

0,77247104

0,44844269

x4

-1779,01007

1495,09628

-1,18989666

0,24736608

x5

2385,44751

1358,71144

1,75566896

0,09372229

x6

-114,523938

60,3744802

-1,89689315

0,07168111

x9

-1,40218052

0,64535216

-2,172737

0,04139249

x11

-21,1531939

8,89398942

-2,37836959

0,02695964

x1

89,5307785

31,9956305

2,79821891

0,01077258

x8

9,48197117

3,08903096

3,06956171

0,00581648

Intercepcin

1037,58233

855,62329

1,21266256

0,23872499

La tabla anterior nos indica que el mayor valor de la probabilidad que es mayor
que 0.05 es la probabilidad del coeficiente de X2, lo que nos indica que debemos
eliminar la variable X2 y realizar otra regresin lineal mltiple, la cual se muestra a
continuacin:

Regresin 8:

Variables
x4
x5
x6
x9
x11

Coeficientes

Error tpico

Estadstico t

Probabilidad

-1518,64975
2168,73834
-107,485701
-1,47842034
-21,0136309

1443,19693
1317,19223
59,1334454
0,63188801
8,81027485

-1,05228172
1,64648583
-1,81768034
-2,33968727
-2,38512774

0,30409163
0,11387573
0,08275866
0,02878042
0,02611708

x1
x8

93,0761626
9,18591228

31,3731632
3,03693856

2,96674461
3,02472773

0,00712211
0,00622693

Intercepcin

1102,7763

843,610579

1,30721014

0,20463972

La tabla anterior nos indica que el mayor valor de la probabilidad que es mayor
que 0.05 es la probabilidad del coeficiente de X4, lo que nos indica que debemos
eliminar la variable X4 y realizar otra regresin lineal mltiple, la cual se muestra a
continuacin:

Regresin 9:

Variables

Coeficientes

Error tpico

Estadstico t

Probabilidad

x6

-55,0361447

31,8919775

-1,72570499

0,09781282

x9

-1,39770154

0,62867601

-2,22324618

0,0363066

x11

-23,4403026

8,52291752

-2,75026744

0,01139719

x8

8,86194412

3,02833196

2,92634501

0,00759178

x1

97,109221

31,2107214

3,11140584

0,00491293

x5

803,662013

228,848135

3,51176999

0,00187352

Intercepcin

705,566211

756,205475

0,93303505

0,3604941

La tabla anterior nos indica que el mayor valor de la probabilidad que es mayor
que 0.05 es la probabilidad del coeficiente de X6, lo que nos indica que debemos
eliminar la variable X6 y realizar otra regresin lineal mltiple, la cual se muestra a
continuacin:

Regresin 10:

Variables

Coeficientes

Error tpico

Estadstico t

Probabilidad

x9

-1,19280444

0,6422998

-1,85708364

0,07561396

x11

-17,1383753

8,01201036

-2,13908551

0,04280717

x1

73,8743301

29,2946096

2,52177213

0,01872276

x8

8,80620636

3,15047832

2,79519663

0,01004054

x5

639,340194

216,503405

2,95302604

0,00693658

Intercepcin

543,442075

780,656392

0,69613479

0,49303155

La tabla anterior nos indica que el mayor valor de la probabilidad que es mayor
que 0.05 es la probabilidad del coeficiente de X9, lo que nos indica que debemos
eliminar la variable X9 y realizar otra regresin lineal mltiple, la cual se muestra a
continuacin:

Regresin 11:

Variables

Coeficientes

Error tpico

Estadstico t

Probabilidad

x11

-13,5291957

8,14450399

-1,66114421

0,10917603

x1

56,1285613

29,0168375

1,93434454

0,06446549

x5

475,671424

207,212308

2,29557514

0,03036306

x8

9,00599561

3,29924444

2,72971457

0,0114418

Intercepcin

-738,324352

382,196996

-1,93179005

0,06479543

La tabla anterior nos indica que el mayor valor de la probabilidad que es mayor
que 0.05 es la probabilidad del coeficiente de X11, lo que nos indica que debemos
eliminar la variable X11 y realizar otra regresin lineal mltiple, la cual se muestra
a continuacin:

Regresin 12:

Variables

Coeficientes

Error tpico

Estadstico t

Probabilidad

x1

14,2377953

14,8313913

0,95997705

0,34590975

x5

208,747543

135,184986

1,54416218

0,13463468

x8

9,3744021

3,40133507

2,75609486

0,01054783

Intercepcin

-492,769702

364,182785

-1,35308346

0,18767811

La tabla anterior nos indica que el mayor valor de la probabilidad que es mayor
que 0.05 es la probabilidad del coeficiente de X1, lo que nos indica que debemos
eliminar la variable X1 y realizar otra regresin lineal mltiple, la cual se muestra a
continuacin:

Regresin 13:

Variables

Coeficientes

Error tpico

Estadstico t

Probabilidad

x5

207,072853

134,977224

1,53413181

0,13663303

x8

8,75853162

3,33542821

2,6259092

0,01406116

Intercepcin

-433,697718

358,424664

-1,21001081

0,23676226

La tabla anterior nos indica que el mayor valor de la probabilidad que es mayor
que 0.05 es la probabilidad del coeficiente de X5, lo que nos indica que debemos
eliminar la variable X5 y realizar otra regresin lineal mltiple, la cual se muestra a
continuacin:

Regresin 14:

Variables

Coeficientes

Error tpico

Estadstico t

Probabilidad

x8

9,22861377

3,400655

2,71377537

0,01125409

Intercepcin

98,7680914

91,6020626

1,07822999

0,29013279

Observamos que las probabilidades estn en la variable X8 ya que es menor que


0.05, lo que indica que nuestro modelo definitivo quedara de la siguiente manera:

Algunos detalles adicionales del reporte de Excel nos permiten observar adems
que nuestro modelo definitivo es bueno por el valor del Valor crtico de F el cual
es de 0.011254087, que es mucho menor que 0.05.
Otro valor que se puede interpretar es el valor de R que es igual a 0.17997039, a
partir del cual puede decirse que aproximadamente el 17.99% de la variacin en Y
es debida a las variable X8.

Tol viejo (Tv) por R:


Cargamos el archivo en R, seleccione todo el conjunto de datos y envelas a R con
la siguiente orden:
d=read.delim("clipboard")
attach(d)
Invocamos la librera MASS (que contiene la funcin stepAIC()) con la siguiente
orden:
library(MASS)
Genere una regresin lineal mltiple con la variable Y, en funcin de todas las
dems variables X, con la siguiente orden:
r1=lm(y~.,data=d)
Puede observar todos los detalles de la modelacin con la siguiente orden:
summary(r1)

En el listado anterior, observamos que los valores de las probabilidades de cada


uno de los coeficientes estimados, aquellos valores mayores de 0.05 significa que
deben salir del modelo. Puede seguir el procedimiento indicado en el taller de
regresin lineal mltiple.
Pero puede realizar la modelacin con eliminacin hacia atrs, utilizando la
funcin stepAIC(), con la siguiente orden:
r2=stepAIC(r1,k=log(length(d)))
Importante usar k=log(length(d) este nos brinda una salida detallada de todos los
pasos del proceso de modelacin. Observe que se incluye dentro del parntesis el
valor de la matriz d. El resultado es el siguiente:

Como puede apreciar las variables que selecciona el mtodo de eliminacin hacia
atrs no son las mismas que obtuvimos con el procedimiento manual utilizando
Excel. Con esta observacin procedemos a realizar una regresin lineal mltiple
en R utilizando solamente las variables X6, X9, X11, X8, X1, y X5 la cual la
podemos realizar de la siguiente manera:
r1=lm(y~x6+x9+x11+x8+x1+x5,data=d)
summary(r1)

Y = 705.5662 + X6*-55.0361 + X9*-1.3977 + X11*-23.4403 + X8*8.8619 +


X1*97.1092 + X5*803.6620
Algunos detalles adicionales del reporte de R nos permiten observar adems que
nuestro modelo definitivo es bueno por el valor del P-value el cual es de
0.007045, que es mucho menor que 0.05.
Otro valor que se puede interpretar es el valor de R que es igual a 0.5097, a partir
del cual puede decirse que aproximadamente el 50.97% de la variacin en Y es
debida a las variables X6, X9, x11, x8, X1 y X5.
El procedimiento en Excel report solamente la variable X8

Mientras que el procedimiento en R:


Y = 705.5662 + X6*-55.0361 + X9*-1.3977 + X11*-23.4403 + X8*8.8619 +
X1*97.1092 + X5*803.6620

Slo nos restara averiguar si existe alguna diferencia significativa entre los dos
modelos, lo cual lo podemos averiguar con la funcin anova() de R. Llamemos a r1
al primer modelo de tres variables X6, X9, x11, X8, X1 y X5, luego llamemos r2 al
segundo modelo de dos variables X6 y X5. Finalmente verificaremos si hay
diferencias entre ellos aplicando la funcin anova() a los dos modelos r1 y r2. El
procedimiento en R es el siguiente:
r1=lm(y~x6+x9+x11+x8+x1+x5,data=d)
r2=lm(y~x6+x5,data=d)
anova(r1,r2)
El resultado se muestra a continuacin:

El resultado de la funcin anova() de R, que realmente es un anlisis de la


varianza de los dos modelos, nos reporta un valor de la probabilidad igual a
0.005023. Como este valor es menor que 0.05 podemos concluir que los dos
modelos tienen diferencias significativas, es decir, cualquiera de los dos modelos
que se utilicen dar resultados estadsticamente significativas. El planteamiento de
las hiptesis sera:
Ho:
Ha:

r1 = r2
r1 r2

Como el valor de la probabilidad Pr(>F) fue de 0.005023 y este valor es menor que
0.05, podemos rechazar la hiptesis nula con lo que concluimos que los dos
modelos r1 y r2 son diferentes.

You might also like