You are on page 1of 7

Din activitatea unei societăţi comerciale se cunosc următoarele date pentru perioada 1995-

2004:
Capitalul fix
Producţia
Anul Număr de salariaţi (mii lei preţuri
(mii buc.)
comparabile)
1995 20 1000 4000
1996 24 1200 4200
1997 28 1400 4400
1998 32 1100 4600
1999 34 1500 4600
2000 40 1700 4200
2001 40 1900 4600
2002 42 1900 4800
2003 44 2000 4800
2004 46 2100 5000

Presupunând că între cele 3 variabile există o dependenţă liniară, se cere:


a) să se estimeze parametrii modelului de regresie;
b) să se determine erorile reziduale;
c) să se măsoare intensitatea legăturii dintre producţie şi cele două variabile;
d) să se testeze validitatea modelului de regresie folosit.

Rezolvare:
Notăm cu:
y = producţia;
x1 = numărul de salariaţi;
x2 = valoarea capitalului fix.
Ecuaţia de regresie este:
ŷ  a 0  a 1 x 1  a 2 x 2
unde ŷ reprezintă valorile ajustate sau teoretice ale variabilei y în funcţie de cele două variabile
factoriale x1 şi x2.
Determinarea parametrilor modelului de regresie se face prin metoda celor mai mici
pătrate:
  y i  ŷ i  2 min    y i  a 0  a 1 x i1  a 2 x i 2  2 min 
i i

  
0
 na 0  a 1  x i1  a 2  x i 2   y i
 a 0  i i i
   2
 0  a 0  x i1  a 1  x i1  a 2  x i1 x i 2   x i1 y i
 a 1  i i i i
  a  x  a  x x  a  x 2   x y
 a  0
0 i2 1 i1 i 2 2 i2 i2 i

 i i i i
 2
Calculele ajutătoare pentru rezolvarea sistemului sunt prezentate în tabelul următor:

yi x i1 x i2 x i21 x i22 x i1 x i 2 x i1 y i x i2 y i
20 10 40 100 1600 400 200 800
24 12 42 144 1764 504 288 1008
28 14 44 196 1936 616 392 1232
32 11 46 121 2116 506 352 1472
34 15 46 225 2116 690 510 1564
40 17 42 289 1764 714 680 1680
40 19 46 361 2116 874 760 1840
42 19 48 361 2304 912 798 2016
44 20 48 400 2304 960 880 2112
46 21 50 441 2500 1050 966 2300
350 158 452 2638 20520 7226 5826 16024

10a 0  a 1  158  a 2  452  350



a 0  158  a 1  2638  a 2  7226  5826 
a  452  a  7226  a  20520  16024
 0 1 2

a 0  23,13

a 1  1,67
a  0,70
 2
Deci:
ŷ  23,13  1,67 x 1  0,70 x 2
Se observă că la o creştere cu 100 a numărului de salariaţi, producţia va crete cu 1,67 mii
bucăţi, iar la o creştere a capitalului fix cu 100 mii lei, producţia va creşte cu 0,7 mii bucăţi.
Matricial, sistemul se rezolvă astfel:
   X ' X  1 X ' Y
1 10 40 
 
1 12 42 
1 14 44 
 
1 11 46 
   10 158 452 
1 15 46   
X ; X ' X   158 2638 7226  ; X ' X  55640
1 17 42   452
   7226 20526 
1 19 46 
1 19 48 
 
1 20 48 
1 21 50 

 34,73  0,41  0,91   350 


   
 X' X  1
   0,41 0,017  0,015  ; X' Y   5826 
  0,91  0,015 0,025  16024 
  

  23,13 
 
   1,67 
 0,70 
 
b) Erorile sau valorile variabilei reziduale sunt: u i  y i  ŷ i , iar rezultatele sunt prezentate
în tabelul de mai jos:

yi ŷ i ui u i2
20 21,65 -1,65 2,72
24 26,40 -2,40 5,76
28 31,15 -3,15 9,92
32 27,53 4,47 19,98
34 34,22 -0,22 0,05
40 34,76 5,24 27,46
40 40,91 -0,91 0,83
42 42,32 -0,32 0,10
44 43,99 0,01 0,00
46 47,07 -1,06 1,12
c) Pentru măsurarea intensităţii legăturii dintre producţie şi cele după variabile folosim
raportul de corelaţie multiplă:
n
  y i  ŷ i  2
67,95
R y / x1 ,x 2  1  i1  1  0,95
  y i  y
n 2 706
i 1
10
 yi
i 1 350
y   35
10 10

 yi  2   20  35 2   24  35 2  ...   46  35 2  67,95


10
y
i 1
Deoarece R y / x1 ,x 2  0,95  1 înseamnă că între cele 3 variabile există o legătură directă,
puternică.

d) Testarea validităţii modelului de regresie


- se stabileşte ipoteza nulă: H0: modelul nu este valid;
- se stabileşte ipoteza alternativă: H1: modelul este valid;
- se calculează testul F:
s 2x , x 319,05
Fcalc  1 2
  32,89
s 2u 9,69

  ŷ i 2
10
y
SSR i1 638,10
s 2x ,x     319,05
1 2 k k 2

  yi 2
10
y
SSE 67,890
s 2u   i 1   9,69
n  l 1 n  l 1 8
k = numărul variabilelor factoriale = 2
- se compară Fcalc cu F; k; n-k-1:
F0,05; 2; 7 = 4,74
Deoarece Fcalc = 32,89  F0,05; 2; 7 
Respingem ipoteza nulă şi acceptăm alternativa, deci modelul este valid.

Rezolvarea în programul EXCEL:


Se introduc valorile variabilei rezultative y în celulele A2-A11
Se introduc valorile variabilei xi1 în celulele B2-B11
Se introduc valorile variabilei xi 2 în celulele C2-C11
Se selectează din meniul principal opţiunea Tools, apoi Data Analysis şi apoi Regression şi
se va deschide următoarea fereastră:

Rezultatele obţinute cu ajutorul EXCEL-ului sunt :


SUMMARY OUTPUT

Regression Statistics
Multiple R 0.950698331
R Square 0.903827316
Adjusted R Square 0.876349406
Standard Error 3.114434486
Observations 10
ANOVA
df SS MS F Significance F
Regression 2 638.1020848 319.051 32.89287 0.000275855
Residual 7 67.89791517 9.699702
Total 9 706

Standard Lower Upper


Coefficients t Stat P-value
Error 95% 95%
Intercept -23.13515457 18.27935628 -1.26564 0.246136 -66.35893281 20.08862
X Variable 1 1.672178289 0.395220664 4.230999 0.003883 0.73763059 2.606726
X Variable 2 0.701653487 0.496840815 1.41223 0.20076 -0.473187514 1.876494

RESIDUAL OUTPUT

Observation Predicted Y Residuals


1 21.65 -1.65
2 26.40 -2.40
3 31.15 -3.15
4 27.53 4.47
5 34.22 -0.22
6 34.76 5.24
7 40.91 -0.91
8 42.32 -0.32
9 43.99 0.01
10 47.06 -1.06

Explicitarea datelor din tabelele de mai sus:


SUMMARY OUTPUT

Regression Statistics
n n
Multiple R   ŷ i  y  2   y i  ŷ i  2
Raportul de corelatie 0.950698331 Ry , x 1 , x 2  i1  1  i 1
n n
  y i  y 2   y i  y 2
(R)

i 1 i 1

  ŷ i  y 
n 2
R Square
2y / x 2e
Coeficientul
0.903827316 R2   1  i 1
  yi  y
(gradul ) de 2y 2y n 2
determinaţie
i 1
Adjusted R Square
Valoarea ajustată a
0.876349406 2 2u / n  k  1
coeficientului de R 1
determinaţie 2y / n  1
Standard Error n
Abaterea medie   y i  ŷ i  2
3.114434486 2u
pătratică a erorilor în su   i1
eşantion n2 n2
Observations
Numărul 10
observaţiilor (n)

Tabel 2.
ANOVA
MS =SS/df
df
Sursa SS (varianţa) (media pătratelor) Significance
(grade de F
variaţiei (suma pătratelor) (dispersia F
libertate)
corectată)
SSR=
Regression 2x
(variaţia
datorată
2 (k)
2
x
n
   yˆ i  y
i 1
  2
= s x2 
k
= Testul
F=32.89287
0.000275855<
0.05
(resping H0 –
regresiei) 319.051 2 2
F= s x / s u
638.1020848 model valid)
SSE=
Residual 2u
    yi  yˆ i 
n
(variaţia 7 (n-k-1)
2 2
= su2  =
u
i 1
n  k 1
reziduală) 9.699
67.89791517
SST=
Total
(variaţia 9 (n-1)
n
2y   y i  y
i 1
  2
=
s y2 
2y
totală) n 1
706
SST=SSR + SSE

Tabel 3
Standard Error
Coefficients (Abaterea Lower Upper
t Stat P-value
(Coeficienţi) medie 95% 95%
patratică)
Limita inf. a Limita sup. a
intervalului de intervalului
încredere de încredere
Intercept s a0 t a0
a0= = = 0.246136> -66.35893281
(termenul 20.08862
-23.1351545 18.27935628 -1.26564 0,05
liber)
Numărul a1 = s a1 t a1 = 0.003883<
= 0.73763059 2.606726
de salariaţi 1.672178289 0.395220664 4.230999 0,05

Capitalul a2 = s a2 ta2 0.20076>


= = -0.473187514 1.876494
fix 0.701653487 0.496840815 1.41223 0,05

Tabel4.
RESIDUAL OUTPUT
Residuals
Observation Predicted ŷ i y i  yˆ i
1 21.65 -1.65
2 26.40 -2.40
3 31.15 -3.15
4 27.53 4.47
5 34.22 -0.22
6 34.76 5.24
7 40.91 -0.91
8 42.32 -0.32
9 43.99 0.01
10 47.06 -1.06

Interpretare rezultate din tabelul SUMMARY OUTPUT:


 R = 0.950698331 arată că între cele trei variabile există o legătură puternică
directă.
 R2 = 0.903827316arată că 90% din variaţia producţiei este explicată de model;
 Abaterea medie patratica a erorilor s u = 3.114434486. În cazul în care acest
indicator este zero înseamnă că toate punctele sunt pe dreapta de regresie.
Interpretare rezultate din tabelul ANOVA:
În acest tabel este calculat testul F pentru validarea modelului de regresie. Întrucât F =
32.89287, iar Significance F (pragul de semnificaţie) este
0.000275855 (valoare mai mica de 0.05) atunci modelul de regresie construit este valid şi
poate fi utilizat pentru analiza dependenţei dintre cele trei variabile.
Interpretarea rezultatelor din tabelul 4:
 Intercept este termenul liber, deci coeficientul a0 este -3.1351545.
Termenul liber este punctul în care variabilele explicative (factorială) sunt 0.
t
Deoarece a 0 = -1.26564iar pragul de semnificaţie P-value este 0.246136 > 0,05
înseamnă că acest coeficient este nesemnificativ. De altfel faptul că limita
inferioară a intervalului de încredere
(-66.35893281  0  20.08862) pentru acest parametru este negativă, iar limita
superioară este pozitivă arată că parametrul din colectivitatea generală este aproximativ
zero.
 Coeficientul a1 este 1.672178289, ceea ce însemnă că la numărului de salariaţi cu
o sută, producţia va creşte cu 1.672178289 mii bucăţi. Deoarece t a1 = 4.230999
iar pragul de semnificaţie P-value este 0.003883 < 0,05 înseamnă că acest
coeficient este semnificativ. Intervalul de încredere pentru acest parametru este
0.73763059  1  2.606726
 Coeficientul a2 este 0.701653487, ceea ce însemnă că la capitalului fix cu o sută
mii lei, producţia va creşte cu 0.701653487 mii bucăţi. Deoarece t a 2 = 1.41223
iar pragul de semnificaţie P-value este 0.20076 > 0,05 înseamnă că acest
coeficient nu este semnificativ.

You might also like