Professional Documents
Culture Documents
Regiuni Județe Nr. mediu Câștig salarial PIB (mil lei) Populație
salariați(nr.pers.) (lei/salariat) (mii pers)
Centru Alba 684 2049 8000,7 376
Brașov 853 1712 14160,4 594
Covasna 172 1700 3540,4 223
Harghita 587 1691 5248,1 326
Mureș 3014 2832 9440,8 582
Sibiu 2006 3430 9026,3 423
S-V Dolj 1630 2118 10675,0 712
Oltenia
Gorj 15703 2585 7613,9 382
Mehedinți 1170 2321 3755,6 299
Olt 904 2087 5566,3 476
Vâlcea 2678 2322 6808,8 412
Vest Arad 1254 2210 10064,4 458
Caraș-Severin 345 1606 5353,2 328
Hunedoara 12626 2376 8740,1 422
Timiș 1434 2158 18838,0 667
Cerinţe:
a. Realizarea şi interpretarea regresiei unifactoriale
yi = f ( x1i )
REZOLVARE:
SUMMARY OUTPUT
Regression Statistics
Multiple R 0,01243677
R Square 0,00015467
Adjusted R Square -0,0767565
2
Standard Error 4812,1139
Observations 15
ANOVA
df SS MS F Significance F
Regression 1 46569,02941 46569,029 0,0020111 0,9649125
Residual 13 301033723 23156440
Total 14 301080292
RESIDUAL OUTPUT
Predicted
Nr mediu
salariati din
ind
extractiva
Observation (pers) Residuals
1 2997,491622 -2313,491622
2 3085,645969 -2232,645969
3 2933,658182 -2761,658182
4 2958,097875 -2371,097875
5 3018,101566 -4,101566206
6 3012,169463 -1006,169463
7 3035,76478 -1405,76478
8 2991,955946 12711,04405
9 2936,73801 -1766,73801
10 2962,651784 -2058,651784
11 2980,433783 -302,4337831
12 3027,026197 -1773,026197
13 2959,602011 -2614,602011
14 3008,073521 9617,926479
15 3152,589291 -1718,589291
Coefficients Coeficienţii
Intercept 2882,98986 a -termen liber
PIB (mil lei) 0,01431147 b -coeficient de regresie
3
a = 2882,98986
b = 0,01431147
y = 2882,98986+0,01431147xi
ANOVA
df SS MS F Significance F
Regression 1 46569,02941 46569,029 0,0020111 0,9649125
Residual 13 301033723 23156440
Total 14 301080292
Întrucât Significance F (pragul de semnificaţie) este 0.9649125 (valoare mai mare de 0,05),
atunci modelul de regresie construit nu este valid.
H0: modelul nu este valid statistic (împrăştierea valorilor datorate PIB nu diferă
ŷ t
semnificativ de împrăştierea aceloraşi valori datorate întâmplării)
H1: modelul este valid statistic
Ştiind că pragul de semnificaţie este şi (există un singur factor de
α = 0,05 k =1
influenţă) se stabileşte:
♦ valoarea critică:
Ftabelar = Fα ; k ; n −k −1 = Fα ;1;n−2 = F0 , 05;1;13 = 4,67
4
2. Să se testeze semnificaţia parametrilor modelului de regresie, pentru un nivel de
semnificaţie 0,05.
Standard
Coefficients t Stat P-value Lower 95% Upper 95%
Error
Intercept 2882,98986 2970,726669 0,9704662 0,3495249 -3534,8749 9300,8546
PIB (mil lei) 0,01431147 0,319132828 0,0448449 0,9649125 -0,6751331 0,703756
5
♦ valoarea critică:
t critic = t α = t 0,5 BILATERAL;15−2 = t 0,5 BILATERAL; 13 = 2,160
; n − k −1
2
Intensitatea legăturii dintre cele două variabile se poate stabili atât prin aplicarea
coeficientului de corelaţie liniară, dar şi cu ajutorul raportului de corelaţie (care se aplică atât
pentru legăturile liniare, cât şi în cazul legăturilor neliniare).
xi yi (x i −x ) ( yi − y ) ( xi − x )( yi − y ) ( x − x)
i
2
( yi − y ) 2
6
10675,0 1630 2219.5 -1374 -3049593 4926180.2 1887876
( x − x)
∑ ( y − y ) ∑ ( x − x )( y − y ) ∑
2
∑x ∑y ∑(x − x) ∑( y − y)
i 2
i i i i i i i
2 1 9 3 6 7 7 2,479
126832 45060 − 0 .5 0 3253967,1 1134326291
cov ( x, y ) s xy ∑( x i − x ) ⋅ ( yi − y )
r= = = i =1
sx ⋅ s y sx ⋅ s y n 2
n
2
∑ i ( x − x ) ∑ ( y i − y )
i =1 i =1
n∑ xi y i − ∑ xi ⋅ ∑ y i
r=
[n ∑ x 2
i
2
][
− ( ∑ xi ) n∑ y i2 − ( ∑ y i )
2
]
cov( x, y ) s xy ∑(x i − x ) ⋅ ( yi − y )
3253967,1
r= = = i =1
= = 0,0124
sx ⋅ s y sx ⋅ s y n 2
n
2 219367727,49 ⋅ 113432691
∑ i ( x − x ) ∑ ( yi − y )
i =1 i =1
x=8455,5 mil lei/județ
y=3004 persoane/județ
7
xi yi xi2 y i2 xi yi
∑x i ∑y i ∑x 2
i = ∑y 2
i = ∑x y
i i =
126832 45 06 0 5302997914
83.05994 435061132 398206972.4
n∑ xi y i − ∑ xi ⋅ ∑ y i
r=
[n ∑ x 2
i
2
][
− ( ∑ xi ) n∑ y i2 − ( ∑ y i )
2
]
15 ⋅ 398206972.4 − 126832⋅ 45060
=
15 ⋅ 530299791483.05994 − 1268322 ⋅ 15 ⋅ 435061132− 450602
= 0,0124
r = 0,0124 > 0, ceea ce ne arată că, între PIB şi numărul mediu de salariați din industria
extractivă există o legătură directă foarte slabă.
8
- se stabileşte ipoteza nulă (coeficientul de corelaţie al colectivităţii din care
H0 : ρ = 0
s-a extras eşantionul nu diferă semnificativ de zero, deci nu este semnificativ statistic);
- se stabileşte ipoteza alternativă (coeficientul de corelaţie al colectivităţii din
H1 : ρ > 0
care s-a extras eşantionul este semnificativ mai mare decât zero, deci este semnificativ
statistic);
Concluzie:
Deoarece se acceptă, prin urmare coeficientul de
t calculat ( 0,584) < tα ;n − k −1 (1,771) H0
corelaţie al colectivităţii din care s-a extras eşantionul nu diferă semnificativ de zero, deci nu
este semnificativ statistic.
R = 0,0124 ne arată că, între PIB şi numărul mediu de salariați există o legătură foarte slabă.
Deoarece R = r = 0,0124, apreciem că există o legătură liniară, foarte slabă şi directă
între cele două variabile.
9
Ştiind că pragul de semnificaţie este şi (există un singur factor de
α = 0,05 k =1
influenţă) se stabileşte:
♦ valoarea critică:
Ftabelar = Fα ; k ; n − k −1 = Fα ;1;n− 2 = F0,05;1;13 = 4,67
♦ regiunea de respingere: dacă , atunci H0 se respinge
Fc > Fα ; k ; n− k −1
Determinarea statisticii testului ( ) are la bază relaţia:
Fcalculat = Fc
R2 n − k −1 0,0124 13
Fc = ⋅ = ⋅ = 0,16328
1− R 2
k 1 − 0,0124 1
Concluzie:
Deoarece , atunci se acceptă, ceea ce înseamnă că raportul
Fcalc (0,16328) < F0,05; 1; 13 ( 4,67) H0
de corelaţie al colectivităţii din care s-a extras eşantionul nu diferă semnificativ de zero, deci
nu este semnificativ statistic.
2. Ce pondere din variaţia variabilei efect este explicată de variatia variabilei cauză?
SUMMARY OUTPUT
Regression Statistics
Multiple R 0,01243677
R Square 0,00015467
Adjusted R Square -0,0767565
Standard Error 4812,1139
Observations 15
) în variaţia rezultatului ( )
y
10
R Square - ne arată că 0,015% reprezintă influența PIB asupra variației
R 2 = 0,00015467
numărului mediu de salariați din industria extractivă la nivelul celor15 județe.
yi x1i x3i
x2i
11
SUMMARY
OUTPUT
Regression Statistics
Multiple R 0,385880719
R Square 0,148903929
Adjusted R
Square -0,083213181
Standard
Error 4826,520049
Observations 15
ANOVA
df SS MS F Significance F
14944012, 0,6415034
Regression 3 44832038,42 8 6 0,604082797
23295295,
Residual 11 256248253,6 8
Total 14 301080292
RESIDUAL
OUTPUT
Predicted
Nr mediu
salariați din
Observatio ind extractiva
n (pers) Residuals
-
2919,5486 2235,5486
1 84 84
-
1099,5266 246,52665
2 57 7
-
2053,2716 1881,2716
3 33 33
-
1482,7997 895,79971
4 19 9
-
4255,8602 1241,8602
5 02 02
6 7713,7645 -
96 5707,7645
12
96
804,19136 825,80863
7 58 42
4721,7619 10981,238
8 42 06
-
3679,3070 2509,3070
9 46 46
-
1673,1302 769,13023
10 3 04
-
3341,0294 663,02941
11 13 32
-
3220,9739 1966,9739
12 73 73
-
1180,4963 835,49634
13 48 76
3855,4415 8770,5584
14 01 99
-
3058,8966 1624,8966
15 9 9
yˆ x1 , x2 , x3 ,i = b0 + b1 x1i + b2 x 2i + b3 x3i
Coefficients Coeficienţii
termen liber
b0
Intercept -2888,984192
coeficient de regresie (primul factor)
Câștig salarial din ind b1
extractivă (lei/salariat) 3,611760756
coeficient de regresie (al doilea factor)
b2
PIB (mil lei) 0,210481963
Populația (mii pers) -8,712680725 b3 coeficient de regresie (al treilea factor)
13
yˆ x1 , x2 , x3 ,i = −2888,984192+ 3,611760756x1i + 0,210481963x 2i − 8,71680725x3i
ANOVA
df SS MS F Significance F
0,6415034
Regression 3 44832038,42 14944012,8 6 0,604082797
Residual 11 256248253,6 23295295,8
Total 14 301080292
Întrucât Significance F (pragul de semnificaţie) este 0.604082797 (valoare mai mare de 0,05),
atunci modelul de regresie construit nu este valid.
H0: modelul nu este valid statistic (împrăştierea valorilor datorate factorului timp nu
ŷ t
diferă semnificativ de împrăştierea aceloraşi valori datorate întâmplării)
H1: modelul este valid statistic
Ştiind că pragul de semnificaţie este şi (există trei factori de influenţă) se
α = 0,05 k =3
stabilesc:
♦ valoarea critică:
Ftabelar = Fα ; k ; n − k −1 = Fα ;3;n −3−1 = F0,05; 3;11 = 3,59
♦ regiunea de respingere: dacă , atunci H0 se respinge
Fc > Fα ; k ; n− k −1
Determinarea statisticii testului ( ) are la bază relaţia:
Fcalculat
s y2 / x 14944012,8
F= 2
= = 0,64150346
s e 23295295,8
14
ind extractivă
(lei/salariat) 7
0,3753273
PIB (mil lei) 0,210481963 0,560795719 4 0,71455363 -1,023821092 1,444785
Populația (mii pers) -8,712680725 16,31979935 -0,5338718 0,60405119 -44,63231689 27,206955
respinge
Statistica testului este:
b0 − 2888,984192
t calc = t b 0 = = = −0,4176666
sb 0 6916,963146
Decizia:
Se observă că parametrul nu este semnificativ statistic deoarece:
β0
– din compararea statisticii testului cu valoarea testului critic (tabelar sau teoretic)
rezultă că: ;
− t critic ( − 2,201) < t b 0 ( − 0,4176666) < t critic ( 2,201)
– pragul critic P-value = 0,68422725> pragul de semnificaţie
b0 α = 0,05
15
– limita inferioară a intervalului de încredere (lower 95% = -18113,11742) este cu semn
contrar faţă de limita superioară a intervalului (upper 95% = +12335,149); intervalul
de încredere este -18113,11742 12335,149;
≤ β0 ≤
respinge
Statistica testului este:
b1 3,611760756
t calc = t b1 = = = 1,33306297
sb1 2,709369957
Decizia:
Se observă că parametrul nu este semnificativ statistic deoarece:
β1
– din compararea statisticii testului cu valoarea testului critic (tabelar sau teoretic)
rezultă că: ;
− t critic ( − 2,201) < t b1 (1,33306297) < t critic ( 2,201)
– pragul critic P-value = 0,20946209> pragul de semnificaţie
b1 α = 0,05
16
– limita inferioară a intervalului de încredere (lower 95% = -2,351522307) este cu semn
contrar faţă de limita superioară a intervalului (upper 95% = +9,5750438); intervalul
de încredere este -2,351522307 9,5750438;
≤ β1 ≤
respinge
Statistica testului este:
b2 0,210481963
t calc = t b 2 = = = 0,37532734
sb 2 0,560795719
Decizia:
Se observă că parametrul nu este semnificativ statistic deoarece:
β2
– din compararea statisticii testului cu valoarea testului critic (tabelar sau teoretic)
rezultă că:
17
– limita inferioară a intervalului de încredere (lower 95% = -1,023821092) este cu semn
contrar faţă de limita superioară a intervalului (upper 95% = + 1,444785); intervalul de
încredere este -1,023821092 1,444785.
≤ β2 ≤
respinge
Statistica testului este:
b3 − 8,712680725
t calc = t b 3 = = = −0,5338718
sb3 16,31979945
Decizia:
Se observă că parametrul nu este semnificativ statistic deoarece:
β3
– din compararea statisticii testului cu valoarea testului critic (tabelar sau teoretic)
rezultă că:
18
– limita inferioară a intervalului de încredere (lower 95% = -44,63231689) este cu semn
contrar faţă de limita superioară a intervalului (upper 95% = + 27,206955); intervalul
de încredere este -44,63231689 27,206955.
≤ β3 ≤
SUMMARY OUTPUT
Regression Statistics
Multiple R 0,385880719
R Square 0,148903929
Adjusted R Square -0,083213181
Standard Error 4826,520049
Observations 15
19
Determinarea statisticii testului ( ) are la bază relaţia:
Fcalculat = Fc
R2 n − k −1 0,1489 11
Fc = ⋅ = ⋅ = 0,6415
1− R 2
k 1 − 0,1489 3
Concluzie:
Deoarece , atunci se acceptă, ceea ce înseamnă că
Fc (0,6415) < F0,05; 3; 11 ( 3,59) H0
raportul de corelaţie al colectivităţii din care s-a extras eşantionul nu diferă semnificativ de
zero, deci nu este semnificativ statistic.
SUMMARY OUTPUT
Regression Statistics
Multiple R 0,385880719
R Square 0,148903929
Adjusted R Square -0,083213181
Standard Error 4826,520049
Observations 15
salarial din industria extractivă, PIB, populație) asupra variației numărului mediu de salariați
din industria extractivă.
20