You are on page 1of 46

n timpurile strvechi nu exista

statistica, aa c oamenii erau nevoii s recurg la poveti. De aici exagerrile grosolane ale literaturii primitive: gigani, minuni, miracole... Ceea ce ei obineau cu minciuni, noi realizm cu statistica. n fond e acelai lucru! Anonim

Statistic
Prof.dr. Zizi Goschin Catedra de Statistic i econometrie Cam.2610 zizigoschin@hotmail.com

Noiuni introductive
1. Definirea statisticii 2. Concepte de baz 3. Gruparea datelor

I.Ce este statistica?


Accepiuni: Date statistici ale cursului valutar, omajului, ratei inflaiei etc. tiina care studiaz aspectele cantitative ale fenomenelor de mas. Caracteristici: Colectiviti mari Variabilitatea formelor de manifestare Incertitudine

II. Concepte de baz 1. Colectivitate (populaie)


= ansamblul elementelor de aceeai natur Grup de persoane/ obiecte /evenimente Caracter obiectiv, finit Delimitat dup coninut, spaiu i timp. Ex. - agenii economici privai din Bucureti n 2009; falimentele din industria turismului n 2008, n jud. Constana

1.Colectivitate static: un stoc existent la un moment dat. Ex. Populaia Romniei la 1 iulie 2009, stocul de produse finite al unui agent economic la 1.02.2010

2. Colectivitate dinamic: un proces, o evolutie pe o perioad de timp. Ex. Cheltuielile de consum ale populaiei Romniei n anul 2009, produse fabricate de un agent economic n luna februarie 2010.

2. Unitate statistic
= elementul de baz al populatiei investigate A. simpl: o persoan/ obiect B. complex: un grup de uniti simple (subansamblu independent) familia, echipa, firma

Datele sunt nregistrate pentru fiecare unitate statistic.

3.Caracteristica (variabila)
= o proprietate, un atribut al unitilor statistice Ex. Vrsta persoanei, cifra de afaceri a agentului economic, preul bunului Variaz de la o unitate statistic la alta Variante= mrimi distincte ale unei variabile ntr-o colectivitate Frecvena= numrul unitilor statistice cu aceeai variant (valoare a caracteristicii)

1. Variabil cronologic (timp) 2. Variabil teritorial (spaiu) 3. Variabil atributiv: 3.1. Calitativ= exprimat n cuvinte (profesia, ramura economic) 3.1.1.Alternativ (binar)= doua forme de manifestare (urban/rural, admis/respins) 3.1.2.Nealternativ 3.2. Cantitativ= numeric 3.2.1.Discret= ia valori strict determinate ntr-un interval de variaie (nr. copii pe familie, nr. de falimente anual) 3.2.2.Continu = poate lua orice valoare ntr-un interval de variaie (greutatea, profitul)

III. Gruparea datelor


= separarea unitilor colectivitii n subansambluri omogene, dup o caracteristic de grupare - Variabile: Calitative grupate pe variante Cantitative grupate pe variante (cnd sunt puine valori distincte) grupate pe intervale de variaie egale (cnd A este moderat, variaie uniform) grupate pe intervale de variaie neegale (cnd A este mare, variaie neuniform).

A=Xmax Xmin

Procedura de grupare pe intervale egale de variaie: 1.Nr. de grupe k: a. Ales dup mrimea colectivitii, natura variabilei, scopul analizei; n general: 5-20 grupe b. Calculat cu formula Sturges: k=1+3.322 lg n, unde n-volumul colectivitii. 2.Mrimea unui interval de grupare: h=A/k (rotunjire n plus). 3.Definirea intervalelor (pornind de la Xmin i adunnd repetat h pn se ajunge la Xmax). 4.Numrarea unitilor care aparin fiecrui interval (frecvene absolute)

Ex. Gruparea salariailor unei firme dup vrst Vrsta: 22, 25, 29, 30, 30, 31, 32, 34, 45, 61.
Grupe dup vrst* (ani) Numr de persoane (frecven absolut)

1.A=61-22=39 2.k=4 3.h=A/k= =9.7510

22-32 32-42 42-52 52-62 Total

6 2 1 1 10

*Limita inferioar inclus n interval

Gruparea pe intervale neegale de variaie: cnd A este mare i variaia neuniform. Ex. Firme de construcii pe clase de mrime dup nr.de salariai, n 2006
Clasa de mrime (persoane) 0-9 10-49 50-249 250 i peste Total
Sursa: Anuarul statistic al Romniei, 2007

Nr de firme 24799 4211 1194 168 30372

Prezentarea datelor
1.Serii statistice 2.Tabele 3.Grafice

1.

SERII STATISTICE
=iruri de date ordonate rezultate din grupare

1.1. Serii cronologice (de timp) : prezint valorile unei caracteristici n uniti de timp succesive.
Exemplu. Producia lunar a unui bun n 2008
Luna Producia (mii Euro) Mar Apr Mai Jun Jul Aug Sept ... 35 51 60 59 62 63 63 ...

1.2.Serii teritoriale: prezint variaia n spaiu a valorilor unei caracteristici statistice.


Exemplu. Vnzarea automobilelor pe regiuni in 2009
Regiunea Nr. automobile Nord 860 Sud Est 750 300 Vest Total 90 2000

1.3.Serii (distribuii) de frecvene

- rezult din gruparea datelor n funcie de o variabil:


-cantitativ (ex.distribuia salariailor dup venit) sau -calitativ (ex. distribuia salariailor dup profesie).

- sunt formate din dou iruri corelate:


1. variantele/ intervalele de variaie 2. frecvenele (absolute/relative).

Frecvenele absolute ni = numrul de observaii incluse ntr-un interval de variaie). Frecvenele relative ni* = ponderea frecvenelor absolute corespunztoare grupelor n total (n suma tuturor frecvenelor).

ni ni ni
*

ni ni % 100 ni
*

Distribuii de frecvene absolute i relative


Exemplu: distribuia muncitorilor dup salariu

Salariu (RON)

765810

810855

855900

900945

945Total 990

Numr de muncitori (ni)


Ponderea muncitorilor (n*i%)

14

40

17,5

35,0

17,5

12,5

7,5

100

2.TABELE
Toate seriile statice sunt prezentate n tabele. Elemente: titlul general, titlurile interne, unitile de msur a datelor, sursa datelor, note explicative. Tipuri:
Tabele simple pentru date grupate dup o singur variabil Tabele bidimensionale (cu dubl intrare) pentru date grupate dup dou variabile simultan

Distribuia salariailor dup vechimea n munc i salariu


Vechimea n munc (ani) 2-8 8-14 14-20 20-26 26-32 32-38 Total dup salariu Salariu (RON) 720765 4 4 765810 2 2 3 7 810855 3 5 5 1 14 5 1 1 7 855900 900945 4 1 5 Total dup 945vechime 990 1 2 3 6 5 8 14 4 3 40

3.GRAFICE
Evideniaz ntr-o form sugestiv distribuia valorilor, tendiele de evoluie, legturile dintre variabile, structura colectivitii. Elemente: titlul, coordonatele (X i Y), scara de reprezentare, legenda, sursa datelor, note explicative. Fiecare punct al graficului este definit n funcie de coordonatele sale.

3.1.Pictograma folosete simboluri pentru a reprezenta informaia statistic. Variante: a) simboluri multiplicate b) simboluri proportionale sugestive, uor de neles, dar cu nivel mai redus de precizie

a) Pictogram cu simboluri multiplicate

b) pictogram cu simboluri proporionale

3.2. Grafice prin coloane = valorile variabilei sunt reprezentate grafic prin coloane cu baze egale i nlimea proporional cu mrimea variabilei.
Coloane simple una pentru fiecare grup

Coloane multiple (grupate) compar variabile diferite pentru aceleai grupe.

Coloane de structur - compar structura grupelor

3.3.Benzi

Simple Grupate De structur

Distribuia elevilor unei coli dup desertul preferat

Piramida vrstelor

3.4.Cercuri de structur
sectoarele cercului reprezint proporiile grupelor colectivitii Etape: 1.Se calculeaz frecvena relativ a fiecrei grupe. 2.Se nmulesc frecvenele cu 360 pentru a obine dimensiunile sectoarelor n grade. 3.Se delimiteaz sectoarele cercului i se coloreaz/haureaz diferit.

Student response to the poll 'Should the college adopt student uniforms?'

Cercurile proporionale arat simultan dimensiunea i structura.

3.5. Cronograma > pentru serii cronologice


- Valorile variabilei sunt msurate pe OY, iar pe OX se trec unitile de timp - arat variaia n timp i tendina de evoluie, dar imaginea poate fi distorsionat de alegerea scrii de reprezentare.
Ex. Evoluia costurilor de producie (aceleai date, scri de reprezentare diferite)

originea diferit de zero

3.6.Corelograma (scatterplot)
identific legturile dintre variabile: variabila independent pe axa OX, variabila dependent pe axa OY originea graficului este ntotdeauna zero (0,0). fiecare unitate statistic e reprezentat printr-un punct; punctele nu sunt unite

Cartogram: PIB/locuitor in 2004 (% din media UE 27) pe regiuni

Source: Eurostat Regional Yearbook 2007

3.7. Grafice pentru distribuii de frecvene


Histograma - fiecare grup e reprezentat printr-o coloan cu suprafaa proporional cu frecvena absolut a grupei respective - atunci cnd caracteristica reprezentat grafic are variaie continu, coloanele sunt lipite - cnd variaia e discret, exist spaii ntre coloane

Ex. Distributia muncitorilor dup producia zilnic (histogram)

nr. muncitori

producie (buc)

Poligonul frecvenelor se obine unind vrfurile coloanelor histogramei. Ex. Distributia muncitorilor dup producia zilnic (histogram i poligonul frecvenelor)

nr. muncitori

producie (buc)

Curbele frecvenelor cumulate (cresctor/ descresctor) Frecvena cumulat cresctor a unei grupe este numrul de uniti statistice cu valori sub limita superioar a intervalului de variaie. -> pentru reprezentarea grafic se folosesc limitele superioare ale intervalelor de grupare. Frecvena cumulat descresctor a unei grupe este numrul de uniti statistice cu valori peste limita inferioar a intervalului de variaie. -> pentru reprezentarea grafic se folosesc limitele inferioare ale intervalelor de grupare

Productia (buc)
0

Numr de Frecvene cumulate muncitori Cresctor Descresctor (ni)


1 3 4

sub 120 120-140 140-160 160-180 180-200 200-220 220-240 240 i peste Total

10 18 23 38 51 40 15 5 200

10 28 51 89 140 180 195 200 -

200 190 172 149 111 60 20 5 -

Ex. Curbele frecvenelor cumulate


225 200 175

nr. muncitori

150 125 100 75 50 25 0 100 120 140 160 180 200 220 240 260 produci a (bu c.)

Selectarea tipului de grafic


cerc sau coloan de structur pentru descrierea componentelor colectivitii (structura) coloane/ benzi pentru compararea unor variabile diferite pentru aceleai grupe, pt serii de timp i teritoriale cronograma pentru serii de timp corelogram pentru evidenierea legturii dintre dou variabile histogram, poligonul frecvenelor i curbele frecvenelor cumulate pentru distribuii de frecvene

Erori de reprezentare grafic


Prea multe variabile

Variatie nesemnificativ:
Fig. Numrul adulilor tineri care fac drumeii sptmnale, dup vrst, 1996 - 2002

Incorect:

Corect:

lips

origine incorect a graficului

Valori absolute, nedeflaionate (fig.1) n locul mrimilor relative (fig.2

1.Cheltuieli guvernamentale, 1930-1980

2.Ponderea cheltuielilor guvernamentale n PIB, 1930-1980

You might also like