You are on page 1of 20

STATISTICA INFERENTIALA Concepte fundamentale (populaie/eantion; distribuia de eantionare; ipoteze i decizii statistice) Testul z(t) pentru un singur eantion

Lect. univ. dr. Gheorghe Perea Populaie i eantion Obiectivul legitim al cercetrii tiinifice este identificarea unor adevruri cu un anumit grad de generalitate. Din punct de vedere statistic generalul este reprezentat de totalitatea valorilor care descriu o anumit caracteristic, i este numit populaie. Din pcate ns, investigarea tuturor indivizilor (valorilor) care compun o anumit populaie nu este aproape niciodat posibil. Ca urmare, n practica cercetrii tiinifice se supun cercetrii psihologice loturi mai restrnse, numite eantioane, extrase din ansamblul populaiei vizate. Parametrii descriptivi ai acestor eantioane (medie, abatere stadard) sunt extrapolai, n anumite condiii i cu ajutorul unor proceduri specializate, la populaia din care fac parte.

m s2 s esantion

Indicatorii esantionului estimeaza

Parametrii populatiei s2 s

A fundamenta un adevr statistic nseamn a trage o concluzie care descrie parametrii unei populaii de valori, pe baza indicatorilor unui eantion din acea populaie. n contextul cercetrii statistice utilizm urmtoarele definiii: Populaia reprezint totalitatea unitilor de informaie care constituie obiectivul de interes al unei investigaii. Prin uniti de informaie nelegem cel mai adesea persoane (subieci, cu un termen uzual in cercetarea psihologic1). Dar, la fel de bine, putem nelege i populaia de cupluri familiale, sau populaia de diferene dintre mediile a dou variabile, de exemplu. n esen, prin populaie trebuie s nelegem extinderea maxim posibil, sub aspectul volumului, a respectivei uniti de informaie. Extinderea menionat este, la rndul ei, definit prin obiectivul de cercetare, ceea ce nseamn ca are o dimensiune subiectiv. Aceasta se refer la domeniul de interes pe care i-l propune cercettorul. De exemplu, ntr-un studiu cu privire la efectul oboselii asupra performanei cognitive, pot fi vizate diferite categorii de populaii: a aviatorilor, a studenilor, a mecanicilor de locomotiv, a ahitilor, etc. Este de la sine neles faptul c, nc de la nceputul unei cercetri tiinifice, se va preciza populaia cercetrii, cu alte cuvinte, domeniul de extindere a rezultatelor i a concluziilor ce urmeaz a fi trase.

Eantionul reprezint unitile de informaie selecionate pentru a fi efectiv

studiate. Ideea pe care se bazeaz cercetrile bazate pe eantioane este aceea c se pot face aprecieri asupra unei ntregi populaii, n anumite condiii, doar pe baza caracteristicilor msurate pe o parte a acesteia. Exemple: -ntr-un studiu asupra efectelor accesului la internet asupra elevilor de liceu, elevii de liceu reprezint populaia, iar elevii selecionai pentru investigaie, eantionul. -ntr-un studiu care vizeaz influena inteligenei asupra performanei n instruirea de zbor, populaia este reprezentat de toi piloii, iar eantionul, de subiecii inclui n studiu. Dac am reui recoltarea datelor cu privire la ntreaga populaie care face obiectul cercetrii, am putea trage concluzii directe cu privire la aceasta prin utilizarea indicatorilor statistici descriptivi cunoscui (medie, dispersie, abatere standard) numii i parametrii populaiei. Dar acest lucru nu este aproape niciodat posibil i, ca urmare, indicatorii statistici ai eantionului sunt utilizai pentru a face estimri, inferene, cu privire la parametrii populaiei. n esen, a testa o ipotez statistic nseamn a emite concluzii asupra unei populaii pe baza rezultatelor obinute pe un eantion care aparine acelei populaii. n acest context, demersul tiinific presupune urmtorii pai: -formularea problemei cercetrii (sub forma unei ntrebri, cu referire la o anumit populaie); -emiterea unei ipoteze privind cel mai probabil rspuns; -selectarea unui eantion; -aplicarea unei proceduri care sa permit acceptarea sau respingerea ipotezei. Reprezentativitatea eantionului Verificarea statistic a ipotezelor se bazeaz pe o idee simpl: dac avem un eantion a crui alegere respect anumite condiii, extras dintr-o populaie orict de mare, rezultatele obinute pe acesta pot fi extrapolate la ntreaga populaie. Calitatea unui eantion de a permite extinderea concluziilor la ntreaga populaie din care a fost extras se numete reprezentativitate. De fapt, nici un eantion nu poate reprezenta perfect datele populaiei. De aceea reprezentativitatea are o semnificaie relativ. Ca urmare estimrile pe baz de eantion conin ntotdeauna o doz mai mare sau mai mic de eroare. Cu ct eroarea este mai mic, cu att concluziile obinute pe eantion pot fi generalizate mai sigur asupra populaiei. Pentru a permite fundamentarea inferenelor statistice, eantionul trebuie s fie constituit din uniti de informaie (subieci, valori, etc.) independente unele de altele. Independena valorilor se refer la faptul c fiecare valoare (sau unitate experimental) trebuie s fie absolut distinct de celelalte. n esen constituirea unui eantion trebuie s evite efectele unor factori sistematici care s interfereze cu obiectivele studiului, orientnd rezultatele ntr-o anumit direcie (situaie desemnat n limba englez prin termenul de bias). Cteva exemple: Dac msurm timpul de reacie la un numr de cinci subieci, dar facem trei evaluri la fiecare subiect, nu avem eantion de 15 valori independente, deoarece valorile aceluiai subiect au n comun o constant personal care le face dependente una de cealalt. Pentru avea un singur eantion am putea s utilizm media celor trei determinri pentru fiecare subiect. Dac dorim s investigm efectul inteligenei asupra performanei colare trebuie s avem grij s includem n eantion subieci provenind din familii cu un nivel variat al veniturilor, pentru a anihila influena statutului socio-economic asupra performanei colare.

Un

studiu asupra atitudinii fa de utilizarea computerelor n educaie, poate fi influenat n mod sistematic dac eantionul este constituit numai din elevi care utilizeaz frecvent calculatorul. n cazul unui sondaj cu privire la inteniile de vot bazat pe interviul telefonic, vom obine rezultate afectate de starea social a respondenilor (i permit montarea unui telefon) sau de ora apelului (n orele dimineii sunt acas, s zicem, mai multe femei casnice). Este clar de ce modul de constituire a eantionului este decisiv pentru nivelul de reprezentativitate. Esenial n acest caz este asigurarea condiiilor ca acesta s acopere n mod real caracteristicile populaiei, evitndu-se favorizarea sistematic a unor subieci nereprezentativi. Fr a intra n amnunte tehnice cu privire la procedurile de eantionare, iat care sunt cele mai utilizate metode de constituire a eantioanelor: a)Eantionare stratificat multistadial. Populaia se mparte n categorii, fiecare categorie n subcategorii .a.m.d., iar subiecii sunt selecionai aleator la nivelul categoriei de nivelul cel mai sczut. Se obine astfel un eantion care reproduce fidel structura populaiei. b)Eantionare prin clasificare unistadial. Se identific categorii pe un singur nivel iar subiecii se extrag aleator din fiecare categorie. c)Eantionare aleatoare. Subiecii sunt extrai aleator (la ntmplare) din ansamblul populaiei. La ntmplare, nseamn n acest caz utilizarea unei proceduri care asigur fiecrui subiect al populaiei absolut aceleai anse de a fi extras. n acest scop se pot utiliza programe de calculator (de ex. SPSS) sau tabele de numere aleatoare. d)Eantionare pseudo-aleatoare (haphazard, sau de convenien). Sunt utilizai subiecii disponibili. Este cazul cel mai frecvent ntlnit n practic i, dac disponibilitatea nu este afectat de un aspect care s influeneze semnificativ obiectivul cercetrii, atunci reprezentativitatea este acceptabil. n concluzie, presupunnd c am obinut anumite rezultate pe un eantion aleator, raionamentul statistic ne permite s aplicm concluziile la ntreaga populaie din care a fost extras acel eantion. Se impune ns, o precizare clar a populaiei de referin pentru c, dincolo de limitele acesteia, extrapolarea nu este permis. De exemplu, rezultatele unui studiu asupra atitudinii fa de internet efectuat pe un eantion de studeni nu poate fi extrapolat la alte categorii sociale, i nici chiar la alte categorii de studeni, dac n eantionul nostru au intrat numai studeni de la faculti umaniste, s zicem. Distribuia mediei de eantionare Atunci cnd constituim un eantion de studiu nu facem dect s utilizm doar unul dintre eantioanele posibil a fi selecionate (alese, constituite, extrase) din populaia cercetrii. Dac am selecta mai multe eantioane din aceeai populaie, fiecare dintre ele ar fi caracterizat prin indicatori sintetici specifici, vor avea, fiecare, media i abaterea lor standard. Imaginea de mai jos sugereaz situaia descris:

Dac fiecare dintre cele patru eantioane de valori are propria sa medie, atunci distribuia mediilor tuturor eantioanelor extrase se numete distribuia mediei de eantionare sau, mai scurt,

distribuia de eantionare. La rndul ei, distribuia mediilor are i ea o medie, numit medie de eantionare, i care se calculeaz, evident, dup urmtoarea formul:

unde este media populaiei, valorile m sunt mediile fiecrui eantion constituit, iar k este numrul eantioanelor. Dac am extrage toate eantioanele posibile dintr-o populaie, atunci media de eantionare este identic cu media populaiei. Pentru exemplificare, s presupunem c avem o populaie constituit din valorile 1,2,3,4 i s ne propunem constituirea tuturor eantioanelor posibile de cte 3 valori. Tabelul de mai jos ilustreaz aceast situaie: Populaia 1 2 3 4 =2.5 =1.29 Eantioane 1,2,3 1,2,4 3,4,1 2,3,4 Toate eantioanele posibile pentru N=3 Distribuia mediei de eantionare m1=2.00 m2=2.33 m3=2.67 m4=3.00 =10.00 m=10/4=2.5

Aa cum se observ, dac extragem toate eantioanele posibile (n acest caz 4) dintr-o populaie de valori, atunci media mediilor eantioanelor extrase (denumit medie de eantionare) este identic cu media populaiei (n cazul dat: m==2.5). Datele din tabel ne mai arat i faptul c media fiecrui eantion oscileaz (variaz) n jurul mediei de eantionare. De aceea ele pot fi considerate o estimare a acesteia din urm, n ciuda impreciziei pe care o conine fiecare. Aceast imprecizie se numete eroare de estimare. Desigur, exemplul are o valoare de ilustrare teoretic deoarece, n practic, niciodat nu se ajunge la selectarea tuturor eantioanelor posibile dintr-o anumit populaie de valori. mprtierea distribuiei de eantionare (eroarea standard a mediei) Distribuia de eantionare nu are aceeai mprtiere ca i distribuia valorilor individuale ale variabilei de origine. Aceasta pentru c, la nivelul fiecrui eantion, o parte din mprtierea total este absorbit de media fiecrui eantion n parte. Cu ct eantioanele sunt mai mari, cu att media fiecrui eantion tinde s fie mai apropiat de media variabilei originale i, implicit, abaterea standard a distribuiei de eantionare este mai mic prin comparaie cu abaterea standard a variabilei. Exemplu: S considerm populaia valorilor 1,2,3,4,5,6,7,8,9,10, pentru care am calculat =5.5 i =3,0276. Am extras, cu ajutorul unui program statistic, cinci eantioane aleatoare (pentru uurina calculelor, am ales pentru fiecare eantion N=3). Iat cum se prezint mediile i abaterile standard pentru cele cinci eantioane selectate: m1=5.00 s1=5.65 m2=4.5 s2=4.94 m3=4.0 s3=4.24 m4=2.5 s4=2.12 m5=5.5 s5=6.36

n acest exemplu, cele cinci eantioane nu sunt toate, ci doar o parte din eantioanele posibile de 3 valori extrase din populaia cercetat. Media distribuiei de eantionare pentru acest exemplu este:

n ceea ce privete mprtierea distribuiei de eantionare, aceasta este, aa cum am spus, mai mic dect mprtierea variabilei la nivelul ntregii populaii, deoarece o parte a mprtierii generale se concentreaz (se pierde) n media fiecrui eantion extras. Ca urmare, abaterea standard a distribuiei de eantionare este o fraciune din abaterea standard a populaiei, fiind dependent de mrimea eantionului. Mai precis, fr a intra n detalii explicative, abaterea standard a distribuiei de eantionare este egal cu N din abaterea standard a populaiei, unde N este volumul eantionului. Deoarece mprtierea mediei de eantionare arat ct de mult se abat aceste medii de la media populaiei, abaterea standard a mediei de eantionare este denumit eroare standard a mediei i se calculeaz cu formula:

unde sm este eroarea standard a mediei de eantionare, a este abaterea standard a populaiei iar N este volumul eantionului. n cazul distribuiei de mai sus, eroarea standard a mediei este

Pentru c, n mod obinuit, abaterea standard a populaiei nu este cunoscut, eroarea standard a mediei de eantionare se calculeaz utiliznd abaterea standard a eantionului, care reprezint o estimare a mprtierii la nivelul populaiei. Figura de mai jos sugereaz foarte bine modul n care, prin creterea volumului eantionului, media eantionului se apropie tot mai mult de media populaiei, cu alte cuvinte, comport o eroare din ce n ce n mai mic fa de aceasta.

Expresia de eroare standard a mediei poate fi mai greu de neles, dat fiind faptul c este folosit pentru a defini un indicator al mprtierii, n timp ce are n compunere cuvntul medie. Trebuie ns s reinem faptul c acest indicator msoar ct de departe poate fi media unui eantion de media populaiei din care a fost extras. Altfel spus, ct eroare poate conine media unui eantion n estimarea mediei populaiei. Avnd n vederea faptul c la numitor avem o expresie bazat pe N (volumul eantionului), este limpede de ce, cu ct eantionul este mai mare, cu att eroarea standard a mediei este mai mic.

Teorema limitei centrale n exemplele date anterior am extras eantioane din populaii foarte mici de valori. Problema este c, dac am avea populaii att de mici, atunci nu am avea nevoie s facem studii pe baz de eantion, ci am putea investiga fr dificultate ntreaga populaie. n realitate populaiile care fac obiectul de interes al cercetrilor de psihologie sunt prea mari pentru a fi accesibile n ntregimea lor. i chiar dac ar fi accesibile, ar fi prea costisitor s fie investigate integral. n acest caz se pune problema msurii n care putem estima caracteristicile statistice ale distribuiei populaiei (media, abaterea standard) pe baza acelorai indicatori, calculai doar la nivelul unui anumit eantion, selectat pentru studiu. Soluia acestei probleme rezid n teorema limitei centrale2 care certific dou adevruri statistice fundamentale: 1.Cu ct numrul eantioanelor realizate dintr-o populaie (tinznd spre infinit) este mai mare, cu att media distribuiei de eantionare se apropie de media populaiei. 2.Distribuia mediei de eantionare se supune legilor curbei normale, chiar i atunci cnd distribuia variabilei la nivelul ntregii populaii nu are un caracter normal, cu condiia ca volumul eantioanelor s fie suficient de mare. Cu alte cuvinte, distribuia mediei de eantionare se apropie de distribuia normal, cu att mai mult cu ct volumul eantionului este mai mare. Teorema limitei centrale este adevrat n urmtoarele condiii fundamentale: a. eantioanele sunt aleatoare sau neafectate de erori (bias); b. valorile care compun eantioanele sunt independente unele de altele (msurarea unei valori nu este influenat de msurarea altei valori din eantion); c. eantioanele au acelai volum de valori (subieci). Utilitatea teoremei limitei centrale const n faptul c ea permite fundamentarea inferenelor statistice fr a ne preocupa prea mult de forma distribuiei valorilor individuale la nivelul populaiei. Este de ajuns s utilizm un eantion suficient de mare pentru a ne putea asuma presupunerea unei distribuii normale la nivelul mediei de eantionare. ntrebarea care se pune este, ns, ct de mare trebuie s fie un eantion pentru a putea fi considerat suficient de mare ? Fr a intra n amnunte, vom spune c, Pe aceast baz orice eantion avnd cel puin 30 de valori este considerat eantion mare n timp ce orice eantion cu mai puin de 30 de valori este considerat eantion mic. Pentru a nelege mai bine modul n care se distribuie mediile de eantionare vom apela la un set de imagini obinute prin simulare computerizat. Au fost luate n considerare distribuiile a dou variabile. Prima, cea din stnga, nu are un caracter normal n timp ce a doua, din dreapta, are un caracter normal. Pentru fiecare dintre ele au fost simulate distribuii de eantionare pentru eantioane progresive ca volum: 2, 10, 25, 50 sau 100 de valori. Figurile de mai jos ne ajut s desprindem dou concluzii: 1.indiferent de forma distribuiei variabilei, distribuia de eantionare tinde spre curba normal, pe msur ce volumul eantionului crete 2.dac distribuia variabilei la nivelul populaiei este normal, atunci distribuia de eantionare atinge o form normal pentru eantioane de volum mai mic.

Sau teorema limit central.

n stnga, distribuia valorilor individuale (n=1) este una bimodal. Cu toate acestea, pe msur ce se constituie eantioane mai mari i se reprezint grafic mediile acestora, distribuia mediei de eantionare capt o form care se apropie, progresiv, de forma distribuiei normale. n dreapta, unde distribuia valorilor individuale (n=1) este apropiat de forma normal, media de eantionare se apropie de forma normal ncepnd de la eantioane de volum mai mic.

n concluzie, distribuia mediei de eantionare are o evoluie diferit de distribuia valorilor individuale ale unei caracteristici. Chiar i atunci cnd acestea din urm nu se distribuie dup regulile curbei normale, mediile eantioanelor tind spre o distribuiei normal dac volumul lor este suficient de mare. Mrimea eantionului trebuie s fie de cel puin 30 de valori pentru a avea ncredere c teorema limitei centrale se verific. Dar chiar i eantioane de volum mai mic pot avea medii ce se plaseaz pe o distribuie normal, dac provin din populaii normale. Din pcate, forma distribuiei la nivelul populaiei nu este aproape niciodat cunoscut. n acest caz singurul lucru pe care l putem face este s utilizm, ori de cte ori ne putem permite, eantioane mari, adic de cel puin 30 de valori, i chiar mai mari, dac acest lucru este posibil. Cu toate acestea, aa cum vom vedea mai departe, exist soluii statistice i pentru eantioane mai mici de 30 de valori3. Scoruri standardizate z pentru eantioane (grupuri) Ne vom referi acum la exemplul anterior, n care avem cinci eantioane extrase dintr-o populaie de 10 valori. Dac avem media distribuiei de eantionare i abaterea standard a acesteia (calculat ca eroare standard a mediei, cu formula 3.1), atunci putem exprima media unui eantion oarecare, ca scor standardizat z, ntr-o manier similar cu scorul standardizat z pentru o valoare oarecare. Rostul acestei transformri ar fi acela de a vedea n ce msur media eantionului de studiu se ndeprteaz de media populaiei de referin. Cu alte cuvinte, n ce msur rezultatul obinut pe eantion este unul obinuit (mai aproape de media populaiei) sau unul neobinuit (mai ndeprtat de media populaiei). Formula de calcul este foarte asemntoare cu formula lui z pentru valori individuale:
3

Dincolo de aceste considerente teoretice, mrimea eantioanelor utilizate n studiile statistice psihologice face obiectul unor recomandri specifice pentru diferite situaii practice de cercetare. Acestea vor fi prezentate mai trziu.

mediei.

unde m este media eantionului, media populaiei, iar sm este eroarea standard a

Dac presupunem c obiectul studiului l face eantionul 1, atunci putem calcula mai nti eroarea standard a mediei, astfel:

n exemplul nostru, limitat la o populaie cunoscut, am putut calcula abaterea standard a populaiei (=3.02), dar pentru situaii reale, cu populaii nelimitate, acest lucru nu este posibil. n astfel de cazuri se accept faptul c abaterea standard a populaiei este suficient de bine reprezentat de abaterea standard a eantionului extras din aceasta. Ca urmare, dac nu aveam abaterea standard a populaiei, am fi putut utiliza n formula erorii standard a mediei abaterea standard a eantionului (n cazul nostru s1=5.65 n loc de =3.02). Mai departe, scorul standard z pentru eantionul 1, se calculeaz astfel:

Exemplu: S presupunem c, la un examen de cunotine de statistic, o grup de 45 de studeni obine un scor mediu de m=28.5 puncte. Presupunnd c media pe populaia studeneasc care a mai dat acest examen (calculat de-a lungul anilor anteriori) este =27.3, cu o abatere standard =8.2, trebuie s aflm care este performana grupei respective transformat n not z. Calculm mai nti abaterea standard a mediei:

Calculm apoi scorul z pentru grup:

Dac vrem s tim unde se plaseaz performana grupului nostru pe o curb normal, atunci ne uitm pe tabela notelor z i gsim, n dreptul scorului z=0.98, valoarea tabelar 0.3365. Aceasta poate fi interpretat n mai multe feluri. De exemplu, putem spune c procentul performanelor posibile peste nivelul grupului nostru este 50%-33%, adic 17%. Sau, n termeni probabilistici, putem sune i c: probabilitatea de a avea o grup (un eantion, de aceeai mrime) care s obin un scor mai bun la un examen de statistic (cu aceleai ntrebri) este de 0.17.

Ipoteze i decizii statistice. Testul z pentru un singur eantion. S ne imaginm c un psiholog colar i pune ntrebarea dac elevii participani la olimpiadele colare au un nivel de inteligen (QI) superior elevilor n general. Dac acceptm c aceast problema prezint interes din punct din vedere practic-pedagogic sau tiinific, atunci se justific transformarea ei ntr-o problem de cercetare. n esen, aceast problem ar putea fi formulat astfel: Elevii participani la olimpiade sunt mai inteligeni dect toi elevii n general, fie ei participani sau nu la olimpiade?. Ipoteza cercetrii n mod obinuit, o cercetare tiinific se bazeaz pe estimarea unui rezultat ateptat, denumit ipotez. n cazul nostru, psihologul se poate atepta n mod legitim ca participanii la olimpiad s fie mai inteligeni dect elevii n general. Acest rezultat ateptat, prefigurat, se numete ipoteza cercetrii, fiind codificat cu H1. Am putea formaliza ipoteza cercetrii astfel: H1 mpomeg unde mpo reprezint media inteligenei populaiei participanilor la olimpiade, iar meg reprezint media inteligenei populaiei elevilor n general. n conformitate cu ipoteza cercetrii, exist dou populaii distincte sub aspectul nivelului de inteligen, cea a elevilor participani la olimpiade i cea a elevilor n general. Ipoteza statistic (de nul) Avnd n vedere c este imposibil s evalueze inteligena tuturor participanilor la olimpiade, psihologul cercettor trebuie s gseasc un rspuns la problema cercetrii sale cu ajutorul unui eantion. n acest scop, selecteaz la ntmplare, din populaia de participani la olimpiade, un grup de 30 de elevi, crora le aplic un test de inteligen general. S presupunem c analiza rezultatelor indic pentru acest grup o medie a coeficientului de inteligen m=106 i o abatere standard s=7. Amintindu-ne c media valorilor QI la nivelul ntregii populaii este =100 (=15)4, se poate trage concluzia c elevii din populaia de olimpici sunt mai inteligeni dect cei din populaia general de elevi? Aparent diferena de 6 uniti QI n favoarea eantionului cercetrii i-ar ngdui o astfel de concluzie. Rigoarea tiinific l oblig ns s observe c generalizarea mediei eantionului de cercetare asupra ntregii populaii de elevi olimpici comport anumite riscuri. Eantionul cercetrii, compus aleatoriu din elevi participani la olimpiade, nu este dect unul din eantioanele de olimpici care ar fi putut fi selectat. Astfel, faptul c eantionul su are un QI mediu mai mare dect media populaiei se poate ncadra n caracteristica oricrei medii de eantion de a oscila n jurul mediei populaiei din care este extras. Ar fi posibil deci, ca valoarea medie de 106 s fie doar rezultatul hazardului, care face ca mediile eantioanelor extrase din aceeai populaie s varieze n jurul mediei populaiei. Ca urmare, pentru a decide cu privire la ipoteza cercetrii (olimpicii sunt mai inteligeni dect elevii n general) cercettorul trebuie s evalueze probabilitatea ca media eantionului cercetrii s fie rezultatul hazardului de eantionare. Rezult de aici c, pentru a putea afirma c olimpicii sunt mai inteligeni dect media populaiei, cercettorul trebuie s dovedeasc faptul c nivelul de inteligen al eantionului de olimpici este mai mare dect al unui eantion care ar fi fost extras absolut la ntmplare din populaia general de elevi.
4

n realitate, media QI este diferit n funcie de vrst, dar, pentru exemplul nostru, vom accepta c populaia general de elevi are o medie de 100 i o abatere standard de 15.

Procedura statistic care se bazeaz pe acest raionament se numete ipotez de nul (se utilizeaz i alte variante: ipoteza diferenei nule sau, pur si simplu, ipotez statistic). Respingerea ei implic o dovad indirect a validitii ipotezei cercetrii, i se bazeaz pe un scenariu negativ (similar cu a pune rul n fa). Ipoteza de nul se formuleaz ca opusul ipotezei cercetrii. n cazul nostru ipoteza de nul va fi exprimat astfel: participanii la olimpiad nu au o inteligen mai mare dect populaia de elevi n general. Ipoteza de nul este simbolizat cu H0, iar expresia ei formal este: H0 mpo=meg ceea ce semnific faptul c mediile celor dou populaii comparate nu difer, ci sunt egale. Cu alte cuvinte, ipoteza de nul afirm c nu exist dou populaii distincte sub aspectul nivelului de inteligen, ci una singur. Elevii participani la olimpiade nu se deosebesc sub aspectul inteligenei de populaia elevilor n general. Distribuia ipotezei de nul Expresia mpo=meg descrie situaia n care media olimpicilor nu difer de media populaiei generale de elevi, care poate fi definit, din acest motiv, drept populaia diferenei nule sau, mai scurt, populaia de nul. Corespunztor, distribuia mediilor eantioanelor aleatore extrase din populaia de nul se numete distribuia populaiei de nul sau distribuia de nul. Aa cum am spus anterior, extragerea unui numr mare de eantioane (eventual infinit de mare), produce ceea ce se numete distribuia de eantionare, care respect legea curbei normale. Din perspectiva cercetrii statistice, aceasta este chiar distribuia de nul, deoarece ilustreaz forma n care se distribuie mediile tuturor eantioanelor posibile, dac acestea ar fi constituite pe o baz pur ntmpltoare, cu alte cuvinte, exact situaia n care ipoteza de nul ar fi adevrat. Dac avem n vedere eantioane extrase la ntmplare din populaia de nul, atunci, n conformitate cu teorema limitei centrale, mediile acestora se distribuie pe o curb normal. Ca urmare, putem utiliza tabela distribuiei normale standard pentru a rspunde ntrebrilor cu privire la media eantionului de cercetare, n acelai mod n care am fcuto pentru notele z individuale. Dac vrem s tim care este probabilitatea de a obine un rezultat mai bun prin jocul ansei, nu trebuie dect s vedem unde se plaseaz rezultatul cercetrii pe distribuia de nul. Apoi calculm aria de dincolo de acest punct, deoarece aceasta ne arat proporia (probabilitatea) cazurilor n care eantioane de aceeai mrime, selectate la ntmplare din populaia de nul, ar putea avea un QI mediu mai mare dect eantionul de participani la olimpiad. Procedura de calcul a testului z pentru un singur eantion n urma aplicrii testului de inteligen pentru eantionul de participani la olimpiad (N=30) am obinut urmtoarele valori statistice: m=106 i s=7. Ne amintim c media inteligenei populaiei, exprimat n uniti QI, este =100, iar abaterea standard =15. Cu aceste date putem calcula nota z corespunztoare eantionului cercetrii, cu formula:

unde m este media eantionului, este media populaiei, iar sm este eroarea standard a mediei.

Rezultatul calculului este:

n exemplul de mai sus, fiind vorba de o valoare QI, a crei abatere standard la nivelul populaiei ne este cunoscut (am optat pentru =15) i am utilizat-o ca atare. Dac ar fi fost vorba de o variabil pentru care nu cunoteam abaterea standard la nivelul populaiei, am fi putut utiliza aceeai valoare calculat pe eantionul de studiu (s=7). Dac citim frecvena corespunztoare valorii z calculate (2.18) n tabelul distribuiei normale, constatm c ntre media populaiei de nul (z=0) i nivelul inteligenei eantionului de elevi olimpici se afl 48.54% dintre valorile posibile. De aici rezult c exist 50-48.54 adic 1.46% anse (sau o probabilitate p=0.0146) ca hazardul s produc un eantion cu un QI egal sau mai mare dect eantionul cercetrii noastre. Imaginea de mai jos ilustreaz grafic poziia mediei eantionului de cercetare pe distribuia de nul.

Ne putem imagina o situaie n care scorul mediu QI al eantionului de participani la olimpiad este att de mare nct s nu existe nici o ans de a se obine un rezultat mai bun ca urmare a unei selecii ntmpltoare din populaia de nul? Teoretic, acest lucru nu este posibil. Orict de mare ar fi media unui eantion de olimpici, hazardul poate produce un eantion cu medie mai mare din populaia de nul, deoarece curba normal este asimptotic. Exist ns un prag dincolo de care probabilitatea unui eantion aleatoriu din populaia general de elevi cu un QI mai mare dect cel al eantionului de olimpici este att de mic, nct s ne putem permite s o considerm neglijabil. ntr-un asemenea caz, putem concluziona c valoarea calculat pe eantionul cercetrii nu decurge din variaia ntmpltoare a mediei de eantionare, ci provine din aciunea unui factor sistematic care a condus la ndeprtarea semnificativ a mediei eantionului de studiu de media populaiei (n cazul nostru, accesul celor mai inteligeni elevi la olimpiadele colare). Despre pragul evocat mai sus, vom vorbi n continuare. Decizia statistic Urmtorul pas pe care trebuie s l fac cercettorul este acela de a decide dac valoarea medie a eantionului de olimpici decurge din faptul c acetia sunt ntr-adevr mai inteligeni dect elevii n general, sau reprezint rezultatul unui joc al ansei, care a condus la selecia unui eantion ce nu se difereniaz n mod real de populaia de nul. Este evident faptul c, dac media eantionului de olimpici ar fi fost egal cu 100, cercettorul ar fi decis c valoarea nu confirm ipoteza cercetrii. n exemplul dat ns, media eantionului cercetrii fiind mai mare, ne punem problema, ct de mare trebuie s fie diferena fa de media populaiei pentru a accepta c este o diferen real (determinat de un factor de influen, accesul la olimpiad pe baza inteligenei). Altfel spus, trebuie s decidem dac acceptm sau respingem ipoteza de nul. Din pcate, nu exist un criteriu obiectiv de decizie ntr-o situaie de acest gen. Acceptarea sau respingerea ipotezei de nul depinde de gradul de risc pe care suntem dispui s ni-l asumm n acest sens. Este evident c cineva interesat n acceptarea ideii c olimpicii sunt mai inteligeni ar fi dispus s considere c valoarea obinut este suficient de ndeprtat de medie pentru a respinge ipoteza de nul. La fel cum, cineva nencreztor

n aceast ipotez (considernd c efortul de studiu, motivaia, fac diferena dintre participanii i neparticipanii la olimpiadele colare), ar putea fi dispus s impun un prag de respingere mult mai sever. Iat de ce, n practica cercetrii tiinifice s-a impus convenia unui prag maxim de risc acceptat pentru decizia statistic. Acest prag critic se numete nivel alfa () i corespunde probabilitii de 0.05. Pe curba normal z, fiecrei probabiliti i corespunde o anumit valoare z, ca urmare i probabilitii critice alfa i corespunde o valoare critic z. Dat fiind faptul c a nceput prin a fi citit dintr-un tabel, mai este desemnat i ca valoare tabelar. Avem acum toate elementele pentru luarea deciziei statistice n cazul cercetrii noastre, pe baza unui raionament convenional, identic pentru ntreaga comunitate tiinific. Esena acestuia const n comparaia rezultatelor derivate dintr-un context de cercetare cu cele specifice unui context ipotetic, aleatoriu (bazat pe ansa pur), dup cum urmeaz: a. Dac rezultatul calculat pentru eantion este cel puin egal sau mai mare dect scorul critic, atunci avem un rezultat semnificativ al cercetrii. Aceasta, deoarece se accept c ansele ca acest rezultat s fi decurs din ntmplare sunt suficient de mici pentru a fi ignorate. n consecin, ntr-un astfel de caz, ipoteza de nul (H0) se respinge, iar ipoteza cercetrii (H1) se consider confirmat la un prag alfa=0.05 (dac acesta a fost nivelul ales). b. Dac rezultatul eantionului este mai mic dect scorul z critic, atunci avem un rezultat nesemnificativ al cercetrii, prin faptul c exist prea multe anse ca acesta s poat fi obinut n condiii pur aleatoare. n aceast variant, ipoteza de nul se accept, iar ipoteza cercetrii se consider infirmat la un prag alfa=0.05. c. Cele dou reguli decizionale de la punctele a i b sunt exprimate pe baza comparaiei dintre valoarea calculat a testului i valoarea critic tabelar, aferent nivelului alfa. Ele ns pot fi exprimate i direct, prin comparaia probabilitii valorii calculate cu alfa. Singura diferen este dat de faptul c raportul dintre probabilitatea asociat scorului calculat i alfa este invers dect n cazul valorilor. Astfel, ipoteza de nul se admite dac probabilitatea (p) a valorii calculate este mai mare dect alfa, i se respinge dac este egal sau mai mare dect acesta. Aceast precizare, i dovedete utilitatea n momentul n care se utilizeaz programe statistice, care fac inutil consultarea tabelelor distribuiei de nul, deoarece dau direct probabilitatea asociat valorii calculate a testului. Imaginea de mai jos ilustreaz poziia valorii calculate a testului z n raport cu valoarea critic pentru alfa=0.05.

Dat fiind faptul c z calculat (+2.18) este mai mare dect z critic pentru valoarea lui alfa=0.05 (+1.65), decidem respingerea ipotezei de nul5. Ca urmare, n legtur cu studiul nostru demonstrativ, trebuie s decidem respingerea ipotezei de nul (participanii la olimpiade nu sunt mai inteligeni dect elevii n general) ceea ce nseamn, implicit, confirmarea ipotezei de cercetare. (participanii la olimpiade sunt mai inteligeni dect elevii n general). Raionamentul deciziei statistice exemplificat astfel, se va regsi n toate situaiile de testare a ipotezelor statistice cu care ne vom confrunta mai departe, indiferent de modelul de cercetare i de natura relaiei pe care vrem s o demonstrm ntre variabile.

Decizii statistice unilaterale i bilaterale n exemplul nostru, ipoteza cercetrii a fost aceea c elevii participani la olimpiade au o inteligen mai mare dect media populaiei de nul. Din acest motiv, ne-a interesat s vedem n ce msur rezultatul nostru confirm ipoteza pe direcia valorilor din dreapta curbei normale (valori mari, cu z pozitiv). Ca urmare, am efectuat ceea ce se numete un test unilateral (one-tailed). n acest caz, ipoteza c participanii la olimpiadele colare ar putea avea o inteligen sub medie, nu este viabil, dar dac am fi obinut un z negativ pentru eantionul cercetrii, ar fi trebuit s l testm n partea din stnga curbei de distribuie, n aceste dou situaii am fi avut acelai z critic (1.65) cu semnul + sau n funcie de zona scalei pentru care fceam testarea. Imaginea de mai jos ilustreaz grafic cele dou direcii de testare a ipotezelor statistice unilaterale i ariile valorilor semnificative/nesemnificative, n funcie de valoarea critic a lui z.

Ce s-ar fi ntmplat ns dac eantionul cercetrii ar fi obinut un scor QI=94, ceea ce ar fi corespuns unui scor z=-2.18? n acest caz, aplicnd un test unilateral orientat spre valori superioare mediei, conform ipotezei, ar fi trebuit s acceptm ipoteza de nul, concluzionnd c olimpicii nu sunt mai inteligeni dect media, fr a putea emite o concluzie privitoare la faptul c ei sunt, de fapt, mai puin inteligeni, aa cum ar fi cerut-o datele cercetrii. Pentru a elimina acest neajuns putem verifica ipoteza pe ambele laturi ale distribuiei, aplicnd ceea ce se numete un test bilateral (two-tailed). n acest caz se pstreaz acelai nivel alfa (0.05), dar el se distribuie n mod egal pe ambele extreme ale curbei, astfel nct pentru 2.5% de fiecare parte, avem un z critic de 1.96 (cu semnul - sau +). Aceast valoare este luat din tabelul ariei de sub curb, n dreptul probabilitii 0.4750 care corespunde unei probabiliti complementare de 0.025 (echivalent cu 2.5%) 5. Puteam ajunge la aceeai concluzie pe baza faptului c probabilitatea valorii calculate (0.014) este mai mic dect alfa (0.05), dar acest raionament nu este posibil dect atunci cnd utilizm programe specializate de calcul, care ne ofer direct valoarea lui p calculat.

Figura de mai sus indic scorurile critice pentru un test z bilateral. Se observ c n cazul alegerii unui test bilateral (z=1.96) nivelul de 5% se mparte n mod egal ntre cele dou laturi ale curbei. Este de la sine neles faptul c semnificaia statistic este mai greu de atins n cazul unui test bilateral dect n cazul unui test unilateral, deoarece valoarea testului trebuie s fie mai mare de 1.65, ct este n cazul pentru un test unilateral. Alegerea tipului de test, unilateral sau bilateral, este la latitudinea cercettorului.

De regul ns, se prefer testul bilateral, chiar i n situaii de cercetare cum este aceea din exemplul nostru, cnd o diferen negativ fa de media populaiei este improbabil. Motivul l constituie necesitatea de a introduce mai mult rigoare i de a lsa mai puin loc hazardului. Se alege testul unilateral doar atunci cnd suntem interesai de evaluarea semnificaiei strict ntr-o anumit direcie a curbei, sau atunci cnd miza rezultatului este prea mare nct s fie justificat asumarea unui risc sporit de eroare. n mod uzual, ipotezele statistice sunt testate bilateral, chiar dac ipoteza cercetrii este formulat n termeni unilaterali. Testarea unilateral este utilizat numai n mod excepional, n cazuri bine justificate. O scurt discuie pe tema nivelului alfa maxim acceptabil (0.05) se impune, avnd n vedere faptul c ntregul eafodaj al deciziei statistice se sprijin pe acest prag. Vom sublinia, din nou, c p=0.05 este un prag de semnificaie convenional, impus prin consensul cercettorilor din toate domeniile, nu doar n psihologie. Faptul c scorul critic pentru atingerea pragului de semnificaie este 1.96 a jucat, de asemenea, un rol n impunerea acestei convenii. Practic, putem considera c orice ndeprtare mai mare de dou abateri standard de la media populaiei de referin este semnificativ. Chiar dac persist posibiliti de a ne nela, ele sunt suficient de mici pentru a le trece cu vederea. Impunerea unui prag minim de semnificaie a testelor statistice are ns, mai ales, rolul de a garanta faptul c orice concluzie bazat pe date statistice rspunde aceluiai criteriu de exigen, nefiind influenat de subiectivitatea cercettorului. Nivelul alfa de 0.05 nu este dect pragul maxim acceptat. Nimic nu mpiedic un cercettor s i impun un nivel mai exigent pentru testarea ipotezei de nul, ceea e nseamn un prag alfa mai sczut. n practic mai este utilizat pragul de 0.01 i, mai rar, cel de 0.001. Toate aceste praguri pot fi exprimate i n procente, prin opusul lor, care exprim nivelul de ncredere n rezultatul cercetrii. Astfel, printr-o probabilitate de 0.05 se poate nelege i un nivel de ncredere de 95% n rezultatul cercetrii (99%, pentru p=0.01 i, respectiv, 99.9% pentru p=0.001). n fine, este bine s subliniem faptul c utilizarea acestor praguri vine din perioada n care nu existau calculatoare i programe automate de prelucrare statistic. Din acest motiv, cercettorii calculau valoarea testului statistic pe care apoi o comparau cu valori tabelare ale probabilitii de sub curba de referin. Pentru a face mai practice aceste tabele, ele nu cuprindeau toate valorile de sub curb, ci doar o parte dintre acestea, printre ele, desigur, cele care marcau anumite praguri. Rezultatul cercetrii era raportat, de aceea, prin invocarea faptului de a fi sub pragul de semnificaie sau deasupra sa. Odat cu diseminarea pe scar larg a tehnicii de calcul i cu apariia programelor de prelucrri statistice, semnificaia valorilor testelor statistice nu mai este cutat n tabele, ci este calculat direct i exact de ctre program, putnd fi afiat ca atare. De aici, aa cum am mai spus, rezult i posibilitatea de a lua decizia statistic prin compararea direct a valorii calculate a lui p cu pragul alfa critic asumat. Estimarea intervalului de ncredere pentru media populaiei Eantionul cercetrii noastre a obinut medie QI=106, care s-a dovedit semnificativ. Acest lucru nseamn c valorile inteligenei elevilor olimpici fac parte dintr-o populaie special de valori QI, care are o medie mai mare dect media populaiei generale de elevi. Dar ct de mare este aceast medie? Media eantionului cercetrii ne ofer o estimare a acesteia dar, ca orice estimare, conine o anumit imprecizie, exprimat prin eroarea standard a mediei. Nu vom putea ti niciodat cu precizie care este media inteligenei populaiei de elevi olimpici, dar teorema limitei centrale ne permite s calculm, cu o anumit probabilitate, n ce interval se afl ea, pe baza mediei eantionului cercetrii i a erorii standard a acesteia. Acest lucru se bazeaz pe proprietatea curbei normale de a avea un numr bine definit de valori pe un interval simetric n jurul mediei. Astfel, dac lum pe curba normal un interval cuprins ntre z=1.96 de o parte i de alta a mediei, tim c acoperim aproximativ 95% din valorile posibile ale distribuiei. n acest caz, z=1.96 se numete z critic deoarece reprezint un prag limit, pe cele dou laturi ale distribuiei (care, pentru curba normal standardizat, este 0). Alegerea acestor limite pentru z critic este

convenional. Se pot alege, la fel de bine, valori simetrice ale lui z care s cuprind ntre ele 99% sau 99.9% dintre valorile de pe curba normal. Prin consens, ns, se consider c asumarea unui nivel de ncredere de 95% (corespunztor pentru valori critice ale lui z=1.96) este considerat suficient pentru pstrarea unui echilibru ntre precizia estimrii i probabilitatea estimrii. Ca urmare, n aceast condiie, putem spune c exist 95% anse ca, avnd media unui eantion aleator, media populaiei s se afle undeva n intervalul: unde =media populaiei, pe care o cutm m=media eantionului de cercetare zcritic=valoarea corespunztoare pentru alfa ales (de regul 0.05) sm=eroarea standard a mediei n ce privete eroarea standard a mediei, aceasta este dat de raportul dintre abaterea standard a populaiei, pe care n acest caz o cunoatem (15) i radical din volumul eantionului:

Mai departe, utiliznd formula 3.3 pentru datele eantionului cercetrii, limitele de ncredere pentru media populaiei mediei pot fi calculate astfel: pentru limita inferioar = 106-1.96*2.74 = 100.62 pentru limita superioar = 106 +1.96 * 2.74 = 111.37 Ca urmare, putem afirma, cu o probabilitate de 95%, c media real a populaiei de elevi olimpici, estimat prin media eantionului cercetrii, se afl undeva ntre 100.6 i 111.3. Acest interval a crui limit inferioar este foarte aproape de media populaiei generale de valori QI (100), ne arat c, dei semnificativ, diferena eantionului nostru nu are o valoare foarte ridicat. Trebuie s observm, de asemenea, c mrimea intervalului de ncredere rezult din imprecizia mediei, exprimat prin eroarea standard a mediei. Acesta, la rndul ei, este cu att mai mare cu ct volumul eantionului este mai mic. Desigur, cu ct limitele intervalului de estimare sunt mai apropiate de media eantionului, cu att aceasta din urm estimeaz mai precis media populaiei i prezint mai mult ncredere. Testul t (Student) pentru un singur eantion Aa cum am precizat mai sus, testul z poate fi utilizat doar atunci cnd cunoatem media populaiei de referin i avem la dispoziie un eantion mare (adic de cel puin 30 de subieci, n cazul unei variabile despre care avem motive s credem c se distribuie normal). Dar nu ntotdeauna putem avea la dispoziie eantioane mari (minim 30 de subieci). Pentru situaiile care nu corespund acestei condiii, testul z nu poate fi aplicat. i aceasta, pentru c distribuia mediei de eantionare urmeaz legea curbei normale standardizate doar pentru eantioane de minim 30 de subieci, conform teoremei limitei centrale. La nceputul secolului XX, William Gosset, angajat al unei companii productoare de bere din SUA, trebuia s testeze calitatea unor eantioane de bere pentru a trage concluzii asupra ntregii arje. Din considerente practice, el nu putea utiliza dect eantioane (cantiti) mici de bere. Pentru a rezolva problema, a dezvoltat un model teoretic propriu, bazat pe un tip special de distribuie, denumit distribuie t, cunoscut ns i ca distribuia Student, dup pseudonimul cu care a semnat articolul n care i-a expus

modelul.

n esen, distribuia t este o distribuie teoretic care are toate caracteristicile unei distribuii normale (este perfect simetric i are form de clopot). Specificul acestei distribuii const n faptul c forma ei (mai exact, nlimea) depinde de un parametru denumit grade de libertate (df sau degrees of freedom), care este egal cu N-1 (unde N este volumul eantionului). Acest parametru poate fi orice numr mai mare dect 0, iar mrimea lui este aceea care definete forma exact a curbei i, implicit, proporia valorilor de sub curb ntre diferite puncte ale acesteia. Imaginea de mai jos ilustreaz modul de variaie a nlimii distribuiei t, n funcie de gradele de libertate.

Aa cum se observ, curba devine din ce n ce mai aplatizat pe msur ce df (volumul eantionului) este mai mic. Acest fapt are drept consecin existena unui numr mai mare de valori spre extremele distribuiei. Nu este ns greu de observat c, pe msur ce df este mai mare, distribuia t se apropie de o distribuie normal standard astfel nct, pentru valori ale lui N de peste 31 (df=30), aria de sub curba distribuiei t se apropie foarte mult de valorile de sub aria curbei normale standard (z), iar scorul critic pentru t este acelai ca i cel pentru z pe curba normal (1.96). Din cele spuse rezult c, dac avem un eantion de volum mic (N<30), vom utiliza testul t n loc de testul z, pe baza unei formule asemntoare:

unde:

m este media eantionului este media populaiei sm este eroarea standard a mediei

Interpretarea valorii lui t se face n mod similar cu cea pentru valoarea lui z, cu deosebirea c se utilizeaz tabelul distributiei t (Anexa 2). n acest caz, valorile critice ale lui t vor fi diferite n funcie de numrul de grade de libertate. Citind tabelul, se observ c pragurile critice ale lui t (subnelegnd alfa=0.05, pentru test bilateral) se plaseaz la valori diferite n funcie de nivelul df. n acelai timp, dac df este mare (peste 30), valorile tabelare ale lui t se apropie de cele ale lui z. La infinit, ele sunt identice (1.96, la fel ca i n cazul valorilor lui z). Date fiind caracteristicile enunate, n practic, testul t se poate utiliza i pentru eantioane mari (N30). n nici un caz ns, nu poate fi utilizat testul z pentru eantioane mici (N<30). Utilizarea testului bazat pe un singur eantion (fie z sau t) depinde ntr-o msur decisiv de asigurarea caracteristicii aleatoare a eantionului. Publicarea rezultatelor testului z sau t Publicarea rezultatelor diferitelor proceduri statistice trebuie fcut astfel nct cititorii s i poat face o imagine corect i complet asupra rezultatelor. n acest scop la publicarea rezultatelor trebuie respectate anumite reguli, la care vom face trimitere n continuare, n legtur cu fiecare nou test statistic ce va fi introdus.

n principiu, publicarea rezultatelor unui test statistic se poate face n dou moduri: sintetic (de regul sub form tabelar), atunci cnd numrul variabilelor testate este relativ mare; narativ, atunci cnd se refer, s zicem, la o singur variabil. n cazul testului pentru un singur eantion se vor raporta: media eantionului, media populaiei, valoarea lui z (sau t), nivelul lui p, tipul de test (unilateral/bilateral). Dac avem n vedere rezultatele obinute pe exemplul de mai sus, se apeleaz la o raportare de tip narativ, care poate utiliza o formulare n maniera urmtoare: Eantionul de elevi participani la olimpiade a obinut un scor (QI=106; 95%CI: 100.6-111.3) peste media populaiei generale (QI=100). Testul z, cu alfa 0.05, a demonstrat c diferena nu este semnificativ statistic, z=+2.13, p>0.05, unilateral. n acest exemplu de prezentare nu formularea ca atare este esenial, ci informaiile asociate publicrii testului z. Formularea poate diferi de cea enunat, dar elementele informaionale trebuie s fie complete. Expresia 95%CI vine de la 95% Confidence Interval i exprim intervalul de ncredere pentru media populaiei. Aa cum am spus mai sus, utilizarea programelor statistice ofer pentru orice valoare a lui z (sau oricare alt test statistic) valoarea exact a lui p. Ea poate fi utilizat ca atare, pstrnd ns raportarea acesteia la pragul de semnificaie. Orice valoare a lui p mai mare de 0.05 este considerat nesemnificativ6, dac nu a fost fixat un alt prag, mai sever. --6

Programele de prelucrri statistice utilizeaz termenul Sig. (de la significance n loc de p. Ele sunt strict echivalente.

UN EXEMPLU DE STUDIU BAZAT PE TESTUL z(t) Aa cum am precizat deja, testul z sau testul t(Anexa 2) pentru un singur eantion (comparat cu populaia de referin) sunt teste statistice destul de rar utilizate n practic, deoarece rareori cunoatem parametrii populaiei (medie, abatere standard). Vom prelua aici un studiu efectuat de Sara Tonin, (B.H. Cohen, op.cit., p. 205) cu privire la relaia dintre depresia de lung durat (cronic) i nlime. Ipoteza cercetrii, bazat pe experien i observaie ndelungat, a fost aceea c femeile care sufer de depresie cronic sunt mai scunde dect cele care nu prezint aceast suferin psihic. n acest caz, ipoteza statistic (de nul sau a diferenei nule) este c nu exist nici o diferen de nlime ntre femeile care sufer i cele care nu sufer de depresie cronic. n primul rnd, este necesar luarea n considerare a mediei populaiei feminine. Aceasta a fost luat din studii de antropometrie, fiind: =165 cm. n faza urmtoare cercettoarea a ales valoarea lui =0,05. A decis s utilizeze un test de tip bilateral (aceasta pentru a acoperi i eventualitatea c femeile depresive sunt chiar mai nalte dect cele care nu sufer de depresie). n acest caz, pentru a afla valorile critice ale lui z, a mprit la 2 (0.05/2=0.025 ceea ce, transformat n procente de sub curb, nseamn 2.5%). A sczut 50-2.5=47.5% pentru a gsi procentul corespunztor lui z critic, pe care l-a citit din tabel, aa cum se vede n imaginea de mai jos: zcritic=1.96. Fiind vorba de un test bilateral, exist de fapt dou valori pentru z critic, una cu plus i una cu minus, pentru fiecare dintre cele dou extreme ale curbei (zcritic=1.96). n continuare, cercettoarea a selectat un eantion aleator de femei cu depresie cronic (N=30), pentru care a calculat nlimea medie: m=160 cm i abaterea standard s=7.62. n final, a calculat valoarea lui z:

Pentru c abaterea standard a populaiei nu a fost cunoscut, a utilizat abaterea standard a eantionului pentru aproximarea acesteia. Valoarea calculat a lui z este -3.59, adic este mai mare (n valoare absolut) dect 1.96, ct era valoarea critic pentru z. n concluzie, se poate respinge ipoteza de nul i, ca urmare, ipoteza cercetrii este acceptat. Femeile depresive cronic sunt, statistic vorbind, mai scunde dect cele fr probleme depresive. Acest rezultat nu permite tragerea unei concluzii ferme cu privire la relaia direct ntre nlime i nivelul depresiei. Nu este exclus ca nlimea s joace un anumit rol n echilibrul vieii de relaie, dar la fel de posibil ar fi ca nlimea s fie determinat de anumii factori fiziologici care, abia ei, s aib o legtur direct cu depresia.

EXERCIII 1.S presupunem c media populaiei pentru o scal de anxietate este =40. Dup un cutremur puternic se obin urmtoarele scoruri pe un eantion de subieci care se adreseaz unui cabinet de psihologie clinic: 62, 49, 44, 46, 48, 52, 57, 51, 44, 47. -Testai ipoteza conform creia nivelul anxietii este influenat de cutremur. (=0,05, bilateral). -Calculai intervalul de ncredere pentru media populaiei (95%). 2.Scorurile obinute la o scal de satisfacie profesional de ctre angajaii unui compartiment dintr-o companie privat sunt urmtoarele: 10, 12, 15, 11, 10, 22, 14, 19, 18, 17, 25, 9, 12, 16, 17. Scala a fost aplicat ntregului personal al companiei (=13 i =4) -Este nivelul de satisfacie al compartimentului respectiv semnificativ mai mic dect satisfacia la nivelul ntregii companii? (pentru alfa=0.01)
Anexa 2.Tabelul valorilor critice pentru distribuia t Student (bilateral)

Df(Na = 6,10 1) 1 3,078 2 1,886 3 1,638 4 1.&3 5 1,476 6 1,440 7 1,415 8 1,397 9 1.383 10 1,372 11 1,363 12 1,356 13 1,350 14 1,345 15 1,341 16 1,337

a = 0,05

a= a= a = 0,01 a = 0,005 0,025 0,0005 6,314 12,706 31,821 63,657 636,620 2,920 4,303 6,965 9,925 31,598 2,353 3,182 4,541 5,841 12,924 2,132 2,776 3,747 4,604 8,610 2,015 2.571 3,365 4,032 6,869 1,943 2,447 3,143 3,707 5,959 1,895 2,365 2,998 3,499 5,408 1,860 2,306 2,896 3,355 5,041 1,833 2,262 2,821 3,250 4,781 1,812 2,228 2,764 3,169 4,587 1,796 . 2,201 2.718 3,106 4,437 1,782 2,179 2,681 3,055 4,318 1,771 2,160 2,650 3,102 4,221 1,760 2,145 2,624 2,977 4,140 1,753 2,131 2,602 2,947 4,073 1,746 2,120 2,583 2,921 4.015

17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120

1,333 1,330 1,328 1,325 1,323 1,321 1,319 1,318 1,316 1,315 1,314 1,313 1,311 1,310 1,303 1,2% 1,289 1,282

1,740 1,734 1,729 1,725 1,721 1.717 1,714 1,711 1,708 1,706 1,703 1,701 1,699 1.697 1,684 1,671 1,658 1,645

2,110 2,101 2,093 2,086 2,080 2,074 2,069 2.064 2,060 2,056 2,052 2.04 2,045 2,042 2,021 2,000 1,980 1.960

2,567 2,552 2,539 2,528 2,528 2,508 2,500 2,492 2,485 2,479 2.473 2.467 2.462 2.457 2,423 2.390 2,358 2,326

2,898 2,878 2,861 2,845 2,831 2,819 2.807 2.797 2.787 2.779 2,771 2,763 2,756 2,750 2,704 2,660 2,617 2,576

3,965 3.922 3,883 3,850 3.819 3,792 3,767 3,745 3,725 3,707 3.690 3,674 3,659 3,646 3,551 3,460 3,373 3,291