Professional Documents
Culture Documents
Potreba za parcijalnom korelacijom javlja se u situacijama kada znamo da stvarna korelacija moe biti iskrivljena ako u jednoj ili u obe varijable skupljamo zajedno skupine koje imaju razliite AS-e. Tada nam parcijalna korelacija omoguava da doemo do istog rezultata bez frakcionisanja podataka u homogene grupe (tako to drimo konstantnim varijable koje nam smetaju). Dakle, koeficijent parcijalne korelacije pokazuje kolika bi bila korelacija izmeu dve varijable kada na njihovo zajedniko variranje ne bi uticala trea (ili vie varijabli). Ako se dri konstantnom samo jedna varijabla, tada se govori o parcijalnoj korelaciji prvog reda, ako se dre konstantnim dve ili vie varijabli onda je to parcijalna korelacija drugog reda ili viestruka korelacija. Delovi varijabli koji se prepokrivaju predstavljaju kovarijansu. Parcijalna korelacija bie to vea to je njihova varijansa vea, tj. to je moderator varijabla manja, odnosno to je vea korelacija izmeu varijabli i manja njihova korelacija sa treom varijablom. Znaajnost parcijalne korelacije se proverava t-testom uz stepene slobode N=3.
- u ovom sluaju parcijalna korelacija je jednaka jednostavnoj korelaciji tj. moderatora nema
- parcijalna korelacije je 0, jer sve to V1 i V2 imaju je ono to prepokriva moderator varijabla tj. nemamo dokaza da su povezane V1 i V2 iako je r visok jer njihova kovarijansa pripada moderatoru
a, b, c.... - povrine koje predstavljaju odnos kovarijanse i umnoaka dveju varijansi b - prostor prekrivanja izmeu V1 i V2 f - prostor koji V1 i V2 dele sa treom varijablom koju hoemo da otklonimo. r12 - koeficijent povezanosti V1 i V2 je ono to je samo njima zajedniko V3 - varijabla koju hoemo da parcijalizujemo, i stavimo pod kontrolu
Na je zadatak da utvrdimo parcijalnu korelaciju izmeu V1 i V2 i da uklonimo ono to je deo kovarijanse ovih varijabli a pripada treoj varijabli, tj. moguem moderatoru. r12 = fb / abef x bcfg = kovarijansa / umnoak varijanse (koef. jednostavne korelacije) r12.3 = b / ab x bc (koef. parcijalne korelacije, teorijska formula) r12.3 = r12 - r13 r23 / 1 - r132 x 1 - r232 (koef. parc. korelacije, kalkulaciona formula) Primer: Primer korelacije izmeu broja izostanaka sa posla i veliine plate. Javlja se sta kao moderator varijabla. Jednostavna korelacija daje meru prividne povezanosti (radnici koji vie izostaju imaju i vee plate). Stvarna povezanost j euoljiva samo iz parcijalne korelacije (visina plate i izostajanje su u stvari u obrnutoj korelaciji). r12 mera povezanosti (udeo svih zajednikih elemenata) r12.3 mera ekskluzivne povezanosti (udeo specifinih, samo njima svojstvenih elemenata). Ako deluju moderatori onda je ona mera stvarne povezanosti.
r122 - koeficijent viestruke determinacije (D), oznaava proporciju varijanse, procenu zajednikih faktora.
1 - r122 - koeficijent nondeterminacije, preostali procenat varijanse koji tek treba objasniti.
8. Supresorske varijable
Supresor varijabla je varijabla (test, prediktor) koja poveava prognostiku valjanost nekog skupa varijabli (npr. baterije testova) supresijom nevalidne varijable iz istog skupa. Supresorsorske varijable nisu u korelaciji sa kriterijem, ali je zato u korelaciji sa varijablom iji je supresor. Ona otklanja nevalidni, neeljeni deo varijanse prediktora i time poboljava predikciju (merenjem nevalidnog dela vaijanse i ukljuivanjem u bateriju ponitava se njegov neeljeni uinak). Za ispitivanje supresor efekta potrebno je raditi backward regresijsku analizu. R = b / ab x bcd - otklonivi d smanjili smo vrednost umnoka ali poveali vrednost r12.3
Supresor varijabla kao prediktor doprinosi prognozi samo time to potiskuje, tj. suprimira nepoeljni deo varijanse drugih prediktora. Ipak u konkretnim primerima, ovo je nejasan odnos. Ne moe se nai pravi primer za supresore. Primer: Profesor je u nekom odnosu sa svojim studentima. Profesor ima enu, koja, ako se pojavi pred studentima, iako nije ni u kakvoj vezi s njima, menja odnos izmeu profesora i studenata. Dejstvo supresor varijabli je teko objanjiv fenomen, odnosno teko je objasniti zato neke varijable neoekivano uspostave odnose sa kriterijumom.
Zadatak viestruke regresione analize je da na osnovu empirijskih podataka uzorka otkrije onaj poloaj regresione ravni u trodimenzionalnom koordinatnom sistemu koji pokazuje najmanje odstupanje regresionih taaka. Dakle, i ovde se primenjuje metod najmanjih kvadrata da bi se minimizirala odstupanja taaka od ravni, s tim da je cilj metoda najmanjih kvadrata odreivanje sume reziduala (e), odnosno odstupanja predvienih vrednosti od empirijski dobijenih vrednosti zavisne varijable (Y-). Jednaina specifikacije viestruke regresije poput prostog linearnog regresionog modela, sastoji se iz dva aditivna dela: a) deterministikog - pokazuje prosean uticaj NV (prediktorskih) varijabli na ZV b) stohastikog - pokazuje efekte ostalih faktora koje je nemogue identifikovati i objasniti regresionim modelom Y = 0 + 1X1 + 2X2 + 3X3 + ...... + kX3 + e
deterministiki stohastiki (rezidual)
0, 1, 2, 3, - parametri modela
e - stohastiki lan (sluajna greka)
Navedeni model, kompozit, odnosi se na zakonitosti koje vladaju u populaciji. Meutim, obzirom da se u istraivanjima prevashodno operie uzorkom i na osnovu njega vri ocena parametara osnovnog skupa, tako se i navedeni parametri regresije u realnom istraivanju zamenjuju svojim ocenama (b0, b1 i b2), a u raunsku proceduru ukljuuje se kao kompletan kompozit samo deterministiki deo modela: Y = b0 + b1X1 + b2X2 Kada je u pitanju ocenjivanje reprezentativnosti modela viestruke regresije od znaaja su 2 mere: prva je apsolutna i zove se standardna greka, a druga je relativna i zove se koeficijent determinacije multiple regresije, a obe se objanjavaju razlaganjem ukupnog varijabiliteta na objanjeni i neobjanjeni deo (tj. njihovim odnososm), tako da se i ovde razlikuju 3 tipa varijabiliteta: a) ukupni (totalni) - izraunava se kao suma kvadrata odstupanja empirijskih vrednosti od AS ZV b) objanjeni (regresioni) - izraunava se kao suma kvadrata odstupanja predvienih vrednosti od AS ZV c) neobjanjeni (rezidualni) - izraunava se kao suma odstupanja empirijskih od predvienih vrednosti Standardna greka regresije (kao apsolutna mera) objanjava se pomou neobjanjene sume kvadrata, preko rezidualne varijanse, tj. kao njen kvadratni koren. Varijansa se odreuje iz odnosa varijabiliteta i odgovarajueg broja stepeni slobode: S = S2 = (Y-)2 / N-3 pri emu je ovde: df = N - (k+1) gde je N - broj ispitanika, a k - NV Koeficijent viestruke determinacije, kao relativna mera, objanjava se uporeivanjem ukupnog i objanjenog varijabiliteta. Prednosti Koeficijenta determinacije R su u tome to je dobar pokazatelj povezanosti, ijom se primenom ne trai puno raunanja i ne vri mnogo nasilja nad podacima, a zahtev za predvianjem ini ga popularnim. S druge strane, nedostaci koeficijenta determinacije R su u tome to zavisi od veliine uzorka i broja NV, zbog ega je neophodno izvriti korekciju dobijenog R u odnosu na veliinu uzorka i broj NV, primenom formule za korigovani (prilagoeni, adjusted) koeficijent viestruke determinacije (RA2). Naime, ukoliko je broj ispitanika u uzorku mali, a posmatra se veliki broj NV, vrednost R se pribliava 1 ak i ako one pojedinano ne utiu na ZV, a ukljuivanjem nove NV u regresioni model, R se jo poveava, bez obzira na njen stvarni uticaj
koje su nam potrebne za izraunavanje parametara regresije, odnosno njihovih ocena, b1 i b2, a potom i vrednost za konstantu b0. Interpretacijom rezultata objanjavamo ta znae izraunati koeficijenti: b0 - regresioni koeficijent (ponder) koji odreuje taku u kojoj regresiona ravan see Y-osu, pa se otuda naziva i odseak (intercept); ovaj koeficijent je konstanta koja ima funkciju da obezbedi da AS predviene vrednosti ZV odgovara AS ostvarene vrednosti ZV b1 - regresioni koeficijent (ponder) koji pokazuje za koliko se jedinica promeni ZV ako na nju deluje samo prva prva NV, pri emu se efekti druge NV dre konstantnim b2 - regresioni koeficijent (ponder) koji pokazuje za koliko se jedinica promeni ZV ako na nju deluje samo druga NV, pri emu se efekti prve NV dre konstantn. U interpretaciji rezultata naroito je znaajan R, koeficijent determinacije viestruke regresije koji se dobija kvantifikovanjem udela objanjenog (regresionog) u ukupnom (totalnom) varijabilitetu: R2 = objanjeni varijabilitet / ukupni varijabilitet = (-MY)2 / (Y-MY)2 R obezbeuje najviu moguu korelaciju pomou datih prediuktora jer svakom prediktoru dodeljuje vanost (-ponder) u skaldu sa njegovim doprinosom prognozi kriterijuma
Na primer, za predvianje uspeha u koli, na fakultetu ili nekom konkretnom poslu koritiemo odreenu bateriju testova koja se moe sastojati od testa znanja, uspeha, prethodnih godina kolovanja, kratkih pitanja na intervjuu, iq-testq, itd., ali nam je za dobru prognozu vano da znamo koji nam je broj testova optimalan. Najee je to 3-5 prediktora, a 4 je optimalno. Na grafikom prikazu, poveanje vrednosti R za odreen broj prediktora prikazan je krivom negativne akceleracije, koja pokazuje da posle odreenog optimalnog broja prediktora poveanje njihovog broja gubi smisao.
Analiza varijanse je statistiki postupak koji se upotrebljava za utvrivanje znaajnosti razlika izmeu nekoliko aritmetikih sredina. Uporeivanjem razliitih komponenti varijanse utvruje se moe li se varijabilitet rezultata koji su dobijeni u razliitim eksperimentalnim situacijama smatrati sluajnim varijabilitetom ili se moe pripisati specifinom uticaju nezavisne varijable. Razlikujemo jednostavnu tj. jednosmernu i sloenu tj. dvosmernu ili viesmernu analizu varijnase. Osnovni model jednosmerne analize varijanse primenjuje se na rezultate u 1 ZV dobijene u eksperimentu s 1 NV koja ima vie nivoa (vie eksperimentalnih situacija) koje se meusobno razlikuju kvantitativno, odnosno kvalitativno. Analiza varijanse se zapravo sastoji u tome da se varijabilitet* svih dobijenih rezultata rastavi na delove od kojih je sastavljen, odnosno na varijabilitet unutar grupa (SSwg) i varijabilitet izmeu grupa (SSbg), pri emu se oni stavljaju u odnos (SSbg/SSwg) *varijabilitet - odstupanja rezultata od ar. sred. ili neke mere proseka SSbg - suma kvadrata odstupanja Mg i Mtot SSwg - suma kvadrata odstupanja pojedinanih rezultata ispitanika X i Mg. Osnovna misao koju sadri analiza varijanse je da treba dokazati da li je varijabilitet meu grupama vei od varijabiliteta unutar grupa. a) Ako je varijabilitet meu grupama znaajno vei od varijabiliteta unutar grupa, moemo smatrati da su to grupe koje ne pripadaju istoj populaciji.
b) Ako svaka grupa posebno varira vie nego to variraju ar. sredine tih grupa, moemo pretpostaviti da sve te grupe pripadaju istoj populaciji.
1. meugrupnog - predstavljen meugrupnom varijansom (MSbg) koja se dobija tako to se suma rastojanja AS grupa od totalne AS koja su kvadrirana i pomnoena sa brojem rezultata u grupi (N g), podeli brojem stepeni slobode (dfbg), a on se dobija tako to se od broja grupa (k) oduzme 1 : MSbg = SSbg / dfbg SSbg = [ Ng( ASg AStot)2 ] dfbg = k -1 2. unutargrupnog - predstavljen unutargrupnom varijansom (MSwg) koja je slina standardnoj devijaciji u smislu da ona isto pokuava da priblino predstavi rasprenje populacije. Dobija se tako to se suma kvadriranih rastojanja svakog pojedinanog rezultata od AS pripadajue grupe podeli brojem stepeni slobode (dfwg), a on se dobija tako to se od ukupnog broja rezultata (N)oduzme broj grupa (k): MSwg = SSwg / dfwg SSwg = (X - ASg)2 dfwg = Ntot - k Ove 2 komponente su kljune u jednosmernoj analizi varijanse, a njima pokuavamo da odredimo meusobno rastojanje grupa na kontinuumu odreenih vrednosti. Ako se ASg mnogo manje raspruju od AStot nego to se pojedinani rezultati raspruju od svojih ASg, moemo pretpostaviti da su sve grupe iz iste populacije. Pogledamo li poloaj nekog pojedinanog rezultata u masi drugih rezultata i drugih grupa, moemo ustanoviti da se njegov varijabilitet, tj. njegovo odstupanje od AStot moe podeliti na dve komponente: a) odstupanje tog rezultata od ASg,, tj. unutargrupni varijabilitet b) odstupanje ASg kojoj pripada taj rezultat od AStot, meugrupni varijabilitet, a dokaz toga je da je suma ove dve komponente jednaka odstupanju tog pojedinog rezultata od AStot
18. Testiranje znaajnosti razlika izmeu vie od dve aritmetike sredine: F-test
Testiranje statistiki znaajne razlike izmeu vie od 2 AS vri se primenom F-testa koji stavlja u odos meugrupnu i unutargrupnu varijansu: F = MSbg / MSwg. Pri tom, vano je obratiti panju na injenicu da grupe rezultata ije AS poredimo mogu imati razliit broj rezultata, to moe da utie na vrednost F-odnosa. Da F-test ne bi varirao i da bi bio adekvatno ponderisao rezultate, meugrupne i unutargrupne sume kvadrata odstupanja delimo odgovarajuim brojem stepeni slobode ime dobijamo srednje kvadrate varijansi (MSbg i MSwg) koji su uporedljivi odnosno primenljivi za F-test.. MSbg tretiramo kao objanjenu varijansu (objanjenu nezavisnom varijablom), a MSwg kao neobjanjenu varijansu (tj. kao greku). Kada utvrdimo da je varijabilitet meu grupama vei od varijabiliteta unutar grupa treba da ustanovimo da li je njihova razlika znaajna, a to inimo tako to vrednost dobijenog F-odnosa uporedimo sa brojem koji emo oitati u Snedekerovoj F-tablici pomou pripadajuih stepeni slobode, pri emu su vrednosti date u ovoj tablici date na nivou znaajnosti 0.05 (dfbg = k -1, dfwg = Ntot k; u F-tablici dfbg - gore; dfwg - levo). Ukoliko je F vrednost vea od one iz tablice, znai da je F-test znaajan tj. da postoji statistiki znaajna razlika izmeu AS grupa. Ako je F-test znaajan onda svi uzorci (grupe) nisu iz iste populacije, a ako F-test nije znaajan onda svi uzorci jesu iz iste populacije.
ako je F-test znaajan izmeu ove dve ASg ova dva uzorka nisu iz iste populacije sigurno postoje znaajne razlike Kao i kod T-testa, F-test je znaajniji to su : a) razlike izmeu ASg vee (tj. to su grupe meussobno udaljenije) b) standardne devijacije grupa (tj. varijanse) manje F-vrednost nikada ne moe biti negativna, ali moe biti jednaka nuli, to se deava u sluaju kada su sve ASg jedake, tj. ne postoji meusobna varijansa (ako k = 4, onda ASg1 = ASg2 = ASg3 = ASg4). Za razliku od normalne raspodele, distribucija F-izraza nije simetrina, ve je manje ili vie asimetrina nadesno, tj pozitivno zakoena, jer ima vie niih rezultata.. to je broj uzoraka vei, ova e se distribucija vie pribliavati normalnoj raspodeli, ali nikada joj nee biti jednaka, tj. uvek ostaje pozitivno zakrivljena.
Uslovi za primenu F-testa: 1. Homogenost varijanse (homoskedascitet) - najee se testira Levenovim testom, ali moe i Cochranovim Ili Bartletovim testom 2. Da su podaci na ZV bar sa intervalnog nivoa merenja a NV mora biti kategorijalnog tipa, odnosno podaci mogu biti i sa intervalnog ili racio nivoa, ali da je varijabla diskretna 3. Da distribucija ZV u svakom poduzorku treba biti normalno distribuirana 4. Poduzorci moraju biti izabrani nezavisnim sluajnim biranjem (u praksi se ovo retko deava jer je skupo) 5. Efekti uticaja NV i greke na ZV su meusobno nezavisni ili aditivni, to omoguava da se ukupni varijabilitet (SStot) podeli na dve aditivne meusobno nepkrivajue komponente: a) varijabilitet koji je posledica delovanja NV tj. faktora (SSbg) b) varijabilitet greke (SSwg)
19. Testiranje znaajnosti razlika izmeu parova aritmetikih sredina u analizi varijanse: testovi kontrastiranja
Ako analiza varijanse pokae da moemo smatrati da svi uzorci potiu iz iste populacije (tj. ako F-test nije statistiki znaajan), onda nas dalje ne zanimaju pojedinane razlike izmeu nekih ASg. Ali, ako je F-test znaajan, pa odbaci nultu hipotezu, tj. ako dokaemo da uzorci ne pripadaju istoj populaciji, esto nas moe zanimati koji se uzorci meu sobom statistiki znaajno razlikuju. Tada primenjujemo neki od testova kontrastiranja, koji nam omoguavaju da sagledamo odnos u celini i reguliemo nacrt merenja u eksperimentu. Postoji vie testova kontrastiranja (Scheffeov, Tuckyev, Duncanov, LSD...) koji se meusobno razlikuju: - prema rigoroznosti u odnosu greku tipa I - prema tome da li primenjuju a priori ili a posteriori postupke za raunanje statistike znaajnosti izmeu 2 po 2 AS, u zavisnosti od toga da li se poreenje vree pre ili posle rauna analize varijanse - odnosno, prema tome da li su planski ili neplanski, tj. da li doputaju planirano poreenje (npr.najmanje i najvee razlike) ili neplansko poreenje (svake sa svakom) U vezi sa ovim testovima bitno je istai da bez obzira koliko parova uzimamo, rizik od greke ostaje isti. Po pitanju rigoroznosti u odnosu na greku tipa I, najrigorozniji test je Scheffeov test koji uzima blai nivo znaajnosti (p = 0.1), pa e se njegovom primenom ree dogoditi da utvrdimo da je razlika statistiki znaajna, odnosno ee emo prihvatiti nultu hipotezu iako razlika meu populacijama postoji. Ovaj test je u prednosti nad drugim testovima naroito u situacijama kada su nejednaki N-ovi grupa (uzoraka).
rauna se vie F-testova, jedan za jednu NV, tj. za prvi glavni faktor ili faktor A, drugi F-test za drugu NV, i trei F-test za efekat njihove interakcije.
glavni efekat
jednostavan efekat
ef. interak.
br = npr. pol
r x k = interakcija 2 faktora
wc = within cells
Uslovi za primenu: - normalnost distribucije ZV za svaku kombinaciju kategorija NV, to znai da NV moe biti u kategorijalnom oblik 8sa intervalnog ili racio nivoa, ali diskretna) - homogenost varijanse za svaku kombinaciju kategorija - neponovljivost oba faktora ( u smislu da jedan ispitanik sme biti podvrgnut samo tretmanu jedne kombinacije)
26. Dvosmerna analiza varijanse: prednosti u odnosu na jednosmernu analizu varijanse i t-test
Za razliku od t-testa i jednosmerne analize varijanse kojima utvrujemo postojanje statistiki znaajne razlike izmeu 2 ili vie AS, primenom dvosmerne analize varijanse mi saznajemo ne samo da ta razlika postoji, nego i izmeu kojih je grupa ona znaajna. Dakle, kada bi koristili jednosmernu analizu varijanse za uzorke sa dva izvora varijacije, i kada bi utvrdili postojanje razlike preko F-testa, ne bismo mogli znati koje su NV glavni efekti i da li postoji njihov zdrueni efekat, tj. ne bismo znali kom izvoru da pripiemo konstatovane znaajne razlike. Kada bismo jednosmernom analizom varijanse koristili F-test moglo bi se desiti i to da on ne bude znaajan zbog meusobnih ponitavanja eksperimentalnih varijacija (pojava brkanja efekata). Tako, kada uslovi to dozvoljavaju primenu dvosmerne analize varijanse, ona je mnogo ekonominije reenje sa tanijim rezultatima, koje pri tom istovremeno proverava uticaj obe NV mada broj grupa ostaje isti.
27. Sistematski efekti nezavisnih promenljivih (faktora) u dvosmernoj analizi varijanse: jednostavni efekti
glavni efekat jednostavan efekat ef. interak. greka (pre je bila unutar grupe)
U dvosmernoj analizi varijanse rezultat ispitanika proizilazi iz uticaja: - variranja faktora 1 - variranja faktora 2 - interakcije faktora 1 i 2 - greke (uslovljene dejstvom nekontrolisanih faktora, npr. starost, nacion. prip.) Variranja faktora 1 i 2 predstavljaju jednostavne efekte koji se definiu kao efekti jedne NV na ZV na pojedinanom nivou druge NV (SSbr, SSbk) Vanost jednostavnog efekta ogleda se u tome to da bi bio znaajan neki glavni efekat, mora biti znaajan jednostavan efekat, odnosno, ako nema jednostavnih efekata, nema ni glavnih. H0 - Nema razlike u uinku izmeu autokratski i demokratski voenih manualnih radnika (F1) H0 - Nema razlike u uinku izmeu autokratski i demokratski voenih intelektualnih radnika Nema kombinovanog uticaja Faktorski nacrt: 2 NV (ili faktora A i B) na jednu zavisnu Oba faktora imaju po 2 nivoa, 4 kombinacije koje formiraju razliite nivoe NV
Formiraju se 4 grupe ispitanika: A1B1 = demokratski / manualni A1B2 = demokratski / intelektualni A2B1 = autokratski / manualni A2B2 = autokratski /intelektualni H1: da li stil rukovoenja utie na radnu efikasnost H2: Da li taj uticaj postoji bez obzira na vrstu delatnosti NV - stil rukovoenja (demokratski i autokratski) NV - vrsta delatnosti (manualni i intelektualni) ZV - radna efikasnost (npr. koliko su zaradili u din.)
28. Sistematski efekti nezavisnih promenljivih (faktora) u dvosmernoj analizi varijanse: glavni efekti
glavni efekat
jednostavan efekat jednostavan efekat
ef. interak.
29. Sistematski efekti nezavisnih promenljivih (faktora) u dvosmernoj analizi varijanse: interaktivni efekat
glavni efekat
jednostavan efekat
ef. interak.
U dvosmernoj analizi varijanse, pored uticaja NV javlja se i uticaj koji ne moe da se pripie glavnim efektom, tj. nijednom od dva jednostavna efekta, ve se radi o njihovom zajednikom uticaju, odnosno interakciji (SS r x k). Ova interakcija pokazuje da efekat jednog faktora na ZV zavisi od nivoa drugog faktora (npr. faktor A, stil rukovoenja utie na efektivniji rad, ali pri tom nije isto da li ga vre manualni ili intelektualni radnici; ili npr. neka terapija je pomae, ali nije isto da li je vri ena ili mukarac kao terapeut). Upravo zbog efekta interakcije dva faktora, mi u glavnom efektu ne moemo prosto da saberemo jednostavne efekte, ve efekat interakcije tretiramo kao nezavisnu komponentu, dobijenu kombinovanim efektom AxB. Interakcija je znaajna kada jednostavni efekti jednog faktora na dva nivoa nisu jednaki (meusobno), ili kada jednostavni efekti jednog faktora nisu jednaki glavnom. Ako je efekat interakcije 2 NV statistiki znaajan , onda te dve varijable skupno deluju na ZV, ili jedna (moderator) deluje na drugu NV i ZV. Dakle, efekat interakcije obino ima cilj da testira moderatorski efekat, i ne zavisi od toga da li varijable imaju ili nemaju znaajan glavni efekat. Interakcija je esto znaajna onda kada je pol NV.
Ako efekat interakcije nije znaajan onda se ova velika formula ni ne primenjuje, nego se rauna analiza varijanse za svaki od faktora.
Prvo saberemo sume svih redova (red), a potom i sume svih kolona (kol). Ove dve sume treba da su jednake, tj. red = kol. Potom se obe sume kvadriraju, i onda moemo izraunati varijanse koje su nam neophodne za izraunavanje ukupne varijase, a to su a) varijansa izmeu ispitanika (redova) sred2 = (red)2 / kol 2 / kol x red, pri emu 2 = suma svih rezultata b) varijansa koja se pojavljuje u razliitim merenjima (varijansa kolona) skol2 = (kol)2 / red 2 / kol x red, pri emu 2 = suma svih rezultata, i potom raunamo totalnu, tj. ukupnu varijansu
Zatim raunamo MS (Mean of sqears): MSred = s2red / red-1 MSkol = s2kol / kol-1 MSR = sR2 / (red-1) x (kol-1) sR2 = sT (skol2 + sred2) sT2 = X2 2 / (kol x red) Interpretacija rezultata ogleda se u odreivanju znaajnosti trenda, odnosno porasta ili pada rezultata u ponovljenim merenjima. Tako, u ovom primeru, elimo li da proverimo da li je razlika izmeu ispitanika (tj. rezultata u pogledu npr. smanjenja anksioznosti praene tokom nekog terapeutskog tretmana) statistiki znaajna, primenjujemo F-test: F = MSred / MSR, a ako elimo da ustanovimo da li postoji razlika u efektima (rezultatima) tretmana u odnosu na njegovo trajanje onda primenimo F-test: F = MSkol / MSR. Posle toga, tj. ako smo utvrdili da postoji znaajna razlika, dalje utvrujemo izmeu kojih rezultata ona postoji primenom nekog od testova kontrastiranja. Najprikladniji grafiki prikaz za interpretaciju rezultata u ovom sluaju je prikaz poligonima. to su manje varijacije ispitanika a vee meu testovima promena e biti verovatnija.
Obzirom da se u viesmernoj analizi varijanse sa ponovljenim merenjima specifikuje faktor NV-e, a mogue je da postoji i vie ZV, viesmerna analiza varijanse sa ponovljenim merenjima zapravo je multivarijatna analiza, odnosno kombinacija jednostavne, tj. jednosmerne analize varijanse i regresione analize. Rezultat je, svakako, najbolje vizualizovati da bi se uoila interakcija. Ako je generalni F-test znaajan, moemo primeniti neki od testova kontrastiranja izmeu razliitih AS (npr. Scheffeov, Tuckyev) kako bi utvrdili na kom testu i za koju grupu je dolo do promene, kao i pravac promene. Slino logici u 2-u, marginalne AS-e omoguuju procenu elijskih AS-a.
Primer: Uzmimo da smo na dva uzorka (koji mogu po veliini biti jednaki ili razliiti) dobili u nekom merenju ove rezultate, koje smo zbog preglednosti poreali prema veliini:
Uz. I 8 9 9 10 10 10 12 13 15 17 17 18 19 19 21 23 24 Uz II 3 6 7 7 8 8 8 10 12 16 19 22 24 27 30 32 25 26 28 28 29 31 31
Sada naemo centralnu vrednost (tj. Medijan) iz svih rezultata zajedno i unesemo ih u tablicu 2x2. Obzirom da u naem primeru imamo neparan broj rezultata, tj. 41, Medijan je 21. rezultat po veliini, a to je 17. Ako sve rezultate koji su iznad Mdn oznaimo znakom +, a rezultate na Mdn ili ispod njega znakom -, dobijamo:
Uz I Uz II - - - - - - - - - - - + + + + + + + + + + + + + - - - - - - - - - - + + + + + +
fo
12,5 11,5 7,5 9,5
ft
11,7 12,29 8,29 8,7
fo- ft
0,8 -0,8 -0,8 0,8
(fo- ft)2
0,64 0,64 0,64 0,64
(fo- ft)2/ ft
0,054 0,052 0,077 0,073 2 = 0,256
+ Uz I Uz II
Uz I Uz II
13 11 24 7 10 17 20 21 41
Iz ove tablice sada izraunamo 2-test, vodei rauna o svim pravilima koja vrede za 2, pa stoga u ovom sluaju moramo (jer se radi o 2x2 tablici) upotrebiti Yatesovu korekciju. Izraunati 2= 0.258 je manji od onog u tablici graninih vrednosti hi-kvadrata koji je 2 = 3,83 pri stepenima slobode df = (br.kol-1)x(br.red-1) = (2-1)x(2-1) = 1 na nivou znaajnosti od 0.05, pa zato prihvatamo hipotezu da se Mdn-i oba uzorka statistiki znaajno ne razlikuju, odnosno zakljuujemo da pripadaju istoj populaciji. Ako je broj rezultata paran, Medijan je AS izmeu dva rezultata koji se nalaze u sredini niza svih rezultata poreanih po veliini. U tom sluaju e nam svi rezultati biti ili iznad ili ispod Medijana, a ni jedan na samom Medijanu.
rada od ukupno 3min s 2 odmora od po 30sec u toku rada (eksper. Situacija c) i kod rada od ukupno 3min s odmora od po 20sec (eksper. Situacija d). Na ukupno 11 ispitanika dobio je sledee rezultate, koje je za za svakog ispitanika posebno pretvorio u rangove (rang je uz svaki rezultat oznaen u zagradi): eksperimentalne situacije_________ b c d______ 1 991 (4) 1157 (3) 1232 (1) 1217(2) 2 1139 (2) 1055 (4) 1057 (3) 1173 (1) 3 762 (4) 775 (3) 931 (1) 890 (2) 4 1074 (4) 1121 (3) 1 220 (2) 1260 (1) 5 544 (4) 596 (3) 655 (2) 671 (1) 6 765 (2) 728 (3) 840 (1) 637 (4) 7 904 (1) 839 (2) 746 (4) 774 (3) 8 862 (4) 916 (2) 881 (3) 1157 (1) 9 725 (4) 886 (3) 925 (2) 992 (1) 10 1079 (2) 894 (4) 1130 (1) 1009 (3) ___11 833 (3) 844 (3) 890 (3) 963 (1)___ ___Ti _______________35_______33________22_______20___ ispitanici a Zbog kontrole treba izraunati sumu rangova: Ti = N k(k+1) / 2 = 110 = 44x5 /2. Izraunamo li sumu kvadr. suma rangova, dobijamo: Ti2 = 352 + 332 + 222 + 202 = 3198 Uvrstimo li dobijene vrednosti u formulu, to je: r2 = (12 / 44x5) x 3198 - 33 x 5 = 9,44 Uz (k-1)=3 stepeni slobode, granina vred. 2 iznosi 7815. Obzirom da je 9,44 > 7815 dobijena razlika tj. 2 je znaajan, pa odbacujemo H0 i zakljuujemo da uzorci ne pripadaju istoj populaciji. Ako su N i k mali, postoje posebne tablice za oitavanje znaajnosti izraza r2, na nivou znaajnosti od 5% i 1%.
S = -32
Ispitanik 2 Par 2 : 4 +1 2 : 3 +1 2 : 1 -1 4 : 3 -1 4 : 1 -1 3 : 1 -1
3. Saberu se sve vrednosti S da bi se dobio izraz S. U naem sluaju S = -32. 4. Izrauna se izraz S2 (to je varijansa distribucije uzoraka S) prema formuli: S2 = k(k-1)(2k-5) / 18, pri emu je k = broj eksperimentalnih situacija, i dobijeni se izraz pomnoi ss N (broj ispitanika) kako bi se dobila varijansa distribucije izraza S. Drugi koren iz tog izraza je standardna devijacija izraza S. Dakle, S2 = 4 x 3 x (8 + 5 ) / 18 = 8,67 XS2 = 8,67 x 11 = 95,37 XS = 95,37 = 9,77 5. Izraz |S| - 1 podeli s izrazom XS, i tako se dobije odstupanje u terminima normalne distribucije, dakle z: z = -31 / 9,77 = -3,17 Ako z vei od 1,96 (na nivou p<5%), ili vei od 2,58 (na nivou p<1%), odbaciemo nultu hipotezu. Dakle, u naem sluaju zakljuujemo da nai rezultati pokazuju statistiki znaajan trend (p<0,01).
c) postojanje outliera d) utvrivanje normalnosti distribucije - upotrebiti testove spljotenosti i ikrivljenosti - upotrebiti Kolmogorof-Smirnov - uporediti testove za pojedine varijable - izvedi zakljuak o tome loje su tehnike doputene - ako su zakrivljene u istom pravcu moe se primeniti parametrijski test e) utvrivanje homogenosti varijansi - nije sama sebi cilj nego uslov za prethodnu promenu - upotrebiti test homogenosti varijansi (F) - u sluaju razlike, zapitaj se nad razlozima: uporedi eksperimentalne situacije (standardnost uslova) uporedi N-ove (da li je razlika prevelika?) - prepoznaj strane varijable i u vezi s tim: formiraj unakrsne tabele (cross.tabulation) ili grafikim posmatranjem Pored navedenih ciljeva, eksplorativna analiza obuhvata i identifikaciju sistematskih odnosa meu varijablama kada o njima ne postoje nikakva (a priori) oekivanja, odnosno nikakve hipoteze o tome. Dakle, nije re o inferncijalnoj statistici. Praktino, eksplorativna analiza tretira se kao posebna vrsta istraivanja kojom se stie poetni, orijentacioni uvid u neku pojavu, umesto da se testiraju neke hipoteze. Eksplorativnu analizu koriste npr. menaderi, bankari (tzv. data mining) sa ciljem da npr. ustanove zato ljudi kasne na posao kako bi doneli zakljuke o nanu unapreenja poslovanja. Obzirom da eksplorativna analiza predstavlja pripremu za statistiku obradu, a i zavraava se konkretnim izvetajem, vano je da bude valjana i da ne bude prebrza jer prebrza obrada stvara rizik prikrivanja pravog stanja stvari. Kao poseban vid eksplorativne analize izdvajaju se sofisticirane multivarijatne eksplorativne tehnike koje su usmerene na eksploraciju u latentnoj ravni, koja nam nije dostupna, a za njihovu primenu potrebni su nam: - vei uzorci - vei broj varijabli istovremeno Primena ovih tehnika omoguuje i vizualizaciju podataka, a logika rauna ogleda se u primeni regresijske analize korak po korak. Neke od ovih tehnika dostupne su nam u programu: - klaster analize - faktorske analize - diskriminativne analize - data mininga
standardnost ispitivanja). Ukoliko ne moemo sami dopuniti nedostajui podatak (jer nije u pitanju obian administrativni propust), niti ga moemo naknadno utvrditi, pribegavamao primeni odgovarajuih tehnika za obradu postojeeg materijala, ili ga moemo nadomestiti predvianjem (npr. dodeljujui srednju vrednost grupe ili srednju vrednost ispitanika). Dopuna nedostajueg podatka predvianjem opravdana je i prikladna samo u odreenim situacijama, uglavnom u sluajevima jednostavna statistike obrade uz mogunost primene t-testa. Na primer, ukoliko nas zanimaju korelacije dodavanjem nekog nedostajueg podatka neemo ba falsifikovati stvarnost jer emo dopunom dodati srednju vrednost grupe, eventualno e nam se korelacija malo smanjiti ili poveati. Ovo je dopustivo kod rauna korelacije, ali je manje dopustivo kod ispitivanja razlika ili u situaciji kad nemamo puno ispitanika. Dopunu nedostajueg podatka moemo predviati na osnovu drugih zadataka koje je ispitanik uradio. c) postojanje ekstremnih podataka (outliera) d) utvrivanje normalnosti distribucije e) utvrivanje homogenosti varijansi Program sam uzima one ispitanike koji imaju sve podatke.