Napredna Statistika

1.
Eksperimentalna i statistika kontrola stranih (moderator) varijabli

U teoriji istraivanja i statistikoj terminologiji, moderator varijabla je svaka varijabla koja utie na stepen i prirodu povezanosti izmeu neke druge dve varijable. Moderator varijable nazivaju se jo i interferentne, konfondirajue, interveniue ili eksterne varijable. Da bi prepoznali moderatorsku varijablu ona mora biti u interakciji sa nekom od preostalih prediktorskih varijabli u predvianju kriterijumske, ali sama ne sme biti znaajno povezana sa kriterijumskom, odnosno ona treba da u interakciji sa nekom od ostalih prediktorskih varijabli doprinosi objanjenju kriterijumske, jer na odreen nain elimie nepotrebnu varijansu, onu koja nije objanjena prediktorima i kriterijumom. Uklanjanjem delovanja moderatorske varijable ukupni efekat povezanosti ZV i NV se po pravilu menja, ali treba naglasiti da je povezanost koju dobijamo izmeu dve varijable posredstvom moderator varijable prividna, jer ona nije funkcionalana ve samo statistika. Primer: sloenost posla je moderator koji utie na povezanost izmeu stepena inteligencije i uspenosti u poslu: to su poslovi sloeniji, korelacija izmeu inteligencije i uspenosti je vea. Brojne demografske i psiholoke varijable takoe mogu delovati kao moderatori. Tako, prema nekim istraivanjima negativni uticaj nezaposlenosti na psihiko zdravlje zvisi jednim delom od uzrasta. Uzrast, tj. starost je dakle, u ovom sluaju varijabla koja moderira negativne zdravstvene uinke nezaposlenosti. Eksperimentalna kontrola - se primenjuje u eksperimentalnim nacrtima i predstavlja manipulaciju u cilju kontrole, tj. nastojanje da se eliminiu sve druge varijable koje bi mogle uticati na ZV. Najbolji nain je bukvalna eliminacija varijabli (ili dranje istih konstantnim), to, meutim, u mnogim sluajevima nije mogue, tako da preostaje randomizacija, jednaenje grupa (tj. uzoraka), merenje interveniuih varijabli i njihovo ukljuivanje u eksperimentalni nacrt. Ako npr. elimo da kontroliemo uticaj inteligencije na ZV, tu kontrolu emo ostvariti tako to emo sve grupe ujednaiti po inteligenciji. Postoje 2 sluaja eksperimentalne kontrole: - kada je interveniua v. kategorijalna, tada moe najbolje da poslui kao grupiua - kada je v. kontinuirana (kovarijabla) najbolje se eliminie pomou analize kovarijanse Statistika kontrola - se primenjuje u korelacionim istraivanjima (kada nemamo eksperimentalne nacrte) i predstavlja otklanjanje uticaja moderatora primenom odgovarajueg statistikog postupka. Ima iste logike osnove kao i eksperimentalana, ali je za razliku od nje bra i jeftinija.
2. Statistika kontrola stranih (moderator) varijabli: uslovi i metode primene

Statistika kontrola se primenjuje u korelacionim istraivanjima (kada nemamo eksperimentalne nacrte) i predstavlja otklanjanje uticaja moderatora primenom odgovarajueg statistikog postupka. Ima iste logike osnove kao i eksperimentalana, ali je za razliku od nje bra i jeftinija. Statistika kontrola se, meutim, ne moe uvek koristiti, a da bi se koristila, moderator varijabla mora biti izmerena. Ipak, prednost statistike kontrole ogleda se u mogunosti da moderator varijabla moe biti prepoznata i naknadno. Statistika kontrola moe se vriti razliitim metodama: 1. Frakcionisanjem uzorka - zasebnim raunanjem korelacije za razne vrednosti moderatora (iste dve varijable nisu u istom odnosu kod mukaraca i ena) 2. Raunanjem parcijalne (delimine) korelacije - izmeu 2 varijable, da bi se uticaj moderatora otklonio, tj. nekako izraunao i ponitio
3. Smisao i princip parcijalne korelacije

Parcijalna korelacija je korelacija izmeu dve varijable kod koje iskljuujemo uticaj jednog ili vie faktora koji nam smetaju, odnosno kada se raunski odrava konstantnom korelacija s treom varijablom (ili vie njih) s kojom su povezane obe varijable. Izraava se koeficijentom parcijalne korelacije r12.3.
Potreba za parcijalnom korelacijom javlja se u situacijama kada znamo da stvarna korelacija moe biti iskrivljena ako u jednoj ili u obe varijable skupljamo zajedno skupine koje imaju razliite AS-e. Tada nam parcijalna korelacija omoguava da doemo do istog rezultata bez frakcionisanja podataka u homogene grupe (tako to drimo konstantnim varijable koje nam smetaju). Dakle, koeficijent parcijalne korelacije pokazuje kolika bi bila korelacija izmeu dve varijable kada na njihovo zajedniko variranje ne bi uticala trea (ili vie varijabli). Ako se dri konstantnom samo jedna varijabla, tada se govori o parcijalnoj korelaciji prvog reda, ako se dre konstantnim dve ili vie varijabli onda je to parcijalna korelacija drugog reda ili viestruka korelacija. Delovi varijabli koji se prepokrivaju predstavljaju kovarijansu. Parcijalna korelacija bie to vea to je njihova varijansa vea, tj. to je moderator varijabla manja, odnosno to je vea korelacija izmeu varijabli i manja njihova korelacija sa treom varijablom. Znaajnost parcijalne korelacije se proverava t-testom uz stepene slobode N=3.
- u ovom sluaju parcijalna korelacija je jednaka jednostavnoj korelaciji tj. moderatora nema
- parcijalna korelacije je 0, jer sve to V1 i V2 imaju je ono to prepokriva moderator varijabla tj. nemamo dokaza da su povezane V1 i V2 iako je r visok jer njihova kovarijansa pripada moderatoru
4. Koeficijent parcijalne korelacije: namena i interpretacija

Parcijalna korelacija je korelacija izmeu dve varijable kod koje iskljuujemo uticaj jednog ili vie faktora koji nam smetaju, odnosno kada se raunski odrava konstantnom korelacija s treom varijablom (ili vie njih) s kojom su povezane obe varijable. Izraava se koeficijentom parcijalne korelacije r12.3. Dakle, koeficijent parcijalne korelacije pokazuje kolika bi bila korelacija izmeu dve varijable kada na njihovo zajedniko variranje ne bi uticala trea (ili vie varijabli) i predstavlja odnos kovarijanse i umnoaka dveju varijansi. Potreba za parcijalnom korelacijom javlja se u situacijama kada znamo da stvarna korelacija moe biti iskrivljena ako u jednoj ili u obe varijable skupljamo zajedno skupine koje imaju razliite AS-e. Tada nam parcijalna korelacija omoguava da doemo do istog rezultata bez frakcionisanja podataka u homogene grupe (tako to drimo konstantnim varijable koje nam smetaju). Delovi varijabli koji se prepokrivaju predstavljaju kovarijansu. Parcijalna korelacija bie to vea to je njihova varijansa vea, tj. to je moderator varijabla manja, odnosno to je vea korelacija izmeu varijabli i manja njihova korelacija sa treom varijablom. Znaajnost parcijalne korelacije se proverava t-testom uz stepene slobode N=3.
a, b, c.... - povrine koje predstavljaju odnos kovarijanse i umnoaka dveju varijansi b - prostor prekrivanja izmeu V1 i V2 f - prostor koji V1 i V2 dele sa treom varijablom koju hoemo da otklonimo. r12 - koeficijent povezanosti V1 i V2 je ono to je samo njima zajedniko V3 - varijabla koju hoemo da parcijalizujemo, i stavimo pod kontrolu
Na je zadatak da utvrdimo parcijalnu korelaciju izmeu V1 i V2 i da uklonimo ono to je deo kovarijanse ovih varijabli a pripada treoj varijabli, tj. moguem moderatoru. r12 = fb / abef x bcfg = kovarijansa / umnoak varijanse (koef. jednostavne korelacije) r12.3 = b / ab x bc (koef. parcijalne korelacije, teorijska formula) r12.3 = r12 - r13 r23 / 1 - r132 x 1 - r232 (koef. parc. korelacije, kalkulaciona formula) Primer: Primer korelacije izmeu broja izostanaka sa posla i veliine plate. Javlja se sta kao moderator varijabla. Jednostavna korelacija daje meru prividne povezanosti (radnici koji vie izostaju imaju i vee plate). Stvarna povezanost j euoljiva samo iz parcijalne korelacije (visina plate i izostajanje su u stvari u obrnutoj korelaciji). r12 mera povezanosti (udeo svih zajednikih elemenata) r12.3 mera ekskluzivne povezanosti (udeo specifinih, samo njima svojstvenih elemenata). Ako deluju moderatori onda je ona mera stvarne povezanosti.
5. Smisao i princip viestruke korelacije

Viestruka ili multipla korelacija predstavlja povezanost izmeu kriterijumske i dve ili vie prediktorskih varijabli, a izraava se koeficijentom viestruke korelacije (R). Da bi se odredilo kolika je korelacija izmeu ukupnog rezultata u prediktorima i rezultata kriterijuma, trai se onakva kombinacija zbrojenih rezultata svih prediktora koja e dati najveu moguu korelaciju sa kriterijumom. Dakle, viestruka ili multipla korelacija je maksimalno mogu koeficijent korelacije izmeu dva ili vie prediktora i jednog kriterijuma. Tu maksimalno visoku korelaciju moemo postii samo onda ako veu teinu damo vanijim a manju teinu manje vanim prediktorima. Ovo je najbolje objasniti na primeru. Na primer, ako na osnovu 2-3 testa vrimo selekciju uenika, testovi su prediktori, a selekcija je kriterijum. Na tim testovima varijabilitet rezultata je razliit i zato ne moemo da saberemo bruto rezultate nego ih pretvaramo u z-vrednosti. Meutim, tada dobijamo jednake vrednosti, jednake udele u selekciji, a to opet nije tano jer je neki test znaajniji od drugog, pa zbog toga raunamo parcijalne korelacije i dobijamo -pondere, odnosno dobijamo koliko je koji test znaajan za predvianje kriterijuma. Tek kada z-vrednosti sa testa pomnoimo sa njihovim ponderima i dobijemo max. moguu korelaciju. Predvianje e biti bolje ukoliko su -ponderi vei, odnosno ukoliko imamo veu korelaciju prediktora sa kriterijumom nego izmeu dva prediktora.
6. Koeficijent viestruke korelacije: namena i interpretacija

Koeficijent viestruke ili multiple korelacije (R) pokazuje stepen povezanosti izmeu kriterijumske varijable i optimalne kombinacije prediktorskih varijabli kojih moe biti dve ili vie. Meusobno nekorelirani prediktori ostvaruju vei R, odnosno R se sve vie smanjuje to je vea povezanost meu prediktorima. Svaka dodatna prediktorska varijabla nuno dovodi do toga da R ostaje isti ili se povea. R ne moe biti nii od apsolutne vrednosti najvee korelacije izmeu pojedinog prediktora i kriterijuma, odnosno viestruka korelacija uvek je pozitivna. R0,12 = r012 r022 2r01 x r02 x r12 / 1 r122 (formula za viestruku korelaciju) 1 = r01 r02 x r12 / 1 - r122 2 = r02 r01 x r12 / 1 - r122 (-ponderi za prediktore sa kiterijumom)
r122 - koeficijent viestruke determinacije (D), oznaava proporciju varijanse, procenu zajednikih faktora.
1 - r122 - koeficijent nondeterminacije, preostali procenat varijanse koji tek treba objasniti.
7. Testiranje znaajnosti koeficijenta viestruke korelacije

Znaajnost koeficijenta viestruke korelacije se testira pomou F-testa, ija se vrednost oitava u tablici. F je vei (tj. verovatnije znaajan) to je R vei, a F je znaajniji i to je broj ispitanika vei. Sa poveanjem broja prediktora F-test je manje prihvatljiv. Mi svakako ne moemo imati neogranieni broj prediktora (jer je to problem ekonomske prirode), ve poveanjem prediktora statistike prirode mi vetaki poveavamo koeficijent viestruke korelacije. F = R2 / 1 - R2 x N-k-1 / k df = N-k-1 (br. stepeni slobode) N - broj ispitanika k - broj prediktora R2 - koeficijent viestruke determinacije
8. Supresorske varijable
Supresor varijabla je varijabla (test, prediktor) koja poveava prognostiku valjanost nekog skupa varijabli (npr. baterije testova) supresijom nevalidne varijable iz istog skupa. Supresorsorske varijable nisu u korelaciji sa kriterijem, ali je zato u korelaciji sa varijablom iji je supresor. Ona otklanja nevalidni, neeljeni deo varijanse prediktora i time poboljava predikciju (merenjem nevalidnog dela vaijanse i ukljuivanjem u bateriju ponitava se njegov neeljeni uinak). Za ispitivanje supresor efekta potrebno je raditi backward regresijsku analizu. R = b / ab x bcd - otklonivi d smanjili smo vrednost umnoka ali poveali vrednost r12.3
Supresor varijabla kao prediktor doprinosi prognozi samo time to potiskuje, tj. suprimira nepoeljni deo varijanse drugih prediktora. Ipak u konkretnim primerima, ovo je nejasan odnos. Ne moe se nai pravi primer za supresore. Primer: Profesor je u nekom odnosu sa svojim studentima. Profesor ima enu, koja, ako se pojavi pred studentima, iako nije ni u kakvoj vezi s njima, menja odnos izmeu profesora i studenata. Dejstvo supresor varijabli je teko objanjiv fenomen, odnosno teko je objasniti zato neke varijable neoekivano uspostave odnose sa kriterijumom.
9. Viestruka regresiona analiza: racionale i upotreba

Viestruka regresiona analiza je sloena komparativna procedura u ijem tumaenju vai visoka analogija sa prostom linearnom regresijom. Naime, viestruka regresiona analiza predstavlja proirenje proste linearne regresije na situaciju kada se pored zavisne promenljive Y, u model ukljuuju dve ili vie nezavisnih promenljivih. Za valjanu primenu viestruke regresione analize i dobijanje interpretabilnih rezultata neophodno je ispuniti sledee uslove: a) broj podataka u uzorku mora biti vei od broja parametara koji se ocenjuju, odnosno, broj ispitanika mora biti vei od broja varijabli b) izmeu nezavisnih promenljivih ne sme postojati savrena korelacija, jer je u takvom sluaju parametre regresije nemogue odrediti Broj NV u multiplom regresionom modelu je teoretski neogranien pa se za matematiko procesuiranje obavezno mora koristiti kompjuter. U sluaju da izmeu 2 NV i 1 ZV postoji deterministiki odnos, sve take bi se grupisale u jednoj ravni koja se u statistici oznaava kao regresiona ravan. Meutim, kako su u istraivakoj praksi mnogo ei stohastiki odnosi, take e pokazivati vee ili manje odstupanje od zamiljene ravni koja ih povezuje, a obzirom da je mogue dobiti veliki broj kombinacija prediktorskih (nezavisnih) varijabli, tako se i regresiona ravan moe nai u razliitim poloajima.
Zadatak viestruke regresione analize je da na osnovu empirijskih podataka uzorka otkrije onaj poloaj regresione ravni u trodimenzionalnom koordinatnom sistemu koji pokazuje najmanje odstupanje regresionih taaka. Dakle, i ovde se primenjuje metod najmanjih kvadrata da bi se minimizirala odstupanja taaka od ravni, s tim da je cilj metoda najmanjih kvadrata odreivanje sume reziduala (e), odnosno odstupanja predvienih vrednosti od empirijski dobijenih vrednosti zavisne varijable (Y-). Jednaina specifikacije viestruke regresije poput prostog linearnog regresionog modela, sastoji se iz dva aditivna dela: a) deterministikog - pokazuje prosean uticaj NV (prediktorskih) varijabli na ZV b) stohastikog - pokazuje efekte ostalih faktora koje je nemogue identifikovati i objasniti regresionim modelom Y = 0 + 1X1 + 2X2 + 3X3 + ...... + kX3 + e
deterministiki stohastiki (rezidual)
0, 1, 2, 3, - parametri modela
e - stohastiki lan (sluajna greka)
Navedeni model, kompozit, odnosi se na zakonitosti koje vladaju u populaciji. Meutim, obzirom da se u istraivanjima prevashodno operie uzorkom i na osnovu njega vri ocena parametara osnovnog skupa, tako se i navedeni parametri regresije u realnom istraivanju zamenjuju svojim ocenama (b0, b1 i b2), a u raunsku proceduru ukljuuje se kao kompletan kompozit samo deterministiki deo modela: Y = b0 + b1X1 + b2X2 Kada je u pitanju ocenjivanje reprezentativnosti modela viestruke regresije od znaaja su 2 mere: prva je apsolutna i zove se standardna greka, a druga je relativna i zove se koeficijent determinacije multiple regresije, a obe se objanjavaju razlaganjem ukupnog varijabiliteta na objanjeni i neobjanjeni deo (tj. njihovim odnososm), tako da se i ovde razlikuju 3 tipa varijabiliteta: a) ukupni (totalni) - izraunava se kao suma kvadrata odstupanja empirijskih vrednosti od AS ZV b) objanjeni (regresioni) - izraunava se kao suma kvadrata odstupanja predvienih vrednosti od AS ZV c) neobjanjeni (rezidualni) - izraunava se kao suma odstupanja empirijskih od predvienih vrednosti Standardna greka regresije (kao apsolutna mera) objanjava se pomou neobjanjene sume kvadrata, preko rezidualne varijanse, tj. kao njen kvadratni koren. Varijansa se odreuje iz odnosa varijabiliteta i odgovarajueg broja stepeni slobode: S = S2 = (Y-)2 / N-3 pri emu je ovde: df = N - (k+1) gde je N - broj ispitanika, a k - NV Koeficijent viestruke determinacije, kao relativna mera, objanjava se uporeivanjem ukupnog i objanjenog varijabiliteta. Prednosti Koeficijenta determinacije R su u tome to je dobar pokazatelj povezanosti, ijom se primenom ne trai puno raunanja i ne vri mnogo nasilja nad podacima, a zahtev za predvianjem ini ga popularnim. S druge strane, nedostaci koeficijenta determinacije R su u tome to zavisi od veliine uzorka i broja NV, zbog ega je neophodno izvriti korekciju dobijenog R u odnosu na veliinu uzorka i broj NV, primenom formule za korigovani (prilagoeni, adjusted) koeficijent viestruke determinacije (RA2). Naime, ukoliko je broj ispitanika u uzorku mali, a posmatra se veliki broj NV, vrednost R se pribliava 1 ak i ako one pojedinano ne utiu na ZV, a ukljuivanjem nove NV u regresioni model, R se jo poveava, bez obzira na njen stvarni uticaj
10. Viestruka regresiona analiza: interpretacija rezultata

Viestruka regresiona analiza je sloena komparativna procedura u ijem tumaenju vai visoka analogija sa prostom linearnom regresijom. Naime, viestruka regresiona analiza predstavlja proirenje proste linearne regresije na situaciju kada se pored zavisne promenljive Y, u model ukljuuju 2 ili vie NV. Interpretaciju rezultata najbolje je objasniti na primeru. Na primer, testiramo neku odreenu sposobnost na grupi ispitanika tako to posmatramo uticaj dve odreene NV na tu sposobnost podvrgavanjem ispitanika vrsti zadataka koja testira uticaj tih NV. Na osnovu empirijskih rezultata testiranja odreujemo brojane vrednosti
koje su nam potrebne za izraunavanje parametara regresije, odnosno njihovih ocena, b1 i b2, a potom i vrednost za konstantu b0. Interpretacijom rezultata objanjavamo ta znae izraunati koeficijenti: b0 - regresioni koeficijent (ponder) koji odreuje taku u kojoj regresiona ravan see Y-osu, pa se otuda naziva i odseak (intercept); ovaj koeficijent je konstanta koja ima funkciju da obezbedi da AS predviene vrednosti ZV odgovara AS ostvarene vrednosti ZV b1 - regresioni koeficijent (ponder) koji pokazuje za koliko se jedinica promeni ZV ako na nju deluje samo prva prva NV, pri emu se efekti druge NV dre konstantnim b2 - regresioni koeficijent (ponder) koji pokazuje za koliko se jedinica promeni ZV ako na nju deluje samo druga NV, pri emu se efekti prve NV dre konstantn. U interpretaciji rezultata naroito je znaajan R, koeficijent determinacije viestruke regresije koji se dobija kvantifikovanjem udela objanjenog (regresionog) u ukupnom (totalnom) varijabilitetu: R2 = objanjeni varijabilitet / ukupni varijabilitet = (-MY)2 / (Y-MY)2 R obezbeuje najviu moguu korelaciju pomou datih prediuktora jer svakom prediktoru dodeljuje vanost (-ponder) u skaldu sa njegovim doprinosom prognozi kriterijuma
11. Jednaina specifikacije viestruke regresije: diferencijalno i optimalno ponderisani kompozit

Kada je u pitanju ocenjivanje reprezentativnosti modela viestruke regresije od znaaja su 2 mere: prva je apsolutna i zove se standardna greka, a druga je relativna i zove se koeficijent determinacije multiple regresije, a obe se objanjavaju razlaganjem ukupnog varijabiliteta na objanjeni i neobjanjeni deo (tj. njihovim odnosom), tako da se i ovde, kao i ko prosteg linearnog modela razlikuju 3 tipa varijabiliteta: a) ukupni (totalni) - izraunava se kao suma kvadrata odstupanja empirijskih vrednosti od AS ZV b) objanjeni (regresioni) - izraunava se kao suma kvadrata odstupanja predvienih vrednosti od AS ZV c) neobjanjeni (rezidualni) - izraunava se kao suma odstupanja empirijskih od predvienih vrednosti Za jednainu specifikacije viestruke regresije naroito je znaajan koeficijent determinacije viestruke regresije R, koji se dobija kvantifikovanjem udela objanjenog (regresionog) u ukupnom (totalnom) varijabilitetu: R2 = objanjeni varijabilitet / ukupni varijabilitet = (-MY)2 / (Y-MY)2 R obezbeuje najviu moguu korelaciju pomou datih prediktora jer svakom prediktoru dodeljuje vanost (-ponder) u skaldu sa njegovim doprinosom prognozi kriterijuma. Tako, ukoliko se razliitim prediktorima dodeljuje razliita vanost kaemo da je kompozit diferencijalno ponderisan i to na nain da ukupna mo predvianja bude maksimalna mogua. Zato optimizacijom, tj. isprobavanjem razliitih varijansi koje se zavrava izborom najbolje varijanse dobijamo optimalno ponderisani kompozit. Ovaj kompozit, jednainu, moemo shvatiti kao oblik linearne transformacije koji predstavlja ponderisanu kombinaciju rezultata u kojoj je najpre svaki rezultat pomnoen konstantom a potom su proizvodi sabrani.
12. Regresiona analiza korak po korak: racionale i upotreba

Regresiona naliza korak po korak podrazumeva interaktivnu primenu raunara i kao to i samo ime govori omoguuje da u analizi izaberemo odreene mogue korake kako bi prognoza bila to uspenija. Naime, za odabir prediktora koji slue u odreivanju kriterijuma, analiza korak po korak podrazumeva 2 mogunosti: - analizu unapred (forward stepwise) - analizu unazad (backward stepwise), pri emu ove dve ponuene analize ne zavravaju nuno istim rezultatima. Obzirom da esto prilikom regresione analize imamo veliki broj prediktora to negativno utie na na koeficijent determinacije viestruke regresije (R) kao pokazatelja prave povezanosti u interpretaciji rezultata, analizom korak po korak odreujemo mesto na kojem je broj prediktora optimalan.
Na primer, za predvianje uspeha u koli, na fakultetu ili nekom konkretnom poslu koritiemo odreenu bateriju testova koja se moe sastojati od testa znanja, uspeha, prethodnih godina kolovanja, kratkih pitanja na intervjuu, iq-testq, itd., ali nam je za dobru prognozu vano da znamo koji nam je broj testova optimalan. Najee je to 3-5 prediktora, a 4 je optimalno. Na grafikom prikazu, poveanje vrednosti R za odreen broj prediktora prikazan je krivom negativne akceleracije, koja pokazuje da posle odreenog optimalnog broja prediktora poveanje njihovog broja gubi smisao.
13. Regresiona analiza korak po korak: analiza unapred (forward stepwise)

Regresiona naliza korak po korak podrazumeva interaktivnu primenu raunara i kao to i samo ime govori omoguuje da u analizi izaberemo odreene mogue korake kako bi prognoza bila to uspenija. Naime, za odabir prediktora koji slue u odreivanju kriterijuma, analiza korak po korak podrazumeva 2 mogunosti: - analizu unapred (forward stepwise) - analizu unazad (backward stepwise), pri emu ove dve ponuene analize ne zavravaju nuno istim rezultatima. Analiza unapred polazi od regresione jednaine u kojoj nema ni jednog prediktora, da bi u prvom koraku ukljuila najbolji prediktor, tj. onaj sa najveom parcijalnom korelacijom sa kriterijumskom varijablom. U narednom koraku ukluuje prediktor ija je parcijalna korelacija sledea po veliini, tj. koji obezbeuje najvei porast (inkrement) koeficijenta viestruke korelacije, sve dok dobit od dodavanja prediktora ne postane suvie mala, odnosno statistiki neznaajna. Analiza unapred u svakom koraku ukljuuje kompletnu statistiku koja prati regresionu analizu, dakle pokazae: - multiplu korelaciju Povezanost: 0.20 - 0.40 slaba povezanost - koeficijent determinacije 0.40 - 0.70 stvarna povezanost - analizu varijanse 0.70 i vie znaajna povezanost - regresione koeficijente i njihovu znaajnost, a osim prikaza svakog pojedinog koraka nudi i prikaz rezimea rezultata
14. Regresiona analiza korak po korak: analiza unazad (backward stepwise)

Regresiona naliza korak po korak podrazumeva interaktivnu primenu raunara i kao to i samo ime govori omoguuje da u analizi izaberemo odreene mogue korake kako bi prognoza bila to uspenija. Naime, za odabir prediktora koji slue u odreivanju kriterijuma, analiza korak po korak podrazumeva 2 mogunosti: - analizu unapred (forward stepwise) - analizu unazad (backward stepwise), pri emu ove dve ponuene analize ne zavravaju nuno istim rezultatima. Analiza unazad (backward stepwise) polazi od regresione jednaine u koju su ukljueni svi prediktori zajedno, pa iskljuuje korak po korak prediktore koji najmanje doprinose predvianju, tj. koji imaju najmanju parcijalnu korelaciju sa kriterijumskom varijablom, posle ijeg e se iskljuivanja R najmanje smanjiti. Kao i analiza unapred (forward stepwise) u svakom koraku ukljuuje kompletnu statistiku koja prati regresionu analizu, znai pokazae: - multiplu korelaciju Povezanost: 0.20 - 0.40 slaba povezanost - koeficijent determinacije 0.40 - 0.70 stvarna povezanost - analizu varijanse 0.70 i vie znaajna povezanost - regresione koeficijente i njihovu znaajnost, a osim prikaza svakog pojedinog koraka nudi i prikaz rezimea rezultata
15. Jednosmerna analiza varijanse: namena
Analiza varijanse je statistiki postupak koji se upotrebljava za utvrivanje znaajnosti razlika izmeu nekoliko aritmetikih sredina. Uporeivanjem razliitih komponenti varijanse utvruje se moe li se varijabilitet rezultata koji su dobijeni u razliitim eksperimentalnim situacijama smatrati sluajnim varijabilitetom ili se moe pripisati specifinom uticaju nezavisne varijable. Razlikujemo jednostavnu tj. jednosmernu i sloenu tj. dvosmernu ili viesmernu analizu varijnase. Osnovni model jednosmerne analize varijanse primenjuje se na rezultate u 1 ZV dobijene u eksperimentu s 1 NV koja ima vie nivoa (vie eksperimentalnih situacija) koje se meusobno razlikuju kvantitativno, odnosno kvalitativno. Analiza varijanse se zapravo sastoji u tome da se varijabilitet* svih dobijenih rezultata rastavi na delove od kojih je sastavljen, odnosno na varijabilitet unutar grupa (SSwg) i varijabilitet izmeu grupa (SSbg), pri emu se oni stavljaju u odnos (SSbg/SSwg) *varijabilitet - odstupanja rezultata od ar. sred. ili neke mere proseka SSbg - suma kvadrata odstupanja Mg i Mtot SSwg - suma kvadrata odstupanja pojedinanih rezultata ispitanika X i Mg. Osnovna misao koju sadri analiza varijanse je da treba dokazati da li je varijabilitet meu grupama vei od varijabiliteta unutar grupa. a) Ako je varijabilitet meu grupama znaajno vei od varijabiliteta unutar grupa, moemo smatrati da su to grupe koje ne pripadaju istoj populaciji.
b) Ako svaka grupa posebno varira vie nego to variraju ar. sredine tih grupa, moemo pretpostaviti da sve te grupe pripadaju istoj populaciji.
16. Jednosmerna analiza varijanse: prednosti u odnosu na t-test

Ukoliko bi za testiranje znaajnosti razlika izmeu nekoliko aritmetikih sredina koristili t-test, morali bi da primenimo nekoliko t-testova, ime bi se: 1. znaajno poveao posao izraunavanja 2. poveala bi se verovatnoa javljanja sluajno znaajnih t-testova (na nivou od 5%), tj. poveala bi se verovatnoa javljanja greke tipa I 3. takoe, biranjem dva po dva uzorka koje emo testirati t-testom, naruavamo osnovni uslov sluajnog razvrstavanja u grupe 4. dalje, primenom t-testa, uzimajui u obzir samo po dve ar. sredine, gubimo na preciznosti izraunavanja varijanse koja je uslovljena varijabilitetom svih grupa 5. zatim, za razliku od t-testa, primenom jednosmerne analize varijanse simultano ispitujemo sve razlike meu grupama, imamo holistiki pristup, celovit uvid 6. osim toga, jednosmerna analiza varijanse omoguava mnogo finija poreenja nego t-test, jer omoguava da utvrdimo tano kritiki nivo na kojem razlika postaje statistiki znaajna
17. Meugrupna i unutargrupna varijansa u analizi varijanse

U jednosmernoj analizi varijanse, primenom F-testa testiramo odnos dva varijabiliteta: F = MSbg / MSwg
1. meugrupnog - predstavljen meugrupnom varijansom (MSbg) koja se dobija tako to se suma rastojanja AS grupa od totalne AS koja su kvadrirana i pomnoena sa brojem rezultata u grupi (N g), podeli brojem stepeni slobode (dfbg), a on se dobija tako to se od broja grupa (k) oduzme 1 : MSbg = SSbg / dfbg SSbg = [ Ng( ASg AStot)2 ] dfbg = k -1 2. unutargrupnog - predstavljen unutargrupnom varijansom (MSwg) koja je slina standardnoj devijaciji u smislu da ona isto pokuava da priblino predstavi rasprenje populacije. Dobija se tako to se suma kvadriranih rastojanja svakog pojedinanog rezultata od AS pripadajue grupe podeli brojem stepeni slobode (dfwg), a on se dobija tako to se od ukupnog broja rezultata (N)oduzme broj grupa (k): MSwg = SSwg / dfwg SSwg = (X - ASg)2 dfwg = Ntot - k Ove 2 komponente su kljune u jednosmernoj analizi varijanse, a njima pokuavamo da odredimo meusobno rastojanje grupa na kontinuumu odreenih vrednosti. Ako se ASg mnogo manje raspruju od AStot nego to se pojedinani rezultati raspruju od svojih ASg, moemo pretpostaviti da su sve grupe iz iste populacije. Pogledamo li poloaj nekog pojedinanog rezultata u masi drugih rezultata i drugih grupa, moemo ustanoviti da se njegov varijabilitet, tj. njegovo odstupanje od AStot moe podeliti na dve komponente: a) odstupanje tog rezultata od ASg,, tj. unutargrupni varijabilitet b) odstupanje ASg kojoj pripada taj rezultat od AStot, meugrupni varijabilitet, a dokaz toga je da je suma ove dve komponente jednaka odstupanju tog pojedinog rezultata od AStot
18. Testiranje znaajnosti razlika izmeu vie od dve aritmetike sredine: F-test
Testiranje statistiki znaajne razlike izmeu vie od 2 AS vri se primenom F-testa koji stavlja u odos meugrupnu i unutargrupnu varijansu: F = MSbg / MSwg. Pri tom, vano je obratiti panju na injenicu da grupe rezultata ije AS poredimo mogu imati razliit broj rezultata, to moe da utie na vrednost F-odnosa. Da F-test ne bi varirao i da bi bio adekvatno ponderisao rezultate, meugrupne i unutargrupne sume kvadrata odstupanja delimo odgovarajuim brojem stepeni slobode ime dobijamo srednje kvadrate varijansi (MSbg i MSwg) koji su uporedljivi odnosno primenljivi za F-test.. MSbg tretiramo kao objanjenu varijansu (objanjenu nezavisnom varijablom), a MSwg kao neobjanjenu varijansu (tj. kao greku). Kada utvrdimo da je varijabilitet meu grupama vei od varijabiliteta unutar grupa treba da ustanovimo da li je njihova razlika znaajna, a to inimo tako to vrednost dobijenog F-odnosa uporedimo sa brojem koji emo oitati u Snedekerovoj F-tablici pomou pripadajuih stepeni slobode, pri emu su vrednosti date u ovoj tablici date na nivou znaajnosti 0.05 (dfbg = k -1, dfwg = Ntot k; u F-tablici dfbg - gore; dfwg - levo). Ukoliko je F vrednost vea od one iz tablice, znai da je F-test znaajan tj. da postoji statistiki znaajna razlika izmeu AS grupa. Ako je F-test znaajan onda svi uzorci (grupe) nisu iz iste populacije, a ako F-test nije znaajan onda svi uzorci jesu iz iste populacije.
ako je F-test znaajan izmeu ove dve ASg ova dva uzorka nisu iz iste populacije sigurno postoje znaajne razlike Kao i kod T-testa, F-test je znaajniji to su : a) razlike izmeu ASg vee (tj. to su grupe meussobno udaljenije) b) standardne devijacije grupa (tj. varijanse) manje F-vrednost nikada ne moe biti negativna, ali moe biti jednaka nuli, to se deava u sluaju kada su sve ASg jedake, tj. ne postoji meusobna varijansa (ako k = 4, onda ASg1 = ASg2 = ASg3 = ASg4). Za razliku od normalne raspodele, distribucija F-izraza nije simetrina, ve je manje ili vie asimetrina nadesno, tj pozitivno zakoena, jer ima vie niih rezultata.. to je broj uzoraka vei, ova e se distribucija vie pribliavati normalnoj raspodeli, ali nikada joj nee biti jednaka, tj. uvek ostaje pozitivno zakrivljena.
Uslovi za primenu F-testa: 1. Homogenost varijanse (homoskedascitet) - najee se testira Levenovim testom, ali moe i Cochranovim Ili Bartletovim testom 2. Da su podaci na ZV bar sa intervalnog nivoa merenja a NV mora biti kategorijalnog tipa, odnosno podaci mogu biti i sa intervalnog ili racio nivoa, ali da je varijabla diskretna 3. Da distribucija ZV u svakom poduzorku treba biti normalno distribuirana 4. Poduzorci moraju biti izabrani nezavisnim sluajnim biranjem (u praksi se ovo retko deava jer je skupo) 5. Efekti uticaja NV i greke na ZV su meusobno nezavisni ili aditivni, to omoguava da se ukupni varijabilitet (SStot) podeli na dve aditivne meusobno nepkrivajue komponente: a) varijabilitet koji je posledica delovanja NV tj. faktora (SSbg) b) varijabilitet greke (SSwg)
19. Testiranje znaajnosti razlika izmeu parova aritmetikih sredina u analizi varijanse: testovi kontrastiranja
Ako analiza varijanse pokae da moemo smatrati da svi uzorci potiu iz iste populacije (tj. ako F-test nije statistiki znaajan), onda nas dalje ne zanimaju pojedinane razlike izmeu nekih ASg. Ali, ako je F-test znaajan, pa odbaci nultu hipotezu, tj. ako dokaemo da uzorci ne pripadaju istoj populaciji, esto nas moe zanimati koji se uzorci meu sobom statistiki znaajno razlikuju. Tada primenjujemo neki od testova kontrastiranja, koji nam omoguavaju da sagledamo odnos u celini i reguliemo nacrt merenja u eksperimentu. Postoji vie testova kontrastiranja (Scheffeov, Tuckyev, Duncanov, LSD...) koji se meusobno razlikuju: - prema rigoroznosti u odnosu greku tipa I - prema tome da li primenjuju a priori ili a posteriori postupke za raunanje statistike znaajnosti izmeu 2 po 2 AS, u zavisnosti od toga da li se poreenje vree pre ili posle rauna analize varijanse - odnosno, prema tome da li su planski ili neplanski, tj. da li doputaju planirano poreenje (npr.najmanje i najvee razlike) ili neplansko poreenje (svake sa svakom) U vezi sa ovim testovima bitno je istai da bez obzira koliko parova uzimamo, rizik od greke ostaje isti. Po pitanju rigoroznosti u odnosu na greku tipa I, najrigorozniji test je Scheffeov test koji uzima blai nivo znaajnosti (p = 0.1), pa e se njegovom primenom ree dogoditi da utvrdimo da je razlika statistiki znaajna, odnosno ee emo prihvatiti nultu hipotezu iako razlika meu populacijama postoji. Ovaj test je u prednosti nad drugim testovima naroito u situacijama kada su nejednaki N-ovi grupa (uzoraka).
20. Uslovi za primenu analize varijanse: nivoi merenja varijabli

Kada je u pitaju nivo merenja sa kojeg su varijable, za primenu analize varijanse potrebno je da ZV bude bar na intervalnom nivou merenja, dok NV-e moraju biti diskretne (sa intervalnog ili racio), ali predstavljene u obliku kategorija. Ako je ZV na drugom nivou osim intervalnog ili racio, koristimo neparametrijske zamene za analizu varijanse.
21. Uslovi za primenu analize varijanse: normalnost distribucija

Kada je u pitanju distribucija ZV kao uslov za primenu analize varijanse, opte pravilo je da ona mora biti normalno distribuirana u svakom uzorku, ali poto je F-test robustan, od ovog zahteva se moe odstupiti ukoliko su uzorci jednake ili sline veliine, odnosno ako su im varijanse homogene.
22. Uslovi za primenu analize varijanse: homogenost varijansi

Jedan od vanih uslova za primenu analize varijanse je homogenost varijansi, pod ime se podrazumeva da su varijanse odstupanja rezultata u svakoj grupi (uzorku) priblino jednake. U suprotnom, tj. ako neka grupa ima bitno veu ili manju varijansu, to ugroava rezultate F-testa, pa on nije dobar pokazatelj razlike izmeu ASg (grupa). Homogenost varijanse je robustna jedino ukoliko su N-ovi grupa jednaki; ukoliko, meutim, nisu, homogenost varijanse testira se najee primenom Levenovog testa, a moe i Cochranovim ili Bartletovim testom.
23. Uslovi za primenu analize varijanse: nezavisnost distribucije greke

Jedan od vanih uslova za primenu analize varijanse je nezavisnost distribucije greke, pod im se podrazumeva da su efekti uticaja NV i greke na ZV meusobno nezavisni ili aditivni. Ovo omoguava da se ukupni varijabilitet (SStot) podeli na dve aditivne meusobno nepokrivajue komponente: a) varijabilitet koji je posledica delovanja NV tj. faktora (SSbg) b) varijabilitet greke* (SSwg), pri emu se pod grekom podrazumevaju individualne varijacije lanova grupe Npr.: studente koji prepisuju na ispitu izjednaavamo po kvalitetu sa onima koji ne prepisuju, ime vrimo vetako homogenizovanje
24. Problemi u zakljuivanju na osnovu F-testa: analiza kovarijanse

Analizu kovarijanse koristimo kada znamo da se dve ASg statistiki znaajno razlikuju, pa elimo utvrditi da li je NV imala uticaja i koliko u pojedinanim sluajevima. Za razliku od analize varijanse, u kojoj polazimo od pretpostavke da ukoliko NV nema uticaja, onda nema razlike ni meu grupama, u raunu analize kovarijanse pored uticaja NV merimo i uticaj moguih drugih varijabli koje nazivamo kovarijablama. Dakle, u okviru pretesta, osim ZV merimo i kovarijable koje zatim koristimo za korigovanje mera u posttestu. Na primer, ako ispitujemo efikasnost neke metode uenja, moemo kao kovarijablu uzeti inteligenciju. Onda emo mere grupa na ZV u posttestu (recimo koliina zapamenog gradiva), korigovati za iznos njihove korelacije sa inteligencijom. Razliku izmeu grupa emo potom ispitati samo na onom delu varijanse posttesta koji je preostao nakon to je uee inteligencije eliminisano. Na taj nain smo uradili sasvim isto to smo mogli jednaenjem grupa po inteligenciji. Iz grupnih razlika eliminisali smo inteligenciju. Zato se za nacrt analize kovarijanse kae da je vrlo efikasna statistika zamena ze jednaenje grupa.
25. Dvosmerna analiza varijanse: namena

Dvosmernu analizu varijanse koristimo kada elimo da ispitamo uticaj 2 NV na 1 ZV. Ovakav nacrt spada u tzv. faktorijalne nacrte, jer varijable nazivamo faktorima. Meutim, pored statistike znaajnosti uticaja nezavisnih varijabli na zavisnu, nas zanima koja tano od 2 NV znaajno utie na ZV, a zanima nas i njihov zdrueni uticaj na ZV. Zato se za razliku od jednosmerne analize varijanse SStot se nee razlagati na 2 komponente nego na 4 komponente: 2 jednostavna efekta, efekat interakcije i greku, pa se u dvosmernoj analizi varijanse
rauna se vie F-testova, jedan za jednu NV, tj. za prvi glavni faktor ili faktor A, drugi F-test za drugu NV, i trei F-test za efekat njihove interakcije.
glavni efekat
jednostavan efekat
ef. interak.
greka (pre je bila unutar grupe)
SStot = SSbr + SSbk + SSr x k + SSwc

jednostavan efekat
br = npr. pol
bk = npr. vrsta terapije
r x k = interakcija 2 faktora
wc = within cells
Uslovi za primenu: - normalnost distribucije ZV za svaku kombinaciju kategorija NV, to znai da NV moe biti u kategorijalnom oblik 8sa intervalnog ili racio nivoa, ali diskretna) - homogenost varijanse za svaku kombinaciju kategorija - neponovljivost oba faktora ( u smislu da jedan ispitanik sme biti podvrgnut samo tretmanu jedne kombinacije)
26. Dvosmerna analiza varijanse: prednosti u odnosu na jednosmernu analizu varijanse i t-test
Za razliku od t-testa i jednosmerne analize varijanse kojima utvrujemo postojanje statistiki znaajne razlike izmeu 2 ili vie AS, primenom dvosmerne analize varijanse mi saznajemo ne samo da ta razlika postoji, nego i izmeu kojih je grupa ona znaajna. Dakle, kada bi koristili jednosmernu analizu varijanse za uzorke sa dva izvora varijacije, i kada bi utvrdili postojanje razlike preko F-testa, ne bismo mogli znati koje su NV glavni efekti i da li postoji njihov zdrueni efekat, tj. ne bismo znali kom izvoru da pripiemo konstatovane znaajne razlike. Kada bismo jednosmernom analizom varijanse koristili F-test moglo bi se desiti i to da on ne bude znaajan zbog meusobnih ponitavanja eksperimentalnih varijacija (pojava brkanja efekata). Tako, kada uslovi to dozvoljavaju primenu dvosmerne analize varijanse, ona je mnogo ekonominije reenje sa tanijim rezultatima, koje pri tom istovremeno proverava uticaj obe NV mada broj grupa ostaje isti.
27. Sistematski efekti nezavisnih promenljivih (faktora) u dvosmernoj analizi varijanse: jednostavni efekti
glavni efekat jednostavan efekat ef. interak. greka (pre je bila unutar grupe)

jednostavan efekat
U dvosmernoj analizi varijanse rezultat ispitanika proizilazi iz uticaja: - variranja faktora 1 - variranja faktora 2 - interakcije faktora 1 i 2 - greke (uslovljene dejstvom nekontrolisanih faktora, npr. starost, nacion. prip.) Variranja faktora 1 i 2 predstavljaju jednostavne efekte koji se definiu kao efekti jedne NV na ZV na pojedinanom nivou druge NV (SSbr, SSbk) Vanost jednostavnog efekta ogleda se u tome to da bi bio znaajan neki glavni efekat, mora biti znaajan jednostavan efekat, odnosno, ako nema jednostavnih efekata, nema ni glavnih. H0 - Nema razlike u uinku izmeu autokratski i demokratski voenih manualnih radnika (F1) H0 - Nema razlike u uinku izmeu autokratski i demokratski voenih intelektualnih radnika Nema kombinovanog uticaja Faktorski nacrt: 2 NV (ili faktora A i B) na jednu zavisnu Oba faktora imaju po 2 nivoa, 4 kombinacije koje formiraju razliite nivoe NV
Formiraju se 4 grupe ispitanika: A1B1 = demokratski / manualni A1B2 = demokratski / intelektualni A2B1 = autokratski / manualni A2B2 = autokratski /intelektualni H1: da li stil rukovoenja utie na radnu efikasnost H2: Da li taj uticaj postoji bez obzira na vrstu delatnosti NV - stil rukovoenja (demokratski i autokratski) NV - vrsta delatnosti (manualni i intelektualni) ZV - radna efikasnost (npr. koliko su zaradili u din.)
28. Sistematski efekti nezavisnih promenljivih (faktora) u dvosmernoj analizi varijanse: glavni efekti
glavni efekat
jednostavan efekat jednostavan efekat
ef. interak.

U dvosmernoj analizi varijanse GLAVNI EFEKTI su oni koji NV-e pojedinano vre na ZV (SS br + SSbk, tj. u prethodnom primeru A-stil rukovoenja i B-vrsta delatnosti)
29. Sistematski efekti nezavisnih promenljivih (faktora) u dvosmernoj analizi varijanse: interaktivni efekat
glavni efekat
jednostavan efekat
ef. interak.

jednostavan efekat
U dvosmernoj analizi varijanse, pored uticaja NV javlja se i uticaj koji ne moe da se pripie glavnim efektom, tj. nijednom od dva jednostavna efekta, ve se radi o njihovom zajednikom uticaju, odnosno interakciji (SS r x k). Ova interakcija pokazuje da efekat jednog faktora na ZV zavisi od nivoa drugog faktora (npr. faktor A, stil rukovoenja utie na efektivniji rad, ali pri tom nije isto da li ga vre manualni ili intelektualni radnici; ili npr. neka terapija je pomae, ali nije isto da li je vri ena ili mukarac kao terapeut). Upravo zbog efekta interakcije dva faktora, mi u glavnom efektu ne moemo prosto da saberemo jednostavne efekte, ve efekat interakcije tretiramo kao nezavisnu komponentu, dobijenu kombinovanim efektom AxB. Interakcija je znaajna kada jednostavni efekti jednog faktora na dva nivoa nisu jednaki (meusobno), ili kada jednostavni efekti jednog faktora nisu jednaki glavnom. Ako je efekat interakcije 2 NV statistiki znaajan , onda te dve varijable skupno deluju na ZV, ili jedna (moderator) deluje na drugu NV i ZV. Dakle, efekat interakcije obino ima cilj da testira moderatorski efekat, i ne zavisi od toga da li varijable imaju ili nemaju znaajan glavni efekat. Interakcija je esto znaajna onda kada je pol NV.
Ako efekat interakcije nije znaajan onda se ova velika formula ni ne primenjuje, nego se rauna analiza varijanse za svaki od faktora.
30. Nesistematski efekti (efekti greke)

Nesistematski efekti, odnosno efekti greke, predstavljaju varijansu koju ne moemo da kontroliemo. To su varijacije unutar grupa, nastale kao posledica individualnih razlika i nekontrolisanih faktora. Ovu varijansu ini suma kvadrata unutar jedne varijable.
31. Testiranje znaajnosti efekata u dvosmernoj analizi varijanse

Obzirom da u dvosmernoj analizi varijanse postoje tri efekta, rauna se F-test za efekat A, F-test za efekat B i F-test za efekat interakcije. Ako razlika nije statistiki znaajna zakljuujemo da ne postoji razliit efekat NV-i na ZV, a ako je F-test znaajan, tada se rade testovi kontrastiranja (SCHEffeov, LSD, Duncanov, Tuckyev)
32. Viesmerna analiza varijanse: sluaj vie od dve nezavisne varijable

Viesmernu analizu varijanse upotrebljavamo kada postoji vie od dve nezavisne varijable, pa radimo analizu svake NV za glavne efekte i svake sa svakom za interakciju, to se grafiki moe prikazati sa vie dijagrama, odnosno nacrta. U analizi se, dakle, poveava broj F-testova, jer postiji vie NV, i vie razliitih nivoa interakcije. Na primer, u trosmernoj analizi varijanse raunae se 7 F-testova, za: A, B, C, AxB, AxC, BxC, AxBxC.
33. Analiza varijanse za ponovljena merenja: izvori varijacija u ponovljenim merenjima

Logika analize varijanse za ponovljena merenja ista je kao kod jednosmerne analize varijanse, samo umesto grupa imamo imamo ispitanike, to povlai za sobom potrebu da se detaljnije definie ta je grupa. U nacrtima sa ponovljenim merenjima postoji samo jedna grupa objekata, ali se oni mere u vie navrata. Zato grupu ini skup mera iz jednog merenja. U nacrtima sa ponovljenim merenjima svaki ispitanik se poredi sam sa sobom, a mi utvrujemo da li nakon vie ponovljenih merenja postoji trend porasta ili pada, u smislu da se promene javljaju u odreenom pravcu. Slino t-testu za ZV uzorke kojim se 2x meri neko svojstvo (npr. na poetku i na kraju tretmana), kod analize varijanse sa ponovljenim merenjima u vie navrata se meri isto svojstvo u smislu snimanja efekata (tj. monitoringa) nekog tretmana. Moglo bi se raditi i vie t-testova, ali bi se poveala sistematska greka, pa je bolje raditi analizu varijanse sa ponovljenim merenjima. Meutim, u ponovljenim merenjima esto se deava da rezultati ispitanika variraju zbog razliitih razloga, tj. pojave razliitih efekata. Na primer, obzirom da se ispitanici uzastopno podvrgavaju tretmanu po utvrenom redosledu, prethodni tretmani mogu da deluju na uinak narednih, pa se ova pojava, tj. izvor varijacije naziva efektom redosleda ili sekvencijalnim efektom. Postoji vie vrsta efekata redosleda: - efekat vebanja - ogleda se u tome da rezultati (odgovori) ispitanika variraju jer Ih oni ponavljanjem usavravaju - efekat zamora - deluje suprotno od efekta vebe, a ogleda se u tome da rezultati Ispitanika variraju jerse oni zamaraju ili im postaje dosadno - efekat kontrasta - u zavisnosti od redosleda kojim se ispitanici stavljaju u kontrastne, potpuno razliite situacije, njihovi rezultati variraju Da bi se neutralisao efekat redosleda, na prvom mestu efekat vebe, koriste se tehnike balansiranja, mada se time efekti redosleda ne izbegavaju ve uproseavaju.
34. Jednosmerna analiza varijanse sa ponovljenim merenjima: namena

Logika analize varijanse za ponovljena merenja ista je kao kod jednosmerne analize varijanse, samo umesto grupa imamo imamo ispitanike, to povlai za sobom potrebu da se detaljnije definie ta je grupa. U nacrtima sa ponovljenim merenjima postoji samo jedna grupa objekata, ali se oni mere u vie navrata. Zato grupu ini skup mera iz jednog merenja. U nacrtima sa ponovljenim merenjima svaki ispitanik se poredi sam sa sobom, a mi utvrujemo da li nakon vie ponovljenih merenja postoji trend porasta ili pada, u smislu da se promene javljaju u odreenom pravcu. Dakle, slino t-testu za ZV uzorke kojim se 2x meri neko svojstvo (npr. na poetku i na kraju tretmana), kod analize varijanse sa ponovljenim merenjima u vie navrata se meri isto svojstvo u smislu snimanja efekata (tj. monitoringa) nekog tretmana. Moglo bi se raditi i vie t-testova, ali bi se poveala sistematska greka, pa je bolje raditi analizu varijanse sa ponovljenim merenjima. Ovaj nacrt je mnogo finiji jer moemo da pratimo tempo promena, pravac promena, kao i vreme potrebno da bi promena dosegla odreeni, odnosno kritini nivo.
35. Jednosmerna analiza varijanse sa ponovljenim merenjima: interpretacija rezultata

Logika analize varijanse za ponovljena merenja ista je kao kod jednosmerne analize varijanse, samo umesto grupa imamo imamo ispitanike, to povlai za sobom potrebu da se detaljnije definie ta je grupa. U nacrtima sa ponovljenim merenjima postoji samo jedna grupa objekata, ali se oni mere u vie navrata. Zato grupu ini skup mera iz jednog merenja. U nacrtima sa ponovljenim merenjima svaki ispitanik se poredi sam sa sobom, a mi utvrujemo da li nakon vie ponovljenih merenja postoji trend porasta ili pada, u smislu da se promene javljaju u odreenom pravcu. Dakle, slino t-testu za ZV uzorke kojim se 2x meri neko svojstvo (npr. na poetku i na kraju tretmana), kod analize varijanse sa ponovljenim merenjima u vie navrata se meri isto svojstvo u smislu snimanja efekata (tj. monitoringa) nekog tretmana. Moglo bi se raditi i vie t-testova, ali bi se poveala sistematska greka, pa je bolje raditi analizu varijanse sa ponovljenim merenjima. Ovaj nacrt je mnogo finiji jer moemo da pratimo tempo promena, pravac promena, kao i vreme potrebno da bi promena dosegla odreeni, odnosno kritini nivo. Na primer, elimo utvrditi postoji razlika (promena) meu ispitanicima u odnosu na nivo anksioznosti nakon primene razliitih vrsta psihoterapijskih tretmana. Obzirom da je u pitanju jednosmerna analiza varijanse, imamo 1 ZV i vie nivoa 1-e NV. ZV je promena koju ispitujemo, a nivoe NV predstavljaju ponovljena merenja nakon primene razliitih vrsta psihoterapijskih tretmana. U tabelu unosimo rezultate za obradu na sledei nain: u redovima su rezultati svakog pojedinog ispitanika, a u kolonama nivoi (tj. ponovljena merenja za razliite nivoe NV varijable, tj. razliite vrste terapije).
Prvo saberemo sume svih redova (red), a potom i sume svih kolona (kol). Ove dve sume treba da su jednake, tj. red = kol. Potom se obe sume kvadriraju, i onda moemo izraunati varijanse koje su nam neophodne za izraunavanje ukupne varijase, a to su a) varijansa izmeu ispitanika (redova) sred2 = (red)2 / kol 2 / kol x red, pri emu 2 = suma svih rezultata b) varijansa koja se pojavljuje u razliitim merenjima (varijansa kolona) skol2 = (kol)2 / red 2 / kol x red, pri emu 2 = suma svih rezultata, i potom raunamo totalnu, tj. ukupnu varijansu
s2T = s2kol + s2red + s2R

totalna (ukupna) varijansa komponente varijansa greke (rezidual)
Zatim raunamo MS (Mean of sqears): MSred = s2red / red-1 MSkol = s2kol / kol-1 MSR = sR2 / (red-1) x (kol-1) sR2 = sT (skol2 + sred2) sT2 = X2 2 / (kol x red) Interpretacija rezultata ogleda se u odreivanju znaajnosti trenda, odnosno porasta ili pada rezultata u ponovljenim merenjima. Tako, u ovom primeru, elimo li da proverimo da li je razlika izmeu ispitanika (tj. rezultata u pogledu npr. smanjenja anksioznosti praene tokom nekog terapeutskog tretmana) statistiki znaajna, primenjujemo F-test: F = MSred / MSR, a ako elimo da ustanovimo da li postoji razlika u efektima (rezultatima) tretmana u odnosu na njegovo trajanje onda primenimo F-test: F = MSkol / MSR. Posle toga, tj. ako smo utvrdili da postoji znaajna razlika, dalje utvrujemo izmeu kojih rezultata ona postoji primenom nekog od testova kontrastiranja. Najprikladniji grafiki prikaz za interpretaciju rezultata u ovom sluaju je prikaz poligonima. to su manje varijacije ispitanika a vee meu testovima promena e biti verovatnija.
36. Viesmerna analiza varijanse sa ponovljenim merenjima: namena

Za razliku od jednosmerne analize varijanse sa ponovljenim merenjima, u viesmernoj analizi analizi varijanse sa ponovljenim merenjima osim razliitih nivoa NV na kojima se ponavlja merenje, pojavljuje se i moderator koji se specifikuje kao faktor NV-e (npr. razliito reaguju ekstroverti od introverta), to uslovljava nephodnost sprovoenja dvosmerne analize. Osim dodatnog faktora NV-e, mogue je da postoji vie ZV (npr. pored uticaja nekog psihoterapijskog tretmana na smanjenje anksioznosti, moemo meriti i da li je sprovedeni tretman u isto vreme doveo do neke druge promene u ponaanju ispitanika). Mi tada moemo testirati dve hipoteze: jednu izmeu ispitanika kao kod ponovljenih merenja standardno, a drugu izmeu grupa introvertnih i ekstrovertnih ispitanika i ponovljenih merenja. Pomenuti dodatni faktori specifini za viesmernu analizu varijanse sa ponovljenim merenjima, mogu imati ulogu kovarijeteta, tj. mogu da slue statistikoj kontroli eksperimenta, ime viesmerna analiza varijanse sa ponovljenim merenjima predstavlja multivarijatnu analizu, odnosno kombinaciju jednostavne, tj. jednosmerne analize varijanse i regresione analize. Za viesmernu analizu varijanse sa ponovljenim merenjima karakteristina je mogunost dobijanja nebalansiranih nacrta, usled razliitih N-ova unutar elija. Rezultat je, svakako, najbolje vizualizovati da bi se uoila interakcija. Ako je generalni F-test znaajan, moemo primeniti neki od testova kontrastiranja izmeu razliitih AS (npr. Scheffeov, Tuckyev) kako bi utvrdili na kom testu i za koju grupu je dolo do promene, kao i pravac promene. Slino logici u 2-u, marginalne AS-e omoguuju procenu elijskih AS-a.
37. Viesmerna analiza varijanse sa ponovljenim merenjima: interpretacija rezultata
Obzirom da se u viesmernoj analizi varijanse sa ponovljenim merenjima specifikuje faktor NV-e, a mogue je da postoji i vie ZV, viesmerna analiza varijanse sa ponovljenim merenjima zapravo je multivarijatna analiza, odnosno kombinacija jednostavne, tj. jednosmerne analize varijanse i regresione analize. Rezultat je, svakako, najbolje vizualizovati da bi se uoila interakcija. Ako je generalni F-test znaajan, moemo primeniti neki od testova kontrastiranja izmeu razliitih AS (npr. Scheffeov, Tuckyev) kako bi utvrdili na kom testu i za koju grupu je dolo do promene, kao i pravac promene. Slino logici u 2-u, marginalne AS-e omoguuju procenu elijskih AS-a.
38. Neparametarske zamene za analizu varijanse: namena

Neparametarijski testovi spadaju u metode neparametrijske statistike. Njihova osnovna karakteristika je da ne zahtevaju normalnu raspodelu populacije, mada to ne vai i za uzorak. Primenjuju se na podacima sa nominalnog i ordinalnog nivoa. Mogu da se primene i na podacima sa intervalnog ili racio nivoa, ali tada gubi preciznost koju ovi nivoi merenja nose sa sobom. Prednosti neparametrijskih testova ogledaju se u: - mogunosti primene na podacima sa nieg nivoa merenja (ordinalni, nominalni) - jednostavnosti formula, zahvaljujui emu je rizik od nasilja nad podacima manji - veoj robustnosti, naroito na zahtev o veliini uzorka Nedostaci neparametrijskih testova: - imaju manju snagu, za oko 1/3, upravo zbog toga to se primenjuju na podacima sa nieg nivoa merenja (snaga testa predstavlja njegovu spobonost da otkrije razliku ako ona zaista postoji, 1-, gde je = greka tipa II) Postoji vie neparametrijskih testova koji se koriste kao zamene za analizu varijanse: 1. za nezavisne uzorke: a) Test homogenog niza (Run test, Wald-Wolfowitzov test) b) Medijan test c) Test sume rangova (Mann-Whitneyev U-test) d) Siegel-Tukeyev test 2. za zavisne uzorke: a) Test predznaka (sign test) b) Wilkoksonov test ekvivalentnih parova 3. za vie nezavisnih uzoraka a) Proireni Medijan test b) Kriskal-Wallisov test 4. za vie zavisnih uzoraka a) Friedmanov test b) Cochranov Q-test c) Fergusonov test monotonije trenda
39. Neparametarske zamene za jednosmernu analizu varijanse: Medijan test

Ovo je vrlo jednostavan test koji se svodi na 2-test, a predstavlja zamenu za jednosmernu anovu. Njime se ispituje da li dva ili vie uzoraka pripadaju populaciji sa istim medijanom. Princip Medija testa se sastoji u tome da naemo centralnu vrednost (tj. Medijan) iz svih rezultata zajedno, svakom rezultatu dodelimo vrednost + ili u zavisnosti od toga da li je iznad ili ispod zajednikog medijana, i da ih unesemo u 2x2 tablicu ili tablicu kontingencije u zavisnosti od toga koliko uzoraka imamo. Iz toga raunamo 2. Razliku utvremo tako to testiramo nultu hipotezu (H0), prema kojoj grupe ne pripadaju populaciji sa istim medijanom.
Primer: Uzmimo da smo na dva uzorka (koji mogu po veliini biti jednaki ili razliiti) dobili u nekom merenju ove rezultate, koje smo zbog preglednosti poreali prema veliini:
Uz. I 8 9 9 10 10 10 12 13 15 17 17 18 19 19 21 23 24 Uz II 3 6 7 7 8 8 8 10 12 16 19 22 24 27 30 32 25 26 28 28 29 31 31
Sada naemo centralnu vrednost (tj. Medijan) iz svih rezultata zajedno i unesemo ih u tablicu 2x2. Obzirom da u naem primeru imamo neparan broj rezultata, tj. 41, Medijan je 21. rezultat po veliini, a to je 17. Ako sve rezultate koji su iznad Mdn oznaimo znakom +, a rezultate na Mdn ili ispod njega znakom -, dobijamo:
Uz I Uz II - - - - - - - - - - - + + + + + + + + + + + + + - - - - - - - - - - + + + + + +
Unesemo li frekvencije tih rezultata u tablicu, dobijamo:
fo
12,5 11,5 7,5 9,5
ft
11,7 12,29 8,29 8,7
fo- ft
0,8 -0,8 -0,8 0,8
(fo- ft)2
0,64 0,64 0,64 0,64
(fo- ft)2/ ft
0,054 0,052 0,077 0,073 2 = 0,256
+ Uz I Uz II
Uz I Uz II
13 11 24 7 10 17 20 21 41
Iz ove tablice sada izraunamo 2-test, vodei rauna o svim pravilima koja vrede za 2, pa stoga u ovom sluaju moramo (jer se radi o 2x2 tablici) upotrebiti Yatesovu korekciju. Izraunati 2= 0.258 je manji od onog u tablici graninih vrednosti hi-kvadrata koji je 2 = 3,83 pri stepenima slobode df = (br.kol-1)x(br.red-1) = (2-1)x(2-1) = 1 na nivou znaajnosti od 0.05, pa zato prihvatamo hipotezu da se Mdn-i oba uzorka statistiki znaajno ne razlikuju, odnosno zakljuujemo da pripadaju istoj populaciji. Ako je broj rezultata paran, Medijan je AS izmeu dva rezultata koji se nalaze u sredini niza svih rezultata poreanih po veliini. U tom sluaju e nam svi rezultati biti ili iznad ili ispod Medijana, a ni jedan na samom Medijanu.
40. Neparametarske zamene za analizu varijanse sa ponovljenim merenjima: Friedmanov test

Friedmanov test dvostruke analize varijanse rangova predstavlja vrlo korisnu i upotrebljivu metodu kojoj u parametrijskoj statistici odgovara dvostruka analiza varijanse, a koja se upotrebljava, izmeu ostalog i pri testiranju razlika izmeu AS-a vie zavisnih uzoraka. Drugim reima, Friedmanov test iako koristi jedino rangove, a ne stvarne izmerene vrednosti ima gotovo jednaku snagu kao i analiza varijanse zavisnih uzoraka. Postupak Friedmanova testa sastoji se u tome da se rezultati najpre razvrstaju u tablicu sa N redova i k kolona. Redovi odgovaraju pojedinim ispitanicima (ili grupama ispitanika), a kolone predstavljaju eksperimentalne uslove. Rezultati u svakom redu (dakle za svakog ispitanika posebno) pretvore se u rangove. U sluaju jednakih rezultata, dobijamo naravno zajednike rangove, ali to prema Friedmanu ne utie na vrednost testa. Rangovi se u svakoj koloni (eksperimentalnoj situaciji) zbroje (T). Kada ne bi bilo razlika u rezultatima meu uzorcima iz razliitih eksperimentalnih uslova (tj. kada bi svi uzorci bili iz iste populacije), sume rangova tendirale bi slinim vrednostima. Ako se te sume znaajno razlikuju, moemo odbaciti nultu hipotezu. Da bismo izmerili relativnu veliinu tih razlika, sabraemo kvadrirane sume rangova (suma rangova = Ti), i nakon toga emo izraunati: r2 = 12 / N k(k+1) (Ti)2 3 N (k+1) Ako su broj ispitanika (N) i broj eksperimentalnih uslova dovoljno veliki, izraz 2 ima priblino jednaku distribuciju kao i 2 sa k-1 stepeni slobode, pa stoga znaajnost oitavamo iz tablice graninih vrednosti za 2. H0 je manje verovatna to je suma rangova ispitanika u ponovljenim merenjima razliitija. Primer: Jedan je istraiva ispitivao kako na radni uinak utie vie odmora i da li je u toku rada racionalnije uzeti jedan dui odmor ili vie kraih. Merio je ukupan radni uinak kod rada od 4min bez odmora (eksperimentalna situacija a), kod rada od ukupno 3 min sa jednim odmorom od 60sec u sredini rada (eksper. Situacija b), kod
rada od ukupno 3min s 2 odmora od po 30sec u toku rada (eksper. Situacija c) i kod rada od ukupno 3min s odmora od po 20sec (eksper. Situacija d). Na ukupno 11 ispitanika dobio je sledee rezultate, koje je za za svakog ispitanika posebno pretvorio u rangove (rang je uz svaki rezultat oznaen u zagradi): eksperimentalne situacije_________ b c d______ 1 991 (4) 1157 (3) 1232 (1) 1217(2) 2 1139 (2) 1055 (4) 1057 (3) 1173 (1) 3 762 (4) 775 (3) 931 (1) 890 (2) 4 1074 (4) 1121 (3) 1 220 (2) 1260 (1) 5 544 (4) 596 (3) 655 (2) 671 (1) 6 765 (2) 728 (3) 840 (1) 637 (4) 7 904 (1) 839 (2) 746 (4) 774 (3) 8 862 (4) 916 (2) 881 (3) 1157 (1) 9 725 (4) 886 (3) 925 (2) 992 (1) 10 1079 (2) 894 (4) 1130 (1) 1009 (3) ___11 833 (3) 844 (3) 890 (3) 963 (1)___ ___Ti _______________35_______33________22_______20___ ispitanici a Zbog kontrole treba izraunati sumu rangova: Ti = N k(k+1) / 2 = 110 = 44x5 /2. Izraunamo li sumu kvadr. suma rangova, dobijamo: Ti2 = 352 + 332 + 222 + 202 = 3198 Uvrstimo li dobijene vrednosti u formulu, to je: r2 = (12 / 44x5) x 3198 - 33 x 5 = 9,44 Uz (k-1)=3 stepeni slobode, granina vred. 2 iznosi 7815. Obzirom da je 9,44 > 7815 dobijena razlika tj. 2 je znaajan, pa odbacujemo H0 i zakljuujemo da uzorci ne pripadaju istoj populaciji. Ako su N i k mali, postoje posebne tablice za oitavanje znaajnosti izraza r2, na nivou znaajnosti od 5% i 1%.
41. Neparametarske zamene za analizu varijanse sa ponovljenim merenjima: Fergusonov test

Fergusonov test predstavlja neparametrijsku zamenu za 2-faktorsku analizu varijanse sa ponovljenim merenjima. Nas, naime, moe zanimati ne samo to da li se eksperimentalne situacije statistiki znaajno razlikuju, ve i to da li postoji odreena pravilnost u porastu (ili padu) rezultata od jedne eksperimentalne situacije do druge, odnosno daje nam mogunost da odgovorimo i na to pitanje trenda. Upravo zbog toga, Fergusonov test predstavlja ekstenziju Friedmanove logike. U sluajevima kada nema zajednikih rangovametoda Fergusonovog testa obuhvata 5 koraka: 1. Rangiraju se rezultati svakog ispitanika posebno, za sve eksperimentalne situacije 2. Za svakog ispitanika izrauna se izraz S, koji se rauna ovako: uporedi se svaki rang sa svakim (imamo N(N-1/2) poreenja rangova za svakog ispitanika): ako je par rangova, koji se uporeuje, u prirodnom odnosu (npr. 1-4), zabelei se +1, a ako je red izvrnut (npr. 4-1),zabelei se -1.Rezultati se za svakog ispitan. saberu.
prikaz rangova i vrednosti S za svakog ispitanika ispitanici rangovi minusevi plusevi 1 4 3 1 2 -5 +1 2 2 4 3 1 -4 +2 3 4 3 1 2 -5 +1 4 4 3 2 1 -6 0 5 4 3 2 1 -6 0 6 2 3 1 4 -2 +4 7 1 2 4 3 -1 +5 8 4 2 3 1 -5 +1 9 4 3 2 1 -6 0 10 2 4 1 3 -3 +3 11 4 3 2 1 -6 0 S -4 -2 -4 -6 -6 +2 +4 -4 -6 0 -6
S = -32
Pokazaemo raunanje S za prva dva ispitanika: Ispitanik 1 Par 4 : 3 -1 4 : 1 -1 4 : 2 -1 3 : 1 -1 3 : 2 -1 1 : 2 +1
Ispitanik 2 Par 2 : 4 +1 2 : 3 +1 2 : 1 -1 4 : 3 -1 4 : 1 -1 3 : 1 -1
3. Saberu se sve vrednosti S da bi se dobio izraz S. U naem sluaju S = -32. 4. Izrauna se izraz S2 (to je varijansa distribucije uzoraka S) prema formuli: S2 = k(k-1)(2k-5) / 18, pri emu je k = broj eksperimentalnih situacija, i dobijeni se izraz pomnoi ss N (broj ispitanika) kako bi se dobila varijansa distribucije izraza S. Drugi koren iz tog izraza je standardna devijacija izraza S. Dakle, S2 = 4 x 3 x (8 + 5 ) / 18 = 8,67 XS2 = 8,67 x 11 = 95,37 XS = 95,37 = 9,77 5. Izraz |S| - 1 podeli s izrazom XS, i tako se dobije odstupanje u terminima normalne distribucije, dakle z: z = -31 / 9,77 = -3,17 Ako z vei od 1,96 (na nivou p<5%), ili vei od 2,58 (na nivou p<1%), odbaciemo nultu hipotezu. Dakle, u naem sluaju zakljuujemo da nai rezultati pokazuju statistiki znaajan trend (p<0,01).
42. Eksplorativna analiza: namena

Eksplorativnom analizom obavetavamo se o rasporedu (grupisanju) podataka, a posebno o atipinim vrednostima (outlierima) kako bi se uverili : a) da li postoje uslovi za obradu b) preduzele mere da se oni stvore, i c) odabrale odgovarajue metode Eksplorativna analiza, dakle, mora biti dobro isplarinarana i organizovana, a obuhvata: a) proveru kodiranosti varijabli * npr.: vrednost dodeljena varijabli za = 1, protiv = 0 I rekordiraj ih po ptrebi, npr.: - pretvori u z-vrednosti - ili prevedi u petostepenu skalu - promeni smer varijabli - administrativne greke * npr.: - Uspeh na testu / 2b (sirov skor treba ga prevesti) - potpuno se slaem = ima vrednost 5 (proveriti da li je dobro kodirano, da li je dobar smer) U programu se moe zadati da kompjuter rekordira podatke; npr. dodeli 1 bodovima 1-20 a 2 bodovima 21-40 b) postojanje nedostajuih podataka
c) postojanje outliera d) utvrivanje normalnosti distribucije - upotrebiti testove spljotenosti i ikrivljenosti - upotrebiti Kolmogorof-Smirnov - uporediti testove za pojedine varijable - izvedi zakljuak o tome loje su tehnike doputene - ako su zakrivljene u istom pravcu moe se primeniti parametrijski test e) utvrivanje homogenosti varijansi - nije sama sebi cilj nego uslov za prethodnu promenu - upotrebiti test homogenosti varijansi (F) - u sluaju razlike, zapitaj se nad razlozima: uporedi eksperimentalne situacije (standardnost uslova) uporedi N-ove (da li je razlika prevelika?) - prepoznaj strane varijable i u vezi s tim: formiraj unakrsne tabele (cross.tabulation) ili grafikim posmatranjem Pored navedenih ciljeva, eksplorativna analiza obuhvata i identifikaciju sistematskih odnosa meu varijablama kada o njima ne postoje nikakva (a priori) oekivanja, odnosno nikakve hipoteze o tome. Dakle, nije re o inferncijalnoj statistici. Praktino, eksplorativna analiza tretira se kao posebna vrsta istraivanja kojom se stie poetni, orijentacioni uvid u neku pojavu, umesto da se testiraju neke hipoteze. Eksplorativnu analizu koriste npr. menaderi, bankari (tzv. data mining) sa ciljem da npr. ustanove zato ljudi kasne na posao kako bi doneli zakljuke o nanu unapreenja poslovanja. Obzirom da eksplorativna analiza predstavlja pripremu za statistiku obradu, a i zavraava se konkretnim izvetajem, vano je da bude valjana i da ne bude prebrza jer prebrza obrada stvara rizik prikrivanja pravog stanja stvari. Kao poseban vid eksplorativne analize izdvajaju se sofisticirane multivarijatne eksplorativne tehnike koje su usmerene na eksploraciju u latentnoj ravni, koja nam nije dostupna, a za njihovu primenu potrebni su nam: - vei uzorci - vei broj varijabli istovremeno Primena ovih tehnika omoguuje i vizualizaciju podataka, a logika rauna ogleda se u primeni regresijske analize korak po korak. Neke od ovih tehnika dostupne su nam u programu: - klaster analize - faktorske analize - diskriminativne analize - data mininga
43. Eksplorativna analiza: nedostajui podaci

Eksplorativnom analizom obavetavamo se o rasporedu (grupisanju) podataka, a posebno o atipinim vrednostima (outlierima) kako bi se uverili : a) da li postoje uslovi za obradu b) preduzele mere da se oni stvore, i c) odabrale odgovarajue metode Eksplorativna analiza, dakle, mora biti dobro isplarinarana i organizovana, a obuhvata: a) proveru kodiranosti varijabli b) postojanje nedostajuih podataka Esplorativna analiza obuhvata i utvrivanje nedostajuih podataka i da li moda neke tehnike neemo moi da primenimo u analizi. Naime, u situacijama kada ispitanik nije odgovorio na neko pitanje u testu, mi taj test ipak moemo iskoristiti. Prvo emo pokuati da nedostajui podatak, ako je mogue i dostupno, da pribavimo na drugi nain (npr. ukoliko je ispitanik propustio da napie stepen strune spreme, moemo pokuati da to utvrdimo pregledom eventualno postojee dokumentacije ili da naknadno pitamo ispitanika, mada to moe remetiti
standardnost ispitivanja). Ukoliko ne moemo sami dopuniti nedostajui podatak (jer nije u pitanju obian administrativni propust), niti ga moemo naknadno utvrditi, pribegavamao primeni odgovarajuih tehnika za obradu postojeeg materijala, ili ga moemo nadomestiti predvianjem (npr. dodeljujui srednju vrednost grupe ili srednju vrednost ispitanika). Dopuna nedostajueg podatka predvianjem opravdana je i prikladna samo u odreenim situacijama, uglavnom u sluajevima jednostavna statistike obrade uz mogunost primene t-testa. Na primer, ukoliko nas zanimaju korelacije dodavanjem nekog nedostajueg podatka neemo ba falsifikovati stvarnost jer emo dopunom dodati srednju vrednost grupe, eventualno e nam se korelacija malo smanjiti ili poveati. Ovo je dopustivo kod rauna korelacije, ali je manje dopustivo kod ispitivanja razlika ili u situaciji kad nemamo puno ispitanika. Dopunu nedostajueg podatka moemo predviati na osnovu drugih zadataka koje je ispitanik uradio. c) postojanje ekstremnih podataka (outliera) d) utvrivanje normalnosti distribucije e) utvrivanje homogenosti varijansi Program sam uzima one ispitanike koji imaju sve podatke.
44. Eksplorativna analiza: ekstremni podaci

Eksplorativnom analizom obavetavamo se o rasporedu (grupisanju) podataka, a posebno o atipinim vrednostima (outlierima) kako bi se uverili : a) da li postoje uslovi za obradu b) preduzele mere da se oni stvore, i c) odabrale odgovarajue metode Eksplorativna analiza, dakle, mora biti dobro isplarinarana i organizovana, a obuhvata: a) proveru kodiranosti varijabli b) postojanje nedostajuih podataka c) postojanje ekstremnih podataka (outliera) Ekstremni podaci (outlieri) su oni rezultati koji su diskontinuirani u odnosu na distribuciju. Oni ugroavaju upotrebu parametrijskih testova jer utiu na AS, SD. U ekperimentalnoj psihologiji ovakve rezultate najbolje je eliminisati, dok kod psihologije linosti ove rezultate ne zanemarujemo. Radi identifikacije ekstremnih podataka najbolje je podatke grafiki predstaviti da bi se uoilo koji ispitanici na kojim varijablama deluju kao ekstremni, tj. nemaju kontinuitet sa distribucijom preostalih. Za grafiki prikaz najedakvatnije je da primenimo histogram ili skater dijagram. d) utvrivanje normalnosti distribucije e) utvrivanje homogenosti varijansi Program sam uzima one ispitanike koji imaju sve podatke.

Napredna Statistika

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Napredna Statistika

Uploaded by

Copyright:

Available Formats

1.

Eksperimentalna i statistika kontrola stranih (moderator) varijabli

2. Statistika kontrola stranih (moderator) varijabli: uslovi i metode primene

3. Smisao i princip parcijalne korelacije

4. Koeficijent parcijalne korelacije: namena i interpretacija

5. Smisao i princip viestruke korelacije

6. Koeficijent viestruke korelacije: namena i interpretacija

7. Testiranje znaajnosti koeficijenta viestruke korelacije

9. Viestruka regresiona analiza: racionale i upotreba

10. Viestruka regresiona analiza: interpretacija rezultata

11. Jednaina specifikacije viestruke regresije: diferencijalno i optimalno ponderisani kompozit

12. Regresiona analiza korak po korak: racionale i upotreba

13. Regresiona analiza korak po korak: analiza unapred (forward stepwise)

14. Regresiona analiza korak po korak: analiza unazad (backward stepwise)

15. Jednosmerna analiza varijanse: namena

16. Jednosmerna analiza varijanse: prednosti u odnosu na t-test

17. Meugrupna i unutargrupna varijansa u analizi varijanse

20. Uslovi za primenu analize varijanse: nivoi merenja varijabli

21. Uslovi za primenu analize varijanse: normalnost distribucija

22. Uslovi za primenu analize varijanse: homogenost varijansi

23. Uslovi za primenu analize varijanse: nezavisnost distribucije greke

24. Problemi u zakljuivanju na osnovu F-testa: analiza kovarijanse

25. Dvosmerna analiza varijanse: namena

greka (pre je bila unutar grupe)

SStot = SSbr + SSbk + SSr x k + SSwc

bk = npr. vrsta terapije

SStot = SSbr + SSbk + SSr x k + SSwc

greka (pre je bila unutar grupe)

SStot = SSbr + SSbk + SSr x k + SSwc

greka (pre je bila unutar grupe)

SStot = SSbr + SSbk + SSr x k + SSwc

30. Nesistematski efekti (efekti greke)

31. Testiranje znaajnosti efekata u dvosmernoj analizi varijanse

32. Viesmerna analiza varijanse: sluaj vie od dve nezavisne varijable

33. Analiza varijanse za ponovljena merenja: izvori varijacija u ponovljenim merenjima

34. Jednosmerna analiza varijanse sa ponovljenim merenjima: namena

35. Jednosmerna analiza varijanse sa ponovljenim merenjima: interpretacija rezultata

s2T = s2kol + s2red + s2R

36. Viesmerna analiza varijanse sa ponovljenim merenjima: namena

37. Viesmerna analiza varijanse sa ponovljenim merenjima: interpretacija rezultata

38. Neparametarske zamene za analizu varijanse: namena

39. Neparametarske zamene za jednosmernu analizu varijanse: Medijan test

Unesemo li frekvencije tih rezultata u tablicu, dobijamo:

40. Neparametarske zamene za analizu varijanse sa ponovljenim merenjima: Friedmanov test

41. Neparametarske zamene za analizu varijanse sa ponovljenim merenjima: Fergusonov test

Pokazaemo raunanje S za prva dva ispitanika: Ispitanik 1 Par 4 : 3 -1 4 : 1 -1 4 : 2 -1 3 : 1 -1 3 : 2 -1 1 : 2 +1

42. Eksplorativna analiza: namena

43. Eksplorativna analiza: nedostajui podaci

44. Eksplorativna analiza: ekstremni podaci

You might also like