Professional Documents
Culture Documents
STATISTIKIH HIPOTEZA
CILJEVI POGLAVLJA
8. glava
1. shvatite logiku, zna aj i og ranienja statistikog testiranja
hipoteza
2. razumete razliku izmeu testiranja na osnovu kritinih
vrednosti i p-vred nosti
3. primenite najpoznatije parametarske testove u sluaju
jednog i dva uzorka
4. protumaite raunarski izlaz testiranja h ipoteza ako
koristite statistiki softv er ili Ex cel
Parametarski testovi
Statistiki testovi
Neparametarski testovi
rezultat bio validan, treba izabrati onaj test koji je optimalan u datoj situaciji, a
to znai test za koji su preduslovi primene zadovoljeni. Recimo, ipak, da je
ovakav pristup testiranju relativno nov. Naime, tokom veeg dela XX veka
korieni su iskljuivo parametarski testovi, pri emu je uslov normalnosti
skupa retko proveravan zbog komplikovane i nepouzdane procedure. Situacija
se potpuno izmenila u poslednjih deset godina. Sa optom dostupnou
raunara i statistikog softvera, preduslovi primene testova se mogu lako
proveriti, a sam test primeniti na podatke iz uzorka. Zbog toga naglasak u
modernom testiranju hipoteza vie nije puka primena nekog testa, ve pre
svega:
1) ispitivanje da li su preduslovi na kojima se test zasniva ispunjeni i
2) korektna interpretacija rezultata.
U ovom poglavlju razmatraemo parametarske testove kojima se testira
aritmetika sredina i proporcija jednog i dva osnovna skupa. U sledeem poglavlju
posmatraemo parametarski test zasnovan na vie uzoraka kojim se testira
hipoteza o jednakosti aritmetikih sredina vie osnovnih skupova.
Parametarske testove emo, takoe, primenjivati i u regresionoj i korelacionoj
analizi, koje su predmet razmatranja u 12. i 13. poglavlju. Neparametarskim
testovima emo se baviti u 11. poglavlju.
Nulta hipoteza
Nulta hipoteza (H0) je iskaz (tvrenje) o karakteristici jednog ili vie
skupova. Kod parametarskih testova koje razmatramo u ovom
poglavlju nulta hipoteza se odnosi na vrednost nepoznatog parametra
jednog ili dva skupa. Konkretna nulta hipoteza varira od problema do
problema, ali se po pravilu postavlja u vidu status quo-a, tj. da "nema
razlike", "nema uticaja", ili da "nema promene".
POGLAVLJE 8 Testiranje statistikih hipoteza 175
Nulta hipoteza moe biti prosta i sloena. Nulta hipoteza je prosta ako se
njom tvrdi da je parametar jednak tano jednoj, unapred poznatoj
numerikoj vrednosti, tzv. hipotetinoj vrednosti. Nultu hipotezu
moemo napisati reima ali je, po pravilu, piemo simbolima, na primer,
H 0: =300 i itamo: "nulta hipoteza glasi da je aritmetika sredina skupa
jednaka 300 evra". Ako nulta hipoteza obuhvata vei broj moguih
vrednosti, na primer, H0: 300 , ona je sloena. Bez obzira kako je
postavljena, nulta hipoteza uvek sadri znak jednakosti.
Svakoj nultoj hipotezi suprotstavljamo (pridruujemo) alternativnu
hipotezu i oznaavamo je sa H 1 ili H a.
Alternativna hipoteza
Alternativna hipoteza (H1 ili Ha) je iskaz (tvrenje) o karakteristici jednog
ili vie skupova koje je suprotno tvrenju sadranom u nultoj hipotezi.
Najee se postavlja u vidu da "ima razlike ", da "postoji uticaj" ili da je
"dolo do promene".
2 www.greenhouse.gov.au/fuelguide
176 OSNOVI STATISTIKE
3 http://www.amcham.yu
4 http://www.zdravlje.org.yu/ekoatlas/08t1.htm
POGLAVLJE 8 Testiranje statistikih hipoteza 177
Jaina testa
Jaina testa je verovatnoa da se odbaci pogrena nulta hipoteza.
Obeleava se sa .
Statistika testa
Statistika testa je kriterijum na osnovu kojeg vrimo testiranje.
8.2.5 p-vrednost
p-vrednost
p-vrednost je verovatnoa da statistika testa uzme vrednost
jednaku ili jo ekstremniju od vrednosti koja se upravo
realizovala u uzorku, pod uslovom da je nulta hipoteza tana. to
je manja p-vrednost, jai su dokazi protiv nulte hipoteze.
184 OSNOVI STATISTIKE
Statistika znaajnost
Ako je p-vrednost manja od nivoa znaajnosti , kaemo da je
rezultat statistiki znaajan na nivou .
Z test
Osnovne informacije vezane za primenu Z testa u sluaju testiranja aritmetike
sredine jednog skupa prikazane su u Tabeli 8.3.
6 http://data.energizer.com/PDFs/l92.pdf
POGLAVLJE 8 Testiranje statistikih hipoteza 187
Alternativna
hipoteza p-vrednost
H 1 : > 0 P( Z z )
H 1 : < 0 P( Z z )
H1: 0 2 P(Z z )
z
Slika 8.2 Izraunavanje p-vrednosti kod Z testa
Etapa 5. Postavljanje pravila odluivanja i donoenje odluke o nultoj hipotezi.
Kao to smo videli pravilo odluivanja pri korienju p-vrednosti glasi:
Ako je p-vrednost manja od nivoa znaajnosti, H0 se odbacuje; u suprotnom se ne
odbacuje.
Naa p-vrednost je jednaka 0,1586 i kao takva vea od odabranog nivoa
znaajnosti = 0,05. Usled toga nemamo dovoljno razloga da odbacimo
nultu hipotezu.
Za dobijeni rezultat kaemo da nije statistiki znaajan, odnosno da je
nesignifikantan.
Standardna Z statistika P
greka
0,283 -1,4142 0,15735
Zakljuak
Nemamo dovoljno razloga da tvrdimo da se prosena vrednost u populaciji
razlikuje od 13
Studentov t test
Osnovne informacije vezane za primenu verovatno najpoznatijeg statistikog
testa, t testa, u sluaju testiranja aritmetike sredine jednog skupa prikazane su
u Tabeli 8.4.
Tabela 8.4 Testiranje hipoteze o aritmetikoj sredini skupa
primenom t testa
x=
xi =
106
= 6,625
n 16
a ocenjena vrednost standardne greke iznosi:
sX =
x i
2
n x2
=
11236 16 6,6252
= 0, 499
n (n - 1) 16 15
sajtu www.see-educoop.net/education_in/pdf/heser_reform-ser_enl_t02.pdf
POGLAVLJE 8 Testiranje statistikih hipoteza 191
p - 0 0 (1 - 0 )
Statistika testa: Z = Sp =
Sp n
Standardna greka 0 (1 - 0 )
Sp = (8.5)
proporcije n
7 decembra 2006.
194 OSNOVI STATISTIKE
Hypothesis Tests
Sample proportion = 0,67
Sample size = 1700
Approximate 95,0% confidence interval for p: [0,646001;0,691529]
Null Hypothesis: proportion = 0,76
Alternative: not equal
P-Value = 0,0
Reject the null hypothesis for alpha = 0,05.
Z test
Osnovne informacije vezane za primenu Z testa u sluaju testiranja jednakosti
aritmetikih sredina dva skupa prikazane su u Tabeli 8.6.
Tabela 8.6 Testiranje hipoteze o razlici aritmetikih sredina dva skupa
primenom Z testa
Skup 1 Skup 2
Da li postoji razlika?
1 2
x1 x2
Uzorak 1 Uzorak 2
Slika 8.3 Grafiki prikaz testiranja jednakosti aritmetike sredine dva skupa
Ideja testiranja je u sledeem: ako je nulta hipoteza istinita, tj. ako su aritmetike
sredine dva skupa meu sobom jednake, onda oekujemo da razlike izmeu
aritmetikih sredina uzoraka, izabranih iz dva skupa, bude relativno male.
Takve razlike emo pripisati sluajnom kolebanju uzoraka. U suprotnom, ako
su razlike izmeu aritmetikih sredina uzoraka relativno velike, onda emo ih
tretirati kao argumente protiv nulte hipoteze, koju emo odbaciti uz izabrani
nivo znaajnosti.
Kao to znamo, ako osnovni skup ima normalan raspored, onda i
aritmetike sredine uzoraka iz tog skupa slede normalan raspored. U statistici je
pokazano da razlika aritmetikih sredina uzoraka izabranih iz dva normalno
rasporeena osnovna skupa ima normalan raspored.
X 1 X 2 : N ( 1 2 , X2 1 + X2 2 ) .
12 22
X 1 X 2 = + (8.8)
n1 n2
X1 X2
Statistika Z testa Z = (8.9)
/ n 1 + 22 / n 2
2
1
PROBLEM 8.4: Radi ispitivanja da li novi lek, Topiramejt, ima efekta pri
leenju migrene, formirane su dve grupe (eksperimentalna i kontrolna) od po
osam pacijenata. Rezultati o mesenom broju migrena su objavljeni u
februaru 2004. godine u asopisu Science News9:
Topiramejt 3 3 2 4 3 4 3 5
Placebo 3 3 5 5 7 5 5 4
REENJE
Postavimo najpre nultu i alternativnu hipotezu. Budui da istraivako
pitanje glasi da li lek uzrokuje smanjenje, jasno je da se zahteva primena
jednosmernog testa. Oznaavajui Topiramejt grupu sa 1, a kontrolnu
(placebo) sa 2, nulta i alternativna hipoteza glase :
H0 : 1 2 H1 : 1 < 2
Budui da nivo znaajnosti nije dat uzeemo = 0, 05 .
sredine uzoraka:
x 1 = 27/8 = 3,375 x 2 = 37/8 = 4,625
Na osnovu formule (8.9) realizovana vrednost statistike Z testa jednaka je:
x1 x2 3, 375 4,625
Z = = = -2,15
/n 1 + /n 2
2
1
2
2
1/8 + 1,7 /8
Topiramejt Placebo
Mean 3,375 4,625
Known Variance 1 1,7
Observations 8 8
Hypothesized Mean Difference 0
z -2,151657415
P(Z<=z) one-tail 0,015712173
z Critical one-tail 1,644853627
P(Z<=z) two-tail 0,031424347
z Critical two-tail 1,959963985
Studentov t test
Studentov test kojim se porede aritmetike sredine dva skupa je jedan od
najvanijih i u praksi najee korienih testova. Kao i kod Z testa
zadraemo se samo na sluaju kada je hipotetina vrednost razlike
aritmetikih sredina dva skupa jednaka nuli
Osnovne informacije vezane za primenu t testa u sluaju testiranja jednakosti
aritmetikih sredina dva skupa prikazane su u Tabeli 8.7.
POGLAVLJE 8 Testiranje statistikih hipoteza 199
(X 1 X 2 ) ( 1 2 ) 0 (8.10)
Statistika testa: t =
S X 1 X 2
1 1 (n 1 1) S 12 + (n 2 1) S 22
S X 1 X 2 = S P + SP = (8.11)
n1 n2 n1 + n2 2
10 Testovi koji ispituju jednakost varijansi dva skupa (recimo F test) su neprecizni,
jer strogo zahtevaju da oba skupa imaju normalan raspored.
11 Ovaj problem poznat je u literaturi pod nazivom Fier-Berensov problem.
12U literaturi je predloeno vie predloga kako da se odredi broj stepeni slobode.
Najpoznatiji predlog je tzv. Velova (Bernard Lewis Welch 1911.-1989.) korekcija
broja stepeni slobode koja se koristi, izmeu ostaloga u Excelu, Minitabu i EduStatu.
200 OSNOVI STATISTIKE
(n 1 1) S 12 + (n 2 1) S 22
S P2 =
n1 + n2 2
(indeks p ukazuje da je re o ponderisanoj oceni iste varijanse u oba skupa, pa
je ne treba dovoditi u vezu sa ocenom varijanse proporcije uzorka, S p2 ).
Statistika X1 X2
t= (8.12)
t testa SP (1/ n 1 + 1/ n 2 )
s12 =
xi
2
n1 x 2
=
97 8 3,3752
= 0,84
n1 1 8 1
s22 =
xi
2
n2 x2
=
183 8 4,6252
= 1,69
n2 1 8 1
(8 1) 0,84 + (8 1) 1,69
s P2 = = 1, 265 ,
8+82
odakle je s P = 1,09. Vrednost statistike ponderisanog t testa izraunavamo
po formuli (8.12):
x1 x2 3, 375 4,625
t = = = 2, 22 .
s P (1/ n 1 + 1/ n 2 ) 1,125 1/8 + 1/8
Ali, kao to smo ve rekli, primenom ovog paketa nije mogue testirati
jednosmerne hipoteze, ve samo dvosmerne, pa u izlazu ne moemo ni
dobiti p-vrednost jednosmernog testa. Da bismo ipak utvrdili tanu vrednost
ove verovatnoe, potrebno je da p-vrednost dvosmernog testa, koja iznosi
0,043, podelimo sa 2, na osnovu ega dobijamo P=0,0215. Budui da je P<
nultu hipotezu odbacujemo uz rizik = 0,05. Samim tim, zakljuujemo da
Topiramejt statistiki znaajno smanjuje prosean broj dana u mesecu u
kojima se javlja migrena.
REZIME
Testiranje hipoteza je statistika procedura u kojoj se podaci uzorka koriste da
bi se donela odluka da li neku tvrdnju (ili postavku) o nekoj karakteristici skupa
treba odbaciti ili ne odbaciti. U ovom poglavlju izuavali smo dva parametarska
testa (Z i t) i njihovu primenu u sluaju jednog i dva uzorka. Pri tome smo kao
karakteristike skupa posmatrali njegove parametre, konkretno aritmetiku
sredinu i proporciju. Parametarski testovi se zasnivaju na pretpostavci da
202 OSNOVI STATISTIKE
23. Ako je broj "uspeha" u uzorku od 100 elemenata jednak 73, testirajte sledee
hipoteze:
a) H0 : 0,71, H1 : > 0,71
b) H0 : = 0,70, H1 : 0,70
c) H0 : 0,745, H1 : < 0,745
Uporedite rezultate i objasnite ih.
24. U uzorku od 30 studenata drutvenih fakulteta proseno vreme uenja u toku
dana je 150 minuta, a standardna devijacija 14 minuta. U sluajnom uzorku od
40 studenata tehnikih fakulteta, proseno vreme uenja je 160 minuta, sa
standardnom devijacijom 10 minuta. Testirajte nultu hipotezu da studenti dve
grupe fakulteta u proseku provode isto vreme u uenju; pretpostavka je da su
varijanse oba skupa jednake medu sobom.
25. Ako je u uzorku od 10 prodavnica tampe u gradu A, prosena mesena
prodaja jednaka 4000 dnevnih listova i asopisa, a u uzorku od 8 novinarnica u
gradu B ona iznosi 4300, ispitajte da li se gradovi razlikuju u kupovini tampe.
Standardna devijacija u prvom uzorku je 200 komada, a u drugom 250;
pretpostavlja se da su varijanse skupova meu sobom jednake.
26. U jednoj auto kui, koja se bavi prodajom stranih automobila, anketirano je 400
potencijalnih kupaca i konstatovano da je kod 250 potencijalnih kupaca
prethodni automobil bio domae proizvodnje.
a) Ispitati tvrdnju agenta ove auto kue da je kod 70% potencijalnih kupaca
prethodni automobil bio automobil domae proizvodnje.
b) Uz rizik greke 0,05, ispitati tvrdnju agenta ove auto kue da je proporcija
potencijalnih kupaca iji je prethodni automobil bio automobil domae
proizvodnje manja od 75%.
c) Uz rizik greke 0,05, ispitati tvrdnju agenta ove auto kue da je proporcija
potencijalnih kupaca iji prethodni automobil nije bio automobil domae
proizvodnje vea od 20%.
27. Na osnovu anketiranja 30 nezaposlenih lica koja se nalaze na birou za
zapoljavanje izraunata je njihova prosena starost 30,77 godina i standardna
devijacija 8,62 godine.
a) Uz nivo znaajnosti testa 0,05, ispitati da li se moe prihvatiti pretpostavka
da prosena starost nezaposlenih lica znaajno odstupa od 26 godina.
b) Uz nivo znaajnosti testa 0,05, ispitati da li se moe prihvatiti pretpostavka
da je prosena starost nezaposlenih lica vea od 28 godina.
c) Uz nivo znaajnosti testa 0,05, ispitati da li se moe prihvatiti pretpostavka
da je prosena starost nezaposlenih lica manja od 34 godine.