Professional Documents
Culture Documents
Uvod
Poxto se mnoge statistiqke metode oslaaju na sluqajne uzorke, statistiqarima je qesto potreban izvor sluqajnih brojeva. Starije statistiqke kige su sadrale tablice sluqajnih cifara, koje su predviene da se koriste pri izboru uzoraka ili dizajnu eksperimenta. Sada
statistiqari vrlo retko koriste odxtampane tablice sluqajnih cifara, ali ponekad se koriste takve tablice saquvane u memoriji raqunara. Meutim, najqexe se koriste raqunarski algoritmi za direktno generisae sluqajnih brojeva.
Danas se upotreba sluqajnih brojeva u statistici proxirila van
sluqajnog uzorkovaa ili sluqajne dodele terapija (tretmana) eksperimentalnim jedinicama. Sluqajni brojevi se sada qexe koriste prilikom simulacijskih studija stohastiqkih procesa, analitiqki neizraqunivih matematiqkih izraza ili populacije na osnovu ponovnog
uzorkovaa 1 iz dobijenog uzorka te populacije. Ove tri opxte oblasti
primene sluqajnih brojeva se ponekad nazivaju, redom, simulacija, Monte Karlo i ponovno uzorkovae, ali mi nieemo praviti razlike izmeu
tih termina.
Resampling
Sluqajni brojevi
Nezavisne vrednosti (realizacije) sluqajne veliqine X sa uniformnom raspodelom U(0, 1) se nazivaju sluqajni brojevi.
Realizacija sluqajne veliqine sa diskretnom uniformnom raspodelom
2 ... 9
1
6
Strane su numerisane sa
12
18
24
30
36
72
108
144
180
216
432
648
864
1080
0, 1, 2, 3, 4, 5
1, 2
0, 1, 2, ..., 35
1, 2, 3
0, 1, 2, ..., 215
1, 2, 3, 4
0, 1, 2, ..., 1295
...
...
Pseudosluqajni brojevi
Brojevi iz intervala (0,1) koji se raqunaju po nekim formulama se
nazivaju pseudosluqajni brojevi. Algoritam na osnovu kojega se dobija
niz pseudosluqajnih brojeva se zove generator pseudosluqajnih brojeva.
Dobijeni niz brojeva nije zaista sluqajan jer je u potpunosti odreen
skupom poqetnih vrednosti, ali zadovoava uslove sluqajnosti.
Prednost pseudosluqajnih brojeva u odnosu na sluqajne brojeve je
xto se mogu dobiti na bri i jednostavniji naqin, a imaju (skoro)
sve osobine koji sluqajni brojevi treba da imaju. Takoe se za ihovu
prednost smatra to xto se moe generisati isti niz brojeva vixe od
jedanput, xto znaqi da se eksperiment moe ponoviti pod identiqnim
uslovima.
Niz 1 , 2 , . . . , k pseudosluqajnih brojeva se obiqno dobija nekom
rekurentnom formulom. Jedna od prvih primeivanih formula je tzv.
metod sredine kvadrata koju je predloio on von Nojman 1946. go2
dine. Neka je m oblika 0.1 2 . . . 2k . Kvadriramo m , m
= 0.1 2 . . . 4k
(
)
2
m+1 = D 102k C(103k m
) ,
2
Alternativni zapis: m+1 = 102k C 102k D(10k m
)
X0 , X0 > 0 i rekurentnom
formulom
Xn = (aXn1 + b) mod m
gde su a, m i b dati prirodni brojevi, pri qemu je m > max{a, b, X0 }.
Koristi se oznaka LKG(m, a, b, X0 ). Poxto je Xn odreen sa Xn1 i
poxto postoji samo m moguih vrednosti za Xi - ove, maksimalni period linearnog kongruentnog generatora je m.
Da bismo dobili pseudosluqajni broj (tj. broj iz intervala (0, 1))
potrebno je da svaki dobijeni broj Xn podelimo sa m, tj.
Un =
Xn
.
m
Maksimalan period m niza pseudosluqajnih brojeva dobijenog linearnim kongruentnim generatorom se moe dobiti pri pogodnom izboru
konstanti a, b i m. Vai sledea teorema:
Teorema 3 Niz pseudosluqajnih brojeva koji se dobija linearnim kongruentnim generatorom ima maksimalan period m ako su ispueni
sledei uslovi:
1. Brojevi m i b su uzajamno prosti.
2. Svaki prost delilac p broja m je i delilac broja a 1.
3. Ako je broj m deiv sa 4, onda je i broj a 1 deiv sa 4.
Poxto raqunari koriste binarni ili dekadni brojni sistem, razmotriemo sluqajeve kada je m = 2 ili m = 10 , gde oznaqava
duinu reqi odreenog raqunara.
3
1. Ukoliko je m = 2 , na osnovu prethodne teoreme, maksimalan period niza pseudosluqajnih brojeva se dobija ako vai:
b je neparan broj (m i b su uzajamno prosti).
a 1 je deivo sa 4, tj. a = 2r + 1, r 2.
Smatra se da se dobri statistiqki rezultati mogu postii za
m = 235 , a = 27 + 1, b = 1.
2. Ukoliko je m = 10 , na osnovu prethodne teoreme, maksimalan period niza pseudosluqajnih brojeva se dobija ako vai:
b nije deivo sa 2 ili 5.
a1 je deivo sa 2, 4, 5, tj. a1 je deivo sa 20, a = 10r +1, r 2.
Zadovoavajui statistiqki rezultati se postiu pri izboru a =
101, b = 1, r 4.
Xn
.
m1
U primenama se dobro pokazao multiplikativni linearni kongruentni generator sa m = 231 1 ili m = 261 1 (Mersen prosti brojevi).
Povoni izbori za a su:
Za m = 231 1: a = 215 210 ili a = 221 216 .
Za m = 261 1: a = 230 219 ili a = 242 231 .
2
+ aXn1 + c) mod m.
Xn = (dXn1
4
5
6
10
Poqetna vrednost ovog generatora je vektor (X0 , Y0 , Z0 ). Ovaj generator direktno vraa brojeve Un iz intervala (0, 1). Period generatora je reda 1012 .
Lekijerov generator:
Xn = 4001Xn1 mod 2147483563
Yn = 40692Yn1 mod 2147483399
Zn = (Xn Yn ) mod 2147483563
Un = 4.656613Zn 1010 .
Period ovog generatora je reda 1018 .
Pseudosluqajni brojevi dobijeni pomou kombinovanih generatora
imaju boe osobine sluqajnosti u odnosu na linearne kongruentne generatore.
11
i=1
1
12 .
Drugo, ispitujemo nezavisnost qlanova niza pseudosluqajnih brojeva preko serijskih koeficijenata korelacije. Serijski koeficijent
korelacije sa korakom k se raquna na osnovu formule
nk
1
i=1 (Xi Ak )(Xi+k Bk )
nk
,
rk =
nk
nk
1
2 1
2
(X
A
)
(X
B
)
i
k
i+k
k
i=1
i=1
nk
nk
gde je Ak =
1
nk
nk
i=1
Xi i Bk =
1
nk
nk
i=1
Xi+k .
0.6
0.0
0.2
0.4
drugi[2:30]
0.8
1.0
0.0
0.2
0.4
0.6
0.8
1.0
drugi[1:29]
5
3
i 6 pravih sa k = 52 .
Primer 6 Razmotrimo jedan od poznatijih multiplikativnih kongruentnih generatora, RAN DU odreen formulom
Xn = (216 + 3)Xn1 (mod m),
sa poqetnom vrednoxu x0 = 1.
Generisano je 1000 pseudosluqajnih brojeva. Uzoraqka sredina je
jednaka 0.511, a uzoraqka disperzija 0.082.
13
1.0
0.8
0.6
0.4
0.2
0.0
0
korak
0.6
0.4
0.0
0.2
niz[2:1000]
0.8
1.0
0.0
0.2
0.4
0.6
0.8
1.0
niz[1:999]
15
Test frekvencija
Neka 1 , 2 , . . . , n predstava uzorak cifara niza pseudosluqajnih
brojeva (npr. uzima se prva decimala svakog generisanog pseudosluqajnog broja). elimo da testiramo nultu hipotezu da se cifre 0 9 javaju sluqajno, tj. da cifre pseudosluqajnih brojeva imaju uniformnu
diskretnu raspodelu
2 ... 9
Mj 10
S=
,
n
j=0
10
koja, za veliko n, ima 29 raspodelu. Kritiqne vrednosti za test-statistiku su i jako velike i jako male vrednosti. Velika vrednost test
statistike znaqi da postoje velike razlike u broju pojavivaa pojedinih cifara. Vrlo mala vrednost test-statistike je takoe neprihvativa jer svaki stvarni niz koji ima konaqno mnogo cifara skoro
sigurno ima razliqit broj pojedinih cifara. Prema tome, kritiqna
oblast je oblika
W = [0, c1 ] [c2 , +),
c2 = 29;1 2
Test parova
Uzmimo uzorak 2n cifara niza pseudosluqajnih brojeva (npr. uzimamo prve dve decimale svakog generisanog pseudosluqajnog broja).
Oznaqimo ih redom sa 1 , 2 , . . . , 2n . Formiramo parove 1 2 , 3 4 , . . . ,
2n1 2n i testiramo hipotezu da je raspodela parova diskretna uniformna raspodela
(
00
0.01
01
02
. . . 99
0.01
0.01 . . . 0.01
9 (
Mij
n
100
i,j=0
)
n 2
100
koja, za veliko n, ima 299 raspodelu. Kritiqne vrednosti za teststatistiku su i jako velike i jako male vrednosti, kao u sluqaju testa
frekvencija. Dakle, kritiqna oblast je oblika
W = [0, c1 ] [c2 , +),
gde su c1 i c2 kritiqne vrednosti. Za dati prag znaqajnosti , kritiqne
vrednosti su tada jednake
c1 = 299; 2 ,
c2 = 299;1 2
17
Serijski test
Serijski test se koristi za testirae nulte hipoteze sluqajnosti
uzastopnih brojeva u generisanom nizu pseudosluqajnih brojeva.
Neka je U1 = (X1 , X2 ), U2 = (X3 , X4 ), . . . , Un = (X2n1 , X2n ) niz uzastopnih parova. elimo da testiramo hipotezu da su sluqajne veliqine Ui nezavisne i da imaju uniformnu raspodelu na jediniqnom
kvadratu.
Podelimo jediniqni kvadrat na r2 kvadrata, svaki povrxine
1
r2
j1 j
,
r
r
k1 k
,
r
r
)
,
j = 1, 2, . . . , r, k = 1, 2, . . . , r.
Test-statistika je
V =
r
r2 (
n )2
Vk,j 2
n
r
k,j=1
Test razmaka
Gap test
18
Pomou Pirsonovog 2 testa testiramo da li raspodela G(0.1) odgovara duini razmaka izmeu pojavivaa istih cifara u generisanom
nizu pseudosluqajnih brojeva.
Duine razmaka podelimo na k intervala (klasa) duine l, l > 1.
Imaemo intervale [0, l), [l, 2l), . . . , [(k 1)l, kl]. Oznaqimo sa Mj , broj
pojavivaa uzoraqkih duina razmaka u j - tom intervalu. Teststatistika je
(Mj npj )2
, j = 1, 2, . . . , k
npj
j=1
k=(j1)l
Poker test
Neka 1 , 2 , . . . , n predstava uzorak cifara niza pseudosluqajnih
brojeva. elimo da testiramo hipotezu o sluqajnosti dobijenih cifara.
Formiraju se grupe po k cifara (k-torke cifara, k = 3, 4) i posmatra se broj istih cifara u svakoj grupi. Razmotriemo triling
varijantu testa kada uzimamo m = 3n cifara i formiramo trojke
1 2 3 , 4 5 6 , . . . , 3n2 3n1 3n . Brojimo iste cifre u formiranim trojkama cifara.
Neka je X sluqajna veliqina koja predstava broj istih cifara u
trocifrenim brojevima. Tada je
p0 = P {X = 0} = P {sve cifre su razliqite} = 0.9 0.8 = 0.72
p3 = P {X = 3} = P {sve cifre su iste} = 0.1 0.1 = 0.01
p2 = P {X = 2} = P {jedan par istih cifara} = 1 0.72 0.01 = 0.27.
19
F (x) =
0,
x<0
0.72, 0 x < 2
0.99, 2 x < 3
1,
x3
(Mj npj )2
,
npj
j=1
Test Kolmogorova
Neka je X1 , X2 , . . . , Xn uzorak pseudosluqajnih brojeva. elimo da
testiramo hipotezu da niz pseudosluqajnih brojeva ima uniformnu
U(0, 1) raspodelu. Formiramo varijacioni niz X(1) X(2) . . . X(n) .
Oznaqimo sa F funkciju uniformne U(0, 1) raspodele i sa Fn empirijsku funkciju raspodelu,
Fn (x) = nk ,
ako je X(k1) x < X(k) , k = 1, 2, . . . , n
1,
ako je x X(n)
. Test-statistika je jednaka
Dn = sup |Fn (x) F (x)|.
xR
20
2 2
Test koraka
Runs test
21
Statistika
R E(R)
R =
D(R)
Test autokorelacija
Neka je X1 , X2 , . . . , Xn uzorak pseudosluqajnih brojeva. elimo da
testiramo hipotezu da su sluqajne veliqine Xi , i = 1, 2, . . . , n nezavisne.
Raqunamo autokorelacije izmeu svakih m qlanova niza Xi , Xi+m ,
Xi+2m , . . . , Xi+(M +1)m , gde je M najvei prirodan broj tako da vai
i + (M + 1)m n. Testiramo nultu hipotezu
protiv
H0 : im = 0
H1 : im = 0,
im
,
im
1
Xi+km Xi+(k+1)m 0.25
M +1
M
im =
k=0
ocena autokorelacije im , a
im
13M + 7
=
12(M + 1)
23
x1 x2 . . . xn
p1 p2 . . . pn
)
,
pk = 1.
k=1
pAB
pA .
pB pAB
1pA .
dogaaj B.
2. Neka su dogaaji A1 , A2 , A3 i A4 definisani kao u prethodnom primeru sa verovatnoama jednakim, redom,
p1 = pAB , p2 = pB pAB , p3 = pA pAB , p4 = 1 pA pB + pAB .
Pomou (pseudo)sluqajnog broja modeliramo sluqajnu veliqinu
(
)
1 2 3 4
:
p1 p2 p3 p4
Ukoliko je dobijena vrednost = i, realizovao se dogaaj Ai , i =
1, 2, 3, 4.
Ik .
k=1
Modeliraju se vrednosti za Ik , k = 1, 2, . . . , n i saberu se. Dobijeni broj je realizovana vrednost sluqajne veliqine Sn . Prednost
ovog postupka je xto se ne moraju raqunati verovatnoe pk iz zakona
26
x1 x2 . . . xn . . .
p1 p2 . . . pn . . .
)
,
pk = 1.
k=1
X :
x1 x2 . . . xn
p1 p2 . . . pn
)
,
gde je pn = 1 p1 . . . pn1 . Vrednost ove sluqajne veliqine se modelira na naqin koji je ve opisan za modelirae vrednosti diskretne
sluqajne veliqine sa konaqno mnogo vrednosti. Na taj naqin se nee
dobiti ni jedna od vrednosti sluqajne veliqine X koja je vea od
xn . Meutim, verovatnoa dobijaa bilo koje vrednosti vee od xn
je maa od , a kako je unapred izabrani vrlo mali pozitivan broj,
to su i verovatnoe dobijaa vrednosti sluqajne veliqine X koje su
vee od xn zanemarivo male. U zavisnosti od zadatka koji se rexava
i broja vrednosti koje je potrebno modelirati bira se .
dok se prvi put ne ostvari dogaaj A. Sluqajna veliqina X koja je jednaka broju izvedenih eksperimenata ima geometrijsku raspodelu. en
zakon raspodele je:
(
X:
...
...
p (1 p)p . . . (1 p)n1 p . . .
odnosno pk = P {X = k} = (1 p)k1 p, k = 0, 1, 2, . . ..
Ova sluqajna veliqina se modelira tako xto, za izabrani pozitivni broj i poznatu verovatnou p, se odredi najmai prirodni
broj koji zadovoava nejednakost
n0 >
ln
.
ln (1 p)
X :
,
p (1 p)p . . . pn0
(
)
gde je pn0 = 1 p + (1 p)p + . . . (1 p)n0 2 p , a zatim se modelira korixeem postupka za modelirae diskretnih sluqajnih veliqina sa
konaqno mnogo vrednosti.
X :
2 ... 8
)
,
(
)
gde je pn0 = 1 0.6 + 0.24 + . . . 0.46 0.6 = 0.0016. Korixeem MersenTvister generatora u statistiqkom softveru R, dobijamo pseudosluqajni broj = 0.4813. Kako je p, realizovala se vrednost x = 1 sluqajne veliqine X.
28
k
, k = 0, 1, 2, . . . .
k!
Ova sluqajna veliqina se modelira tako xto se, za izabrani pozitivni broj n0 i poznati parametar , odredi najmai prirodni broj
koji zadovoava nejednakost
e
n0 + 2
n0 +1
< .
(n0 + 1)! n0 + 2
X :
,
p0 p1 . . . pn0
k
gde je pk = e k! , k = 0, 1, . . . , n0 1, pn0 = 1
n0 1
k=0
pk i zatim se
29
Modelirae neprekidnih
sluqajnih veliqina
Metoda inverzne funkcije
Neka je X neprekidna sluqajna veliqina sa funkcijom rapodele F ,
za koju se moe odrediti inverzna funkcija. Modelirae vrednosti
sluqajne veliqine X se moe ostvariti na osnovu sledee teoreme.
Teorema 4 Neka je data sluqajna veliqina X qija je funkcija raspodele F strogo monotona i neprekidna i neka je F 1 ena inverzna funkcija. Neka je Y sluqajna veliqina sa uniformnom raspodelom U(0, 1).
Tada sluqajna veliqina F 1 (Y ) ima funkciju raspodele F .
Dakle, realizovana vrednost x sluqajne veliqine X se dobija pomou
jednog (pseudo)sluqajnog broja , po formuli x = F 1 ().
Nojmanova metoda
Za sluqajne veliqine qija je gustina raspodele f razliqita od nule
i ograniqena na konaqnom intervalu, modelirae se moe ostvariti
na osnovu sledee teoreme.
Teorema 5 Neka je gustina raspodele f sluqajne veliqine X definisana na konaqnom intervalu (a, b) i neka je f (x) M, x (a, b).
Neka su xT i yT modelirane vrednosti nezavisnih sluqajnih veliqina
sa raspodelama, redom, U(a, b) i U(0, M ). Ako je yT < f (xT ) , tada je
realizovana vrednost sluqajne veliqine X jednaka xT .
Da bi se Nojmanovom metodom dobila jedna realizacija sluqajne
veliqine koja se modelira, potrebna su bar dva (pseudo)sluqajna broja.
Ako nejednakost yT < f (xT ) nije zadovoena, treba modelirati sledei
par vrednosti xT i yT , itd. dok se ne dobije par vrednosti xT i yT
koji zadovoava uslove teoreme.
Nojmanova metoda se moe primeniti i na sluqajne veliqine qija je
gustina raspodele razliqita od nule na beskonaqnom intervalu, ali
prvo je potrebno formirati odgovarajuu zaseqenu sluqajnu veliqinu.
Neka sluqajna veliqina X ima gustinu raspodele f (x), a < x < b ,
b
tj. neka je a f (x)dx = 1 . Za sluqajnu veliqinu XZ se kae da ima
zaseqenu gustinu raspodele f ako su vrednosti sluqajne veliqine XZ
iz intervala (a, b) (a , b ), a ena gustina raspodele proporcionalna
gustini raspodele f . Ako se sa fZ oznaqi gustina raspodele sluqajne
veliqine XZ , tada je
fZ (x) = b
a
f (x)
f (x)dx
, x (a, b).
f (x)dx < ,
a
Za dva pseudosluqajna broja 1 = 0.292 i 2 = 0.382, dobijaju se modelirane vrednosti xT = 1 + (e 1) 1 = 1.502 sluqajne veliqine iz
U(1, e) raspodele i yT = 0.382 sluqajne veliqine iz U(0, 1) raspodele.
Kako je yT < f (xT ) = 0.666, realizovala se vrednost x = 1.502 sluqajne
veliqine X.
i=1 (bi ai )
0,
, (x1 , x2 , . . . , xn )
(x1 , x2 , . . . , xn )
/
xi ai
, xi (ai , bi ).
bi ai
32
f1 (x1 ) =
...
+
+
. . . fQ (x1 , x2 , . . . , xn )dx3 . . . dxn
f2 (x2 |x1 ) =
+
f3 (x3 |x1 , x2 ) =
...
f1 (x1 )
fQ (x1 , x2 , . . . , xn )dx4 . . . dxn
..
.
fQ (x1 , x2 , . . . , xn )dxn
1
f (x, y)
=
, 0 < y < 1 x.
fY (y|x) =
fX (x)
1x
Odgovarajue funkcije raspodele su jednake
x
FX (x) =
6u(1 u)du = 3x2 2x3 , 0 < x < 1,
0
y
y
1
dy =
, 0 < y < 1 x.
FY (y|x) =
1
x
1
x
0
Dobijamo sistem jednaqina
3x2 2x3 = 1
y = 2 (1 x).
koji je malo nezgodniji za rexavae.
b) Napiximo gustinu raspodele kao
fQ (x, y) = fY (y) fX (x|y).
Marginalne gustine raspodele su jednake
1y
fY (y) =
6xdx = 3(1 y)2 , 0 < y < 1
0
fX (x|y) =
2x
, 0 < x < 1 y,
(1 y)2
y = 1 3 1
x = 2 3 1 ,
3 1
.
4 R3
3 r2 sin
.
4 R3
3r2 sin 1
R3 2 2
35
rQ
0
3
rQ
3r2 dr
=
= 1
R3
R3
sin
1
d = (1 cos Q ) = 1 2
2
2
0 Q
Q
1
d =
= 3 ,
2
2
0
odakle se dobija
rQ = R 3 1
cos Q = 22 1
Q = 23
Dekartove koordinate taqke Q su
x = rQ sin Q cos Q
y = rQ sin Q sin Q
z = rQ cos Q
Metoda superpozicije
Neka sluqajna veliqina X ima funkciju raspodele F koja se moe
napisati u obliku
F (x) =
ck Fk (x),
k=1
(1)
m
k=1 ck
= 1.
1 2 ... m
c1 c2 . . . cm
36
)
5 (
1 + (x 1)4 , x (0, 2).
12
5
(x 1)5
1
x+
+ .
12
12
12
x
2
5
1
F1 (x) + F2 (x),
6
6
zakon raspodele
(
Y :
1 2
5 1
6 6
5
1 + 22 1, ako je 1 >
37
5
6
5
6
k1
j=1
cj )
ck
(xm)2
1
e 22 , x R
2
pa se ena inverzna funkcija ne moe izraziti preko elementarnih
f (x) =
funkcija.
Modelirau vrednosti normalne raspodele se posveuje posebna
paa zbog znaqaja i qeste primene normalne raspodele. S obzirom
na tvree
Tvree 2 Ako sluqajna veliqina X ima normalnu raspodelu N (m, 2 ),
tada sluqajna veliqina Y =
Xm
N (0, 1).
38
n
2 , D(Sn )
n
12 ,
pa
(n)
x} n
t2
e 2 .
Konvergencija je brza i ve se za n = 12 dobijaju vrlo mala odstupaa , pa ako su 1 , . . . , 12 (pseudo)sluqajni brojevi, moe se smatrati
1
da je (12) = j=1 2j 6 realizovana vrednost sluqajne veliqine sa
normalnom normiranom paspodelom N (0, 1). Na ovaj naqin za modelirae jedne vrednosti sluqajne veliqine sa normalnom normiranom
raspodelom N (0, 1) je potrebno 12 (pseudo)sluqajnih brojeva.
2 ln Y1 cos(2Y2 ) i
Z2 =
2 ln Y1 sin(2Y2 )
2 ln 1 cos(22 ) i
x2 =
2 ln 1 sin(22 ).
(V 1)2
2
(v1)2
2
(Y1 1)2
2
, tada se za realizaciju
(y1 1)2
,
2
Modelirae 2n raspodele
Prilikom modelirae 2n raspodele koristi se sledea definicija.
Definicija 1 Ako su sluqajne veliqine X1 , X2 , . . . Xn nezavisne i imaju normalnu normiranu raspodelu N (0, 1), tada sluqajna veliqina X12 +
X22 + . . . + Xn2 ima 2n raspodelu.
Modelira se n nezavisnih sluqajnih veliqina sa normalnom normiranom raspodelom i saberu kvadrati dobijenih modeliranih vrednosti.
41
g(x)dx
I=
a
1
c(ba) ,
(x, y)
0,
(x, y)
/
(2)
9
10
g(x)dx
I
=
c(b a)
c(b a)
a
(3)
gde je NH
,
N
c(b a)
odnosno,
NH
.
(5)
N
Drugim reqima, da bismo priblino izraqunali (ocenili) inteI 1 = c(b a)
gral I, uzimamo uzorak obima N iz uniformne raspodele (2), prebrojimo broj pogodaka NH ispod krive g(x) i primenimo formulu (5).
Poxto svaki od N pokuxaja ima Bernulijevu raspodelu sa verovatnoom pogotka p, imamo NH : B(N, p). Matematiqko oqekivae i disperzija ocene 1 su, redom, jednaki
c(b a)
E(NH ) = c(b a)p = I
N
c2 (b a)2
p(1 p)
D(1 ) =
D(NH ) = c2 (b a)2
.
N2
N
E(1 ) =
43
1
1 = N 2 c(b a) p(1 p).
Ukoliko ubacimo (3) u izraz za standardnu devijaciju dobijamo
1 = N 2
1
I (c(b a) I).
Standardna devijacija prua meru preciznosti ocene. Dakle, preciznost ocene integrala dobijene na osnovu metode pogodaka i promaxaja je reda N 2 , tj. O(N 2 ).
1
1 I
: N (0, 1).
1
Tada imamo
P {|1 | z } = ,
gde je z =
tako da je
N
.
c(ba) p(1p)
1+
(z ) = 2 ,
c2 (b a)2 z2
42
NH
.
N
2
2
Primer 16 Ocenimo integral I = 0 ex dx. Direktnim izraqunava
(
)
em se dobija I = () (2 2) 0.5 = 0.8820814
Podintegralna funkcija g(x) = ex je ograniqena, g(x) 1. Odred2
z0.99 =
2
c2 (ba)2 z
2
4
= 3841459,gde je
b
a
1
ba ,
a<x<b
0,
inaqe
45
Tada imamo da je
E (g(X)) =
I
,
ba
odnosno
I = (b a)E (g(X)) .
Nepristrasna ocena za integral I je uzoraqka sredina
2 = (b a)
N
1
g(Xi ).
N i=1
)2
N
1
D(2 ) = E (b a)
g(Xi ) I 2 =
N i=1
1
= (b a)2 2
Eg 2 (Xi ) + 2
Eg(Xi )Eg(Xj ) I 2 =
N
i=1
i=j
(
)
( )
b
1
1
N
2
2
2
= (b a) 2 N
g (x)
dx + 2
(Eg(X)) I 2 =
N
b
a
2
a
(
)
b
1
2
2
(b a)
g (x)dx I .
=
N
a
N
1
g(Xi ).
N i=1
2
0
ex dx iz prethodnog primera
2
t1 D(1 )
< 1.
t2 D(2 )
Uporedimo sada efikasnost metode pogodaka i promaxaja sa efikasnoxu metode uzoraqke sredine.
Stav 1 D(2 ) D(1 ).
Dokaz: Imamo da je
(
)
b
1
2
g (x)dx .
D(1 ) D(2 ) = (b a) cI
N
a
Kako je g(x) c, c
b
a
g(x)dx
b
a
Pod pretpostavkom da su vremena izraqunavaa ocena t1 i t2 priblino jednaka, zakuqujemo da je metoda uzoraqke sredine efikasnija
od metode pogodaka i promaxaja.
47
11
i metodu stra-
tifikovanog uzorkovaa.
Ilustrovaemo sledeim primerom znaqaj redukcije disperzije.
1
, x (0, +).
(1 + x2 )
1
dx
(1 + x2 )
N
1
I{Xi > 2},
N i=1
p(1p)
N
0.127
N .
N
1
I{|Xi | > 2}
2N i=1
p(12p)
N
0.052
N .
11
1
p=
2
Importance sampling
48
dy
,
(1 + y 2 )
h(Yi ).
2 N i=1
p3 =
0.0285
N .
N
1
h(Zi ).
4N i=1
0.000095
.
N
I=
g(x)dx, D Rn .
D
integral I kao
I=
g(x)dx +
D1
g(x)dx.
D2
Pretpostavimo da se integral
I1 =
g(x)dx
D1
gde je P =
D1
g(x)
h(x)dx =
I = I1 +
g(x)dx = I1 +
h(x)
D2
D2
(
)
(
)
g(X)
g(X)
= I1 + E
= I1 + (1 P )E
.
h(X)
fX (X)
Nepristrasna ocena integrala I je tada jednaka
N
1 g(Xi )
3 = I1 + (1 P )
.
N i=1 fX (Xi )
g 2 (x)
dx I 2 =
f
(x)
X
D
g 2 (x)
g 2 (x)
dx +
dx I 2
=
f
(x)
f
(x)
X
X
D2
D1
N D(2 ) =
(
)2
2
g 2 (x) fX
(x)
g(x) fX (x)
dx (1 P )
dx =
D2 fX (x) (1 P )
D2 fX (x) (1 P )
(
)2
2
g (x)
= (1 P )
dx
g(x)dx .
D2 fX (x)
D2
N D(3 ) = (1 P )2
Dae, dobijamo
D1
g 2 (x)
dx (1 P )2 + (I I1 )2 .
fX (x)
= (1 P )
D1
I1
g 2 (x)
dx
=
fX (x)
P
)2
D1
Oznaqimo sa
C2 =
g 2 (x)
dx (1 P )2 +
fX (x)
D1
50
g(x)
I1
fX (x)
P
)2
fX (x)dx.
g(x)dx
D2
Tada imamo da je
N ((1 P ) D(2 ) D(5 )) = (1 P )C 2 +
I1
PI
P
)2
0.
Dakle, na osnovu ovog stava zakuqujemo da je metoda analitiqke
redukcije barem (1P )1 puta efikasnija od metode uzoraqke sredine.
I=
D
g(x)
fX (x)dx = E
fX (x)
g(X)
fX (X)
)
,
N
1 g(Xi )
.
N i=1 fX (Xi )
51
fX (x) =
)2
|g(x)|dx
g 2 (x)
dx,
fX (x)
|g(x)|dx =
fX (x)dx
fX (x)
D
D
g 2 (x)
dx
fX (x)dx =
D fX (x)
D
g 2 (x)
=
dx
D fX (x)
Meutim, ova teorema nema direktnu praktiqnu primenu poxto
|g(x)|
fX (x)
c.
Razmotrimo sada drugi naqin za formirae ocene po metodi uzorkovaa na osnovu relevantnosti. Neka je h(x) =
g(x)
fX (x) ,
fX (yi )
fY (yi )
1
N
i=1 wi h(Yi )
.
N
i=1 wi
Primer 19 Neka sluqajna veliqina X ima normalnu normiranu raspodelu. elimo da ocenimo verovatnou p = P {X > 4.5} za koju znamo
52
N
1
I{Xi > 4.5}.
N i=1
N
1 (Yi )
I{Yi > 4.5} = 0.000003377.
N i=1 fY (Yi )
Stratifikovano uzorkovae
elimo da ocenimo integral
I = E (g(X)) =
g(x)fX (x)dx,
D
Ii =
g(x)fX (x)dx,
Di
Definiximo
Pi =
Imamo da je
fX (x)dx.
Di
m
i=1
Pi = 1 i
I=
g(x)fX (x)dx =
Di
i=1
Uvodimo
gi (x) =
Ii .
i=1
g(x), ako je x Di
inaqe
0,
fX (x)
fX (x)
Ii =
Pi g(x)
dx = Pi
gi (x)
dx = Pi E (gi (X)) ,
Pi
Pi
Di
Di
gde je
Di
fX (x)
dx = 1.
Pi
Ni
Pi
g(Xki ), i = 1, 2, . . . , m,
Ni
ki =1
fX (x)
Pi
na Di i
m
i=1
Ni =
N.
Tada je ocena integrala I jednaka
5 =
i =
i=1
Ni
m
Pi
g(Xki ).
Ni
i=1
ki =1
P2
i
i=1
Ni
gde je
i2 = D (g(Xi )) =
1
Pi
D (g(Xi ))
P 2 2
i
i=1
Ni
g 2 (x)fX (x)dx
Di
Ii2
.
Pi2
(m
1
N
)2
Pi i
i=1
m
1
Pi D (g(Xi )) .
N i=1
I =
Ii
i=1
m
Ii2
i=1
Dae,
)2
Pi
(
=
I
i
Pi
Pi
i=1
Pi =
i=1
)2
I2
i
i=1
g 2 (x)fX (x)dx
D
i=1
(6)
Pi
Pi D (g(Xi )) =
I2
i
i=1
Pi
i=1
Pi D (g(Xi ))
55
1
m
i Ni =
N
m
uzorkovae.
1
m.
N
2. Generisati {Uki , ki = 1, 2, . . . m
, i = 1, 2, . . . , m} iz U(0, 1).
i1+Uki
, ki
m
1
Xki = F (Yki ).
3. Izraqunati Yki =
4. Izraqunati
N
= 1, 2, . . . m
, i = 1, 2, . . . , m}.
5. Oceniti integral I sa
N
m
m
1
5 =
g(Xki ).
N i=1
ki =1
56
Literatura
1. Gentle, James E.(2005), Random Number Generation and Monte Carlo Methods,
Springer - Verlag, New York, 2005.
2. Jevremovi, Vesna i Jovan Malixi, (2002), Statistiqke metode
Moskva.
57