Professional Documents
Culture Documents
Lijenik u svom radu prikuplja mnotvo podataka. Dovoljno je pogledati zdravstveni karton u
ordinaciji ili povijest bolesti na bolnikom odjelu pa da se ustanovi da sve vrvi od podataka od
kojih su neki lijeniku praktiaru vrlo vrijedne informacije. Neki podaci, a pojavljuju se vrlo
esto pa se ak i ponavljaju, i ne moraju biti informativni. U jednom zdravstvenom kartonu
nae se i po nekoliko tisua podataka.
Podaci su po svojoj prirodi razliiti. Neka svojstva (obiljeja, atributi, varijable) pobrojavamo,
neka mjerimo. Spol primjerice biva oznaen rijeima ili simbolom m/ ili pak 1 za muko 2 za
ensko ili binarizirano (tako e spol biti pretvoren u dvije varijable: muko 1 0 a ensko 0 1).
Spol kao varijabla ne moe primiti nikoju drugu vrijednost. Stanje neke bolesti u trenutku
promatranja moe biti pogorano, nepromijenjeno ili poboljano. Pritom imamo tri kategorije
ali se za njih ne moe reci da predstavljaju skalu sreenog intenziteta. Takva svojstva kao to su
spol i spomenuti ishod bolesti zovemo nominalno mjerenim svojstvima (lat. nomen, nominis
= ime)
Intenzitet opeklina opisujemo u etiri stupnja. Stupanj predstavlja dogovorenu kategoriju
intenziteta. Takovo svojstvo zovemo ordinalno mjerenim svojstvom (lat. ordo, ordinis = red,
vrsta). U nas uobiajeni sustav ocjena na ispitu (1-5) takoer je ordinalno mjereno svojstvo.
Usporeujemo li intenzitet odnosno veliinu nekog svojstva s definiranim standardom,
primjerice metrom, takvo svojstvo zovemo intervalno mjerenim. Intervalna skala mjerenja
ima jedinicu intervala (primjerice kg, cm, mmol/L, kPa, mmHg, stupnjevi temperature i slino).
Istovrijedna je na bilo kojem mjestu skale mjerenja.
Nominalno i ordinalno opisane atribute zovemo kvalitavnima, atributivnima, nenumerikima
odnosno nemetrikima.
1
VARIJABLE
KATEGORIJSKE, NUMERIKE,
KVALITATIVNE KVANTITATIVNE
Iz originalnih podataka esto se izvode novi tipovi podataka. Poboljanje pacijenata u nekom
postupku lijeenja esto prikazujemo u obliku postotaka (engl. percentages). Tako, na primjer,
nakon primjene lijeka pluna funkcija pacijenta (forsirani ekspiratorni volumen u 1 sekundi,
FEV1) moe se poveati za 24% to je bolji prikaz stupnja poboljanja nego apsolutna
vrijednost FEV1 nakon tretmana. Nerijetko nailazimo na omjere ili kvocijente (engl. ratio or
quotients) dvaju varijabli. Pri procjeni pretilosti upotrebljava se indeks tjelesne mase (engl.
Body mass indeks, BMI) koji se rauna kao omjer teine izraene u kg i kvadrata visine
izraene u m2. U epidemiolokim studijima uestalo se upotrebljavaju razliite stope (engl.
rates), kao na primjer broj oboljelih na 100.000 stanovnika odreene regije za odreeni
2
vremenski period. Serija odgovora na pitanja u vezi kvalitete ivota mogu se sumirati na
odreeni nain te prikazati kao skor (engl. score) individualne procjene vlastite kvalitete ivota.
Sve navedene izvedene varijable u veini analiza mogu se tretirati kao kontinuirane varijable. U
sluaju kada se varijabla izvodi iz vie od jedne vrijednosti izuzetno je vano zabiljeiti sve
originalne vrijednosti iz kojih je nova varijabla izvedena. Tako na primjer nije svejedno koja je
poetna vrijednost nekog obiljeja bila ako je rezultat primjenjenog lijeenja njegovo 10%
poboljanje.
Postupci sreivanja podataka, ovisno o tome jesu li kvalitativni ili kvantitativni, razliiti su. Tim
su postupcima prilagoene i razliite komercijalno dostupne programske podrke (Statistica,
SAS, SPSS, S-Plus, Epi-Info i slino).
Dva su pristupa. Jedan je klasina, tradicionalna tablica frekvencija a drugi tzv. stablo-list
prikaz (engl. stem and leaf), dodue informativniji ali rjee u uporabi.
Pri formiranju tablice frekvencija valja odrediti razrede (kategorije, klase) numerikog obiljeja
i razmjestiti podatke u odgovarajui razred. Razredi se meusobno ne smiju preklapati. Nijedan
podatak pritom ne smije biti izgubljen. Razredi se formiraju prema razliitim kriterijima: ili
tako da dobivene podskupine imaju fizioloko ili pak kliniko opravdanje ili tako da se odredi
eljeni broj razreda s istim razrednim intervalom (raspon izmeu donje i gornje granice razreda)
ili pak po meunarodnim konvencijama za dati problem kako bi se omoguila usporedivost.
3
Tablica 1.
Tablica frekvencija indeksa tjelesne mase izmjerenog kod 1229 odraslih mukaraca u dobi od
26 do 77 godina.
kumulativna
INDEKS relativna
kumulativna relativna
TJELESNE frekvencija frekvencija
frekvencija frekvencija
MASE (BMI) (%)
(%)
10,0< x 15,0 0 0 0,00 0,00
15,0< x 20,0 105 105 8,54 8,54
20,0< x 25,0 648 753 52,73 61,27
25,0< x 30,0 407 1160 33,12 94,39
30,0< x 35,0 61 1221 4,96 99,35
35,0< x 40,0 8 1229 0,65 100,00
Ukupno 1229 100,00
Tablica 2.
Kliniki reducirana tablica frekvencija indeksa tjelesne mase izmjerenog kod 1229 odraslih
mukaraca u dobi od 26 do 77 godina (prema europskoj klasifikaciji stupnja pretilosti, Vrhovac
Interna medicina, str. 1445)
kumulativna
relativna
STUPNJEVI kumulativna relativna
frekvencija frekvencija
PRETILOSTI frekvencija frekvencija
(%)
(%)
Stupanj 0 753 753 61,27 61,27
(BMI 25,0)
Stupanj 1 407 1160 33,12 94,39
(25,0<BMI 30,0)
Stupanj 2 69 1229 5,61 100,00
(30,0<BMI 40,0)
Stupanj 3 0 1229 0,00 100,00
(40,0<BMI)
Ukupno 1229 100,00
Tako sreeni podaci mogu se prikazati i grafiki, kao stupasti (histogram) i linijski dijagram,
ili na neki drugi nain, pregledno po razredima ili pak kumulativno. Crte olakava uvid u
razdiobu a moe posluiti i za orijentaciono oitavanje pojedinih svojstava distribucije.
4
Slika 2.
Histogram indeksa tjelesne mase izmjerenog kod 1229 odraslih mukaraca u dobi od 26 do 77
godina.
Histogram:
INDEKS TJELESNE MASE
1229 mukaraca u dobi od 26 do 77 godina
800
700
600
500
Frekvencija
400
300
200
100
0
10 15 20 25 30 35 40
X <= granice razreda
Slika 3.
Poligon frekvencija indeksa tjelesne mase izmjerenog kod 1229 odraslih mukaraca u dobi od
26 do 77 godina.
Poligon frekvencija:
INDEKS TJELESNE MASE
1229 mukaraca u dobi od 26 do 77 godina
800
700
600
500
Frekvencija
400
300
200
100
0
10 15 20 25 30 35 40
X = sredine razreda
5
Slika 4.
Kumulativni histogram indeksa tjelesne mase izmjerenog kod 1229 odraslih mukaraca u dobi
od 26 do 77 godina.
Kumulativni histogram:
INDEKS TJELESNE MASE (BMI)
1229 mukaraca u dobi od 26 do 77 godina
114% 1400
98% 1200
81% 1000
Apsolutna frekvencija
Relativna frekvencija
65% 800
49% 600
33% 400
16% 200
0% 0
10 15 20 25 30 35 40
X <= granice razreda za BMI
Slika 5.
Kumulativni poligon frekvencija indeksa tjelesne mase izmjerenog kod 1229 odraslih
mukaraca u dobi od 26 do 77 godina.
Kumulativni histogram:
INDEKS TJELESNE MASE (BMI)
1229 mukaraca u dobi od 26 do 77 godina
114% 1400
98% 1200
81% 1000
Apsolutna frekvencija
Relativna frekvencija
65% 800
49% 600
33% 400
16% 200
0% 0
10 15 20 25 30 35 40
X = sredine razreda za BMI
6
Praktinost tablice frekvencija je oita. Meutim, takvim se pristupom sreivanju podataka
gube pojedinane vrijednosti podataka a prepoznaje samo njihova pripadnost pojedinom
razredu odnosno klasi. elimo li sauvati uvid u pojedinane vrijednosti a ipak steci sliku o
njihovoj raspodjeli, srediti emo podatke u obliku stablo i list. Stablo pritom ine prve
znamenke izmjerene vrijednosti koje su iste nekoj klasi podataka a listove ine znamenke koje
odreuju vrijednost pojedinanog podatka.
Tablica 3.
Stablo i list prikaz indeksa tjelesne mase izmjerenog kod 1229 odraslih mukaraca u dobi od 26
do 77 godina. (Programska podrka: Statistica 7.1)
7
lanovima dviju familija u kojima postoji nasljedno oboljenje deficit G6PD (bolest kod koje je
ovjek uvjetno zdrav sve dok ne konzumira neke tvari kao to su mahunarka bob, kininski
preparati, babiturati i drugo, kada nastupa hemoliza) izmjerena je enzimatska aktivnost G6PD
(enzim glukoza-6-fosfat-dehidrogenaza). Vrijednosti su prikazane po spolu:
Mukarci:
190 187 2 173 148 160 195 9 168 6
4 163 158 171 170 9 206 14 8 165
197 230 149 149 168 175 163 169 162 176
163 153 168 19 15 197 173 187
ene:
115 187 170 91 124 193 120 122 184 139
190 98 162 125 161 175 179 159 184 182
158 153 192 115 163 77
Mukarci:
Sredit emo podatke tradicionalno tablicom frekvencija. Pritom emo jednom uzeti razredni
interval od 80 a drugi put od 20 internacionalnih jedinica enzimatske aktivnosti.
Tablica 4.
Tablica frekvencija enzimatske aktivnosti G6PD izmjerene kod 64 ispitnika (38 mukaraca i 26
ena) s razrednim intervalima od 80 internacionalnih jedinica
frekvencija (%)
frekvencija
frekvencija
relativna
relativna
relativna
aktivnost G6PD
(i.u.)
8
Tablica 5.
Tablica frekvencija enzimatske aktivnosti G6PD izmjerene kod 64 ispitnika (38 mukaraca i 26
ena) s razrednim intervalima od 20 internacionalnih jedinica
frekvencija (%)
frekvencija (%)
frekvencija (%)
Enzimatska
frekvencija
frekvencija
frekvencija
relativna
relativna
relativna
aktivnost G6PD
(i.u.)
Slika 6.
Histogram enzimatske aktivnosti G6PD s razrednim intervalima od 80 internacionalnih jedinica
prema spolu ispitanika
Histogram:
Enzimatska aktivnost G6PD po spolu
38%
34%
31%
28%
25%
Relativna frekvencija (%)
22%
19%
16%
13%
9%
6%
3% SPOL:
mukarci
0%
ene
0 80 160 240
9
Slika 7.
Histogram enzimatske aktivnosti G6PD s razrednim intervalima od 20 internacionalnih jedinica
prema spolu ispitanika
Histogram:
Enzimatska aktivnost G6PD po spolu
25%
22%
19%
Relativna frekvencija (%)
16%
13%
9%
6%
3%
SPOL:
mukarci
0%
ene
20 40 60 80 100 120 140 160 180 200 220
Uz veliki razredni interval i zanemarujui spol dobili smo jednu relativno simetrinu raspodjelu.
Lako bismo upali u zamku da govorimo o jednoj homogenoj skupini s neto eim nizom
vrijednostima enzimatske aktivnosti. Meutim uz mali razredni interval, jo uvijek
zanemarujui spol, skupina se jasno razdvaja na dvije: jednu sa vrlo niskim vrijednostima i
jednu sa viim vrijednostima, asimetrinu sa pomakom u lijevo. Kada pak samemo podatke
uzimajui u obzir spol uz veliki razredni interval dobijemo dvije sline distribucije s tim da je
distribucija za ene pomaknuta u lijevo. Uz mali razredni interval dobijemo posve razliite
distribucije za mukarce i ene. Distribucija za ene kontinuirana je sa vrijednostima od 77
navie, sa pomakom u lijevo. Distribucija za mukarce ima dva vrha s tim da od vrijednosti 19
do 148 nema nijednog podatka. Ovdje se dakle ne radi o jednoj ve o dvije jasno razdvojene
distribucije to sugerira da je promatrano svojstvo spolno vezano monogeno determinirano.
Mukarci s niskom enzimatskom aktivnou su osobe sa genskim defektom. Kako se ovdje radi
o selekcioniranom familijama za oekivati je da se meu enama nae znatan broj onih koje su
prenosioci patolokog svojstva. Paljivom inspekcijom distribucije za ene uoava se lijeva
asimetrinost. ene sa vrijednostima ispod 160 moemo smatrati prenosiocima iako su sve
zajedno kliniki uvjetno zdrave. U uzorku naemo i etiri mukarca s vrijednostima ispod 160
ali znatno iznad 20. Ako je vrijednost 160 arbitrarna granica normale onda ovih etiri mukarca
imaju predstavljati laboratorijsku greku mjerenja.
Sredimo li podatke u maniri stablo i list dvojbe o prirodi pojave koju promatramo znatno su
manje.
10
EMPIRIJSKA DISTRIBUCIJA.
Razdiobe mogu biti simetrine, asimetrine bilo prema viim bilo prema niim vrijednostima
obiljeja, sa jednim ili vise vrhova. Primjer simetrine razdiobe: antropometrijski podaci
(visina, tjelesna teina, sluajne greke mjerenja). Lijevo asimetrine, s veinom podataka s
viim vrijednostima (kvocijent inteligencije, hemoglobin u ena). Desno asimetrine, s veinom
podataka prema niim vrijednostima (glukoza u krvi natate a pogotovo nakon optereenja
glukozom, kolesterol u serumu, krvni tlak sve to u populacijama koje ive u obilju). Raspodjele
koje imaju vise od jednog vrha kao i asimetrine raspodjele ukazuju na postojanje jednog ili
vise snanih imbenika koji ine podatke jednoznano heterogenima. Ako na neko svojstvo
utjee vise imbenika od kojih nijedan nije jak ve imaju kumulativni uinak u oba smjera
podjednako podaci se raspodjeljuju pravilno, simetrino i zvonoliko. Primjerice visina
normalne i zdrave djece u zdravoj okolini odreena je poligeno i multifaktorijalno.
Tablica 6.
Udio uzroka smrti u Hrvatskoj 2003. godine 10 vodeih uzroka smrti (Izvor: Hrvatsko
zdravstveno-statistiki ljetopis za 2003. godinu)
11
Tablice s vie ulaza slue zornom prikazu relacija meu odabranim obiljejima ili kao podloga
za ispitivanje ima li meu tim varijablama povezanosti ili pak razlikuju li se uzorci po prisustvu
nekog svojstva.
EKG NALAZ
Ukupno
uredan patoloki
Slika 8.
Trodimenzionalni prikaz povezanosti nalaza EKG-a i spola ispitanika
EKG NALAZ x SPOL
12
Slika 9. Grafiki prikaz (pite) povezanosti nalaza EKG-a i spola ispitanika
Pie Chart: EKG NALAZ x SPOL
patoloki patoloki
uredan uredan
Mukarci ene
EKG NALAZ
Tablica 8, 32 tablica kontingencije, prikazuje povezanost dobi i nalaza EKG. Dob je pritom
kategorizirana u 3 dobne skupine. Podloga je ispitivanju povezanosti izmeu ovih dvaju
obiljeja, tj. imaju li stariji ispitanici ee patoloki nalaz EKG-a od mlaih.
EKG NALAZ
Ukupno
uredan patoloki
25-44
1228 168 1396
godine
45-64
DOB
13
Slika 10. Histogram povezanosti EKG nalaza i dobi ispitanika
1400
1200
1000
Apsolutna frekvencija
800
600
400
200
0 EKG
65 i vie
25-44
45-64
uredan
patoloki
Histogram na slici 10 prikazuje udio razliitiha EKG nalaz u svakoj od opisane tri dobne
skupine ispitanika. To moemo prikazati i pomou pita to prikazuje slika 11. Vidimo da
udio patolokih nalaza EKG raste u starijim dobnim skupinama.
14
Slika 11. Grafiki prikaz povezanosti EKG nalaza i dobi ispitanika
patoloki
patoloki
uredan
uredan
uredan
65 i v ie godina
Grafiki prikaz povezanosti dobi i EKG nalaza moemo obrnuti. Na slici 12. vidimo koliki su
udjeli razliitih dobnih skupina skupinama ispitanika s urednim i patolokim EKG nalazima.
Udio najmlaih ispitanika (25-44 godine) vei je u skupini ispitanika s urednim nalazom EKG-
a, dok je udio najstarijih bolesnika (65 i vie godina) vei u skupini ispitanika iji je EKG nalaz
bio patoloki.
3
1
15
Literatura:
16