You are on page 1of 36

Mthodologie et outils statistiques : indicateurs

Dr Roch Giorgi
roch.giorgi@ap-hm.fr

LERTIM, Facult de Mdecine, Universit de la Mditerrane, Marseille, France http://cybertim.timone.univ-mrs.fr

Prambule

Lacquisition de la partie Mthodologie et outils statistiques : bases pidmiologiques est un pr-requis avant ltude de ce cours. Ltudiant pourra faire abstraction de certaines formules mathmatiques dans une premire lecture de cette partie. Il cherchera surtout comprendre le sens des indicateurs prsents.

Roch Giorgi, LERTIM, Facult de Mdecine, Universit de la Mditerrane

Indicateurs et outils
Ncessit de disposer dindicateurs pour :
mesurer comparer

Doivent tre :
fiables facilement reproductibles

Ncessit de disposer doutils pour quantifier les effets Nous allons maintenant prsenter un certain nombre dindicateurs utiliss dans le domaine mdical. Leur utilisation repose sur certaines hypothses de bases. Elle peut galement dpendre du type denqute.

Roch Giorgi, LERTIM, Facult de Mdecine, Universit de la Mditerrane

Incidence
Quantifie la production de nouveaux cas de malades dans une population sur une priode de temps donne (t). Mesure relative qui rapporte un nombre de malades (nouveaux cas) un nombre de sujets. Seuls les non malades peuvent produire des nouveaux cas. Hypothses :
risque de maladie le mme entre les sujets risque instantan de survenue de la maladie constant au cours du temps

Diffrentes mesures :
Incidence cumule Incidence instantane

Roch Giorgi, LERTIM, Facult de Mdecine, Universit de la Mditerrane

Incidence cumule : exemple


Dans un registre de population de cancers du sein on dispose :
du nombre de cas de cancers du sein diagnostiqus annuellement de la population annuelle dans la zone gographique couverte par le registre
Anne 1995 1996 1997 1998 1999 Nouveaux cas 22 28 26 28 30 Population 220 335 250 236 244 369 249 875 252 002

On va mesurer la survenue de cancers dans du sein dans cette population en calculant lincidence cumule de cancer du sein.

Roch Giorgi, LERTIM, Facult de Mdecine, Universit de la Mditerrane

Incidence cumule
Les sujets doivent tre suivis pendant toute la priode de temps.

Ic =

m[t , t + t ] N 0 [t , t + t ]

m = nombre de nouveaux cas N0 = nombre de personnes non malades en dbut de priode t = priode de temps

Utilise pour des maladies dont lexposition au risque est courte, des maladies aigus le plus souvent.

Roch Giorgi, LERTIM, Facult de Mdecine, Universit de la Mditerrane

Incidence cumule : exemple (suite)


Lincidence cumule du cancer du sein en 1998 est de :
Anne 1995 1996 1997 1998 1999 Nouveaux cas 22 28 26 28 30 Population 220 335 250 236 244 369 249 875 252 002

I c (1998) =

28 = 11,2 pour 100000 249875

Lincidence cumule moyenne annuelle du cancer du sein entre 1995 et 1999 est de :
Anne 1995 1996 1997 1998 1999 Nouveaux cas 22 28 26 28 30 Population 220 335 250 236 244 369 249 875 252 002

Ic =

(220335 + ... + 252002) 5

(22 + ... + 30) 5

= 11,0 pour 100000

Roch Giorgi, LERTIM, Facult de Mdecine, Universit de la Mditerrane

Incidence instantane ou taux dincidence


Les sujets ne sont pas forcement suivis sur toute la priode. Chacun des temps de suivi est pris en compte au dnominateur pour calculer la dure totale dexposition au risque d tre malade.
m[t , t + t[ PT [t , t + t[

TI =

m = nombre de nouveaux cas PT = nombre de personnes-temps non malades (somme des dure de suivi des sujets pouvant devenir malade) t = priode de temps

Roch Giorgi, LERTIM, Facult de Mdecine, Universit de la Mditerrane

Incidence instantane : exemple


Personnes
MM M
+ +

M+ MM M
+ -

Dure de suivi M- : Absence de la maladie M+ : Prsence de la maladie M-

M M0 2 4 6 8 10

12

Dure dobservation en mois rvolus

Dure dexposition totale = 80 mois Nombre de malades = 5 (t) = 1 an 5


TI = 6,6

= 0,75 par an

Roch Giorgi, LERTIM, Facult de Mdecine, Universit de la Mditerrane

Incidence instantane : remarque


Remarque : on na pas forcement la dure de suivi des patients. On se rfre alors une population moyenne.
Population 2 031 35 1980 1985 1990 1995 Total 2 140 32 2 195 38 2 250 43 2 120 148 43 302,5 3,4 10 925 3,94 11 112,5 3,42 10 837,5 2,95 10 427,5 3,36 Cas Personnes -annes TI

Annes 1975

Calcul de TI1975-80 :
do TI1975-80 =

population moyenne :

2031 + 2140 5 = 10427,5 2

35 1000 = 3,36 10427,5

et donc TI1975-95 =

148 1000 = 3,42 43302,5

Le calcul de TI1975-95 en considrant demble lintervalle 1975-1995 dans son ensemble donne un rsultat diffrent (TI = 148 cas pour 41 510 PA = 3,57) du fait des variations de population. Il faut dcouper en priodes homognes.
Roch Giorgi, LERTIM, Facult de Mdecine, Universit de la Mditerrane

Prvalence
On sintresse non plus la survenue dune maladie mais aux malades prsents dans une population un moment donn. Mesure relative qui rapporte un nombre de malades (anciens et nouveaux cas) un nombre de sujets. Diffrentes mesures :
Prvalence instantane Prvalence au cours du temps

Roch Giorgi, LERTIM, Facult de Mdecine, Universit de la Mditerrane

Prvalence instantane

Prvalence instantane : proportion de malades dans une population un moment donn.

Roch Giorgi, LERTIM, Facult de Mdecine, Universit de la Mditerrane

Prvalence instantane : exemple


1 2 3 4 5

1-1-97

1-5-97

1-9-97

1-1-98

Prvalence linstant t = (cas1 + cas2 + cas5) / population linstant t

Roch Giorgi, LERTIM, Facult de Mdecine, Universit de la Mditerrane

Prvalence au cours du temps

Prvalence au cours du temps : proportion de malades (initialement prsents et nouveaux cas) dans une population sur une priode donne.

Roch Giorgi, LERTIM, Facult de Mdecine, Universit de la Mditerrane

Prvalence au cours du temps : exemple


1 2 3 4 5

1-1-97

1-5-97

1-9-97

1-1-98

Prvalence du 1-1-97 au 1-5-97 = (cas1 + cas2 + cas3 + cas5) / population moyenne au 1er quadrimestre 97

Roch Giorgi, LERTIM, Facult de Mdecine, Universit de la Mditerrane

Prvalence : remarques (1)


La notion de prvalence intgre deux dimensions diffrentes :
dure de la maladie : plus la maladie dure, plus le nombre de malades prsents est grand
ex 1 : dans une maladie chronique P (prvalence) peut augmenter car les traitements ont amlior la survie ex 2 : Ppopulation A < Ppopulation B peut reflter que la mortalit dans la population A > celle de B

vitesse dapparition des nouveaux cas : plus elle est grande plus P augmente Exemple :
Population A 1-1-90 M+ MTotal P 5 100 37 400 42 500 12 % 1-1-97 15 330 28 470 43 800 35 % Population B 1-1-90 25 160 100 640 125 800 20 % 1-1-97 48 300 89 700 138 000 35 %

volution diffrente entre les 2 populations pour une mme prvalence au 1-1-97

Roch Giorgi, LERTIM, Facult de Mdecine, Universit de la Mditerrane

Prvalence : remarques (2)


Sous certaines conditions, la prvalence est le produit de lincidence instantane par la dure moyenne de la maladie
incidence faible population stable incidence et prvalence constantes au cours du temps

Roch Giorgi, LERTIM, Facult de Mdecine, Universit de la Mditerrane

Notations : remarques prliminaires


Nous allons prsent poser des notations utiles au calcul des diffrents indicateurs de risque qui vont tre abords. Lors du calcul dindicateurs, il faudra bien veiller construire le tableau de contingence 2 lignes - 2 colonnes de la manire dont il est prsent. Le mme tableau est utilis pour les enqutes exposs-non exposs et les enqutes cas-tmoins. La variable dintrt ntant pas la mme dans ces 2 cas (la maladie dans les enqutes exposs-non exposs et lexposition dans les enqutes cas-tmoins) les notations seront diffrentes.

Roch Giorgi, LERTIM, Facult de Mdecine, Universit de la Mditerrane

Notations
M E E
+ +

M b d

Total n1 n0 n

a c m1

Total

m0

Exposs - non Exposs


Frquence de la maladie chez les exposs
R1 = P M + E + = a

Cas-tmoins
Frquence de lexposition chez les malades

n1

PE1 = P E + M + = a

m1

Frquence de la maladie chez les non exposs

Frquence de lexposition chez les non malades

R0 = P M + E = c

n0

PE0 = P E + M = b

m0

Roch Giorgi, LERTIM, Facult de Mdecine, Universit de la Mditerrane

Voir exercice 1

Risque de maladie ou risque absolu


Dfinition : cest la probabilit de prsenter un vnement donn pendant une priode de temps (horizon du risque).
R t =

nombre de nouveaux cas nombre d' exposs au dbut

Et si TI est constant et petit :


R t TIt

Roch Giorgi, LERTIM, Facult de Mdecine, Universit de la Mditerrane

Risque de maladie ou risque absolu


Rduction relative du risque : rduction proportionnelle du risque entre les deux groupes
R0(t) : risque absolu quand on nest pas expos au facteur R1(t) : risque absolu quand on est expos au facteur
RRR t =

R1 (t ) R0 (t ) R0 (t )

Rduction absolue du risque :


RAR t = R1 (t ) R0 (t )

Nombre de sujets traiter pour viter un vnement (en thrapeutique) :


NST = 1 RAR (t )

Roch Giorgi, LERTIM, Facult de Mdecine, Universit de la Mditerrane

Voir exercice 2

Risque de maladie ou risque absolu


Remarque :
les formules prcdentes correspondent au cas o le traitement exprimental rduit le risque dun vnement dfavorable on aura le mme type dindicateurs dans deux autres cas :

Probabilit de lvnement favorable est augmente par le traitement


Augmentation Relative du Bnfice Augmentation Absolue du Bnfice NST

Probabilit de lvnement dfavorable est augmente par le traitement


Augmentation Relative du Risque Augmentation Absolue du Risque NSTD

Roch Giorgi, LERTIM, Facult de Mdecine, Universit de la Mditerrane

Risque relatif
Dfinition : mesure laugmentation du risque de maladie chez des sujets exposs par rapport des sujets non exposs

P M + /E + R RR = = 1 P M + /E R0
si RR < 1, effet protecteur si RR = 1, pas deffet si RR > 1, effet nfaste

( (

) )

Remarque :
Lestimation des probabilits de maladies, donc de RR, nest possible que dans les enqutes de cohorte

Roch Giorgi, LERTIM, Facult de Mdecine, Universit de la Mditerrane

Voir exercice 3

Odd ratio
Dfinition : mesure la force de lassociation entre la maladie et un facteur de risque. Il est dfini partir des probabilits de maladie chez les exposs et les non exposs, ou par les probabilits dexposition chez les cas et les tmoins.

R1 OR = R0

(1-R1 ) = (1-R0 )

PE1 PE0

(1 P ) = ad
E1

(1 P )
E0

cb

Remarque :
OR est estimable quel que soit le type dtude (enqutes cas-tmoins +++)

Roch Giorgi, LERTIM, Facult de Mdecine, Universit de la Mditerrane

Risque individuel / Risque pour une population


Les RR et OR sont des indicateurs mesurant lintensit dun risque au niveau individuel. Il ne donnent pas dinformation concernant limportance dun facteur de risque au niveau d une population. Les indicateurs qui vont tre maintenant prsents permettent de mesurer limportance dun facteur de risque au niveau dune population. Se sont des indicateurs de mesure dimpact potentiel.

Roch Giorgi, LERTIM, Facult de Mdecine, Universit de la Mditerrane

Fraction de risque attribuable


Dfinition : proportion de cas attribuables lexposition tudie.
Mesure le nombre de cas qui seraient vits si lexposition au FDR tait supprime

RA =

M E+ M

ME+ : nb de nouveaux cas dus lexposition M : nb de nouveaux cas pendant la priode tudie

Selon le type denqute : Exemple : enqute de cohorte (enqute cas-tmoins : RR est remplac par OR).

RA =

PE (RR-1) PE (RR-1) + 1

PE : frquence de lexposition dans la population


Roch Giorgi, LERTIM, Facult de Mdecine, Universit de la Mditerrane

Fraction tiologique
Dfinition : proportion de cas dus lexposition parmi les sujets exposs
RR - 1 RR

FE =

Il sagit donc de la mme expression que pour la fraction de risque attribuable dans le cas o 100 % des sujets sont exposs (PE = 1).

Roch Giorgi, LERTIM, Facult de Mdecine, Universit de la Mditerrane

Voir exercice 4

Fraction prventive
Dfinition : proportion de cas de maladie vits par la prsence du FDR
FP = PE (1 RR )
PE : frquence de lexposition dans la population

Roch Giorgi, LERTIM, Facult de Mdecine, Universit de la Mditerrane

Indicateur et prcision de lestimation : prambule


Jusqu prsent nous nous sommes intress la valeur ponctuelle estime de lindicateur (RR, OR, ). Cette information seule nest pas suffisante. Linterprtation et la production dun rsultat statistique doit intgrer une autre dimension : la prcision (ou la variabilit) de lestimation. Lintervalle de confiance (IC est dcrit dans ce qui suit) galement valeur de test : si lintervalle de confiance dun RR ne contient pas la valeur 1, alors ce RR est significatif; le RR est non significatif lorsque lIC contient la valeur 1.

Roch Giorgi, LERTIM, Facult de Mdecine, Universit de la Mditerrane

Indicateur et prcision de lestimation


Paramtre de position : estimation ponctuelle de la mesure Paramtre de dispersion : variance de la mesure
70 60 50 40 30 20 10 0 10 20 20 diffrentes, mme dispersion Positions 30 40 50 60 70 80

70 60 50 40 30 20 10 0 10 20 20 30 40 50 60 70 80 90 100

Dispersions diffrentes, mme position

50 40

Intervalle de confiance 20
10 0 1 2 3 4 IC5
95%

30

Pr = 0,95
6 inf 7 8

IC9 10 11 95% sup

12

13

La probabilit que IC95%inf < < IC95%sup est de 95%


Roch Giorgi, LERTIM, Facult de Mdecine, Universit de la Mditerrane

Indicateur et prcision de lestimation : exemple


M+ E+ ETotal 210 120 330 M52 180 232 262 300 562

RR =

P(M + / E + ) P(M + / E )

210 262 = 2, 00 120 300

Var (Log (RR )) =

b d + = 0,006 n1a n0 c

Le calcul de lIC du RR ncessite destimer la variance du logarithme du RR, de calculer lIC de Log(RR), puis de prendre lexponentielle de lIC de Log(RR)

IC95% (Log (RR )) = 0,69 1,96 0,006 = [0,54;0,84]


50 95% 40 30 20 10 0 1 2 3 4 1,71 5 7 8 2,32 10 9 2,00 IC(RR) avec =5% 6 11 12 13

IC

(RR ) = [1,71;2,32]

Pr = 0,95

La probabilit que 1,71 < RR < 2,32 est de 95%

Roch Giorgi, LERTIM, Facult de Mdecine, Universit de la Mditerrane

Quelques relations entre les risques


Risque absolu et RR :

R1 (t ) = R 0 (t ) RR 01
R0(t) = risque absolu dans le groupe de base (rfrence) R1(t) = risque absolu dans le groupe risque

RR et OR :
OR =

RR (1-R0 ) 1-RR R0

OR RR si le risque de maladie chez les sujets non exposs (R0) est faible.

Roch Giorgi, LERTIM, Facult de Mdecine, Universit de la Mditerrane

Quelques relations entre les risques


RRA et RRB :

RR AB = RR A RRB
Hypothses : modle multiplicatif, pas dinter-action entre les deux facteurs. Idem pour les OR

Roch Giorgi, LERTIM, Facult de Mdecine, Universit de la Mditerrane

Etude de survie 5 ans de patients atteints de cancer de la sphre ORL


V ariab les L o calisatio n L arynx B ou ch e P h aryn x A utres T P etite G rand e N N on O ui M A bsen te P rsente RR 1 1 ,6 5 1,55 1,78 1 2 ,1 0 1 1,34 1 2,78 IC [1,16 ; 2,34 ] [1,13 ; 2,21 ] [1,17 ; 2,69 ] [1,63 ; 2,72 ] [1,05 ; 1,70 ] [1,66 ; 4,66 ]

RR pour un patient ayant une tumeur larynge, grande, avec envahissement ganglionnaire et sans mtastases (en l absence dinter-action entre les diffrents facteurs) : RR = RRLarynxxRRT GrandexRRN OuixRRM Absente RR= 1x2,10x1,34x1 = 2,81 (par rapport une tumeur petite N-).
Roch Giorgi, LERTIM, Facult de Mdecine, Universit de la Mditerrane

Quelques rfrences
Bouyer J, Hmon D, Cordier ,. et al. pidmiologie : principes et mthodes quantitatives. INSERM, Paris, 1995. Rumeau-Rouquette C, Blondel B, Kaminski M, Brart G. Epidmiologie mthodes et pratique, Mdecine-Sciences Flammarion, Paris, 1994.

Roch Giorgi, LERTIM, Facult de Mdecine, Universit de la Mditerrane

Probabilit conditionnelle
La notation P(A / B) correspond une probabilit conditionnelle. Il sagit de connatre la probabilit davoir A lorsque lon dispose dj dune information sur B (probabilit davoir A sachant B). Linformation apporte est donc diffrente de la probabilit lmentaire de A. La probabilit de A sachant B est dfinie par : P( A / B ) = do P(A B ) = P(A / B)P(B) = P(B / A)P(A) et
P( A / B ) = P(B / A)P( A) P (B )

P( A B ) P (B )

Thorme de Bayes
P ( Ai / B ) = P(B / Ai )P( Ai ) P(B / A1 )P( A1 ) + ... + P(B / An )P( An )

Formule dveloppe de Bayes


Roch Giorgi, LERTIM, Facult de Mdecine, Universit de la Mditerrane

You might also like