You are on page 1of 34

Fletcher R, Fletcher S.

Diagnstico en: Epidemiologa


Onica: Aspectos Fundamentales. Editorial Masson 3
Williams & Wilkins 1998. 43-73
,1
DIAUNSTICO
Las impresiones mentales son de cuatro tipos: cosas que
son lo que parecen ser; o no lo son y no parecen serlo; o lo
son y no parecen serlo; o no lo son, aunque parecen serlo.
Es misin del hombre sabio tomar la decisin correcta en
todos estos casos. .
Epicteto, aproximadamente siglos I-1I d. de JC.
Los mdicos dedican gran cantidad de tiempo a determinar los diagns-
ticos correspondientes a las molestias o anomalas experimentadas por sus
pacientes. Llegan hasta el diagnstico despus de aplicar diversas pruebas.
La mayor parte de mdicos competentes utilizan el buen juicio clnico, un
conocimiento cabal de la literatura mdica y un enfoque improvisado con
respecto a cmo debe organizarse la informacin. Sin embargo, tambin
existen unos principios bsicos con los que el clnico debe estar familiariza-
do cuando interpreta las pruebas diagnsticas. Este captulo analizaestos
principios.
Habitualmente, el concepto de prueba o exploracin diagnstica se
interpreta como aqulla que se lleva a cabo en un laboratorio. Sin embar-
~ go, los principios descritos en este captulo tambin se aplican a la infor-
macin clnica obtenida a partir de la historia, la exploracin 'sica y las
] tcnicas de diagnstico por la imagen. Tambin se aplican cuando una serie
!1 . de hallazgos sirvn como prueba diagnstica. De esta forma, nos podemos
~ referir al valor de los sntomas neurolgicos prodrmicos, las cefaleas, las
. nuseas y los vmitos para establecer el diagnstico de la migraa clsica
!;; o el de la hemoptisis y la prdida de peso en un fumador como indicadores
1 de un cncer de pulmn .
..;
CIJ
i SIMPLIFICACiN DE LOS DATOS
~
~ En el captulo 2,se ha mencionado que las determinaciones clnicas,
.. incluy.endo los datos procedentes de las pruebas diagnsticas, se expresan
~ en escalas nominales, ordinales o de intervalo. Con independencia del tipo
~ de datos producidos 'por estas pruebas diagnsticas, en general, los clfnieos
~ reducen los datos a una forma ms simple para que, en la prctica, les
:: resulten tiles. La mayor parte de escalas ordinales constituyen ejemplos
@ de este proceso de simplificacin. Sin duda, los soplos cardacos pueden
43
35

I
44 Epidemiologa clnica. Aspectos fundamentales
fluctuar desde los muy intensos hasta los inaudibles, pero tratar de expre-
sar graduaciones sutiles en la intensidad de los soplos es innecesario para
la toma de decisiones clnicas. Una escala ordinal simple, del grado 1 al VI,
es igualmente eficaz. Ms a menudo, los datos complejos se reducen a una
simple dicotoma (p. ej., presente/ausente, anormal/normal o enfermo/
sano). Esto se realiza especialmente cuando se utilizan los resultados de
una prueba para decidir un tratamiento. En cualquier momento determi-
nado de tiempo, las decisiones teraputicas son no tratar/tratar. O bien se
inicia un tratamiento o se decide no aplicarlo. .
La utilizacin de los datos de la presin arterial para decidir el trata-
miento constituye un ejemplo de cmo simplificamos la informacin con
objetivos clnicos prcticos. La presin arterial suele determinarse hasta
los 2 mm Hg ms cel'canos, es decir, en una escala de intervalo. 'No obstan-
te, la mayor parte de directrices del tratamiento de la hipertensin, como
las del Joint National Committee on the Detection, Eval'Uation and Treat-
ment ofHypertension (1), as como la mayor parte de mdicos, escogen un
nivel concreto (p. ej., presin diastlica de 95 mm Hg) a partir del cual se
inicia el tratamiento farmaco16gico. Para ha,cerlo, los mdicos han transfor-
mado los datos de intervalo en datos nominales (en este caso, dicotmicos).
Profundizando ms en el ejemplo, el Joint National Committee recOInienda
que un mdico escoja un plan de trataIniento segn si la presi6n arterial
diast6lica del paciente se encuentra ligeramente elevada (90-94 mm Hg),
moderadamente elevada (95-114, mm Hg) o notablemente elevada.
(>115 mm Hg), es decir, una escala ordinal.
EXACTITUD DEL RESULTADO DE UNA PRUEBA
Establecer Ill,Q,iag.6siico conlltitqye ,un proceso imperfecto que da lugar
a una probabilidad ms que a una certidumbre de qu es lo COl'I'.ecto. En el
pasado, la certidumbre o incertidumbre diag.sticade nn mdico: sexpre-
saba utilizando trminOS como descartar oposible antes de,un diag.6stico
clnico.. De fOrIu!l crel;ie;nte, el mdico moderno exprella la ,posibilidad de
que un p!!-ciente experimente una enfermedad utilizando la probabilidad.
Siendo ste el CallO, es preciso que el clnico se familiarice con las relaciones
matemtil;as entre las propied!ldes de las pruebas diagnllticas)' la infor-
maci6n que proporcionan en diferentes situacione;!;liJaEn. Jl;luchos
casos, la comprensi6n de estos aspectos ayudar al mdico a resolver en
cierta medida la incertidumbre que conlleva la utilizaci6n de las pruebas
diag.6sticas. En ocasiones puede convencer al S,u
nivel de incertidumbre.
En la figura 3-1 se muestra una forma simple de, CQnsidefm',llS relaciones
entre los resul:t;ldosdec@ll prueba y el diag.6Ilti!;Q reJ!!l, lYa'll.rRepaSe conside-
ra pQsj,tiya (anormal)o,negativa (normal) y o ausen-
te. Por ppsi,b}es de .una
prueba, dos.de los cuales son correctos y dos 1:,$ iprtittba proporcio-
na: iI;Qrre,cta,. es pos:itiVa
conducido a
36
,
/
Positiva
Negativa
---------
Diagnstico 45
ENFERMEDAD
Presente
Verdaderos
positivos
.Ausente
Verdaderos
-negativos
Fig. 3-1. Relacin entre el resultado de una prueba diagnstica y la incidencia de la enfermedad.
Existen dos posibilidades de que el resultado de la prueba sea correcto (verdadero positivo y
verdadero negativo) y dos posibilidades de que el resultado de la prueba sea Incorrecto (falso
positivo y falso negativo).
error si es positiva cuando la enfermedad est ausente (falso positivo) o nega-
tiva cuando la enfermedad est presente (falso negativo).
El patrn oro
La evaluacin de la exactitud de una prueba se basa en su relacin COn
alguna forma de saber si la enfermedad est verdaderamente presente o
no lo. est: una indicacin consistente de la certidumbre, a la que a menudo
se .hace referencia como patrn oro. Habitualmente, el patrn oro es difi-
cil de alcanzar. En ocasiones, el patrn de exactitudes errsmismd una
prueba relativamente simple y de bajo coste, como un Cultivo farl;lgeo en
busca del estreptococo beta-hemoltico para validar la impresihclnica de
una inflamacin farngea o una prueba de anticuerpos en busca del virus
i de la inmunodeficiencia humana. No obstante, habitualmente no es as .
.
Mucho ms a menudo es preciso recurrir a pruebas relativamente comple-
.j . jas, de coste elevado o que conllevan riesgos. para asegurar la existencia o
:. inexistenciade la enfermedad. Entre estaspruebas,cabe.citar las biopsias,
J las exploraciones quirrgicas y, naturalmente la autopsia.
Para las enfermedades que no son autolimitadas y habitualmente se
-<:
'" manifiestan al cabo de algunos aos despus de sus primeros indicios, los
i resultados de un seguimiento .como patrn oro, La par-
te de cnceres yde enfermedades crnicas degenerativas se incluyen dentro
1 de esta categora. Para stas es posible una validacin, incluso si no esvia-
"" ble una confirmacin inmediata del rendimiento de una prueba, porque el
'patrn oro disponible de inmediato conlleva demasiados riesgos o tiene un
,. coste demasiado elevado. Es preciso. decidir cuidadosamentela;duracin del
perodo de seguimiento, que4ebes.er Jo suficiel1teIllente prolongado como
::; para que la enfermedad se manifieste, .pero no tanto 'como para.que aparez_
@ can casos de enfermedad despus de las pruebas originales.
37
46 Epidemiologo clnica. Aspedos fundamentales
Puesto que utilizar estas formas ms precisas de establecer la certidum-
bre casi siempre comporta mayor coste y riesgo, los clnicos y pacientes pre-
fieren pruebas ms simples que el riguroso patrn oro, al menos inicial-
mente. Para determinar la naturaleza de una neumona se utilizan las
radiografias de trax y los frotis del esputo ms que una biopsia pulmonar
con un anlisis del tejido pulmonar patolgico. De forma parecida, los elec-
trocardiogramas y las enzimas sricas frecuentemente se utilizan para
establecer el diagnstico de un infarto de miocardio agudo ms que una
cateterizacin o procedimentos de diagnstico por la imagen. Las pruebas
ms simples. se utilizan como sustitutos de formas ms eJaboradas, pero
ms exactas, para establece,r la existencia de la enfermedad, a sabiendas
de que existe cierto riesgo de clasificacin en'.Qnea de los . .re$ultados. Este
riesgo est justificado por la seguridad y comodidad de las pruebas ms
simples. Sin embargo, las pruebas ms simples slo son tiles cuando se
conocen los riesgos de una clasificacin errne.s. y se consideran aceptable-
mente .. bajos. Esto requiere unos datos fiables que comparen su exactitud
con un patrn adecuado.
Falta de informacin sobre las pruebas negativas
El objetivo de todos los estudios clnicos que describen el valor de las
pruebas diagnsticas debe ser obtener datos para las cuatro casillas de la
figu;a 3-1. Sin todos estos datos, no es posible evaluar los riesgos de una
clasificacin errnea, las preguntas decisivas sobre .el rendimiento de las
pruebas. En ocasiones, el objetivo de llenar las cuatro casillas es dificil
. cumplirlo en la posible que exista un medio objetivo y vlido
de establecer el diagnstico, pero qu, por razones ticas o prcticas, no sea
factible utilizarlo para determinar formalmente las propiedades de una
prueba: Considrese la 'situacin en la cual se obtenga la mayor parte de
informacin sobreprnebas diagnsticas. Los informes publicados proceden
principalmente de contextos clnicos y no de la investigacin. LoS: mdicos
estn utilizando la prueba en el proceso:de 'asistencia a los pacientes en
estas 'circunstancias:"Sl:o'consicreran jUstificado proceder a una evaluacin
ms exhaustiva, dado el inters del paciente, cuando las pruebas diagns-
ticas preliminares son positivas. Cuando la prueba es negativa, son reacios
a-iniciar. una evaluacin.-diagnstica agresivajecm sus.riesgosy.costes aso-
ciados. Como consecuencia, la informaci6n sobre laEf'pruebas negativas, con
independencia de que sean verdaderos o falsos negativos, tiende a ser
mucho menos completa en la literatura-mdica.
Este problema est il1,lstrado por' un influyente es1;udio-de la utilidad
del.anlisis diagnstico que detecta elantgno prosftico'. especfico (APE)
para el diagnstico del cncer de prstata (2). Alas paci'entes'eon unAPE
superior al"punto de corte se les- efectu una biop-sra, 1ni'entras que los
pacientes con un APE ,inferior al punto de corte I<T'fuerll' ,biopsia-dos. Los
autores:ccomprensiblemente-,. fueron' reacios' -a: someter'a.losv.arones a un
prpcedi,roje;r;U;o. mQlesm sin pruebas quejo respald{U'jj,D.;J;lpmoJ;onscuencia,
el estudio na nos permite determinar la tasa: de faisos' negativos para el
estudiomediante,elAEE.. _,_ .. __. "-_"":_ : ' ....
38
/
Falta de informacin sobre los resultados de las pruebas
en ausencia de la enfermedad
Diagnstico 47
Como se ha descrito antes, los clnicos comprensiblemente se resisten a
llevar a cabo pruebas complejas en pacientes que no tienen problemas. Una
evaluacin del rendimiento de una prueba puede ser extremadamente err-
nea si la prueba slo se aplica a los p?cientes con la enfermedad.
Ejemplo. La resonancia magntica (RM) d la columna lumbar se utiliza frecuentemente
en la evaluaCin de los paCientes con una lumbalgia. Numerosos pacientes con dolor lumbar
pr.esentan discos intervertebrrues en la RM, lo que a menudo resulta til para expli-
car el dolor y orientar el tratamient!>o
La RM-se llev'a cabo en 98 voluntarios asintomticos (3). Dos radilogos, que desconocan
el estado de los sntomas de los 'paCientes, examinaron las radiografas. Se identificaron pro-
trusiones discales en casi dos tercios de los individuos asintomticos, una incidencia slo lige-
ramente inferior a la frecuencia de una anomala similar 'en pacientes ton d<flor lumbar. Los
autores ooncluyeron que dichos hallazgos <<podran ser fortuitos muchas veces.
Falta de patrones objetivos para las enfermdades
En algunos procesos, simplemente no existen criterios rpidos e infali-
bles para el diagnstico. Uno de estos procesos es la angina de pecho. Sus
manifestaciones clnicas se .describieron .hace casi un siglo. Sin embargo,
todava no existe nip.gn medio mejor para confirmar la existencia de una
angina de pecho que llevar a cabo una historia clnica cuidadosa. Quiz,
diversos-fenmenos que pueden medirse objetivamente guardan relacin
con este sndrome clnico, por ejemplo, estenosis de la arteria coronaria
identificada en la angiografa, retraso delap.erfu.inenJa
yanormalidades caractersticas en los electrocardiogramas tanto en reposo
como de e;;fuer:;o . . Todos estos hallazgos se describen ms' a menudo en
pacieJ;ltescqn una posible angina de pecho. Sin emJ:>argo; ninguno tiene una
f relacin lo suficientemente firme con el sndrome clnico como para servir
de patrn para considerar que el proceso ex.iste o no. __ . .
En ocasiones, pretendiendo cierto rigor, el mdico aplica un razona-
:!l miento circular. La validez de un;tprueba de laboratorio se establece com-
I parando sus resultados -con el diagnstico clnico, bas.do en una historia
.lij cuidadosa de los sntomas y en la exploracin fsica. Una vez establecido,
l se utiliza la prueba para validar el diagnstico clnico obtenido a partir de
i la historia y la xploracin fisica. Un ejemplo de ello sera la utilizacin de
- la manometra para confirmar un sndrome del colon irritable,porque el
patrn de contz:accin demostrado mediante la manometra y considerado
t caracterstico del colon irritable fue v. alidado mediante la impresin clnica

.

en primer lugar.
E .
i . Consecuencias de los patrones iinpeectos
Debido a dificultades como stas, a veces no es posiple que en la prcti-
ca los mdicos encuentren informacin respecto al punto hasta el cual las
pruebas que utilizan son comparables con un p.trn rigurosamente fide-
@ dignO. Es preciso patrn de validez otra prueba conside-
39

J
I
rada imperfecta, pero que resulta la mejor disponible. Esto puede obligar-
los a comparar una prueba dbil con otra, tomando una como patrn de
validez porque se ha utilizado durante mayor tiempo o es considerada
superior por consenso de un grupo de expertos. Al hacerlo, puede surgir
una paradoja. Si una nueva prueba se compara con una prueba patrn
antigua (pero inexacta), la nueva prueba puede parecer indsopeor, aun-
que en realidad sea mejor. Por ejemplo, si la nueva prueba es ms sensible
que la prueba patrn, los pacientes adicionales identificados mediante la
nueva prueba se consideraran falsos positivos en comparacin con la prue-
baantigua. Precisamente dicha situacin se produjo en una comparacin
de la ecografa en tiempo real y la colecistografa para la deteccin de los
clclos biliares (4). En cinco pacientes, la eCografa detect los clculos
que se pasaron por alto con unacolecistografa estndar. Dos de los pacien-
tes fueron sometidos ms tarde a una ciruga que identific.losclculos, de
modo que -como mnimo para dos de los pacientes-, en realidad lacolecis-
tografa oral estndar fue menos exacta que la ecografa en tiempo real,
ms reciente. De forma parecida, si la nueVa prueba es negativa con mayor
frecuencia para aquellos pacientes que en realidad no presentan la enfer-
medad, ls resultados para estos pacientes se consideraran falsos negati-
vos comparados cn la prueba antigua. Por esta razn, si -s.e utiliza un
patrn inexacto' de validez, una ,prueba nueva quiz no rinda mejor que la
estndar y'parecer inferior aunque se aproxime ms exactamente a la cer-
tidumbre.
/
SENSIBILIDAD Y ESPECIFICIDAD
La figura 3-2 resume algunas reiaciones entre una prueba diagnstica y
la existencia real de la enfermedad. Es una ampliacin de la figura "3-1 con
la adiCin de algunas definiciones de utilidad. El resto de este captulo des-
cribe detalladamente estas relaciones. La figura 3-3 ilust-a estasrelacio-
nes. La prueba:diagnstica es la impresin clnica del personal mdico de
si los pacientes con faringitis experimentan una infeccil" no por el
estreptococo beta-hemoltico del grupo A y el patrn rii es un cultivo farn-
geo.
Definiciones
Como puede observarse en la figura 3-2, la sensibilidad se define como
el porcentaje de individuos con la enfermedad que 'presentan una prueba
positiva para la enfermedad. Una prueba sensIble rara vez pasar por alto
a los individuos con la enfermedad. La especificidad es el porcentaje de
indj'liduos sin la enfermedad que presentan Wla .. Una
prueba especfica rara vez clasificar errneamente a 'los :iD:dividuossin la
enfermedad cmo enfermos .
. Si aplicamos estasdefmiciones al ejemplo de la 'faringitis (fig. 3-3),
obserVamos que 37 de 'los 149 pacientes con'illialhfj;dn de garganta
presentaron pos.itivos y el. personal diagnostic6.correctamente a 27
40

ID
W
::l
a:
o..
Positiva
Negativa
ENFERMEDAD
Presente
a+c
a
Se=--
a+c
Ausente
b+d
d
Sp=--
b+d
a e
a+c a+c
CP+ = --,---- Cp"': =
b d
b+d b+d
a+b
c+d
Diagnstico 49
, a
VP+=--
a+b
d
CP-=-'-
c+d
a+b+c+d
P= a+c
a+b+c+d
Fig.3-2. Caractersticas y definiciones de las pruebas diagnsticas. Se, sensibilidad; Sp, especi-
ficidad; p, prevalencia; VP, valor predictivo; Cp, cociente d probabilidad.
de stos, para una sensibilidad del 73 %. Adems, en 112 pacientes se iden-
f tificaron resultados negativos del cultivo; el personal no administr correc-
s tamente antibiticos a 77 de stos, para una especificidad del 69 0/0
. $

i de las pruebas
Cuando seleccionan una prueba diagnstica, los clnicos deben tener en
l
lil cuenta la sensibilidad y especificidad.de,.sta. Es v,reci$,o prue-
ba sensible (es decir, una prueba que suele ser positiva s Xiste eruerme-
,f
dad) cuando el precio que deba pagar por el hecho de omitirla puede ser
muy elevado. ste sera el caso, por ejemplo, cuando elcisten razones para
t sospechar un proceso grave, pero tratable, como la tUberculos,is, la sfilis o
w la enfermedad de Hodgkin. Las prUebas sensibles, ta-mbinson tiles
j durante las primeras fases de la investigacin diagnstiea, cuando se con-
.. sideran numerosas posibilidades para disminuir el nmero de stas. Las
pruebas diagnsticas se utilizan en estas situaciones para descartar las
enfermedades, es decir, para-establecer que determinadas enfermedades
son. pasibilidades improbables. Por ejel!:lplo, e.n la evaluacin de unos infil-
:::; trados pulmonares y una pr.dida de pes, se podra escoger precozmente
" un. anlisis. de,los"anticuerpos, .. anti .. VIH para descartar una infeccin rela-
50 Epidemiologa clnica. Aspectos fundamentales
S
No
EstreptocQco
beta-hemolticodi grupo A
identificado en el cultivo
farngeo
Presente Ausente
( 37 112
27
Se=-=73%
37
77
Sp= --=69%
112
27 10
27 + 10 10+27
62
87
149
cp+=
35
=2,3 cp-=
77
= 0,39
.'
35+ 77 77 +35,
. 27
VP+= -=44%
62
.. 77
VP-= -=88%
87

f' 1

149
Fig. 3-3. Exactitud del diagnstico' clfnico de la faringitis estreptoccica comparado con los
resultados del cultivo farngeo. (De Fletcher SW y Harnann C. Emergency room management al
patients with sore throats in a teaching hospital; influence lf hoh-ptiysiiiin f;&tors. J'Comm
Health 1976; 1: 196'204.)
cionada con el SIDA. En resumen, una sensible til
para el clnico cuando su resultado es figtivo; o. . '. .
Otil.izaciolles d iasprubas espefficas . . "
Las pruebas especficas son tiles para conflrmar (o' dictaminar) un
diagnstico que:ha sido .. sugeriao por otros datos. La razn de ello. es que
un'p:rueb,a mu.y;especifica . rara vez .espositiva si no existe:enfermedad,es
decir, proporciona pocos :I'esultados.falsos positivo:S., t.as pruebs muyespe-
cflcas son necesarias especialmente cuando los faisospoBitivospueden per-
judicar al paciente desde un ,punto de vista sico; emocional o econmic.o.
Por consiguiente, antes de someter a los pacientes a una quirilioterapia
para 'un cncer (con sus riesgos concomitantes; .el trauma emocional y los
c.dstes econmicos asociados), es precioun diagnstico. histolgico enlugar
de confiar en pruebas menos especficas .. En resumen, unaprueba especfi-
caces,l!l.s-til .cuandl:tLr.eilitlt.adQ .aeJa prueba .esl'!ositi-vo.; .
42
:1';:::
. , ..
o
Diagnstico 51
Equilibrios entre sensibilidad y especificidad
Evidentemente, es des,eable disponer de una prueba que sea al mismo
tiempo muy sensible y muy especfica. Por desgracia, esto habitualmente
no es posible. En lugar ,de ello, este un equilibrioi-\n1;re Ia)lensibilidad y
la especificidad de :una pruepa diagnstica. Eeto es verdad siempre que los
datos clnicos adquieren una variedad O espectr ge valores. En esiassiha-
ciones, la localizacin lo
normal y lo anormal, constituye 1;illa irQitraria. C0!D0 consecuen-
cia, para resultado de una prueba en una
escala continua, una caracterstica (p. ej .,a slo puede
aumentar a expensas de la otra (p. ej., ESpecificidad). La tabla3-l
demuestra esta interrelacin para el diag:i6stcod tiiiii-
ramOS que la glucemia sangunea 2, h9ra, deEp.Jl..,scle l,a .inge;tin ,cleali-
( mentos fuera superior .a 180 mg/H)O mlpara dagnsticar Hta:(abets;' qui.
z todos los individuos diagnosticados como dabticos ex;perimentanall
la en.fermeClad"p,ero mucha::, otras
aIto al utilizar esta definicin tan extraordhariamente rigurosa de l
enfermedac;l. Esta. prue,ba s,eria m-gy eSPeffPS a de ,la sensibili-
ad. En el otro extremo, si c'Ulllquier individu
nea superior a 70 mg/lOO mI fuera diagnosticdo como diabtico, 8e pasa- ( E
ra por alto a muy pocas personas con la enfernedad, pero la mayor parte r+
de personas normales se etiquetaran falsame:te como pacientes con dia-
..... '
betes. As pues, la prueba sera sensible pero ilespe<3P-ca. Utilizando una
determinacin aislada de la glucemia sangunlli en condiciones estndar,
no existe ningn medio para: mejorar al mismo tiempo la sensibilidad y la
especificidad de la prueba. .
Otra forma de expresar la relacin entre la ensibilidad y la especifici-
dad para una prueba determinada es construye:douna curva denominada
Tabla 3-1. Equilibrio entre la sensibilidad y la especlflciad en el diagnstico de la
'diabetes'
Nivel de glucemia 2 horas despus
de la ingestl6n de alimentos Sensibilidad
(%)
,especificidad
; (mg1100 mQ - (%)

-,
ro U
80 97,1 25,5
90 94,3 47,6
100 88,6 69,8
110 8?L_ 84,1
120 71,4 92,5
130 64,3 96,9
o 140 57,1 99,4
o
150 50,0 99,6
,,160 47,1 99,8
j 170 42,9 100,0
;:: . 180 3fl,6 100,0
. 190 34,3 100,0
g 200 , __
'Publlc Health Servic . Diabetes program'guide. Pubibatin n.' 506. Washington, t. ''U,S.Govemment
O Printing Offic; 1960. .." , .... ." ' .
43
52 Epid,emioJoga clnica. Aspectos fundc. ... ...
curva de caractersticas opera,tiu.as para el receptor CROC). En la figura 3-4
se ilustra una curva ROC para la utilizacin de una determinacin aislada
de la glucemia sangunea para el diagnstico de la diabetes mellitus. Se
traza mediante una grfica la tasa de verdaderos positivos (sensibilidad)
frflnte a la tasa de falsos positivos (1 especificidad) a io largo" de una serie
de plintos de corte. Los valores en los . ejes' fluctan desd' Una probabilidad
de O a'l,O (o alternativamente, desde O hasta el 100 %). La figilra 3-4 ilus-
tra el dilema creado por el equilibrio entre sensibilidad y especificidad. Un
punto de corte de 100 de la glucemia sangunea sl 'pasara por alto al
11% de diabticos, pero el 30 % de individuos normales se alarmaran por
un'falso positivo. El aumento del punto de corte hasta 120 'disminuye los
falsos positivos hasta, 'lI).enos qe1l0 % de los norm?les, expensas de
omItir casi el 30 % de los casos. . ' ,
Las pruebas que diferencian bien se agrupan hacia el extremo superior
izquierdo de la curva ROC; para stas, a medida que la sensibilidad
aumenta progresivamente (cuando disminuye el punto de corte), apenas
existe una prdida de especificidad no S produce ninguna hasta que se
alcanzan niveles muy elevados de sensibilidad. Las pruebas que rinden
nienos tienen curvas que se sita'n ins catea de la diagon q'e 'va desde
el extremo inferior izquierdo hasta e1strperior derecho. La diagonai inues-
1 - Especificidad %
Tasa de falsos positivos
Fig. 3-4. Curva ROC. Precisin de los valores posprandialesa las 2 horas de I,,-glucemia como
prueba diagnstica de la diabetes meUitus. (Q!ll Public HealthServlce .. Oiabeles program guide .
. Publicaci6n n."&@, WaruO!lt9I1,D<;;j,;S. Prir]ting 1960.)
44
t
e
"
~
i
.
1
~
.;
,e
!
~
~
..
Diagnstico 53
tra la relacin entre las tasas de verdadllros positivos y de falsos positivos
que se produciran para una prueba que no aportase informacin, es decir,
si el clnico simplemente decidiera echarlo a cara o cruz.
La curva ROC pone de manifiesto lo importante que es el equilibrio
entre la sensibilidad y la especificidad para una prueba, y puede utilizarse
para contribuir a decidir dnde debe estar el mejor punto de corte. En gene-
ral, el mejor punto de corte est en el hombr"o de la curva ROC, o cerca de
ste, a menos que existan razones clnicas "para minimizar los falsos nega-
tivos o los falsos positivos.
Las curvas ROCson mtodos especialmente valiosos para comparar
pruebas alternativas para"un mismo diagnstico. La exactitud global de
una prueba, puede describirse como el rea bajo la curva ROC; cuanto
mayor es el rea, mejor es la prueba.
La figura 3-5 compara la eurva ROC para los dos cuestionarios utiliza-
dos para el estudio del alcoholismo en pacientes ancianos: el CAGE y el
Michigan alcoholism screening test (MAST) (5). El cuestionario CAGE es al
mismo tiempo ms sensible y ms especfico qUll el MAST e incluye un rea
bajo la curva mucho mayor. ""
Obviamente, las pruebas que son tanto sensibles como especficas son
las ms buscadas y pueden tener un extraordinario valor. No obstante, los
80 r-
70
60
50
40



.
30
~ .
,
,

20

t
10
D
I I I I I I
,.
I I
O 10 20 30
" 40
50 60 70 80 90 100
j 1 - Espeplficidad
~ Fig. 3-5. Curvas ROC para los cuestionarios CAGE y MAST en paCientes ancianos con y sin
o
ID alcoholismo. (De Jones 1V, Lindsey BA, "Yount P, Soltys R y Farani-Enayat B. Alcoholism scree-
~ ning questionnaires: are they valid in elderly medic.,1 outptients? J Genlntern Med 1993; 8: 674-
1) 678.) "
45
':'4 I:plaemlologla Cllnlca. l 'unQg,IIC;:IUI("UC::'
clnicos en ejercicio rara vez trabajan con pruebas que son al mismo tiempo
muy sensibles y especficas. Por consiguiente, por el momento es preciso
que utilicemos otros medios para resolver el equilibrio entre la sensibilidad
y la especificidad. La forma ms frecuente de hacerlo es utilizar los resul-
tados de varias pruebas ala vez (tal y cmo Se describe ms adelante).
CMO ESTABLECER LA SENSIBILIDAD Y LA ESPECIFICIDAD
Frecuentemente, se describe una nueva prueba diagnstica en 'trminos
elogiosos cuando se introduce por primera vez; y slo c\i.ari.do se ha acumu-
lado experiencia se ponen de manifiesto sus defectos. El 'entusiasmo por el
valor clnico del antgeno carcinoembrionario (ACE) experiment este alti-
bajo. Primero se consider que el ACE era un mtodo muy prometedor para
el diagnstico d,el cncer de colon, pero despus 'se puso de manifiesto que
el ACE estaba aumentado en una amplia variedad de otros procesos, al
igual que en alrededor del 20 % de fumadores sin cncer. Este tipo de con-
fusin, el entusiasmo irucial seguido de una decepcin; no es debido a una
falta de honestidad porprte delos primeros investigadors o a un escepti-
cismo injusto por parte de la comunidad mdica sino que ms bien tiene /
que ver con las limitaciones de los mtodos mediante los cuales se estable-
cieron en primer lugar las propiedades de la prueba. Al nivel ms bsico,
las propiedades de una prueba diagnstica (p, ej., la sensibilidad y especifi-
cidad), pueden ser descritas de forma inexacta porque se ha escogido un
patrn incorrecto de validez, tal y como se ha descrito previamente. No obs-
tante, otros dos aspectos, relacionados con la seleccin de pacientes enfer-
mos y no enfermos, tambin pueden afectar profundamente la determina-
cin de la sensibilidad y la especificidad. stos son el espectro de pacientes
a los cuales se aplica la prueba y el sesgo al juzgar el rendimiento de la
prueba. Un tercer problema ,que puede conducir a estimaciones inexactas
de la sensibilidad y especificidad es el azar.
Espectro de pacientes
Pueden surgir dificultades cuando los pacientes utilizados para descri-
bir las propiedades de una prueba son diferentes a las de los pacientes a
quienes se aplicar la prueba en la prctica clnica. Frecuentemente,10s
informes preliminares evalan el valor de la prueba ent:re individuos que
estn claramente enfermos comparados con individuos que claramente no
estn enfermos, por ejemplo, estudiantes de medicina que se ofrecen como
voluntarios. La prueba puede distinguir, muy bieJ!. entre estos extremos.
Sin embru;go, incluso los pacientes con'la enfermedad en cuestin pue-
den diferir con respecto a la gn.vedad, estadio o duracin de la enfermedad
y la :;ensibilidadde una prueba eI;,dt. tendencia a ser ms elevada en los
pa.cientes ,!l).?:;; gravem,j:lnte
" -. '., .. . '-' . ..... . , . . .. '-' .'
Ejemplo. La figUra 3
e
6' ilustra cmo el rendimiento de la determinacin delACE vana
segn el estadio del cMcr colorrecj;al. El ACE tiene un buen rendimiento para la enfermedad
!
/
46
/
i
1,00
0,80
0,40
Diagnstico 55
Especificidad
0,8 0,6 0,4 0,2
- --
-;,.. ",.
---
---
,;; ,
'Estadio 0- - :
,; .-
,; -
.-
,;
--
,
Estadi C
,; ;
,;
.-
,;
.-
;
.-
;
.-
.-
;
.-
,
, ,
" ,"
, "
".- ;
,
Estadio B ,
,
,
,
.-
Estadio A
,
0,40
Punto de corte
... 2,5ng/ml
5,0 ng/ml
10,0 ng/ml
0,60 0,80
1 - Especificidad
0,2
0,4
0,6
0,8
1,00
."
;g
:s
.;
e
.,
In
I
.,..
Fig. 3-6. Curva ROe para el ACE como prueba diagnstica d.el cncer colorrectal, de acuerdo
con el estadio de la enfermedad. La sensibilidad y la especificidad dEl una prueba varan con el
estadio de la enfermedad. (De FletCher RH. Carcinoembryonic antigen. Ann Intern Med 1986;
104: 66-73.)
metastsica y un mal para el cnce; localizado. Por est ... raz,n; la senSilidad
para el cncer colorrectal depend de la mezcla concreta de estadios de los pacientes con la
enfermedad utilizados para describir la prueba i su e."actitud es ms estable dentro de los
estadios (6) .

.

Igualmente, algunos tipos de individuos sin la enfermedad (p. ej.,
i aqullos en quienes ,se sospecha) pueden experimentar 'Otros procesos qU,e
1$ provoquen una prueba positiva, con lo que .aUmenta la tasa de falsos posi-
.i' tivos y.disminuye la especificidad. Por ejemplo, el ACE tambin est
.;
'" aumentado. en numerosos pacientes con colitis-ulcero,sa:O"-cirrosis; Si los
pacientes ,e.on estas enfermedades, fueran incluidos en el :grupo no enfer-
;l mo, cuando se estudia el rendimiento del ACE para el cncer colorrectal,
aumentaran los falsos positivos y disminuirla la especificidad de la prue-

.. ba para el cncer.
I En teorla; la sensibilidad y la especificidad de una prueba son indepen-
dientes de la prevalencia de los individuos enfermos en la muestra en la
cual se est evaluando la prueba. (Para confirmarlo trabaje con la fig. 3-2.)

::; No obst;:tnte, en la prQ,tica, diversas caracterlsticasde los ,pacientesi.tales
@como,el.estadio yla.g:raV:edad .. de .laenf.ermedad; pueden 'guardar relacin
00 J:plaemlologla cunlca. AspeCTOS tundamenrales
tanto con la sensibilidad y especificidad de una prueba como con la preva-
lencia, porque se identifican diferentes tipos de pacientes en situaciones de
prevalencia elevada y baja. La utilizaci6n de una prueba para el cribado de
una enfermedad ilustra este aspecto (v. cap. 8 para una descripci6n en pro-
fundidad del cribado). El cribado incluye J. :qtjlizaci6n de la prueba en una
._poblaci6n asintomtica, en la cual la prevalencia de la enfermedad en gene-
ral es baja y, en cuanto al espectro de la enfermedad, predominan los casos
ms precoces y menos graves. En dichas situaciones, la sensibilidad tiende
a ser ms baja y la especificidad ms elevada que cuando la misma prueba
se aplica a los pacientes con indicios de la enfermedad, "la mayor parte de
los cuale.s presentan una enfermedad avanzada.
Sesgo
En ocasiones, la sensiblidad_y especificidd de una pTU.ba no se estable-
cen independientemente de los mtodos por medio-de-los ,c;:uales se establece
el diagnstico verdadero, lo que conduce a una evaluacitn sesgada de las pro-
piedades de la prueba. Esto puede ocurrir de diversas formas. Como ya se ha
mencionado, si la prueba se evala utilizando datos obt!lnidos durante el
curso de una valoracin clnic;l de pacientes con indicios de:la enfermedad en
cuestin, una prueba positiva puede propiciar que el mdico contine inves-
tigando el diagnstico, lo que aumenta la probabilidad de identificar la enfer-
medad. Asimismo, una prueba negativa puede ser responsable de que el
mdico abandone la investigacin adicional, lo que aumenta las probabilida-
des de que la enfermedad; si presente; -se pase por alto.
En otras situaciones, el resultado d tina prueba puede_ formar parte de la
informacin utilizada para establecer el diagnstiCo, al ontrario, los resulta-
dos de la prueba pueden interpretarse teniendo en cuenta otra informacin
clnica o el diagnstico final. Los radilogos frecuentemente estn sujetos a
este tipo de_ sesgo cuando interpretan las radiograas. Puesto que la interpre-
tacin: de las ra:dl.ografli.s es en cirto modo subjetiva, ".resulta fcil estar influi-
do por la informacin clnica proveda. '!bdos los clnicos han pasado por la
situacin de haber interpretado exageradamente una radiograa debido a una
impresin clnica o, al contrario, de recuperar una radografia antigua en la
cual se pas por alto -un hallazgo porque en-ese momento no se'conoCa Un _pro-
blema- clnic-o y; por esta r-azn; no se prest -atencin a un-rea concreta de la
iadiografia. Debido a estos sesgos, _ algunos radilogos prefieren interpretar
las radiograasdos veces; primero sin la con
ellai'lbdos_estos_sesg.os tienen tendencia a auIil.enta!' el -acuerdo'entreda prue-
ba _de-valideZi.6s:decir, tienentenden:cia-.a hacer lJ.ue la prueba
parezca ms til de lo.que realmente es, como,por ejemplo, cuando una RM
de la columna lumbar muestra un prolapso discal-en un paciente con dolor
lumbar (v. el ejemplo previo en este cap.).
Azar
Los valores de la sensibilidad y la especificidad (o cocientes -de probabi-
lidad, -otl'ac/Wacterstica de las-pruebas diagnsticas descrita ms adelan-
48
-
-
,..
Diagnstico 57
o L_ ____ -L ____ ____ ____ _L ____
10 20 30 40 50
Nmero de individuos observados
Fig. 3-7. de una estimaci61) de la $ensibilidad,. Intervalo d,e conli"n;:" del 95 % para
una sensibilidad observad del 76 %, de acuetdbcon l de individuos observados.
,'(...{
te) suelen estimarse a partir de observaciones en muestras relativamente
pequeas de indiViduos, con y sin la enfermedad en cuestin. Debido al
azar (variaCin aleatoria) en una muestra,especia:hnentei es de pequeo
tamao, la sensibilidad y la especifiddadrea1es deda'pfuebapueden estar
representadas errnemente incluso aunque en el estili'no exista un ses-
go. Los valores concretos observados son compatiblscii:ii.a serie, de valo-
res rales, caracterizados tpicamente por los intervalos de confianza del
.; 95 %' (v. cap. 9). La amplitud de este intervalo de valores defieeTgrado
I de precisin de las estimaciones de la sensibilidad y la' especiticidad. Por
_ esta razn, los valores mencionados para -lasensibili,dad y la especificidad
ii no deben tomarse demasiado al pi de la letra si s'estuda: aun mimero
reducido de pacientes: ' ,

= La figura 3-7 muestra cmo la precisin de las estimaciones de la sen-
sibilidad aumenta a medida que, aumenta el nmero de 'indiriduos en los
. cualsse basa la estinlcin. En este ejemplo concreto, Iasens'ibrtidad
i observada de la prueba diagnstica es del'75 %.. L fignra 3-7 muestrl
que S esta estiniaCin slo se efecto d'el azar
;: rusUl; lsenslo.iJldad real podri sersollnente 'del 45 %'y hasta d casi
..
j 'El intervalo de confianza del 95 % de un porcentaje se estima fcilmente mediante la siguiente f6rmu
la, basado en el teorema binomial:
O +2d P (l-pl
p- V N'
donde p es la proporcin observada y N es el nmero de individuos observados, Para una aproiimaciD. ms
exacta, multiplicar por 1,96.
49
58 Epidemiologa clnica. A$pecto$ fundamentales
el 100 %. Cuando se estudia a un mayor nmero de paciente:>, se estrecha
el intervalo de confianza del 95 %, es decir, aUIne:ii.til la precisin de la
estimacin.
VALOR PREDICTIVO
Como se ha mencionado previamente, la sensibilidad y la especificidad
constituyen propiedades de una prueba que se tienen en'cuenta cuando se
decide emplearla o no. Pero, una vez que se dispone de los resultados de
una prueba diagnstica, sean positivos o negativos, la sensIbilidad y espe-
cificidad de la prueba dejan de ser importantes porque estos valores perte-
necen a individuos en los que se conoce si tienen la enfermedad o no. Sin
embargo, si se conociera el estado de la enfermedad del paciente, no sera
necesario realizar la prueba! Para el clnico, el dilema estriba en determi-
nar si el paciente tiene la enfermedad o no, dados los resultados de una
prueba.
Definiciones
La probabilidad de una enferme'ad, dados los resultados de una prue-
ba, se q.enorr.i,ria ualor predictipde It, prueba (v. fig. 3-2). EJ:t!4lor predic-7 ..
tiuo'Yiositiuo es la probabilidad de la enfermedad' en unpaCientecori uni
T
resultado. (anormal) de la prueba.. El valor predictivo negativo
la .probabilidad de no tener la enfermedad cuando .el de la prue.::.J
ba es,n,egatiyO (norm<!1). El vaorpredictivo respondea)a cuestit?n: si el
resltdo de la prueba de mi paciente eS.positivo.(negativo>; cIes son
las probabilidades de que mi paciente tenga (no tenga) la enfermedad?.
El valor prealctivo en ocasiones se 'denomina pr\>babilidad posterior (o
posprlleba), la probbilidad de la dellPys de.co:rLQcer .el resUl-
tado de la ilustra, 'estos' concePtos. E;n.tre los pacien-
tes tratados con antibiticos .pQr tina faD.Jiitls menos de
la rutad (44 %) presentaban ei proceso, segn el cultivo (valor predictivo
positivo). El valor pn;d!ctivo negativo de las impresione!> diagnsticas del
per;;onalflle lflejor; d,e 10s.87 pacimtes en qwenell se consider que no
presentabn una faringitis estreptoccica: la :iil.presin fuec.or,rectapara
77de1Jos %). .' '. '. . ' .' . '. . . . . . . . . . .
Se hmdescrito.trminos que resumen el valQt; global de una pJ,'lleba.
; Un tnnino de este tipo, la, exactitud, qetpd.os"los
1 R?S d!'l'I
a
.P9sltivos y .!lon {Parll:el
lde de lffg;"3"3, la e-x:actltud d!)lasunpreslOIles ru,lgn6Ilticas
( del personal fue del 70 %.) ElIea baj la .cw;va E,QQ es. 4:aindida ,resu-
{ men til de la informaci6n prporCionada poi el resUitad de una prueba.
- . . .
Sin embargo, estas medidas resumen son excesivamente como para
ser de utilidad desde un punto de vista clnico porque la informacin espe-
cfica sobre las partes que la componen -la sensibilidad, la especificidad y
el valor predictivo a determinados puntos de corte- se pierde cuando se
agregan en un ndice nico.
50
r
.Diagnstico 59
Determinantes del valor predictivo
El valor predictivo de una prueba no es una propiedad de la prueba ais-
lada. Est determinado por la sensibilidad y la especificidad dela prueba y
por la prevalencia de la enfermedad en la poblacin que est siendo eva-
luada, en la cual, la prevalencia tiene su significado tradicional: el porcen-
taje de individuos en una poblacill definida en un punto dado de tiempo
que sufren el proceso en cuestin. La prevalencia trup.bin recibe el nombre
de probabilidad previa (o preprueba), la probabilidad de la enfermedad
antes que se conozca el resultado de la prueba. (Para una descripcin deta-
llada de la prevalencia, v. cap. 4.)
La Jrmula IDatemtic,a sensibilida.d; laoespecifi.idad y
la prevalencia con el valor predictivo positivo denva del teorema de Bayes
de las probabilidades condicionales:
V:
C' dicti ti Sensibilidad x Prevalencia
GUor pre vo pOS! vo = . _ .
n- ! .
(Sensibilidad x Prevalencia) + (1 - Espe-cificidad) x (1- Prevalencia)
'nr-..
):1 '. Cuanto m,s .sensible es una prueba, mejor ser su "!llor predictivo
". < negativo (ms seguro podr estar el clinico de qU el resultado iiegativo de
.. '\)a prueba descarta 'la enfermedad l:bvestigada). Por el contrario, cuanto
ms especfica sea la prueba, mejor ser su valor 'pt'dctiV'O"psitivo{ms
'. seguro estar.el .cln.icode qEl1ma pt\leba ,posj,tiYa confirma,Q corro-
. bora el diagnstico investigado). Puesto que el valor predictivo tambin
est influido por la prevalencia, no es independiente del contexto en el cual
se utiliza la prueba. Los resultados positivos, in<;:luso para una prueba muy
especfica, cuando se aplican a pacientes con una baj.aprobabilidad de
tener la enfermedad, sern en su mayor parte falsos positivos. De forma
parecida, los resultados negativos, incluso para una prueba muy sensible,
cuando se apliquen a pacientes con una probabilidad elevada de tener la
enfermedad, es probable que sean falsos negativos. En resumen, la inter-
pretacin de. un resultado positivo o negativo de una prueba'diagnstica
t vara de un contexto a otro,de acuerdo con la prevalencia-estimada de la
enfermedad en cada contexto concreto. .'

e A veces, no es evidente qu tiene que ver la prevalep.cia con un paciente
i concreto. Para los escpticos, podra ser til considerar cmo rendira una
. i prueba en los extremos de la prevalencia. Es preciso recordar que no
'" importa el grado de sensibilidad y especificidad (cerc;ana a la perfeccin)
de una prueba, ya que siempre existir un pequeo porcentaje de pacientes
:#. clasificados errneamente por.ena. Imaginemos a Una poblacin en la cual
d 1 ul
w ningn indivi uo padece a enfermedad. En dicho grupo, todos los res ta-
i dos positivos, incluso para una prueba muy especfica, sern falsos positi-
vos. Por consiguiente, a que la prevalencia de la en
j una poblacin se acerca al O, la prevalencia del valor predictivo positivo de
la prueba tambin se acerca al O. Por el contrario, si cada individuo de la
poblacin examinada padece la enfetnedad, todos los resultados negativos
sern falssneg'ativos, incluso para una pI"Jleba muy s.ensible. Amedida
@ que laptevalencia se acerque al 100 %, el v.alor predictivo negativo se acer-
51
60 Epidemiologa clnica. Aspectos fundamentales
car al O. Otra forma para que los escpticos se convenzan de estas relacio-
nes es considerar la figura 3-2, manteniendo la sensibilidad y la especifici-
dad constantes, modificando la prevalencia y calculando los valores predic-
tivos resultantes.
El efecto de la prevalencia sobre el valor predictivo positivo, para una
prueba con diferente-s niveles de sensibilidad y especificidd, aunque gene-
ralmente elevados, se ilustra en la figura 3-8. Cuando la prevalencia de la
enfermedad en la poblacin investigada es relativamente elevada, superior
a determinado porcentaje, la prueba tiene un: buen reridimiento, pero con
prevalencias ms bajas, el valor predictivo positivodismnuye casi a O y la
prueba prcticamente no es til para el diagnstico. A medida que la sensi-
bilidad y la especificidad disminuyen, 'llega a ser ms 'aguda la influencia
de los cambios de la prevalencia en el valor predictivo.
Ejemplo. El valor predictivo del APE para el diagnstico del carcinoma de prstata ha
sido estudiado en diversas situaciones clnicas que corresponden a diferentes prevalencias .0
probabilidades previas. En varones asintomticos, de edad avanzada, en los que se estima
que la prevalencia delcarcinoma de prstata es del 6-12 %, slo alrededor del 15 % de varones
con un APE de 4 mgldl o superior padecan realmente un cncer. En varones con un riesgo
ms elevado (con sntomas o una exploracin rectal sugestiva), en los cuales la prevalencia
del carcinoma de prstata era del 26 %, e140 % de ellos con un APE positivo padecan el cn-
cer (7). Si elAPE se hubiera utilizado como prueba de cribado en varones asintomticos, 5 o 6
varones sanos habran terido que hacerse pruebas adicionales, a menudo .incluyendo la biop-
sia, para identificar a mi varn con cncer. No obstante, cuando existe un ndicio clrico con-
vincente' de malignidad, casi en el 50 % de varones con una prueba positiva se identificar un
cncer de prstata.
Los esfuerzos actuales para prevenir la transmisin del sndrome de la
inm'unodeficiencia adquirida (SIDA) por los productos sanguneos es otro
ejemplo del efecto de la prevalencia de la enfermedad sobre el valor predic-
tivo positivo.
100
:.I!
o
80
g Sensibilidad/especificidad
!t!
\
\.
'\.
..
80/90 90/90 99/99 o
60 Q.
o
. ~
40 ...
f
Q.
..
.0
;
20
O
1/5 1110 1/50 1/100 1/1.000 1/10.000
Pre'o(alencia
Fig. 3-8. Valor predictivo positivo de acuerdo con la sensibilidad, ia especificidad y la prevalencia
de la enfermedad ..
52
/
Diagnstico 61
Ejemplo. Para el cribado de los donantes de sangre, se utiliza nn anlisis de sangre en
busca de anticuerpos frente al virus de la inmunodeficiencia humana (VIH). A un determina-
do punto de corte, la sensibilidad es del 97,8 % Y la especificidad del 90,4 %. En 1985, a partir
de la prevalencia en las unidades infecciosas, se estim que el valor predictivo positivo de la
prueba no era superior a 1/10.000. Por consiguiente, por cada resultaClo verdadero positivo,
existiran 9.250 Tesultados falsos positivos de la prueba (8). Habran tenido que rechazarse
casi 10.000 unidades o investigarse adicionalmente para prevenir una transfusin de sangre
contaminada. Los autores concluyeron que, en un tema con tanta carga emocional, Una adhe-
renj.a cuidadosa a los principios de la evaluacin de las pruebas diagnsticas evitar expecta-
tivas poco realistas.
Pero la situacin cambi. A medida que la prevalencia de la infeccin por el VIH aument
en la poblacin general, mejor el valor predictivo positivo de la prueba de cribado. En una
publicacin un ao ms tarde, li prevalencia de unidades infectadas entre 67.190 unidades
examinadas fue de 25/10.000 y, a niveles similares de sensibilidad y especificidad, el valor
predictivo positivo sera del 2,5 %, muy superior al de unos aos atrs (9).
Estimacin de la prevalencia
/.
Cmo pueden estimar los clnicos la prevalencia o probabilidad de una
enfermedad en un paciente para determinar el valor predictivo del resulta-
do de una prueba? Existen diversas fuentes de informacin: la literatura
mdica, las bases de datos locales y el juicio clnico. Aunque la estimacin
resultante de la prevalencia rara vez es muy precisa, no es probable que el
error sea de tal magnitud que modifique los juicios clnicos que se basan en
la estimacin. En cualquier caso, el proceso tender a ser ms exacto que el
mero juicio clnico implcito.
En general, para determinar el valor predictivo, la prevalencia es ms
importante que la sensibilidad y la especificidad (v. fig. 3-8).l]na razn de
ello es que la prevalencia generalmente vara a lo largo de unos lmites ms
amplios. En distintos contextos clnicos la prevalencia de una .enfermedad
puede variar desde una fraccin de un porcentaje hasta casila ertidum-
bre, en funcin deja edad, el sexo, los factores de y los hallazgos cl-
:j
nicos del paciente. Comprese la prevalencia de hepatopata.en un
* adult joven, sano, no consume drogas ilegale:b. otros frmacos y que
j consume alcohol slo ocasionalme_ute, con de un <4"ogadicto por va intra-
venosa que presenta ictericia. Segn los patrones IlCtuales, los cinicos no

. estn especialmente interesados en las pruebas con:sensibili4ades y espe-
cificidades por debajo del 50 %, pero, si tanto la sensibilidad como la
especificidad son del 99 %, se considera la prueba es muy buena. En
otras palabras, en trminos prcticos, la sensibilidad y la especi,ficidad rara
vez varan ms de dos veces.
i
Aumento de la prevalencia de la enfermedad

.. Al considerar la relacin entre el valor predictivo de una prueba y la
' w
prevalencia, constituye una ventaja evidente para el mdico aplicar las
pruebas diagnsticas .en los pacientes con mayor probabilidad de padecer
la,erifermedad que se est investigando. De hecho, tal y como muestra la
figura 3-8, las pruebas diag'rrstics son de mayor utilidad cuando la exis-
@ tencia de la enfermedad no es ni muy probable ni muy improbable.
53
62 Epidemiologa clnica. Aspectos fundamentales
Existe una serie de mtodos mediante los cuales puede aumentarse la
probabilidad de una enfermedad antes de utilizar una prueba diagnstica.
Proceso de referencia
El proceso de referencia o envo es uno de los mtodos ms frecuentes a
travs del cual se aumenta la probabilidad de la enferme.dad. El envo a
hospitales docentes, consultas externas y servicios de urgeI).cias aumenta
la probabilidad de que tras las molestias deLpaciente subyaz.cauna enfer-
medadsignificativa . Por esta razn, en estos contextos puede estar justifi-
cado una utilizacin relativamente ms agresiva de lasprueba diagnsti-
cas. Asimismo, en atencin primaria y especialmente entre pacientes sin
molestias, la probabilidad de hallar la enfermedad es considerablemente
menor y las pruebas deben utilizarse con mucha mayor parquedad.
Ejemplo. Durante la prctica en una clnica militar, uno de los autores visit6 a cientos de
individuos con cefaleas; rara vez solicit6 pruebas liagn6sticas y.nunca identific6 a ningn
paciente con una causa grave subyacente de la cefalea. (Es poco probable que se omitieran
procesos importantes puesto que la clnica era prcticamente la nica fuen,te de asistencia
mdica para estos 'pacientes y se haca un seguimiento prolOl:igado.) Sin embargo,. durante la
primera semana d vuelta a la residencia mdica, en un paciente que' 8Culi al departamento
de urgencias del hospital por una' cefalea similar. ls tratadas enla clfnica militar se identi-
fic un absceso cerebeloso .. .
. .' . . ' . I . ' . .
Puesto que los clnicos pueden trabajar en diferentes .extremos del
espectro de la prevalencia en diferentes momentos en su prctica clnica,
deben tener en cuenta que puede ser necesario ajustar la intensidad de la
evaluacin diagnstica a cada situacin especfica. '
Grupos demogrficos seleccionados
En un contexto determinado, los mdicos pueden aumentar el rendi-
miento de las pruebas diagnsticas aplicndolas a grupos demogrficos
conocidospo'r presentar inayorriesgo de la enfe"Iliedad. Un varn de 65
aos presenta 15 veceS ms probabilidades 'de experimentar una arteriopa-
ta coronaria como causa de un dolor torcico atpico que una mujer de 30
aos; por consiguiente, la prueba electrocardiogrfica de esfuerzo, una
prueba cqncreta }Jara l coronariopai', es menos til para con-
firmar el diagnstico en la mujer joven que en el varn 'de edad avanzad'a
(lO). De forma pareCida; una prueba para la anemia falciforme obviamente
tendra un valor predictivo positivo ms elevado entre individuos de raza
negra que entre individuos de raza blanca.
Caracterfsticas especfficas de /a situacin c1fnica
Claramente, las caractersticas especficas de la situacin clnica consti-
tuyen la influencia ms poderosa en la decisin de solicitar pruebas. Los
signos,sntomas y facrores de iiesgode la enfermedad aumentan o dismi-
nuyen la probabilidad dehallar'una enfeTinedad. Por ejemplo; una mujer
con un delor torcico tiene mayolles probabilidade-s de experimentar una
54
/
,
/
..
Diognstico 63
coronariopata si padece una angina tpica e hipertensin y es fumadora.
Como consecuencia, Un electrocardiograma de esfuerzo con un resultado
anormal tiene mayores probabilidades de representar una coronariopata
en dicha mujer que en individuos con un dolor torcico inespecfico y sin
factores de riesgo coronario.
El valor de aplicar las pruebas diagnsticas en personas con mayores
probabilidades de experimentar una enfermedad concreta es intuitivamen-
te evidente para la mayora de mdicos. Sin embargo, con la creciente dis-
ponibilidad de pruebas diagnsticas, es ms fcil adoptar un enfoque
menos selectivo cuando se solicitan pruebas. No obstante, cuanto menos
selectivo sea el enfoque, probablemente menor ser la prevalencia de la
enfermedad y menor ser el valor predictivo de la prueba.
La magnitud de este efecto puede ser mayor de lo que la mayora de
nosotros imaginamos.
Ejemplo, Los factores que influyen en la interpretacin de un resultado anormal de un
electrocardiograma de esfuerzo se ilustran en la figura 3-9. La figura muestra que el valor
100
90
..
80
'C
. ~ g
70
"' ....
"'o
&.u
60
o ~
~ ..
50 uc.
._ o
"'1:
f-! 40
c. ..
.25
30
~ e
..
c.
20
10
O
Edad
Sfntoms
Prevalencia para la
arteriopata coronaria
r.73 0,5-1,0 mm
_ >2,5 mm
30-39 60-69
Ninguno Ninguno
1,9 12,3
60-69
Angina
atpica
67,1
60-69
Angina
tpica
94,3
I Fi9. 3-9. Efecto de la prevalencia de la enfermedad sobre el valor predictivo positivo de una
~ : : ' prueba diagnsti.ca. Probabilidad de arteriopata coronaria de acuerdo con la edad, los sntomas
: y la depresin del segmento ST en el electrocardiograma. (De Diamond (3A y F<?rrester JS. Analy-
sis 01 probability as an ad in !he clinical diagnosis of coronary artery disease. N Engl J Med 1979;
o 300, 1350-1358.)
55
-,...-....... _._;:1.- ...... u __ --,.._ ... ....... _ ...... GII."' ..,;::,
predictivo positivo para la arteriopata coronaria asociado con un resultado anormal de l a
prueba puede variar desde e11,7 hasta el 99,8 %, dependi"ndo de la. edad, los sntomas y el
grado de anormalidad de la prueba. As, una prueba de esfuerzo en Un varn asintomtico de
35 aos cuyo resultado indique una depresin de 1 mm del seginento sr ser un falso positivo
en ms del 98 % de casos. El mismo resultado de la prueba en un varn de 70 aos con una
angina tpica segn la historia se asociar con una arteriopata coronaria en ms del 90 % de
casos (10).
Debido a este efecto es preciso que los mdicos interpreten resultados
similares de una prueba de mailera diferente en distintas situaciones clni-
cas. Una prueba de esfuerzo negativa en un varn asinto-mtico de 35 aos
simplemente corurrma la probabilidad, ya de por s baja:, de una arteriopa-
ta coronaria, pero tina prueba positiva habitualmente conducir a error si
se utiliza para investigar la enfermedad no sospechada, tal y como se ha
llevado a cabo en individuos que practicanjogging, en pilotos y en ejecuti-
vos. Lo contrario vale para el varn de 65 aos con una angina tpica. En
este caso, la prueba puede ser til para confirmar la enfermedad, pero no
para excluirla. La prueba es sobre todo til en situaciones intermedias, en
las cuales la prevalencia no es ni muy elevada ID muy baja. Por ejemplo,
un varn de 60 aos con un dolor torcico atpico tiene una probabilidad
del 67 % dearteriopata coronaria antes de la prueba de esfuerzo (vase
fig. 3-9), pero ,despus;' con una depresin del segmento ST superior a 2,5
mm, tiene un"a probabilidad de coronariopata del 99 %. .
Puesto 1.,. la enfermedad es un determinante tan
potente del;grado en,que unapmeba diagnstica ser til, es preciso que
los clnicos la probbilidad de la enfermedad antes de solicitar
la prueba. Hi!sta hace.p,oc,o los clnicos se basaban en observacio-
nes clnicas yen su estimar la probabilidad preprueba de
una EnJil: actuatiqad, la investigacin, que utiliza extensos
bancos de dilJs estimaciones cuantita-
tivas de la de la eilfermecia, dadas diversas combinaciones
. deha:llazgos:pfuicos (). . .' ",
para
las descripciones publicadas de las pruebas diagnsti-
in,cluyen" .adems de la seI!Sibilidad y la especificidad, algunas concIu-
de una prueba positiva o negativa, es decir,
el valQrpredictivo.Esto se lleva a cabo, con razn, para proporcionar infor-
macin, ,directamente til para los mdicos, pero los ditospiUlastas publi-
se renen en hospitales docentes universitarios donde
de una enfermedad grave es relativamente elevada. Como
consecueneia"Jas afIrmaciones sobre el valor predictivo enJIl .bibliografa
mdicapueden'e-onducir a error cuando la prueba.se .-aplica'n mbitos
menos';slellcinados. Y lo que es peor, los autores ,a menudo comparan el
prueba en una serie de Pl1cieJ:ites en los que se .ha
y en un nfunero igUal de pa:iMribis sin la enferme-
, : ' " . ", "' .... .. \..f ' . ? .. , ' . . .' . ."
describi;rJa .. y especifici-
dad. valorpredictivo positivo mencionado proceden-
. . " .
56
/
Diagnstico 65
te de dichos estudios apenas tiene valor porque se ha determinado para un
grupo de pacientes en los cuales los investigadores establecieron la preva-
lencia de la enfermedad en el 50 %.
COCIENTES DE PROBABILIDAD O VEROSIMILITUD
Los cocientes de probabilidad o verosimilitud sQn una forma alternativa
de describir el rendimiento de una prueba diagnstica. Resumen el mismo
tipo de informacin que la sensibilidad y la especificidad y pueden utilizar-
se para calcular la probabilidad de la enfermedad despus de una prueba
positiva o negativa. -
Odds
Puesto que la utilizacin de los cocientes de probabilidad o verosimilitud
depende de la odds, para comprenderlos primero es necesario distinguir la
odds de la probabilidad. La probabilidad, utilizada para expresar la sensibili-
dad, la especificidad y el valor predictivo, es el porcentaje de individuos en
quienes est presente una caracterstica concreta, como una prueba positiva.
Por otra parte, la odds es la razn de dos probabilidades. La odds y la probabi-
lidad contienen la misma informacin, pero la expresan de forma diferente.
Las dos pueden interconvertirse utilizando frmulas simples:
Odds = Probabilidad del acontecimiento + 1- Probabilidad del acontecimiento
Probabilidad = Odds -;- 1 + Odds
Los lectores deben estar familiarizados con estos trminos porque se
t utilizan en la conversacin diaria. Por ejemplo, podemos decir que la odds
de que un equipo de ftbol gane esta noche es de 4:1 o que tiene una proba-
o
bilidad de ganar del 80 %.
:
j
.
la
1
,f
Definiciones
El cociente de probabilidad o verosimilitud para un valor concreto de
una prueba diagnstica sedefinecomo la probabilidad de dicho resultado
de la prueba en individuos con la enfermedad dividida por la probabilidad
.;
UJ del resultado en individuos sin la enfermedad. Los.cocientes de probabili-
i dad expresan cuntas veces ms (o menos) _probable es que se identifique
w un resultado de una prueba en individuos enfermos comparados con los no
. i enfermos. Si una prueba es dicotmica (positiva/negativa), dos tipos de
" cocientes de probabilidad describen su capacidad para diferenciar entre
j "individuos enfermos y no enfermos: uno se asocia con una prueba positiva
'f y el otro, con-una prueba negativa (v. fig. 3-2).
g

@
del R. El vocablo odds DO tiene una traducein al castellano ampliamente Entre las
muchas propuestas que se han efectuado para traducir odds ratio destacan Oportunidad relativa y el
extranjerismo Razdtz de odds (v. Gaceta Sanitaria 1990; 4 (16): 35-39).
57
66 Epidemiologa clnica. Aspectos fundamentales
En el ejemplo de la faringitis (v. fig. 3-3), los datos pueden utilizarse
para calcular los cocientes de probabilidad de una faringitis estreptoccica
si existe una prueba positiva o negativa (diagnstico clnico). Una prueba
positiva es aproximadamente 2,5 veces ms probable que se produzca si
existe faringitis estreptoccica que si no existe. Si los mdicos consideraron
que no exista una faringitis estreptoccica, el cociente de probabilidad
para esta prueba negativa fue de 0,39; la odds de que se estableciera Ul
diagnstico clnico negativo con faringitis estreptoccica comparada con
que no hubiera enfermedad fue de aproximadamente 1:2,6.
Utilizacin de los cocientes de probabilidad
La probabilidad preprueba (prevalencia) puede convertirse en odds pre-
prueba utilizando la frmula presentada previamente. Despus, los cocien-
tes de probabilidad pueden utilizarse para convertir la odds preprueba en
odds posprueba, por medio de la frmula siguiente:
Odds preprueba x Cociente de probabilidad = Odds posprueba
A su vez, las odds posprueba pueden convertirse de nuevo en una pro-
babilidad, utilizando la frmula descrita previamente en este captulo. En
esta relacin, la odds preprueba contiene la misma informacin que la pro-
'babilidad previa (prevalencia), los cocientes de probabilidad, la misma
informacin que la sensibilidad/especificidad y la odds posprueba la misma
que el valor predictivo positivo (probabilidad posprueba).
La principal ventaja de los cocientes de probabilidad es que permiten ir
ms all de una clasificacin simple y burda de un resultado de una prue-
ba como anormal o normal, tal y como se lleva a cabo habitualmente cmm-
do se describe la exactitud de una prueba diagnstica slo en trminos de
sensibilidad y especificidad en un solo punto de corte. Obviamente, la
enfermedad es ms probable si existe un resultado extraordinariamente
anormal de la prueba que con un resultado prximo a los lmites. Con los
cocientes de probabilidad, es posible resumir la informacin contenida en
el resultado de. una prueba a diferentes niveles. Se pueden definir los
cocientes de probabilidad para cualquier resultado de una prueba a lo lar-
go de todos los lmites de los posibles valores. De este modo, no se desecha
la informacin' representada por el grado de la anormalidad, ms que por
la mera presencia o ausencia de sta. En el clculo de los cocientes de pro-
babilidad a travs de un espectro de resultados de la prueba, la sensibili-
dad hace referencia a la capacidad de dicho resultado concreto de la prueba
para identificar a los individuos con la enfermedad y no a individuos con
dicho resultado o algo peor. Lo mismo puede afirmarse para el clculo de la
especificidad.' -
Por consiguiente, los cocientes de probabilidad pueden adaptarse a la
prctica clnica comn y razonable de dar mayor valor a unos resultados
extraordinariamente elevados (o bajos) de una prueba que a unos resulta-
dos en los lmites cundo se estima la probabilidad (u odds) de que est
presente una enfermedad concreta. . .
58

'O
e
"


e
'" 'O
.l
o

e
"
t

..;
(f)
oi
'j
"-

w

e
:z
i:
..

ji
!
o
(f)
(f)
'"
::;
@
/
Diagnstico 67
Ejemplo. Hasta qu punto es exacta ulJa determinacin aislada de la tiroxina (T,) srica
como prueba del hipotiroidismo? Esta cuestin se abord en un estudio con 120 pacientes
ambulatorios de medicina general con indicios de hipotiroidismo (12). Los pacientes fueron
diagnosticados como portadores de un posible hipotiroidismo si se identific un aumento de la
tirotropina (TSH) srica y si las evaluaciones posteriores, incluyendo otras pruebas tiroideas
y la respuesta al tratamiento, fueron congruentes con un hipotiroidismo. Los autores estudia
ron el nivel inicial de T, en 27 pacientes con hipotiroidismo y en 93 pacientes en los que no se
diagnostic para establecer la exactitud de la determmacin aislada de T. para el diagnstico
del hipotiroidismo.
Como era de prever, los cocientes de probabilidad para el hipotiroidismo fueron mayores
para los niveles bajos de T, y menores para los niveles elevados (tabla 3-2). Los valores ms
bajos en la distribucin de la T, 4,0 )lg/dl) slo se identificaron en pacientes con hipotiroi-
dismo, es decir, estos niveles confirmaron el diagnstico_ Los niveles ms elevados.(> 8,0 )lg/dl)
no se identificaron en pacientes con hipotiroidismo, es decir, la existencia de estos niveles des-
cart la Los autores concluyeron que es posible lograr un ahorro de los costes
sin la prdida de exactitud diagnsticautiliz"ildo 'una determinacin aislada de T, total para
la evaluacin inicial de la sospecha de hipotiroidismo en pacientes concretos .
El cociente de probabilidad tiene otras ventajas con respecto a la sensi-
bilidad y especificidad como descripcin del rendimiento de la prueba. La
informacin con la que contribuye la prueba se resume en un nmero en
lugar de dos. Los clculos necesarios para obtener la odds posprueba a par-
tir de la odds preprueba son sencillos. Asimismo, los cocientes de probabili-
dad son especialmente adecuados para describir la probabilidad global de
la enfermedad cuando se utilizan una serie de pruebas diagnsticas (v. ms
adelante); ,
Los cocientes de probabilidad (CP) tambin tienen desventajas. Es pre-
ciso utilizar odds y no probabilidades, y la mayora de nosotros tenemos
ms dificultades para razonar en trminos de odds que en trminos de pro-
babilidades. Adems, la conversin de la probabilidad en odds y a la inver
sa requiere un clculo matemtico o la utilizacin de un normograma, lo '
Tabla 3-2. Distribucin de los valores de tiroxina srica en pacientes hipotroideos y' en
individuos nonnales con el clculo de los c.oclentes de probabilidades'
Pacientes con resultados de la prueba
llroxina srica totaf Hipotiroidismo NonnaJ Cociente de
Jgldl) (N.', porcentaje) (N.', porcentaje) probabilidad
< 1,1 2 (7,4) r
1,1-2,0 3(11,1) Confirmado
2,1-3,0
1 (3,7) .
J
3,1-4,0 8 (29,6)
4,1-5,0 4 (14,8) 1 (1,1) 13,8
5,1-6,0 4 (14,8) 6 (6,Si
2,3
6,1-7,0 3 (11,1) 11 (11,8) 0,9
7,1 -8,0 2 (7,4) 19 (20,4) 0,4
i
8,1-9,0 17 (18,3)
9,1-10 20 (21,5)
10,1-11 11 (11,8) Descartado
11,1-12 4 (4,3)
1
>12 4 (4,3)
Total 27 (10Q) 92 (100)
-De Goldsteln BJ y Mushlin Al. Use of a Single thyroxine test to evaluate ambu!atory medica! patients for
suspected'hypothyroidism. J Gen Intern Med 1987; 2: 20-24.
59
68 Epidemiologa clnica. Aspectos fundamentales
que -en parte- contrarresta la simplicidad del clculo de la odds posprue-
ba utilizando cocientes de probabilidad. Por ltimo, para las pruebas con
un intervalo de resultados, los cocientes de probabilidad utilizan medidas
de sensibilidad y especificidad que son diferentes de las habitualmente des-
critas.
PRUEBAS MLTIPLES
Puesto que los mdicos generalmente utilizan pruebas diagnsticas
imperfectas, con una sensibilidad y especificidad inferiores al 100 % y
cocientes de probabilidad intermedios, a menudo una sola prueba propor-
ciona una probabilidad de la enfermedad que no es ni muy alta ni muy
baja, por ejemplo, situada entre el1Q y el 90 %. Habitualmente, no es acep-
table interrumpir el proceso diagnstico en este punto. Estara satisfecho
un mdico o un paciente con la conclusin de que el paciente tiene una pro- .
babilidad del 20 % de padecer un carcinoma de colon? O de que un varn
asintomtico de 35 aos de edad con una depresin de 2,5 mm del segmen-
to ST en una prueba de esfuerzo tuviera una probabilidad del 42 % de
sufriruna arteriopata coronaria (v. fig. 3-9)? Incluso para enfermedades
que no conduoen a la muerte, como el hipotiroidismo, las pruebas con pro-
babilidades posprueba intermedias apenas son de utilidad. El mdico, por
lo general, est dispuesto a aumentar o a disminuir la probabilidad de la
enfermedad en estas situaciones, a menos que naturalmente todas las posi-
bilidades diagnsticas sean insignificantes, no pueda hacerse nada acerca
del resultado o el riesgo de continuar adelante sea prohibitivo. Salvo estas
excepciones, el mdico desear proseguir con pruebas adicionales.
Cuando se llevan a cabo mltiples pruebas y todas son positivas o nega-
tivas, la interpretacin es clara. ,Sin embargo, a menudo algunas son posi-
tivas y otras negativas. En estos casos, la interpretacin. es,ms complica-
da. Este apartado describe los principios mediante los cuales se aplican e
interpretan mltiples pruebas.
Las pruebas mltiples pueden aplicarse de dos formas en general (figu-
ra 3-10). Pueden utilizarse en paralelo (es decir, todas a la vez) y un resul-
tado positivo de cualquiera de las pruebas se considera una prueba de la
enfen;ne,l<t!l, o bien pueden llevarse a cabo de 1Il.anera seriada (es decir, con-
secutivamente), partiendo de los resultados de la prueba previa;:Para las
pruebas seriadas, es preciso que todas las .ptuebas deparen un.res.ultado
positivo para que se establezca el diagnstioo, puesto que el proceso diag-
n6stico ~ e interrumpe cuando se obtiene un resltado negativo. .
Pruebas paralelas
Los mdicos habitualmente solicitan pruebas en paralelo cuando es
necesaria una evaluacin rpida, tal y como ocurre en los pacientes hospi-
talizados o visitados en situaciones de urgencia, o para los pacientes ambu-
latorios que no pueden regresar fcilmente porqe haiirecprndo una larga
dietancia para ser evaluados. .
60
Diagnstico 69
ESTRATEGIA SECUENCIA DE CASOS CONSECUENCIAS
Pruebas seriadas
S\QI>.
. u I La prueba A y la prueba B y la prueba e son positivas
Pruebas paralelas
Sensibilidad
t Especificidad
La prueba A o la prueba B o la prueba e son positivas
Flg. 3-10. Pruebas seriadas y paralelas.
t Sensibilidad
Especlfiidad
Las pruebas mltiples en paralelo en general aumentan la sensibilidad
y, por .esta razn, el valor predictivo negl\tivo para.1,lD.a prevalllncia deter-
minada de la enfermedad es superior al del de cada pruebaindividtial. Por
.<i
otra parte, disminuyen la especificidad y el valor predictivo PW!i.tivo. Es
decir, es menos probable que la enfermedad se pase por alto Gas pruebas
] paralelas proba.blemente constituyen una explicacin de que. los centros
." hospitalarios parezcan que diagnostiquen las enfermedades que 'los mdi-
i cos locales pasan por alto); pero tambin es ms probable que se establez-
jjj can di:agnsticos falsos positivos (y por consiguiente, la propensin a sobre-
la diagnosticar en dichos' centros tambin es mayor). el). que
i aumenta la sensibilidad y el valorpredictiv.o negativodepeI).de.detgI'ado
'" en que las pruebas identifican a pacientes con la enfermedad que han sido
omitidos por las otras pruebas utilizadas. Por ejemplo, si se utilizan dos
W
f
pruebas deforma parelela con unas sensibilidades del 60 y elegO %, la sen-
sibilidad de la prueba paralela slo ser del 80 %, si la mefor prueba iden-
i tifica a todos los casos puestos de manifiesto mediante la prueba menos
'" sensible, Si ambas pruebas detectan todos los Casos omitidos por la otra, la
1 sensibilidad de las pruebas paralelas naturalmente es del 100 %. Si las
dos pruebas son completamente independientes entre s, la sensibilidad de
I las pruebas. paralelas sera del 92 %.
" Las pruebas paralelas son especialmente tiles cuando el clnico se
@ enfrenta a la necesidad de una prueba muy sensible pero solamente dispo-
61
,

I
70 Epidemiologa clnica. Aspectos fundamentales
ne de dos o ms pruebas relativamente insensibles que miden diferentes
fenmenos clnicos. Utilizando las pruebas en paralelo, el efecto neto es
una estrategia diagnstica ms sensible. No obstante, el precio que debe
pagarse es la evaluacin o tratamiento de algunos pacientes sin la enfer-
medad.
Ejemplo. El APE Y el examen rectal digital son pruebas insensibles para el diagnstico
del cncr de prstata (7). La tabla 3-3 muestra su sensibilidad, especificidad y valores pre-
dctivos en un contexto de cribado (varones sin sntomas). Cuando ambas pruebas se utilizan
en paralelo, la sensibilidad aumenta, pero la especificidad disminuye. El valor predctvo posi-
tivo es ms bajo que la determinacin aislada del APE.
Pruebas seriadas
Los mdicos utilizan frecuentemente estrategias de pruebas seriadas
en situaciones clnicas en as que no es preciso una evaluacin rpida de
los. pacientes, por ejemplo, en las consultas privadas yen las consultas
externas hospitalarias, en las cuales los pacientes ambulatorios son segui-
dos a lo largo del tiempo. Las pruebas seriadas tambin SI'! utilizan cuando
algunas, ,de las pruebas tienen un coste elevado o con,llevan riesgos y en este
caso slo se utilizan despus de que pruebas ms simples y seguras sugie-
ran la existencia de la enfermedad. Por ejemplo, la edad materna y los an-
lisis de sangre (alfa-fetoprotena, gonadotropina corinica y estrioD se utili-
zan para identificar embarazos con un riesgo ms elevado de que la mujer
d a luz a un feto con el sndrome de Down .. A 1l1-S madres en las qu se iden-
tifica un riesgo elevado mediante estas pruebas a menudo se les ofrece la
realizacin de una arimiocentesis (13). Las prebas seriadas conducen a
una menor utilizacin del laboratorio que las pruebas 'paralelas porque la
evalacin.adicional depende de los resultados de laprueba<previa. No obs-
t:llJ,te, las pruebas seriadas requieren mayor tiempo porqU slo se solici-
tan pruebas adicionales despus de disponer de los de las prue-
bas previas. . ". -- ...
. Las pruebas seriadas ' maximizaD. la especificidad y el valor predictivo
positivo pero disminuyen la sensibilidad y elvaldt predictiv negativo (ta-
bla 3-3). El clnico acaba' standoms seguro de que los resUltados positivos
de la prueba representan enfermedad, peroeorte;mayorrlesgd de' pasar por
alto la enfermedad. Las prtlEi1>as' seradas' s1i'"espedalnente tiles cuando
ringuria de la,spruebas indiViduales dispolibls es -m.yespe:fica', . .
-Tabla3-3; Caractestlcasde la prueba del,API;:.y de l a,9xP!9raCll6n ractl!l. digItal (ERD)"
Sensibilidad
. AP (4,0 g/mi) 0,67
ERO anormat D lelo 0;50
APE o :ERO oaoormal .. -, 0,84
APE Y ERO anormales
Espacfficidad
0,97
0,9.4': .
,O,9g , .
, . .
" ValoiprediCtivo
. ' .. pp'sltlvo
,-> .' a43
. '- 0;24
0,28
,49
. del.llPE y: ERO aisl.ados, y en complnacic\n el diagnstico
del .(De Ss. y cols. Prosta:t. cancer screening: what we..l0!'w and what we nsed to
know, Ann InI Miid1993; filio '.',. ' . >-" ., .. ... , .. l: ..... . ' .
62
Diagnstico 71
f'1\ p ( v Si un mdico va a utilizar dos pruebas en serie, el proceso ser ms efi
<:'Y'l ciente si se utiliza en primer lugar la prueba con mayor especificidad. La
tabla 3-4 muestra el efecto de la secuencia en las pruebas seriadas.
La prueba A es ms especfica que la B, mientras que la prueba B es ms
sensible que la A. Utilizando en primer lugar la A, un nmero de pacientes
menor se someter a ambas pruebas, a pesar de que se diagnosticarn un
nmero de pacientes idntico, con independencia de. la secuencia de las
pruebas. No obstante, si una prueba tiene un coste ms bajo. o conlleva
menos riesgo, puede ser ms prudente utilizarla en primer lugar.
Asuncin de la independencia
Cuando se utilizan mltiples pruebas, como se ha descrito previamente,
la exactitud del resultado depende de si la informacin adicional a la que
ha contribuido cada prueba es, en cierto modo, independiente de la que ya
se dispona a Partir de fas pruebas previas, es decir, la prueba siguiente no
duplica simplemente la informacin conocida. De hecho, esta premisa des-
taca todo el enfoque del valor predictivo que hemos descrito. No obstante,
parece improbable que las pruebas .para la mayor parte de enfermedades
sean completamente independientes unas de otras. Si la .asuncin de que
las pruebas son totalmente independientes es errnea, el clculo de la pro-
babilidad de la enfermedad a partir de las diversas pruebas tiende a sobre-
estimar el valor de las pruebas.
Tabla 34. Efecto de la secuencia de las pruebas iniciales: A despus B frente a B
despus A'
Prevalencia de la enfermedad
Nmero de pacientes examinados 1.000
Nmero de pacientes con la enfermedad 200 (prevalencia del 20 %)
"

e
1



&'
..;
'"

$
I
..



A
B
Prueba
A
B
Sensibilidad y especificidad de las pruebas
Sensibilidad
80
90
Secuencia de la prueba
Especificidad
90
80
Empezando con la prueba A Empezando con la prueba B
Enfermedad Enfermedad
+ +
+
160 80 240 B
+
180 160
40 720 760 20 640
200. 800 1.000 200 800

340
660
1.000
240 pacientes reexaminados con B 340 pacientes reexaminados con A
Enfermedad Enfenmedad
+ +
+
144 16 160 A
+
144 16 160
16 64 80 46 144 180
160 80 240 180 160 340
@ 'Obsrvese Que en ambas secuencias S6 identifican como enfermos el mismo nmero de paclentes (160) y
r se identifican el mismo nmero d.e verdaderos positiVOS {144}, pero cuando se utiliza primero la prueba: A (con
mayor especificidad), se reexamina un menor nmero padentes. La ms baja de la prueba A
O no afecta adversamente al resultado .final.
63
72 Epidemiologa clnica. Aspectos fundamentales
Cocientes de probabilidad seriados
Cuando se utiliza una serie de pruebas, puede calcularse una probabili-
dad global utilizando el cociente de probabilidad para el resultado de cada
prueba, tal Y como se muestra en la figura 3-11. La prevalencia de la enfer-
medad antes de la prueba se transforma primero en la odds preprueba. A
medida que se lleva a cabo cada prueba, la odds posprueba de una se con-
. vierte en la odds preprueba de la siguiente. Al final, se identifica una nue-
va probabilidad de la e:ermedad que tiene en cuenta la informacin a la
que han contribuido todas las pruebas de la serie.
RECEPTIVIDAD (SENSIBILIDAD)
El estado clnico de los pacientes cambia continuamente como respues-
ta al tratamiento o por los efectos del envejecimiento o la enfermedad. Los
clnicos regularmente se enfrentan a la pregunta mi paciente ha mejora-
do o se ha deteriorado?. Las prueba/! utilizadas para monitorizar el curso
clnico (p. ej., gravedad de los sntomas o estado funcional) a menudo son
algo diferentes de las utilizadas pata el diagnstico de la enfermedad, pero
la evaluacin de su rendimiento es muy similar.
La capacidad de los cambios del valor de una prueba para identificar
correctamente los cambios del estado clnico se denomina receptividad sen-
sibilidad. Desde un punto de vista conceptual, se relaciona con la validez
de una prueba diagnstica, excepto porque el patrn oro es la existencia de
un cambio significativo del estado clnico o no, y no la existencia de la
enfermedad o no. La magnitud de la sensibilidad de una prueba puede
expresarse como sensibilidad, especificidad y valor predictivo o como el
rea bajo la curva ROC. .
Ejemplo. Diversos parmetros autovalorados de salud y estado funcional se utilizan fre-
cuentemente para monitorizar la salud de las poblRciones y evaluar los efectos del tratamien-
to. Dos de dichos parmetros son los das de actividad limitada, es decir, el nmero de das en
los cuales las actividades habituales han estado limitadas por la enfermedad o una lesin, y la
Prueba A
Odds preprueoa X CP A = Odds posprueba
t
Prueba B
Odds preprueoa x CP
s
= Odds posprueba
J
Flg. 3-11. UtilIzacin de los cocientes de prObabilidad
64
72 Epidemiologa clnica. Aspectos fundamentales
Cocientes de probabilidad seriados
Cuando se utiliza una serie de pruebas, puede calcularse una probabili-
dad global utilizando el cociente de probabilidad para el resultado de cada
prueba, tal Y como se muestra en la figura 3-11. La prevalencia de la enfer-
medad antes de la prueba se transforma primero en la odds preprueba. A
medida que se lleva a cabo cada prueba, la odds posprueba de una se con-
. vierte en la odds preprueba de la siguiente. Al final, se identifica una nue-
va probabilidad de la e:ermedad que tiene en cuenta la informacin a la
que han contribuido todas las pruebas de la serie.
RECEPTIVIDAD (SENSIBILIDAD)
El estado clnico de los pacientes cambia continuamente como respues-
ta al tratamfento o por los efectos del envejecimiento o la enfermedad. Los
clnicos regularmente se enfrentan a la pregunta mi paciente ha mejora-
do o se ha deteriorado?. Las prueba/! utilizadas para monitorizar el curso
clnico (p. ej., gravedad de los sntomas o estado funcional) a menudo son
algo diferentes de las utilizadas pata el diagnstico de la enfermedad, pero
la evaluacin de su rendimiento es muy similar.
La capacidad de los cambios del valor de una prueba para identificar
correctamente los cambios del estado clnico se denomina receptividad sen-
sibilidad. Desde un punto de vista conceptual, se relaciona con la validez
de una prueba diagnstica, excepto porque el patrn oro es la existencia de
un cambio significativo del estado clnico o no, y no la existencia de la
enfermedad o no. La magnitud de la sensibilidad de una prueba puede
expresarse como sensibilidad, especificidad y valor predictivo o como el
rea bajo la curva ROC. .
Ejemplo. Diversos parmetros autovalorados de salud y estado funcional se utilizan fre-
CIlentemente para monitorizar la salud de las poblRciones y evaluar los efectos del tratamien-
to. Dos de dichos parmetros son los das de actividad limitada, es decir, el nmero de das en
los cuales las actividades habituales han estado limitadas por la enfermedad o una lesin, y la
Prueba A
Odds preprueoa X CP A = Odds posprueba
t
Prueba B
Odds preprueoa X CP
a
= Odds posprueoa
J
Flg. 3-11. UtilIzacin de los cocientes de prObabilidad
64
Diagnstico 73
salud autovalorada, una pregunta planteada a los individuos que responden al cuestionario
para valorar su salud desde excelente hasta mala comparados con otros individuos de su edad,
Se evalu la receptividad de estos parmetros en un cuestionario administrado con un ao de
diferencia comparando los cambios de cada parmetro entre adultos de edad avanzada que
sufrieron una enfermedad principal durante el ao y los que no la sufrieron (14). En la figu-
ra 3-12, las curvas ROe muestran que los cambios de la salud autovalorada rindieron ligera
mente mej'or que la posibilidad de identificar cambios de la salud asociados con la enfermedad
principal, al mismo tiempo que los cambios de los dias de actividad limitada rindieron mucho
mejor representando elBO % del rea bajo la curva ROe,
RESUMEN
El rendimiento de una prueba diagnstica se evala comparando los
resultados de la prueba con la presencia de la enfermedad en una' tabla
2 X 2. Es preciso llenar las 4 casillas de la tabla. Cuando se estima la sen-
sibilidad y especificidad de una nueva prueba diagnstica a partir de la
informacin de las publicaciones mdicas, es preciso que exista un patrn
oro, con el cual se compare la exactitud de la prueba. Los individuos enfer-
mos y no enfermos deben parecerse a los tipos de pacientes para quienes la
prueba podra ser til en la prctica. Adems, el conocimiento del diagns-
tico final no debe sesgar la interpretacin de los resultados de la prueba o
viceversa. La modificacin del punto de corte entre lo normal y lo anormal
100
80
60
40
20
O ' - - - ~ - - - - - L ____ L-__ -L ____ ~
20 40 60 80 100
1 - Especificidad %
i
~ Fig. 3-12. Receptividad de los' dos parmetros del cuestionario scibre el estado de la salud. Ois-
"' tincin entre los pacientes ancianos con y'sin una enfermedad principal. (De Wagner EH, Lacroix
~ AZ., Grothaus Le y Hecht, JA. Responsiveness of health status measures to changa arnong older
" adults, J Am Gariatr Soc 1993; 41: 241-248.)
65
74 Epidemiologa clnica. Aspectos fundamentales
cambia la sensibilidad y la especificidad. Los cocientes de probabilidades
son otro mtodo para describir la exactitud de una prueba diagnstica.
El valor predictivo de una prueba es la caracterstica ms importante
cuando los clnicos interpretan los resultados de una de ellas. No slo est
determinado por la sensibilidad y la especificidad de la pr1.\eba, sino tam-
bin por la prevalencia de la enfermedad,que puede'cambiar de un contex-
to a otro. Habitualmente es necesap,o utilizar varias pruebas, en paralelo o
en serie, para lograr una certidumbre diagnstica aceptable. La sensibili-
dad, la capacidad de una prueba para detectar un cambio del estado clni-
co, tambin se evala mediante la misma tabla 2 x 2.
BIBLIOGRAFA
1. Joint National Committee on Detection, Evaluation, and Treatment of High Bload Pres-
sure. The fifth report of the Joint National Committee on Detection, Evaluation, and
Treatment of High Blood Pressure UNC V). AIch Inlem Med, 1993; 153:154- 183.
2. Catalona WJ; et al. Measuremerit of prostate-specific antigen in serum as a screening test
for prostate N Engl J Med 1991;324:1156- 1161.
3. Jensen Brant-Zawadzki MN, Obuchowski N, Modie MT, Malkasian D, Ross JS. Mag-
netic resonance nnaging of the lumbar spine in peopIe without back pain, N Engl J Med
1994;331:69- 73.
4. ,Bartrum RJ Jr, Crow HC, Foote SR illtrasonic and radiographic choIecystography. N Engl
J Med 1977;296:538-541.
5. Jones TV, Lindsey BA, Yount P, SoItys R, Farani-Enayat B. Alcoholism screening question-
naires: are they vaild in elderly medical outpatients? J Gen Intem Med 1993;8:674- 678.
6. Fletcher RH. Carcinoembryonic antigen. Ann Intern Med 1986;104:66-73.
7. Voss JO. Prostate caneer, screening, and prostale-specific antiget): promise or perll? J Gen
Inlem Med 1994;9:468- 474. '
8. Barry MI, Mu1ley AG, Singer DE. Screening for HTL V 111,antibodies: the relation be!ween
prevalence and positive predictive value and its social consecUencs. JAMA 1985;253:3395.
9. Ward]W, Grindon AJ, Feorino PM, Schable C, Parvin M, Laboratory and epide-
miologic evaluation of an enzyme irnmunoassay for antibodfes to HTL V 111. J.<\MA
1986;256:357- 361. -
10. Dlamond GA, Forrester JS. Analysis of probability as an aid in fue clnical diagnosis of
coronary artery disease. N Engl J Med 1979;300:1350-1358. '. '
11. Timey WM, McDonaId q. Practice databases and their uses in clinical research. Stat
Med 1991; 10:541- 557. ' " -."
12. Goldstein BJ, Mushlin Al. Use of a single thyraxine test lo evaluate. ambulatory medical
patients for suspected hypothyroidism. J Gen Inlero Med 1987;2:20-24. .
13. Haddow TE, Palomaki GE, I<night GJ, Willlams J, Pulkkinen A, Canick JA, Saller DN Jr,
Bowers GB. Prenatal screening far Down's syndrome with use of maternal serum rnarkers.
N Engl J Med 1992;327:588- 593.
14. Wagner EH, LaCroX AZ, Grothaus LC, Hecht JA. Responsiveness of health status mea-
sures to change among oIder adults. J Aro Geriatr 50.:1993;41:241-248.
LECTURAS RECOMENDADAS
Cebul RD, Beck LH. Teaching clinical decision making. New York: 1985.
Department of Clinical Epidemiology and Biostatistics, McMaster University.Interpretation
o diagnostic data. V. How to do it with simple rnath. Can Med Assoc 1 1983;129:22- 29.
66
ii
"
" c
~
~
c
-o
"
~
~
2
~
~
-"
w
1;
"-
o
Q
2
J'
.t.
<6
,;
oc
ro
"-
,j.
0
~
;::
""
0
i
~
z
g
~
1)
Diagnstico 15
(Reprinted in Sackett DL, Haynes RB, Tugwell P, eds. Clinical epidemiology: a basic science
far clinical medicine. Baston: Little, Brown, 1985.)
Fagan TJ Namogram far Bayes' fueorem [LetterJ. N Engl J Med 1975;293:257.
Griner PF, Mayewski RJ, Mushlin Al, Greenland P. Selection and interpretation af diagnastic
tests and pracedures. Principies and applications. Ann Intem Med 1981;94:557-<500.
Criner.PF, Panzer RJ, Greenland P. Oinieal diagnasis and !he laboratory: lagical strategies
for caromon medical problems. Clcago: Year Book, 1986.
MeNeil BJ, Abrams HL, eds, Brigham and Women's Hospita! handboak af diagnostic imaging.
Bostan: Little, Brown, 1986.
Pauker SG, Kassirer JI'. Clinical applieation of decisian analysis: a detailed iIIuslratian. Semin
Nucl Med 1978;8:324'-335.
Sheps SB, Schechter MT. The assessment oi diagnostie tests. A survey of current medical
research. JAMA 1984;252:2418-2422.
Sox HC Jr. Probability theary in fue use of diagnastie tests. An introduction to critica! study
of fue Iiterature. Ann Intem Med 1986;104:60-66.
Sox HC Jr, Blatt M, Higglns MC, Marton KI. Medica! decision making. Kent, UK: Butterwarth,
1987.
Wasson ]H, Sox He Jr, Neff RK, Goldman L. Oinical iredictian rules. applicatians and
methodalogica! standards. N Engl J Med 1985;313:793-799.
Welnslein MC, Fineberg HV, EIslein AS, Frazier HS, Neuhauser D, NeulraRR, MeNeil BJ.
Oinical decisian analysis. Phlladelphia: WB Saunders, 1980 ..
67

You might also like