A Regra é Clara! O Estudo
ICON-Reloaded
O estudo ICON-Reloaded foi um
estudo publicado no JACC, em 20 de março de 2018, desenhado como um estudo de
acurácia de um método diagnóstico, no caso, do NT-Pro-BNP no diagnóstico de
Insuficiência Cardíaca (IC) em pacientes dispneicos admitidos no departamento
de emergência.
O conceito que motivou sua
concepção foi o de que as mudanças nas características epidemiológicas da
população (mais obesos, renais crônicos dialíticos, portadores de FA) em
relação aos primeiros trabalhos envolvendo o BNP, poderiam ter comprometido a
acurácia dos pontos de corte do BNP e caso isso fosse verdade, eles precisariam
ser revistos.
Nesse sentido, 1.461 pacientes
admitidos em 19 centros médicos com dispneia foram avaliados clinicamente
quanto à presença ou não de IC e tiveram uma amostra de sangue coletada para
dosagem do NT-Pro-BNP. Após isso, uma comissão avaliadora, cega quanto ao
resultado do NT-Pro-BNP, julgava o diagnóstico de IC como correto ou não e a
partir da comparação entre esses dados, os pontos de corte diagnósticos do
NT-Pro-BNP de 450, 900 e 1.800 pg/ml para as respectivas idades: <50, 50 a
75 e >75 anos; assim como o ponto de corte de exclusão <300, independente
da idade, tinham sua acurácia analisada, tendo como padrão ouro o diagnóstico
clínico.
Em outras palavras, na emergência,
qual a chance de um paciente dispneico, de 50 anos, com um BNP >900 ter
realmente insuficiência cardíaca? Ou ainda, quão bom é (acurácia) um BNP >
900 para o diagnóstico de IC em pacientes com 50 anos e dispneia?
E para dissecar essas questões, o
autor definiu como principal desfecho de eficácia o "VALOR PREDITIVO
POSITIVO (VPP)" dos pontos de corte diagnósticos e o "VALOR PREDITIVO
NEGATIVO (VPN)" do ponto de corte de exclusão e como desfechos secundários
o VPN, a razão de verossimilhança (de probabilidade) positiva (RV+),
sensibilidade e especificidade dos valores diagnósticos e a razão de
verossimilhança negativa (RV-), sensibilidade e especificidade do valor de
exclusão.
A amostra final incluiu 1184
pacientes, dentre os quais, 19% (277) foram diagnosticados com Insuficiência
Cardíaca Aguda, uma prevalência (probabilidade pré-teste) abaixo da que
inicialmente foi estimada pelos autores: 50%. E nessa população, o VPP dos
pontos de corte específico para idade de 450, 900 e 1800 identificados foram de
53,6%, 58,4% e 62%; sensibilidade de 85,7%, 79,3% e 75,5%; especificidade de
93,9%, 84% e 75%; RV+ de 14; 4,9 e 3 e RV- de 0,15, 0,25 e 0,32. Já o ponto de
corte para exclusão apresentou sensibilidade de 93,9, especificidade de 86,7,
RV+ 3,3 e RV- 0,09. Na curva ROC, a área sobre a curva do teste foi de 0,91.
Para efeito de comparação
didática, neste mês de copa do mundo, se esta fosse a narração de um jogo da
seleção brasileira, esse "lance" seria considerado polêmico e Galvão
Bueno não titubearia: "Pode isso, Arnaldo?", que responderia
"Não pode, Galvão, a regra é clara...valor preditivo é uma propriedade
intrínseca do doente e não do teste diagnóstico, portanto não deve ser usado
como método de avaliação de teste diagnóstico, ele varia com a prevalência da
doença na população, diferente da sensibilidade, especificidade e razões de
verossimilhança, que são propriedades do teste em qualquer população que sejam
aplicados. Errou o bandeirinha, em não marcar impedimento!"
Além disso, devem pairar em nossa
mente outros fatos que podem comprometer ainda mais a metodologia deste
trabalho: a população final foi pequena, dentre os dispneicos, apenas 277
tinham insuficiência cardíaca; os critérios para diagnóstico da síndrome de
insuficiência cardíaca são importantes demais no contexto do trabalho e não
foram sequer citados.
Outro ponto a ser lucubrado é o
erro na estimativa da prevalência de IC na amostra: esperava-se 50%, mas,
encontrou-se apenas 19%, o que afeta o já equivocado desfecho de eficácia que é
o VPP, posto que este depende da prevalência, afinal, o teste pode ter a melhor
acurácia possível, mas se não houver doentes (pouca prevalência), ele não vai
ter o que identificar (resulta em baixo VPP).
Por conseguinte, quanto ao
trabalho, concluímos que teve uma motivação relevante, mas se perdeu em sua
própria desorganização, porque todos os parâmetros para análise de acurácia
foram obtidos, estão no trabalho, mas não foram devidamente valorizados, em
detrimento do valor preditivo positivo, que NÃO É uma medida de acurácia,
havendo, portanto uma violação do método científico.
E quanto ao BNP, inferimos ser um
bom teste em pacientes com menos de 50 anos, perdendo acurácia e sendo no
máximo moderado em pacientes com mais de 75 anos. Fim de jogo.
João Kleber Menezes
Comentários
Postar um comentário