A Regra é Clara! O Estudo ICON-Reloaded


O estudo ICON-Reloaded foi um estudo publicado no JACC, em 20 de março de 2018, desenhado como um estudo de acurácia de um método diagnóstico, no caso, do NT-Pro-BNP no diagnóstico de Insuficiência Cardíaca (IC) em pacientes dispneicos admitidos no departamento de emergência.

O conceito que motivou sua concepção foi o de que as mudanças nas características epidemiológicas da população (mais obesos, renais crônicos dialíticos, portadores de FA) em relação aos primeiros trabalhos envolvendo o BNP, poderiam ter comprometido a acurácia dos pontos de corte do BNP e caso isso fosse verdade, eles precisariam ser revistos.

Nesse sentido, 1.461 pacientes admitidos em 19 centros médicos com dispneia foram avaliados clinicamente quanto à presença ou não de IC e tiveram uma amostra de sangue coletada para dosagem do NT-Pro-BNP. Após isso, uma comissão avaliadora, cega quanto ao resultado do NT-Pro-BNP, julgava o diagnóstico de IC como correto ou não e a partir da comparação entre esses dados, os pontos de corte diagnósticos do NT-Pro-BNP de 450, 900 e 1.800 pg/ml para as respectivas idades: <50, 50 a 75 e >75 anos; assim como o ponto de corte de exclusão <300, independente da idade, tinham sua acurácia analisada, tendo como padrão ouro o diagnóstico clínico.

Em outras palavras, na emergência, qual a chance de um paciente dispneico, de 50 anos, com um BNP >900 ter realmente insuficiência cardíaca? Ou ainda, quão bom é (acurácia) um BNP > 900 para o diagnóstico de IC em pacientes com 50 anos e dispneia?

E para dissecar essas questões, o autor definiu como principal desfecho de eficácia o "VALOR PREDITIVO POSITIVO (VPP)" dos pontos de corte diagnósticos e o "VALOR PREDITIVO NEGATIVO (VPN)" do ponto de corte de exclusão e como desfechos secundários o VPN, a razão de verossimilhança (de probabilidade) positiva (RV+), sensibilidade e especificidade dos valores diagnósticos e a razão de verossimilhança negativa (RV-), sensibilidade e especificidade do valor de exclusão.

A amostra final incluiu 1184 pacientes, dentre os quais, 19% (277) foram diagnosticados com Insuficiência Cardíaca Aguda, uma prevalência (probabilidade pré-teste) abaixo da que inicialmente foi estimada pelos autores: 50%. E nessa população, o VPP dos pontos de corte específico para idade de 450, 900 e 1800 identificados foram de 53,6%, 58,4% e 62%; sensibilidade de 85,7%, 79,3% e 75,5%; especificidade de 93,9%, 84% e 75%; RV+ de 14; 4,9 e 3 e RV- de 0,15, 0,25 e 0,32. Já o ponto de corte para exclusão apresentou sensibilidade de 93,9, especificidade de 86,7, RV+ 3,3 e RV- 0,09. Na curva ROC, a área sobre a curva do teste foi de 0,91.

Para efeito de comparação didática, neste mês de copa do mundo, se esta fosse a narração de um jogo da seleção brasileira, esse "lance" seria considerado polêmico e Galvão Bueno não titubearia: "Pode isso, Arnaldo?", que responderia "Não pode, Galvão, a regra é clara...valor preditivo é uma propriedade intrínseca do doente e não do teste diagnóstico, portanto não deve ser usado como método de avaliação de teste diagnóstico, ele varia com a prevalência da doença na população, diferente da sensibilidade, especificidade e razões de verossimilhança, que são propriedades do teste em qualquer população que sejam aplicados. Errou o bandeirinha, em não marcar impedimento!"

Além disso, devem pairar em nossa mente outros fatos que podem comprometer ainda mais a metodologia deste trabalho: a população final foi pequena, dentre os dispneicos, apenas 277 tinham insuficiência cardíaca; os critérios para diagnóstico da síndrome de insuficiência cardíaca são importantes demais no contexto do trabalho e não foram sequer citados.

Outro ponto a ser lucubrado é o erro na estimativa da prevalência de IC na amostra: esperava-se 50%, mas, encontrou-se apenas 19%, o que afeta o já equivocado desfecho de eficácia que é o VPP, posto que este depende da prevalência, afinal, o teste pode ter a melhor acurácia possível, mas se não houver doentes (pouca prevalência), ele não vai ter o que identificar (resulta em baixo VPP).

Por conseguinte, quanto ao trabalho, concluímos que teve uma motivação relevante, mas se perdeu em sua própria desorganização, porque todos os parâmetros para análise de acurácia foram obtidos, estão no trabalho, mas não foram devidamente valorizados, em detrimento do valor preditivo positivo, que NÃO É uma medida de acurácia, havendo, portanto uma violação do método científico.

E quanto ao BNP, inferimos ser um bom teste em pacientes com menos de 50 anos, perdendo acurácia e sendo no máximo moderado em pacientes com mais de 75 anos. Fim de jogo.

João Kleber Menezes

Comentários

Postagens mais visitadas deste blog

Ritmo de Marca-passo - Ricardo Sobral

ESTUDO ISIS - 2