Can Deep Learning Reliably Recognize Abnormality Patterns on Chest X-rays? A Multi-Reader Study Examining One Month of AI Implementation in Everyday Radiology Clinical Practice

Kvak, D., Chromcová, A., Ovesná, P., Dandár, J., Biroš, M., Hrubý, R., ... & Pajdaković, M. (2023). Can Deep Learning Reliably Recognize Abnormality Patterns on Chest X-rays? A Multi-Reader Study Examining One Month of AI Implementation in Everyday Radiology Clinical Practice. arXiv preprint arXiv:2305.10116.

Abstrakt:

V této studii jsme vyvinuli algoritmus automatické detekce založený na hlubokém učení (DLAD, Carebot AI CXR) k detekci a lokalizaci sedmi specifických radiologických nálezů (atelektáza (ATE), konsolidace plicního parenchymu (CON), pleurální výpotek (EFF), léze plicního parenchymu (LES), podkožní emfyzém (SCE), zvětšený srdeční stín (CMG), pneumotorax (PNO)) na rentgenových snímcích hrudníku (CXR). Sesbírali jsme 956 snímků CXR a porovnali výkon DLAD s výkonem šesti nezávislých radiologů, kteří snímky hodnotili v nemocničním prostředí. Navrhovaný DLAD dosáhl vysoké sensitivity (ATE 1.000 (0.624-1.000), CON 0.864 (0.671-0.956), EFF 0.953 (0.887-0.983), LES 0.905 (0.715-0.978), SCE 1.000 (0.366-1.000), CMG 0.837 (0.711-0.917), PNO 0.875 (0.538-0.986)) i ve srovnání s radiology (NEJNIŽŠÍ: ATE 0,000 (0,000-0,376), CON 0,182 (0,070-0,382), EFF 0,400 (0,302-0,506), LES 0,238 (0,103-0,448), SCE 0,000 (0,000-0,634), CMG 0,347 (0,228-0,486), PNO 0,375 (0,134-0. 691), NEJVYŠŠÍ: ATE 1,000 (0,624-1,000), CON 0,864 (0,671-0,956), EFF 0,953 (0,887-0,983), LES 0,667 (0,456-0,830), SCE 1,000 (0,366-1,000), CMG 0,980 (0,896-0,999), PNO 0,875 (0,538-0,986)). Výsledky studie ukazují, že navržený DLAD má potenciál pro integraci do každodenní klinické praxe jako systém podpory rozhodování, který účinně zmírňuje míru falešně negativních výsledků u juniorních a středně pokročilých radiologů.

Celý článek

Doporučené články