Mammografie: l’intelligenza artificiale non supera l’uomo


Screening mammario: l’uso routinario dell’intelligenza artificiale non sembra ancora poter competere in accuratezza con le valutazioni dei radiologi

Screening mammario: l'uso routinario dell'intelligenza artificiale non sembra ancora poter competere in accuratezza con le valutazioni dei radiologi

Nello screening del cancro al seno l’uso routinario dell’intelligenza artificiale non sembra ancora poter competere in accuratezza con le valutazioni dei radiologi, secondo gli esiti dell’analisi di 12 studi pubblicata sul British Medical Journal.

C’è stato molto clamore sull’uso dell’intelligenza artificiale in radiologia, tra cui articoli di opinione che suggeriscono una imminente sostituzione dei radiologi con l’intelligenza artificiale, dal momento che i computer non si addormentano o hanno brutte giornate. «Inoltre le loro prestazioni sono in continuo miglioramento» ha spiegato l’autore principale dello studio Karoline Freeman, ricercatrice senior presso l’Università di Warwick, a Coventry, nel Regno Unito. «Tuttavia le attuali evidenze sono molto lontane dall’avere la qualità e la quantità richieste per l’utilizzo dell’intelligenza artificiale nella mammografia di routine».

Analisi di diversi studi su ampie casistiche
I ricercatori hanno estratto i dati da 12 studi che riportavano l’accuratezza dei test degli algoritmi di intelligenza artificiale, da soli o in combinazione con i radiologi. Questi studi sono stati selezionati da un’ampia revisione della letteratura che ha incluso oltre 130mila donne sottoposte a screening dal 2010 al maggio 2021. Tra le altre analisi, sono state confrontate le prestazioni dell’intelligenza artificiale e del radiologo con i risultati della biopsia.

Ne è emerso che nei tre più grandi studi retrospettivi, che includevano quasi 80mila donne sottoposte a screening in Europa e negli Stati Uniti, la maggior parte dei sistemi di intelligenza artificiale (34 su 36, 94%) erano meno accurati di un singolo radiologo ed erano tutti meno accurati dello screening di due o più radiologi.

Inoltre, i risultati apparentemente promettenti in studi più piccoli non sono stati replicati in quelli più ampi e non erano disponibili studi prospettici nel mondo reale che misurassero l’accuratezza dei test con l’intelligenza artificiale.

«Al momento le evidenze non consentono ancora di giudicare l’accuratezza dell’intelligenza artificiale nei programmi di screening del cancro al seno, e non è chiaro dove potrebbe essere utilizzata per essere di aiuto» hanno commentato gli autori. «Un uso complementare all’operato dei radiologi, anziché sostituirsi a loro, potrebbe essere una promettente possibilità, forse usando l’intelligenza artificiale per pre-selezionare le mammografie normali e facili che non necessitano di ulteriori revisioni».

I dati del mondo reale sono più affidabili
Per stabilire il ruolo corretto dell’intelligenza artificiale nello screening del cancro al seno gli studi randomizzati sono cruciali, compresi quelli che confrontano tra loro diversi sistemi di intelligenza artificiale, hanno affermato gli autori.

Concorda Constance Lehman, responsabile dell’imaging mammario presso il Massachusetts General Hospital di Boston. «Ricerche come questa sono importanti per effettuare un’attenta valutazione dell’implementazione dell’intelligenza artificiale nella pratica di routine, ma evidenze più rigorose ci avvicineranno alla comprensione dei rischi e dei benefici dei sistemi attualmente disponibili» ha affermato.

Secondo gli autori il motivo per cui i loro risultati sono meno ottimisti rispetto ai precedenti rapporti e opinioni è probabilmente dovuto al rigore nel puntare sulla qualità degli studi e sul confronto con l’accuratezza dei radiologi.

Inoltre hanno dato maggior peso ai dati del mondo reale. Cinque piccoli studi inclusi avevano infatti concluso che l’intelligenza artificiale è più accurata delle letture di un singolo radiologo, «ma questi studi esaminavano le immagini mammografiche delle donne in un ambiente di laboratorio, che non è generalizzabile alla pratica clinica» hanno spiegato. «Ci auguriamo che l’aver evidenziato queste carenze possa ispirare i responsabili delle decisioni a premere per avere evidenze di alta qualità sull’accuratezza dei test, prima di integrare l’intelligenza artificiale nei programmi di screening del cancro al seno».

Bibliografia
Freeman K et al. Use of artificial intelligence for image analysis in breast cancer screening programmes: systematic review of test accuracy. BMJ 2021; 374. Leggi