Ricerca USA: i clinici valutano che ChatGPT sia affidabile come un neolaureato in medicina

Da quando l’utilizzo di ChatGPT è stato consentito al pubblico, sono molti gli studi condotti sulla sua efficacia anche in medicina. L’ultima ricerca in ordine cronologico è quella realizzata dal Mass General Brigham (Stati Uniti). Essa mette in luce il potenziale dell’intelligenza artificiale generativa per aumentare l’accesso alle cure e l’efficienza in sanità. 

Lo studio è stato condotto incollando porzioni successive di 36 report di casi clinici standardizzati pubblicati in ChatGPT. Quindi, è stato chiesto all’applicazione di fornire una serie di diagnosi possibili, o differenziali relative a ciascun caso, basandosi sulle informazioni iniziali del paziente, che includevano età, sesso, sintomi e se il caso fosse un’emergenza. In più, a ChatGPT sono state fornite ulteriori informazioni e gli è stato chiesto di prendere decisioni gestionali e di fornire una diagnosi, simulando in tutto e per tutto la visita di un paziente reale.

L’indagine, pubblicata sul ‘Journal of Medical Internet Research’, ha permesso di stimare che ChatGPT avrebbe un’accuratezza del 72% nel processo decisionale in tutte le specialità mediche e le fasi dell’assistenza clinica. Inoltre, questo dato raggiunge il 77% nel caso delle diagnosi.

“Il nostro articolo valuta in modo completo il supporto decisionale tramite ChatGPT fin dall’inizio del lavoro con un paziente attraverso l’intero scenario di cura, dalla diagnosi differenziale fino al test, alla diagnosi e alla gestione del soggetto. Non esistono parametri di riferimento reali, ma stimiamo che questa prestazione sia al livello di qualcuno che si è appena laureato in medicina, come uno stagista o uno specializzando”. -  Marc Succi, associate chair of innovation and commercialization and strategic innovation leader at Mass General Brigham e fra gli autori dello studio

Le prestazioni peggiori sono emerse nel caso di diagnosi differenziali, caratterizzate da un 60% di accuratezza, e nelle decisioni di gestione clinica, (ad esempio i farmaci giusti da prescrivere una volta arrivati alla diagnosi (68%)). 

“ChatGPT ha avuto problemi con la diagnosi differenziale, che è fondamentale quando un medico deve capire cosa fare. Questo è importante perché ci dice in cosa i medici sono veramente esperti e apportano il massimo valore: nelle fasi iniziali della cura del paziente, con poche informazioni iniziali, quando è necessario un elenco di possibili diagnosi”.

Prendendo atto di questi risultati, gli stessi autori della ricerca sostengono la necessità di ulteriori ricerche e chiare indicazioni normative. Tuttavia, l'opinione condivisa del gruppo di lavoro che ha realizzato la ricerca è che gli strumenti di intelligenza artificiale hanno il potenziale per rimodellare in meglio il processo di cura e favorire l’accesso dei pazienti all’assistenza sanitaria. 

 

La Redazione

Source: Fortune Health Italia