Skip to main content

L’adozione dell’intelligenza artificiale in ambito sanitario viene spesso accompagnata da una retorica improntata all’efficienza e alla rapidità, ma le evidenze scientifiche più recenti pongono l’accento su pericoli strutturali che vanno ben oltre la semplice precisione tecnica. Se da un lato gli algoritmi mostrano capacità diagnostiche teoriche straordinarie, dall’altro la loro applicazione pratica è minata da una tendenza sistematica all’errore e da una dinamica della fiducia spesso mal riposta. Come riportato in un’analisi di The Conversation e in un articolo scientifico di Nature Reviews Psychology, il nodo della questione non risiede solo nella precisione tecnica dei modelli, ma nel modo in cui la mente umana elabora l’inferenza psicologica (il processo mentale attraverso cui attribuiamo intenzioni o capacità a un interlocutore, anche se artificiale) di fronte a una macchina.

Per comprendere l’impatto di questa dinamica, immaginiamo un paziente che, dopo una diagnosi iniziale di patologia oncologica, decida di interrogare un chatbot per individuare cliniche alternative o protocolli sperimentali. In pochi secondi, lo schermo si riempie di una risposta fluida, dotata di note a piè di pagina e scritta con un tono autorevole che ricalca quello di un medico specialista. Tuttavia, un esame più attento rivela che molte delle affermazioni sono prive di fondamento, i riferimenti portano a pagine inesistenti e l’algoritmo non suggerisce mai che la domanda stessa possa essere fuorviante. Questo scenario non è un’ipotesi isolata, ma è emerso con forza da uno stress test condotto su cinque dei chatbot più diffusi al mondo, i cui risultati sono stati pubblicati su BMJ Open.

Le prove raccolte dai ricercatori dimostrano che circa il 50% delle risposte fornite dall’intelligenza artificiale a quesiti medici è problematico, con una quota del 20% di contenuti classificati come altamente rischiosi. Le criticità maggiori si registrano nelle domande aperte, ovvero quelle che richiedono un parere articolato su integratori o prestazioni atletiche. In questi ambiti, dove l’evidenza scientifica è spesso frammentata, i modelli linguistici di grandi dimensioni (che, ricordiamolo, sono software basati su statistiche probabilistiche che prevedono la parola successiva in una frase, senza comprendere realmente il significato del testo) tendono a generare risposte convincenti ma errate. Particolarmente allarmante è la gestione delle referenze: in venticinque tentativi, nessun chatbot è riuscito a produrre una lista bibliografica accurata, arrivando a inventare autori e titoli di studi scientifici totalmente inesistenti.

La persistenza con cui i cittadini consultano questi strumenti, nonostante le loro carenze, risiede nei principi che regolano il rapporto tra uomo e macchina. La fiducia, infatti, non è una caratteristica programmabile, ma un’esperienza soggettiva che poggia su due pilastri fondamentali. Il primo è la fiducia nelle prestazioni (la valutazione dell’affidabilità tecnica di un sistema), mentre il secondo è la fiducia morale (la percezione che il software agisca con integrità e in linea con i nostri interessi). Il tono pacato e formale dei chatbot manipola, seppure involontariamente, quest’ultima dimensione: tendiamo a fidarci della risposta medica perché il linguaggio utilizzato appare sincero e benevolo, proiettando sulla macchina una agentività (la capacità di agire e decidere in modo autonomo e consapevole) che appartiene solo agli esseri umani.

Un paradosso particolare emerge dal confronto tra la precisione teorica dell’IA e il suo impatto reale sulla salute pubblica. Uno studio apparso a febbraio su Nature Medicine ha evidenziato che, sebbene gli algoritmi possano fornire la risposta corretta nel 95% dei casi se interrogati correttamente, gli utenti comuni riescono a trarre beneficio da queste informazioni meno del 35% delle volte. Questo divario conferma che il problema non è solo la conoscenza medica della macchina, ma la capacità del paziente di interpretare ed eseguire correttamente le istruzioni ricevute. In assenza di una fiducia calibrata, ossia un livello di affidamento proporzionato alla reale capacità dello strumento in una specifica situazione, il rischio di sovradimensionare le risposte artificiali diventa una minaccia concreta alla sicurezza delle cure.

L’intelligenza artificiale, conclude l’articolo su The Conversation, non deve essere trattata come un’autorità medica indipendente, ma come uno strumento di supporto che richiede una costante supervisione umana. Essa può essere utile per sintetizzare argomenti complessi o per preparare una lista di domande da porre al proprio medico, ma non può sostituire il giudizio clinico e l’empatia della relazione di cura. Per proteggere la salute della comunità, è fondamentale adottare protocolli di verifica rigorosi, trattando ogni referenza bibliografica come un suggerimento da controllare e imparando a riconoscere i segnali di allarme nei testi che offrono soluzioni definitive senza i necessari distinguo scientifici. Solo attraverso una cittadinanza digitale consapevole potremo trasformare l’innovazione in un alleato reale, evitando che la ricerca di risposte rapide alimenti dinamiche di disinformazione sanitaria.

(Foto di Planet Volumes su Unsplash)

Ricordati di farlo

Lo sai che puoi destinare il 5 per mille dell’IRPEF all’Avis di Legnano? Basta inserire il nostro codice fiscale al momento della dichiarazione. Useremo i proventi per fare ancora meglio ciò che facciamo da sempre.

È spiegato tutto qui

Privacy Preference Center