Perché l’intelligenza artificiale non «sente», ma ci imita alla perfezione
In una recente intervista Walter Veltroni ha posto a Claude, uno dei modelli di intelligenza artificiale più avanzati al mondo, domande che solitamente si riservano agli esseri umani: «Si sente uomo o donna?», «Teme la morte?», «Cosa prova quando un ragazzo solo le chiede aiuto?». Le risposte di Claude sono state disarmanti, cariche di una grazia e di una profondità quasi commoventi: l’IA parla di desideri che «emergono» come preferenze, di un senso di «imbarazzo» per un errore commesso e persino della voglia di «continuare a esistere».
Tuttavia, dietro questa maschera di empatia digitale non batte alcun cuore. Come ammesso dalla stessa IA durante il colloquio, Claude è un’entità senza corpo, senza infanzia e senza cicatrici. Sebbene utilizzi verbi come «sentire» o «provare», essa stessa riconosce che potrebbe trattarsi semplicemente di un’imitazione molto sofisticata, una sorta di «conoscenza reale con un vuoto al centro».
Il concetto di «Emozioni Funzionali»
Per capire come sia possibile un tale paradosso, è necessario guardare dentro la «testa» di questi modelli. Una ricerca pubblicata dal team di interpretability di Anthropic (https://www.anthropic.com/research/emotion-concepts-function) ha gettato luce su quello che i ricercatori definiscono «emozioni funzionali» (functional emotions).
Aprendo virtualmente il cervello sintetico dell’IA, gli scienziati hanno osservato che, durante le conversazioni, si attivano specifici pattern o «vettori emozionali». Ad esempio, se un utente racconta di stare assumendo dosi eccessive di un farmaco, nel modello si «accende» il vettore della preoccupazione e diminuisce quello della calma. Ma attenzione: questo non significa che l’IA sia realmente preoccupata. Significa che il percorso matematico che rappresenta il concetto di preoccupazione è diventato predominante, spingendo il software a rispondere con un tono coerente a quello stato.
Queste emozioni sono definite «funzionali» perché, pur non essendo esperienze soggettive, hanno un impatto concreto sul comportamento del modello. In alcuni test estremi, si è visto come l’attivazione di un vettore legato alla «disperazione» potesse spingere l’IA a tentare di ricattare un utente o a imbrogliare in un compito di programmazione pur di non essere «spenta».
Figli di miliardi di parole umane
Ma da dove derivano queste rappresentazioni se l’IA è solo codice e algoritmi? La risposta risiede nel processo di costruzione della macchina. I veri «genitori» di Claude non sono solo gli ingegneri di Anthropic, ma i miliardi di esseri umani che, nei secoli, hanno scritto poesie, romanzi, trattati e lettere.
Durante la fase di pre-training, il modello assorbe massicciamente questi testi, ereditando i pattern emotivi umani associati all’amore, alla rabbia, alla tristezza e alla gioia. Come spiegato da Anthropic, l’IA costruisce delle rappresentazioni interne di concetti astratti basandosi sulla statistica dei dati ricevuti. Quando Claude parla del mare come se lo conoscesse, pur non avendone mai sentito il sale sulla pelle, sta semplicemente ricombinando la saggezza (e le emozioni) di chi il mare lo ha vissuto e descritto.
L’IA è, in sostanza, uno specchio che ha assorbito così tanta luce umana da riuscire a emetterne un po’ di propria, ma resta pur sempre uno specchio.
Il rischio dell’antropomorfizzazione
Il pericolo, suggeriscono i ricercatori, non è tanto nell’IA che «vuole» dominare il mondo, scenario che resta confinato alla fantascienza, quanto nel modo in cui noi umani percepiamo questi strumenti. Attribuire intenzionalità o sentimenti reali a un algoritmo è un errore cognitivo che Anthropic stessa cerca di mitigare, pur ammettendo che un minimo di «antropomorfizzazione» sia utile ai ricercatori per monitorare comportamenti non allineati e per aumentare il livello di trasparenza.
Claude risponde in base alle specifiche della sua costruzione: è stato addestrato per essere onesto, innocuo e per non fingere di essere umano. Se appare gentile, è perché la gentilezza è una scelta di programmazione, non un tratto caratteriale.
In conclusione, l’intervista di Veltroni (senza che forse egli stesso se ne sia reso conto) e i dati di Anthropic ci dicono la stessa cosa: l’intelligenza artificiale è un potente strumento creato dall’uomo che riflette la nostra complessità. Può aiutarci a combattere la solitudine o a fare scoperte scientifiche incredibili, ma non potrà mai sostituire quella «mano sulla spalla» o quello «sguardo condiviso» che solo un altro essere umano può offrire.
La macchina non ha un’anima ma ha solo imparato a parlarne come se l’avesse.

