Uno studio recente pubblicato sulla piattaforma preprint arXiv da Benjamin Spiegel e colleghi mostra come i sistemi di intelligenza artificiale possano sviluppare autonomamente proto-sistemi di scrittura attraverso un processo cognitivo chiamato “teoria della mente visiva”. La ricerca rivela sorprendenti parallelismi tra l’evoluzione della comunicazione simbolica negli agenti artificiali e il percorso storico che ha portato gli esseri umani primitivi a passare dai pittogrammi iconici ai simboli astratti nei primi sistemi di scrittura. Questo lavoro offre nuove prospettive sia sull’evoluzione culturale umana che sulle capacità cognitive emergenti nei sistemi di intelligenza artificiale.
La teoria della mente visiva: un meccanismo cognitivo fondamentale
Al centro della ricerca di Spiegel si trova il concetto di “teoria della mente visiva” – la capacità di ragionare su come altri agenti percepiscono e interpretano i segnali visivi. Questa abilità cognitiva risulta cruciale per la comunicazione efficace, poiché consente sia al creatore che all’interprete dei simboli di sfruttare una comprensione visiva condivisa per massimizzare la trasmissione di informazioni.
Nel contesto sperimentale dello studio, gli agenti di intelligenza artificiale dimostrano questa capacità in due modi complementari:
- I “creatori” generano pittogrammi visivamente distintivi e riconoscibili
- I “ricevitori” utilizzano l’inferenza per interpretare il significato inteso, considerando possibili alternative
Questa ricerca mette in discussione alcune ipotesi precedenti sulle capacità di teoria della mente nei modelli linguistici di intelligenza artificiale. Sebbene esistano affermazioni secondo cui grandi modelli come ChatGPT avrebbero raggiunto una forma di teoria della mente, molti esperti rimangono scettici riguardo a tali conclusioni. Il lavoro di Spiegel offre una comprensione più sfumata, concentrandosi specificamente sulla teoria della mente visiva nel contesto dello sviluppo della proto-scrittura.
L’ipotesi che emerge è che questo stesso meccanismo cognitivo sia stato probabilmente determinante per gli esseri umani primitivi nell’inventare i primi sistemi di scrittura, che si basavano sulla creazione di simboli che sfruttavano una comprensione visiva condivisa all’interno delle comunità. L’intelligenza artificiale diventerebbe così uno strumento per esplorare e comprendere meglio i processi cognitivi alla base dell’evoluzione culturale umana.
Il Signification Game: un modello computazionale per studiare l’emergere della scrittura
Per studiare questi fenomeni, i ricercatori hanno sviluppato un innovativo banco di prova per l’apprendimento per rinforzo multi-agente denominato “Signification Game”. In questo framework computazionale, gli agenti AI interagiscono attraverso un processo comunicativo che riflette in modo naturalistico le condizioni in cui potrebbe essere emersa la proto-scrittura nelle società umane primitive.
Le caratteristiche principali di questo modello sperimentale includono:
- Gli agenti comunicano creando e interpretando simboli pittorici disegnati come spline su una tela virtuale
- Il sistema non fa affidamento su linguaggi preesistenti o su hardware di comunicazione specializzato
- L’approccio naturalistico consente analogie più dirette con la cognizione umana e animale rispetto agli studi computazionali precedenti
Una distinzione fondamentale di questo framework rispetto ad approcci più convenzionali è l’integrazione di meccanismi di comunicazione inferenziale piuttosto che il solo affidamento sull’apprendimento per massimizzazione della ricompensa. Lo studio ha infatti riscontrato che i sistemi basati esclusivamente sulla ricompensa risultano fortemente limitati per l’acquisizione di linguaggi simbolici complessi.
Il Signification Game si inserisce in un formalismo più ampio per lo studio della comunicazione, offrendo spunti sia sui processi cognitivi individuali che sulle dinamiche culturali collettive che sottendono l’emergere dei sistemi simbolici. Il design sperimentale permette ai ricercatori di osservare in tempo reale come gli agenti sviluppino strategie comunicative che evolvono da semplici rappresentazioni pittografiche verso sistemi simbolici più astratti ed efficienti.
Il divario di significazione: superare i limiti della rappresentazione pittorica
Uno degli aspetti più interessanti emersi dalla ricerca di Spiegel è l’identificazione di ciò che gli autori chiamano “divario di significazione” – la disparità fondamentale tra la complessità di ciò che deve essere comunicato e ciò che può essere rappresentato efficacemente attraverso semplici pittogrammi. Questo divario diventa particolarmente evidente quando la complessità concettuale supera la capacità rappresentativa dei disegni iconici di base.
Per superare questa limitazione intrinseca, gli agenti AI nello studio hanno sviluppato capacità di teoria della mente visiva, piuttosto che affidarsi esclusivamente a meccanismi di apprendimento basati sulla ricompensa. Questo approccio cognitivo più sofisticato ha permesso loro di creare sistemi comunicativi progressivamente più complessi attraverso un processo di ragionamento su come i ricevitori avrebbero percepito e interpretato i loro segnali visivi.
La ricerca dimostra un principio fondamentale: la semplice massimizzazione della ricompensa non è sufficiente per sviluppare sistemi di comunicazione complessi come la scrittura. Emerge invece il ruolo essenziale della comunicazione inferenziale – la capacità di ragionare sulle intenzioni comunicative e sulle interpretazioni possibili – nell’evoluzione da sistemi di rappresentazione pittografica primitivi a sistemi simbolici efficaci.
Questo risultato offre un’importante chiave interpretativa non solo per comprendere le capacità emergenti nell’intelligenza artificiale, ma anche per rileggere i processi evolutivi che hanno portato all’invenzione della scrittura nelle civiltà umane primitive, suggerendo che l’emergere di capacità di teoria della mente avanzate possa essere stato un prerequisito cognitivo per lo sviluppo dei sistemi di scrittura.
Traiettorie evolutive parallele: dall’iconico all’astratto
Uno degli aspetti più affascinanti della ricerca è la scoperta che sia gli agenti AI nel Signification Game che i primi sistemi di scrittura umani seguono una traiettoria evolutiva notevolmente simile. In entrambi i casi, si osserva un percorso che inizia con rappresentazioni pittografiche altamente iconiche – che assomigliano direttamente ai loro referenti – per poi trasformarsi gradualmente in forme simboliche più astratte e stilizzate.
All’interno del framework computazionale, gli agenti AI inizialmente creano rappresentazioni pittoriche dettagliate ma sviluppano progressivamente simboli più stilizzati e astratti man mano che continuano a comunicare. Questa evoluzione emerge naturalmente in risposta a due pressioni principali:
- La crescente complessità delle esigenze comunicative
- La necessità di rappresentazioni più efficienti dal punto di vista cognitivo
Il parallelismo con l’evoluzione dei sistemi di scrittura umani è sorprendente. Le evidenze archeologiche mostrano che i primi pittogrammi, come quelli trovati nell’antica scrittura sumera o nei geroglifici egiziani, si sono gradualmente evoluti in scritture cuneiformi o ieratiche più astratte. In entrambi i casi – umano e artificiale – la transizione dall’iconico all’astratto non appare casuale, ma rappresenta un processo cognitivo fondamentale nello sviluppo dei sistemi semiotici.
Questa convergenza evolutiva suggerisce che potrebbero esistere principi universali che governano lo sviluppo dei sistemi di comunicazione simbolica, indipendentemente dalla natura biologica o artificiale degli agenti coinvolti. Tali principi potrebbero essere radicati nelle proprietà fondamentali della cognizione e della comunicazione, piuttosto che essere specifici dell’intelligenza umana.
Implicazioni e prospettive future
La ricerca di Spiegel e colleghi apre numerose prospettive per future indagini all’intersezione tra intelligenza artificiale, scienze cognitive e antropologia culturale. In primo luogo, fornisce un modello sperimentale per studiare l’emergere di sistemi simbolici in condizioni controllate, offrendo potenzialmente nuove intuizioni sui processi che hanno portato allo sviluppo della scrittura nelle diverse civiltà umane.
Dal punto di vista delle scienze cognitive, lo studio rafforza l’ipotesi che la teoria della mente – specificamente nella sua dimensione visiva – rappresenti un meccanismo cognitivo fondamentale per lo sviluppo di sistemi di comunicazione complessi. Questo suggerisce che le capacità metacognitive possano essere più importanti dell’intelligenza generale per l’emergere di sistemi simbolici sofisticati.
Per quanto riguarda la ricerca sull’intelligenza artificiale, i risultati indicano che lo sviluppo di capacità comunicative avanzate potrebbe richiedere l’implementazione di meccanismi che vanno oltre il semplice apprendimento per rinforzo, incorporando forme di ragionamento inferenziale e teoria della mente. Questa direzione di ricerca potrebbe contribuire allo sviluppo di sistemi AI con capacità comunicative più naturali e flessibili.
Lo studio di Spiegel rappresenta un esempio affascinante di come la ricerca sull’intelligenza artificiale possa illuminare aspetti fondamentali della cognizione e dell’evoluzione culturale umana. Osservando come agenti artificiali sviluppino spontaneamente proto-sistemi di scrittura, possiamo acquisire nuove prospettive sui processi cognitivi che hanno portato all’invenzione della scrittura – una delle innovazioni culturali più trasformative nella storia umana. Allo stesso tempo, questa ricerca suggerisce che lo sviluppo di capacità avanzate di comunicazione nell’intelligenza artificiale potrebbe richiedere l’implementazione di meccanismi cognitivi che rispecchiano quelli alla base dell’intelligenza sociale umana.