Leggere il pensiero, una lettera alla volta: cos'è Brain2Qwerty di Meta

Leggere il pensiero, una lettera alla volta: cos’è Brain2Qwerty

Immagina di aver perso la capacità di parlare o di muovere le mani — dopo un ictus, un incidente o una malattia neurologica — ma di avere ancora la mente perfettamente lucida. Come potresti comunicare con il mondo? È il problema al centro di Brain2Qwerty, un progetto di ricerca di Meta AI sviluppato insieme al BCBL (Basque Center on Cognition, Brain and Language, in Spagna). Qui trovi il paper: https://facebookresearch.github.io/brain2qwerty/

Il problema di partenza

Oggi esistono già sistemi che permettono a persone paralizzate di comunicare con il pensiero: sono le cosiddette neuroprotesi. Il problema è che quelle più efficaci richiedono un intervento chirurgico a cervello aperto, per impiantare elettrodi direttamente nella corteccia motoria. Funzionano bene, ma sono rischiose e accessibili a pochissimi pazienti.

Brain2Qwerty prova una strada diversa: decodificare frasi complete senza alcuna operazione, usando solo l’attività cerebrale registrata dall’esterno del cranio.

Come funziona

La tecnologia di partenza è la magnetoencefalografia (MEG): uno scanner che, come un casco, misura i minuscoli campi magnetici prodotti dai neuroni mentre pensiamo o agiamo.

La prima versione del sistema, Brain2Qwerty v1 (pubblicata su Nature Neuroscience), aveva già dimostrato che si poteva riconoscere quale tasto della tastiera una persona stesse premendo osservando solo il segnale MEG. Il limite era però importante: il modello aveva bisogno di conoscere in anticipo l’istante esatto di ogni pressione dei tasti, quindi non poteva funzionare “dal vivo”, in tempo reale.

Brain2Qwerty v2 supera questo ostacolo: legge un flusso continuo di attività cerebrale, senza bisogno di sincronizzarlo a eventi precisi, e ricostruisce direttamente intere frasi. Per farlo, mette in cascata tre moduli distinti:

Un Conformer (un tipo di rete neurale usata anche nel riconoscimento vocale) che individua i singoli caratteri a partire dal segnale cerebrale grezzo.
Un Aligner, che traduce questi segnali in rappresentazioni numeriche di parole (i cosiddetti “word embeddings”), aiutando il sistema a capire quale parola è più plausibile.
Un modello linguistico (simile a quelli usati per ChatGPT o altri assistenti) che ricompone il tutto in una frase completa, coerente dal punto di vista grammaticale e di senso.

È un po’ come avere tre “traduttori” in fila: il primo intuisce le lettere, il secondo suggerisce le parole più probabili, il terzo sistema tutto in una frase sensata.

I risultati

Il nuovo modello è stato allenato con 10 volte più dati per partecipante rispetto alla v1, arrivando a testare circa 22.000 frasi digitate (contro le circa 2.200 della prima versione).

I risultati, misurati come percentuale di parole decodificate correttamente, sono nettamente migliori:

Nel migliore dei partecipanti: dal 48% (v1) al 78% (v2).
In media tra tutti i partecipanti: dal 40% (v1) al 61% (v2).

Un dato interessante: le prestazioni migliorano in modo costante man mano che si aggiungono più dati di addestramento, seguendo quella che i ricercatori chiamano una “scaling law”, senza segni di rallentamento. Questo suggerisce che con dataset ancora più grandi il sistema potrebbe migliorare ulteriormente.

Cosa manca ancora

Gli stessi ricercatori indicano due ostacoli principali prima che questa tecnologia possa avere un uso clinico reale:

La precisione non è ancora sufficiente per un uso quotidiano: il sistema commette ancora troppi errori a livello di parole e lettere.
Lo scanner MEG usato nello studio è un macchinario grande e costoso, non qualcosa che un paziente può usare a casa. Esistono però già prototipi di sensori MEG indossabili, più leggeri e pratici, che in futuro potrebbero rendere questa tecnologia realmente accessibile in ambito clinico.

Perché è importante

Brain2Qwerty non è ancora pronto per l’uso clinico, ma rappresenta un passo concreto verso un obiettivo ambizioso: restituire la comunicazione a chi l’ha persa, senza bisturi. È il tipo di ricerca che, un dato alla volta, avvicina le interfacce cervello-computer dalla fantascienza alla pratica clinica.

Leggere il pensiero, una lettera alla volta: cos'è Brain2Qwerty di Meta