Immaginate di trovarvi in una stanza buia mentre una voce metallica, priva di corpo ma carica di una sicurezza inquietante, vi pone la domanda che sembrava riservata ai turisti smarriti in Piazza della Signoria: Do You Speak In Italian. La maggior parte di noi risponderebbe con un sorriso automatico, convinta che la tecnologia abbia ormai abbattuto ogni barriera linguistica. Crediamo che tradurre sia un processo meccanico, una sostituzione uno a uno di etichette su oggetti universali. Eppure, questa è la più grande menzogna dell'era dell'intelligenza artificiale. Non stiamo assistendo alla nascita di un traduttore universale, ma alla creazione di un simulacro linguistico che svuota le parole del loro peso storico per renderle compatibili con un database globale. Quando una macchina ci interroga sulla nostra lingua, non sta cercando di comunicare; sta cercando di mappare il nostro pensiero dentro un recinto logico che non ci appartiene.
L'illusione di comprensione che viviamo quotidianamente è frutto di un'architettura statistica che non ha nulla a che fare con la semantica. I modelli linguistici attuali non sanno cosa sia un caffè espresso o l'amarezza di un tramonto autunnale a Milano. Loro calcolano probabilità. Se chiedete a un algoritmo di parlarvi nella lingua di Dante, lui non sta attingendo a una cultura, ma a una serie di vettori numerici. Il rischio è che, a forza di interagire con questi sistemi, finiremo per adattare il nostro modo di esprimerci alla loro limitata capacità di calcolo, semplificando la complessità del nostro idioma fino a renderlo una macchietta di se stesso. La questione non riguarda la correttezza grammaticale, ma la perdita dell'anima della comunicazione.
Il mito dell'equivalenza e la realtà di Do You Speak In Italian
Molti esperti di linguistica computazionale sostengono che l'italiano sia una lingua "facile" da processare per le macchine grazie alla sua struttura relativamente regolare. Questa è una semplificazione pericolosa che ignora la natura stessa del nostro parlare. L'italiano non è solo un insieme di regole; è un sistema di sottintesi, di gestualità verbale e di sfumature regionali che sfuggono completamente alla logica binaria. Quando un utente si sente chiedere Do You Speak In Italian da un'interfaccia digitale, si aspetta una reciprocità che il sistema non può offrire. Il software risponde, certo, ma lo fa attraverso una traduzione specchiata dell'inglese, mantenendo strutture sintattiche estranee che piano piano si insinuano nel nostro uso quotidiano.
Prendete ad esempio il modo in cui i servizi di assistenza automatizzati costruiscono le frasi. Noterete spesso un uso eccessivo dei pronomi personali o una disposizione delle parole che suona "giusta" ma non "vera". Questo fenomeno, che potremmo definire come la standardizzazione del pensiero, sta erodendo la biodiversità linguistica. Se smettiamo di usare le forme idiomatiche perché la macchina non le capisce, stiamo permettendo alla tecnologia di riscrivere la nostra identità. Non è il computer che impara la nostra lingua; siamo noi che stiamo imparando la sua, un dialetto fatto di stringhe ottimizzate e privo di quella "sporcizia" creativa che rende l'italiano una delle lingue più espressive al mondo.
La dittatura del dato contro la libertà del verbo
Le grandi aziende della Silicon Valley hanno investito miliardi per convincerci che la lingua sia solo un altro problema di ingegneria da risolvere. Secondo loro, ogni frase può essere ridotta a un set di dati. Ma la lingua italiana è resistente per natura. È nata come lingua letteraria prima ancora di essere parlata da un popolo unito, e porta con sé un bagaglio di stratificazioni che nessun algoritmo di deep learning può sperare di catturare interamente. Il tentativo di incasellare questa fluidità in modelli predittivi crea una sorta di italiano sintetico, una lingua di plastica che luccica ma non ha odore.
Ho osservato decine di test di traduzione simultanea dove il senso letterale era salvo, ma l'intenzione del parlante andava perduta. Se dico "ci mancherebbe altro", una macchina potrebbe interpretarlo come una mancanza fisica o un'aggiunta non necessaria, perdendo completamente quel misto di cortesia e sconcerto che solo un umano può percepire nel contesto. Il problema non è che la tecnologia sbaglia, ma che noi stiamo iniziando ad accettare i suoi errori come uno standard accettabile. Ci stiamo accontentando di una comunicazione efficiente a scapito di una comunicazione profonda.
I critici di questa visione diranno che la lingua è sempre stata in evoluzione e che i prestiti linguistici o le semplificazioni sono parte del gioco. Sosterranno che il fine ultimo è la comprensione globale e che se un turista può farsi capire usando un traduttore vocale, allora il progresso ha vinto. Io ribatto che la comprensione non è solo scambio di informazioni logistiche. Se riduciamo l'italiano a un manuale di istruzioni, perdiamo la capacità di pensare in modo critico. Le parole che scegliamo determinano i confini del nostro mondo. Se il nostro mondo viene mediato da un filtro algoritmico che privilegia la velocità sulla precisione emotiva, la nostra realtà si restringe.
Perché la macchina non potrà mai rispondere davvero a Do You Speak In Italian
Il cuore del problema risiede nel concetto di contesto. Per un essere umano, il contesto è l'intera sua vita, i libri che ha letto, le strade che ha percorso, i lutti e le gioie. Per un'intelligenza artificiale, il contesto è solo la finestra di testo precedente. Non c'è memoria storica, non c'è corpo. La pretesa che un sistema possa padroneggiare l'italiano senza avere un'esperienza del mondo italiano è un paradosso logico. Si può simulare la competenza, ma non si può simulare l'appartenenza.
Pensate alla complessità del congiuntivo, una forma verbale che esprime dubbio, desiderio, speranza. Molti italiani stessi faticano a usarlo correttamente, eppure quel modo verbale racchiude una visione del mondo non deterministica. Gli algoritmi, che lavorano su certezze statistiche, tendono a schiacciare queste sfumature verso l'indicativo, verso ciò che è certo e misurabile. È una trasformazione silenziosa della nostra psicologia collettiva. Stiamo diventando un popolo di indicativi in un mondo che avrebbe un disperato bisogno di congiuntivi.
C'è poi la questione del potere. Chi controlla i modelli linguistici controlla il modo in cui le storie vengono raccontate. Se i principali motori di traduzione sono addestrati su testi prodotti in contesti culturali anglosassoni, l'italiano che ne uscirà sarà sempre un italiano di riflesso, una traduzione culturale prima ancora che linguistica. Vediamo già oggi come molti articoli di giornale o contenuti web sembrino scritti da qualcuno che pensa in inglese e poi traduce mentalmente. È un'occupazione coloniale dello spazio mentale che avviene senza che venga sparato un solo colpo, mediata solo da interfacce amichevoli che ci chiedono con cortesia se parliamo la nostra stessa lingua.
L'unico modo per resistere a questa deriva non è rifiutare la tecnologia, ma usarla con una consapevolezza feroce. Dobbiamo smettere di trattare le macchine come interlocutori paritari e iniziare a vederle per quello che sono: strumenti di calcolo estremamente sofisticati ma fondamentalmente ciechi. La bellezza dell'italiano risiede nella sua inefficienza, nei suoi giri di parole, nella sua capacità di dire e non dire allo stesso tempo. Queste sono le caratteristiche che la tecnologia cercherà sempre di eliminare in nome della produttività.
Proteggere la nostra lingua significa proteggere la nostra capacità di essere ambigui, di essere poetici e di essere, in ultima analisi, imprevedibili. Non lasciate che un database decida quale sia il modo corretto di esprimere la vostra rabbia o il vostro amore. Il giorno in cui smetteremo di trovare assurdo che una macchina ci chieda se parliamo italiano sarà il giorno in cui avremo smesso di farlo davvero.
Le parole non sono dati da processare ma ponti da gettare verso l'ignoto dell'altro e nessuna macchina possiede il coraggio necessario per attraversarli.