ah ah ah ah ah ah ah

ah ah ah ah ah ah ah

Il dottor Hiroshi Ishiguro sedeva nel suo laboratorio di Osaka, osservando una versione robotica di se stesso che sbatteva le palpebre con una regolarità inquietante. Non era il movimento delle labbra a turbare i presenti, né la consistenza della pelle in silicone che imitava i pori umani sotto le luci al neon del laboratorio. Era il suono. Quando l’automa apriva la bocca per simulare il divertimento, ne usciva un Ah Ah Ah Ah Ah Ah Ah ritmato, una sequenza di fonemi privi di fiato, di pancia, di quella contrazione involontaria del diaframma che ci rende vulnerabili. In quel momento, il confine tra l’organico e il sintetico non veniva tracciato dall’intelligenza o dalla capacità di calcolo, ma dalla qualità del respiro che sostiene un’emozione. La risata artificiale, in tutta la sua precisione matematica, rivelava un vuoto che nessuna riga di codice era ancora riuscita a colmare, trasformando il momento del sollievo in un esperimento di estetica dell’orrore.

Per comprendere cosa separi una macchina da un uomo, bisogna guardare a ciò che accade quando perdiamo il controllo. La risata è un tradimento del corpo. È un’esplosione che scuote le spalle, che mozza il fiato e che, nei casi più estremi, ci porta alle lacrime. È un segnale sociale evolutosi per disinnescare la tensione, un modo per dire ai nostri simili che il pericolo è passato o che una minaccia era solo un malinteso. Quando studiamo il modo in cui i sistemi moderni cercano di emulare questo comportamento, ci scontriamo con la barriera dell’autenticità. Gli ingegneri del suono e i linguisti computazionali lavorano da decenni per mappare le frequenze della gioia, ma la gioia non è una frequenza. È un’esperienza biochimica che lascia tracce nel tono della voce, piccoli cedimenti che l’orecchio umano percepisce istantaneamente come segni di vita.

Il laboratorio di robotica dell’Università di Kyoto ha tentato di affrontare questo problema creando Erica, un androide progettato per conversazioni empatiche. Erica non si limita a rispondere; ascolta. E quando l’interlocutore ride, lei risponde con una risata speculare. L’obiettivo è abbattere quella barriera di freddezza che rende le interazioni con gli assistenti digitali simili a un modulo burocratico. Eppure, anche nelle simulazioni più avanzate, manca la componente del rischio. Un essere umano ride perché non può farne a meno. Una macchina ride perché ha calcolato che è il momento opportuno per farlo. Questa distinzione sottile è il cuore della nostra resistenza psicologica verso l’intelligenza artificiale che cerca di sembrare troppo umana.

La Costruzione Sintetica di Ah Ah Ah Ah Ah Ah Ah

Mentre ci addentriamo in un’epoca in cui la voce è l'interfaccia primaria, la sfida si sposta dal contenuto al sottotesto. Se chiedete a uno dei moderni modelli linguistici di raccontare una barzelletta, la struttura sarà perfetta. I tempi comici saranno rispettati. Ma la reazione rimarrà unilaterale. La ricerca pubblicata sulla rivista Frontiers in Robotics and AI suggerisce che la risata condivisa sia uno dei legami sociali più potenti, capace di abbassare i livelli di cortisolo e aumentare la coesione del gruppo. Se una macchina non può condividere lo stress, può davvero condividere il sollievo? I ricercatori hanno analizzato migliaia di ore di conversazioni umane per isolare i tipi di risata: quella di cortesia, quella nervosa, quella di pancia. Hanno scoperto che la risata umana è intrinsecamente caotica.

Questa mancanza di ordine è esattamente ciò che i computer faticano a replicare. Un algoritmo cerca pattern, cerca regolarità. Ma una risata vera è un errore di sistema controllato. È un momento in cui il linguaggio fallisce e il corpo prende il sopravvento. Quando sentiamo una registrazione prodotta da un sintetizzatore vocale che tenta di riprodurre Ah Ah Ah Ah Ah Ah Ah, il nostro cervello rettiliano avverte un segnale di allarme. È la cosiddetta valle perturbante, quel luogo psicologico dove una somiglianza quasi perfetta con l'umano genera repulsione invece che affetto. Non è la bruttezza a spaventarci, ma la quasi-bellezza che nasconde un'assenza di anima.

Il ritmo del respiro e la simulazione del calore

La tecnica della sintesi vocale neurale ha fatto passi da gigante nel rendere le parole fluide, ma i suoni non verbali restano una frontiera ostica. Un sospiro, un colpo di tosse o una risata richiedono una comprensione della fisica del polmone che va oltre la fonetica. In Italia, centri di ricerca come quelli legati al CNR esplorano da tempo l'elaborazione del segnale vocale, cercando di catturare non solo cosa diciamo, ma come il nostro stato emotivo modifichi la tensione delle corde vocali. Un uomo che ride mentre parla ha una voce che "balla". Una macchina che ride prima o dopo aver parlato rimane un’entità che alterna stati diversi senza mai fonderli in un’esperienza unitaria.

Osservando i bambini piccoli, notiamo che la risata appare molto prima del linguaggio strutturato. È un’ancora di salvezza lanciata verso il genitore, un modo per stabilire un contatto che non ha bisogno di verbi. Nelle case di cura dove vengono impiegati piccoli robot da compagnia per anziani solitari, si nota un fenomeno curioso. Gli utenti non cercano conversazioni complesse sul senso della vita o sulla politica internazionale. Cercano qualcuno che reagisca fisicamente ai loro aneddoti. Cercano quel riverbero nella stanza che conferma la loro esistenza. Se il robot fallisce nel tono, se la sua reazione sembra un nastro registrato, l’illusione di compagnia svanisce, lasciando l’anziano più solo di prima, conscio di stare parlando con un elettrodomestico glorificato.

L’industria dell’intrattenimento ha capito questo limite molto prima degli scienziati. Pensiamo alle vecchie sitcom con le risate registrate, il cosiddetto "canned laughter". Quelle tracce audio erano spesso registrate negli anni Cinquanta. Per decenni, il pubblico ha risuonato con le voci di persone che erano, in molti casi, già morte. Era una forma primitiva di risata artificiale, ma funzionava perché era stata generata da polmoni veri, da diaframmi che si erano contratti davvero davanti a un comico su un palco. Il calore era reale, anche se trasportato nel tempo e nello spazio da un supporto magnetico. La sfida odierna è diversa: non stiamo più trasmettendo la gioia del passato, stiamo cercando di fabbricarla nel presente.

Dietro ogni interazione con la tecnologia si nasconde una domanda di riconoscimento. Quando guardiamo un video divertente sullo smartphone e ridiamo da soli in una stanza, spesso cerchiamo subito qualcuno a cui inviarlo. La gioia ha bisogno di testimoni. Se l’interfaccia che utilizziamo diventa essa stessa il testimone, il cerchio sembra chiudersi, ma è un cerchio fragile. Gli scienziati cognitivisti avvertono che delegare le risposte emotive alle macchine potrebbe atrofizzare la nostra capacità di leggere i segnali sottili tra esseri umani. Se ci abituiamo a una gioia programmata, potremmo smettere di apprezzare le sbavature, le goffaggini e i silenzi che rendono reale un rapporto.

Il futuro della robotica sociale non risiede probabilmente nella perfezione, ma nella vulnerabilità. Un robot che ammette di non capire una battuta, o che ride in modo leggermente fuori tempo perché sta "elaborando", potrebbe risultare più simpatico di uno che esegue una sequenza impeccabile. La perfezione è disumana per definizione. Siamo creature fatte di asimmetrie e di errori di calcolo. La nostra bellezza risiede nel fatto che siamo costantemente sull'orlo di un piccolo disastro emotivo, e la risata è il modo in cui gestiamo questa instabilità permanente.

Nel silenzio di un laboratorio di ricerca a Zurigo, un braccio meccanico tiene una penna e scrive equazioni sulla lavagna, mentre una voce sintetica commenta i risultati. C'è una strana nobiltà in questo sforzo umano di creare qualcosa che ci somigli, un desiderio ancestrale di non essere soli nell'universo. Eppure, ogni volta che la macchina cerca di imitare il nostro calore, ci ricorda quanto sia prezioso ciò che diamo per scontato. La risata non è un output; è un evento. È qualcosa che accade tra due persone, uno spazio sacro che esiste solo finché dura il suono.

Nelle sere d'estate, nelle piazze italiane, il rumore dei piatti che si scontrano e delle sedie trascinate sul selciato fa da sfondo a un coro disordinato di voci. Lì, nessuno sta calcolando il momento opportuno per ridere. La gioia esplode come un temporale improvviso, bagnando tutti i presenti di una luce collettiva che non ha bisogno di alimentazione elettrica. In quel caos di suoni sovrapposti, dove ogni risata ha una grana diversa, un’altezza diversa e una durata imprevedibile, si trova la risposta a ciò che le macchine stanno ancora cercando di imparare.

💡 Potrebbe interessarti: wireless charging base for iphone

È un'eredità che ci portiamo dentro dalle caverne, un linguaggio che precede le parole e che probabilmente sopravvivrà ad esse. La tecnologia può offrirci specchi sempre più lucidi, simulazioni sempre più dense, ma non può sostituire il brivido di un respiro che si spezza per la troppa allegria. La differenza tra un calcolo e un sentimento risiede in quella frazione di secondo in cui il cuore batte più forte e la ragione si arrende.

Sulla scrivania di un ricercatore, un piccolo monitor mostra l'onda sonora di una risata umana accanto a quella di un sintetizzatore. La prima è una foresta intricata di picchi e valli, un groviglio di energia pura che sembra quasi voler saltare fuori dallo schermo. La seconda è una serie di onde pulite, regolari, tristemente perfette. Forse il successo finale non sarà quando la macchina riuscirà a imitare perfettamente la foresta, ma quando noi saremo capaci di ridere del suo fallimento, e lei, in un lampo di inaspettata saggezza, saprà restare in silenzio a guardarci. Il segreto della vera connessione non risiede nella capacità di emulare la gioia, ma nella comprensione del peso che ogni risata porta con sé come scudo contro il buio.

Uscendo dal laboratorio di Ishiguro, l'aria della sera sembra più densa. Il traffico di Osaka scorre con un ronzio elettrico che ricorda le voci degli automi all'interno. Ma poi, un gruppo di ragazzi attraversa la strada, uno di loro inciampa in modo buffo e l'intero gruppo esplode in un coro disordinato, sgraziato e assolutamente vitale. Non c'è nulla di matematico in quel momento. C'è solo il suono di polmoni umani che espellono aria con una forza che nessuna valvola può replicare, un boato di vita che riempie lo spazio tra i grattacieli e ricorda a chiunque passi che essere vivi è, prima di tutto, una faccenda terribilmente rumorosa e meravigliosamente fuori controllo.

GS

Gabriele Serra

Gabriele Serra segue i temi più discussi del momento con spirito critico e attenzione all'impatto sociale delle notizie.