Che poter comunicare senza barriere linguistiche sia garanzia di reciproca comprensione l’attualità sembra sconfessarlo con tutta evidenza. Fa quasi sorridere che una delle prime sessanta frasi tradotte da un sistema automatico – correva il 7 gennaio 1954 – sia stata “International understanding constitutes an important factor in decision of political questions”. L’originale era in russo, il progetto – piuttosto intuitivamente – americano. Al cervello elettronico del Georgetown-IBM Experiment occorrevano allora 6-7 secondi per ogni frase. Un successo che, riecheggiato dalla stampa mondiale, incoraggiò i governi a investire in linguistica computazionale. La sfida era notevole: ci si rese ad esempio conto che la formulazione della logica necessaria per convertire correttamente i significati delle parole anche in un piccolo segmento di due lingue richiedeva un numero di istruzioni 2,5 volte superiore a quello necessario per simulare il volo di un missile guidato.
Settant’anni più tardi, si arriva al record delle 243 lingue supportate da Google Translate, 110 aggiunte l’anno scorso: da quelle ampiamente parlate come il cantonese, per cui però era difficile trovare dati di training sovrapponendosi spesso al mandarino nella scrittura, a quelle parlate solo da piccole comunità di indigeni africani. Prodigi del suo modello linguistico di grandi dimensioni PaLm2. Obiettivo dichiarato: arrivare a mille (1.000 Languages Initiative). Nel mondo se ne parlano sette volte tante, ma l’assenza di molte dal Www è stata finora di ostacolo agli approcci di addestramento tradizionali, sfida cui cominciano però a rispondere i Large Multimodal Models (LMM) più avanzati, in grado di estrarre informazioni anche dai tanti altri formati digitali di condivisione di contenuti testo, audio e video.
D’altronde il traduttore di Mountain View ha fatto proprio dell’ampia copertura e dell’accessibilità (oltre che dell’integrazione con i servizi di casa) i punti di forza della sua offerta ecumenica, lasciando eccellere altri competitor in accuratezza e personalizzazione. Su queste ultime ci si gioca in particolare la clientela business (quella delle versioni Pro e a pagamento), per cui ormai i servizi di traduzione linguistica automatica – e sempre più anche di scrittura – rappresentano un investimento strategico, specie per realtà in espansione internazionale o votate all’export che per affrontare le sfide comunicative in ambiti come le operazioni interne e il supporto clienti hanno bisogno di soluzioni non solo efficienti, ma progettate per soddisfare specifiche esigenze di riservatezza e adattarsi a stile e ‘lessico’ aziendali, riducendo il rischio di produrre allucinazioni o altre forme di disinformazione.
All’interno di un mercato globale dei servizi linguistici che, traduzioni più interpretazioni, vale decine di miliardi – per una volta guidato dalla poliglotta Europa – le soluzioni abilitate dall’IA stanno registrando la crescita più elevata, trainata dai progressi di machine learning e reti neurali, dallo sviluppo delle tecnologie di elaborazione del linguaggio naturale (NLP) e dei Large Language Models (LLM), dall’aumento della potenza di calcolo (che però, DeepSeek docet, potrebbe non essere imprescindibile) oltre che da scambi sempre più globali e digitali.
Un ritmo di innovazione che si spiega solo considerando come dietro gli attuali risultati raggiunti dai sistemi di traduzione automatica vi sia un lungo cammino. A cimentarsi con la sfida – fra le maggiori per una macchina – si è iniziato dall’immediato secondo dopoguerra. Anni in cui emergeva anche il concetto di intelligenza artificiale. I primi a discuterne furono un manipolo di eccentrici talenti nell’estate del 1956. Nella proposta per ottenere i finanziamenti per quel campus di due mesi al Dartmouth College avanzavano la congettura che “ogni aspetto dell’apprendimento o di qualsiasi altra caratteristica dell’intelligenza può in linea di principio essere descritto così precisamente da farne una macchina in grado di simularlo”. Fra i problemi specifici su cui ritenevano utile concentrarsi suggerirono – primo della lista – l’uso del linguaggio.