In un articolo pubblicato il 27 settembre sul suo Google Research Blog, il gigante dei motori di ricerca ha annunciato l’adozione di un nuovo algoritmo per la sua applicazione Google Translate denominato Google Neural Machine Translation system (GNMT), nell’articolo è linkato anche l’articolo scientifico pubblicato sul sito della Libreria della Cornell University.
Intelligenza artificiale: la tecnica deep learning
Il nuovo algoritmo sviluppato da Google si basa su una nuova tecnica di sviluppo IA denominata deep learning che è un po’ l’astro nascente del settore.
Ma che cos’è deep learning? Facciamo un passo indietro, ricordate un paio di anni fa quando cominciarono le battute sulla constatazione che la social internet è piena di gatti? Sapete come nacquero? Google sperimentava un nuovo sistema di intelligenza artificiale, ha dato in pasto a Google Brain (un network di 1000 computer) qualcosa come 10 milioni di fotogrammi estratti da Youtube, risultato: la IA decise da sola che c’erano dei pattern che si ripetevano, delle categorie in cui suddividerle, tra cui appunto cats (gatti). Vi pare poco? Fu un passo avanti enorme nella intelligenza artificiale, si arrivò a formulare la teoria che fornendo a un sistema di intelligenza artificiale una quantità enorme di dati e potenza di calcolo per processarli questo poteva trarre delle conclusioni simili a quelle che l’intelligenza umana trae in maniera per noi in parte ancora misteriosa (o che comunque non siamo in grado di replicare).
Prestazioni del nuovo Google Translate basato sulla Google Neural Machine Translation
Per ora GNMT è sperimentato solo sul traduttore cinese inglese (sia app che web based) dal prossimo mese comincerà ad essere esteso agli altri linguaggi. Esperti del settore intelligenza artificiale che hanno letto l’articolo tecnico di 23 pagine dicono che quelli di Google non hanno inventato nulla ma hanno fatto un gran lavoro, utilizzando tutti i “trucchi” allo stato dell’arte della IA e col loro lavoro hanno dimostrato che l’approccio alla traduzione automatica basato sulle reti neurali è molto più efficace.
Lo stesso articolo di Google dice che il problema della traduzione automatica non è affatto risolto e che il sistema basato su GNMT può fare ancora gli errori che tutti conosciamo e che un traduttore umano non farebbe mai, tipo mancare completamente il senso di una frase perché non in grado di considerarla nel contesto o saltare parole (anche se l’approccio basato sul considerare tutto l’input piuttosto che spezzettarlo in parole e brevi frasi è una delle caratteristiche di GNMT) , ma che è una importante pietra miliare che dice che quella della traduzione basata su reti neurali è la strada da seguire. Basta guardare la diversa accuratezza della traduzione del testo cinese che trovate nell’articolo sia nella versione tradotta col sistema tradizionale che con quello basato su NMT per non avere difficoltà a crederci.
Roberto Todini