“Il go sta agli scacchi come la metafisica sta alla computisteria”. Lo scrive Trevanian nel suo Il ritorno delle gru (1980). Questa frase rende bene il concetto ed è per questo che la scorsa settimana molti giornali hanno dato la notizia che il programma AlphaGo di Google ha battuto per 5 vittorie a zero Fang Hui, Campione Europeo di Go e la cosa per molti era assolutamente inattesa, diciamo una decina d’anni in anticipo sul previsto. Hanno anche citato la mente che c’è dietro a tutto questo, quel Demis Hassabis, guru di Deep Mind, la start up di intelligenza artificiale (AI) recentemente acquisita da Google.
Hassabis, ragazzo prodigio negli scacchi, computer game designer, neuroscienziato, imprenditore di successo, nonché “world class all-round player”. Ho raccontato la sua incredibile storia un paio d’anni fa in un post qui sul Fatto.
Per quanto riguarda il Go, è il gioco più bello e complesso mai concepito. Alex Randolph, che nel gioco infondeva poesia e filosofia, soleva dire che si tratta di un gioco talmente perfetto da essere stato “scoperto” più che “inventato”. Eppure le sue regole sono semplici: il goban (il tavoliere) è diviso in 19×19 caselle e i due giocatori piazzano alternativamente le loro “pietre” nere e bianche nelle intersezioni. Si delimitano territori rendendoli nel contempo “vivi”, inattaccabili dalle pietre avversarie.
Tutto qui, ma mediamente ad ogni mossa ci sono 10 volte le possibilità degli scacchi e le mosse sono tante. In altre parole nessun computer concepibile può risolvere questo gioco con la forza bruta del calcolo, perché le possibili situazioni sul tavoliere sono inimmaginabilmente tante, circa 10^170 (10 elevato alla 170, cioè seguito da 170 zeri), molto di più del numero di tutti gli atomi dell’universo.
Una difficoltà è capire quale giocatore si trova effettivamente in vantaggio in una determinata situazione, non c’è un modo semplice per determinarlo. Un’altra riguarda il fattore, diciamo, estetico, il riconoscimento delle figure che vengono a crearsi sul tavoliere. Fino a ora i programmi non andavano oltre il livello amatoriale avanzato e solo un paio d’anni fa i ricercatori stimavano che ci sarebbero voluti vari decenni perché una macchina potesse competere con i migliori umani. E allora? Che cosa si è inventato quel genio che in così breve tempo ha rivoluzionato tutto?
Illuminante una chiacchierata che ho fatto con lui qualche mese fa:
Forse ci stai preparando una sorpresa proprio sul Go…
Eh sì, in pochi mesi penso che ci sarà una grossa sorpresa. Tu sai che stiamo lavorando sulla AI e il Go è un gioco veramente difficile da giocare per i computer. Perché è così estetico. Non è di puro calcolo, è fatto di modelli, di forme, di bellezza e normalmente i computer non sono molto bravi con queste cose…
Dopo la vendita record della tua Deep Mind dirigi in Google la ricerca sull’AI.
Sì, adesso dirigo una divisione di Google, e quello che facciamo è proprio lavorare all’AI, ma di un tipo molto specifico. L’AI tratta di rendere le macchine intelligenti, ma ci sono due modi di farlo: uno è che ti poni un problema, pensi alla soluzione, programmi la soluzione nel computer e infine il computer la esegue in modo automatico. Ma invece di questo, noi cerchiamo di dare al computer la capacità di imparare da se stesso, di imparare con l’esperienza. Così, se si tratta di un gioco, imparerà giocando e diventerà progressivamente migliore. Ti insegno a imparare, non ti do la soluzione. È veramente un nuovo tipo di AI, potremmo dire così. Stiamo facendo enormi passi avanti in questo nuovo tipo di algoritmi che imparano.
Per capirci, non hanno realizzato un programma che gioca a Go, ma un incredibile algoritmo che sta imparando a giocare a qualsiasi gioco. Ha cominciato con il vecchio videogioco arcade Breakout (lanci la pallina su un muro per abbatterne i mattoni) e in questo breve video Hassabis racconta cosa l’algoritmo ha imparato a fare in poche ore.
Non mi addentro sui meccanismi del deep learning, sulle reti neurali a strati e su altre questioni tecniche; vi potete fare un’idea leggendo questo articolo su Le Scienze. Fatto sta che l’algoritmo ha “risolto” decine di giochi, battendo non solo i migliori umani, ma anche migliori programmi specificatamente dedicati a ogni singolo gioco.
E in pochi mesi, è arrivato al Go, tra lo stupore generale, battendo lo scorso ottobre il campione europeo e vincendo 499 partite su 500 contro i migliori programmi dedicati esistenti. Ne è seguito un artico su Nature in cui Hassabis e il suo gruppo spiegano in termini tecnici quello che hanno realizzato. Per prima cosa l’algoritmo “osserva” le partite dei giocatori professionali; poi impara le configurazioni che generalmente si sviluppano sul tavoliere, quali sono buone e quali meno e questa è la parte del programma che impara la parte più intuitiva del Go, se vogliamo quella più umana; infine gioca milioni di volte con se stesso, imparando dai propri errori e migliorando continuamente. E ora è pronto per la sfida di marzo in Corea, contro il campione del mondo Lee Se-dol.
E una volta “risolto” il Go, passerà ai videogiochi 3D, ma Hassabis non si vuole fermare ai giochi, vuole dare una mano a risolvere i problemi del mondo, niente di meno. Qui il video di una sua intervista alla Bbc.
A questo punto ci corre un brivido e immagini di film di fantascienza tornano alla memoria… ma lui ci assicura che stanno prendendo ogni precauzione: che siano le “Tre Leggi della Robotica” di Asimov?
Qui il video completo della chiacchierata che abbiamo fatto. Parliamo soprattutto di giochi (è quello il nostro terreno comune), ma accenniamo anche delle sue ricerche, che nei prossimi anni potranno letteralmente cambiare il mondo.