Tecnologia

Intelligenza Artificiale legge 3,3 milioni di documenti e diventa esperta dei nuovi materiali del futuro

Un esperimento ha dimostrato come un'Intelligenza Artificiale senza alcuna conoscenza scientifica possa diventare esperta di scienze dei materiali leggendo solo i riassunti dei testi scientifici. Le competenze acquisite sono state tali da permettere al computer di fare previsioni attendibili sulle prossime scoperte.

Un’Intelligenza Artificiale ha esaminato 3,3 milioni di abstract di documenti scientifici sulla ricerca di nuovi materiali, e analizzando le relazioni tra le parole in essi contenute, è stata capace di predire con anni di anticipo le scoperte di nuovi materiali termoelettrici e di suggerire quelle di materiali ancora sconosciuti.

L’abstract, come quello relativo a questa ricerca, è il paragrafo di apertura di qualsiasi relazione scientifica, in cui i ricercatori espongono contenuti e conclusioni in forma testuale descrittiva. Spesso le pagine successive sono espresse in linguaggio tecnico e formule matematiche, comprensibili solo agli addetti ai lavori o a chi ha competenze specifiche.

I ricercatori del Lawrence Berkeley National Laboratory del Dipartimento dell’Energia degli Stati Uniti hanno usato un algoritmo senza alcuna formazione nella Scienza dei materiali, e gli hanno dato in pasto milioni di pagine per dargli modo di “farsi una cultura” mediante le ben note tecniche di apprendimento automatico.

Foto: Depositphotos

 

Hanno quindi raccolto 3,3 milioni di abstract presi da articoli pubblicati in oltre 1.000 riviste tra il 1922 e il 2018. Un algoritmo chiamato Word2vec ha preso ciascuna delle circa 500.000 parole presenti in quegli abstract e trasformato ciascuna in un vettore di 200 dimensioni, o in una serie di 200 numeri.

Alla fine del lavoro Word2vec, senza sapere nulla di Scienza dei materiali, ha imparato concetti come la tavola periodica e la struttura cristallina dei metalli“, ha spiegato Anubhav Jain, scienziato della divisione Energy Storage & Distributed Resources del Berkeley Lab. Tanto è bastato per dimostrare il potenziale della tecnica sperimentata. L’aspetto più interessante, tuttavia, “è che si può usare questo algoritmo per colmare le lacune nella ricerca sui materiali, ossia per mettere in risalto studi che i ricercatori dovrebbero portare avanti ma che finora non hanno studiato”.

L’interesse verso questa scoperta è tale che lo studio ha guadagnato una pubblicazione sulla rivista scientifica Nature, in cui Gerbrand Ceder del Dipartimento di Scienza e Ingegneria dei Materiali dell’Università di Berkeley, spiega che “il text mining (l’estrazione di informazioni utili da testi non strutturati) della letteratura scientifica può portare alla luce conoscenze nascoste, e che la pura analisi del testo può creare conoscenze scientifiche di base”.

Perché c’è bisogno che un’Intelligenza Artificiale esamini i testi e porti alla luce conoscenze in essi già contenute? Il primo autore dello studio, Vahe Tshitoyan, spiega che “in ogni campo di ricerca ci sono 100 anni di letteratura di ricerca passata, e ogni settimana vengono pubblicati decine di altri studi. Un ricercatore può accedere solo a una frazione di questo materiale. Per questo abbiamo pensato che l’apprendimento automatico potesse essere utile per sfruttare meglio tutta questa conoscenza collettiva”.

Foto: Depositphotos

 

Per sincerarsi che effettivamente la tecnica funzionasse anche in ottica predittiva, i ricercatori hanno analizzato le prime 10 previsioni fatte da Word2vec in relazione alle prossime scoperte di materiali termoelettrici, ossia materiali sicuri, facili da reperire o da produrre, che possono convertire efficientemente il calore in elettricità. In tutti i casi i fattori di potenza calcolati sono risultati leggermente superiori alla media dei materiali termoelettrici conosciuti, e i primi tre candidati segnalati dall’algoritmo avevano fattori al di sopra del 95° percentile di termoelettrici noti.

Jain ha concluso che “questo studio dimostra che se questo algoritmo fosse esistito prima, alcuni materiali potrebbero essere stati scoperti con anni di anticipo”. Ora il gruppo di lavoro sta lavorando per potenziare ulteriormente il motore di ricerca dell’algoritmo per renderlo più utile e efficiente.