Usando reti neurali si riesce a capire meglio quali emozioni si associano a ogni brano, e con quanta intensità. Presto potrebbe aiutare a creare playlist migliori.
Chi usa Apple Music, Spotify o un altro servizio streaming musicale simile probabilmente ha provato almeno una volta una playlist “umorale”. Si tratta di liste automatiche tarate su un certo stato d’animo: per i momenti allegri, per quelli malinconici, per darsi la carica in palestra e così via. Ebbene, la francese Deezer sta sviluppando un nuovo sistema di intelligenza artificiale che potrebbe rendere queste liste migliori di quanto sono ora. Una missione che è più difficile di quanto possa sembrare.
Una ricerca scientifica pubblicata dall’azienda descrive infatti l’uso del Deep Learning per analizzare tanto la musica quanto le parole delle canzoni, e capire che tipo di emozioni destano e con quale intensità. Il nuovo sistema è stato messo a confronto con le tecnologie precedenti, e si è scoperto che se la cava un po’ meglio.
Per fare il lavoro gli scienziati di Deezer hanno prima di tutto preso in considerazione un database chiamato Milion Song Dataset (MSD), una raccolta di titoli di canzoni ed etichette associate a ognuna di esse. Si tratta di una fonte per ricerche scientifiche che non include le canzoni vere e proprie. In termini più tecnici, è una collezione di metadati. Il secondo passo è stato quindi abbinarlo al catalogo di Deezer per ottenere una lista di circa 18mila brani utilizzabili per addestrare le reti neurali.
Queste ultime, infatti, all’accensione sono un sistema vuoto che non sa fare nulla. La rete neurale viene poi programmata per una specifica azione, in questo caso determinare il mood di una canzone. Alla macchina vengono poi forniti i dati, cioè le canzoni, e si innesca un sistema di addestramento: la rete neurale ottiene un feedback (dagli umani) per ogni risposta, giusta o sbagliata che sia, e lo usa per migliorare le proprie capacità. Dopo un po’ di tempo e un gran numero di ripetizioni, la rete neurale è pronta a svolgere il proprio compito al meglio delle sue possibilità.
La cosa interessante di questi sistemi è che il meccanismo finale è misterioso. In una rete neurale abbastanza complessa nessuno, nemmeno i programmatori originali, saprebbe dire perché la macchina ha fatto una certa scelta. Tant’è che si parla di black box (scatola nera). Dettaglio che tra l’altro ha spinto l’Unione Europea ad affrontare l’argomento nel recente Regolamento Generale per la Protezione dei Dati – che in diversi casi proibisce l’uso di sistemi AI che non siano del tutto trasparenti.
Tornando allo studio di Deezer, si è scoperto che le reti neurali mostrano un notevole vantaggio nel riconoscere l’intensità emotiva della parte strumentale. I sistemi tradizionali, invece, sono migliori nell’interpretazione dei testi – o per meglio dire di alcune parole chiave – usati per determinare se l’emozione di un brano è positiva o negativa.
Il documento suggerisce quindi che combinando Deep Learning e strumenti tradizionali si può arrivare a generare playlist automatiche migliori di quelle attuali, almeno per quanto riguarda quelle create per soddisfare un certo stato d’animo o un certo momento, sia la lezione di pilates o la fase che precede il sonno.
Nei prossimi anni Deezer potrebbe decidere che il sistema è pronto per il grande pubblico e aggiungerlo al proprio servizio. Fino a quel momento invece dovremo accontentarci delle playlist automatiche che abbiamo oggi, croce e delizia di molti ascoltatori. Comodissime perché basta un tocco sullo schermo per avere ore e ore di musica. Ma pericolose, perché in mezzo a tante belle canzoni che adoriamo che ne finisce sempre almeno una sbagliata che rovina inevitabilmente l’atmosfera.